Statistika
Random Variables
Discrete Random Variables
Continuous Random Variables
Jurusan Teknik Sipil dan Lingkungan Universitas Gadjah Mada
Pengertian
Random variable (variabel acak)
suatu fungsi yang didefinisikan pada sample
space
Jenis
Discrete random variables
Continuous random variables
Contoh
jumlah hari hujan selama 1 tahun diskrit
Random Variables
Notasi
X variabel random
x nilai variabel random
Fungsi
Suatu fungsi variabel random adalah variabel
random pula
Jika X adalah variabel random, maka Z = g(X)
Univariate Probability Distributions
X = discrete random variables
= x
1, x
2, x
3, …, x
nf
X(x
1)
f
X(x
2)
f
X(x
n)
f
X(x
3)
∑ f
X(x
i) = 1
probability
x1 fX(xi) xn x1 x2 x3
…
xn−1 FX(xi) xn x2 x3…
xn−1 1 a discrete probability distribution a discrete cumulative probability distribution probability x ≤ xi 0
x x i X X ix
f
x
F
i
X
i
X
i1 Xx
F
x
F
x
f
Probability distributionsuatu variabel random X untuk X = x
Cumulative probability distribution suatu variabel random X untuk X = x
Univariate random variables
Jika X dapat bernilai x
1, x
2, …, x
nyang masing-masing memiliki probability
f
X(x
1), f
X(x
2), …, f
X(x
n) dan ∑f
X(x
i) = 1,
maka X adalah variabel random diskrit.
i j x x x x x j i i i i f F F F f 1 1
Frequency
Probability
x x i X X i X i X i X i x f x F x F x F x f 1 frekuensi relatifContinuous Random Variables
Probability
i fxi n n A probni = jumlah data di klas ke-i
n = jumlah seluruh data
Dengan demikian, fxi dapat dipandang sebagai nilai estimasi probability.
fxi estimasi prob(A)
histogram frekuensi pendekatan distribusi probability
frekuensi kumulatif pendekatan distribusi probability kumulatif
continuous random variable treated as thought it were discrete
prob(a ≤ X ≤ b) x x a b a b pX(x) PX(x)
pdf = probability density function
PX(b) PX(a) 1 0 luas = prob(a ≤ X ≤ b) luas = prob(X ≤ b) luas = 1 cdf = cumulative probability distribution function PX(x) = prob(X ≤ x)
pX(x) = probability density function of a continuous random variable
PX(x) = cumulative probability distribution function
x X X X X X t t p x P x x p x P x X x P d d d prob
1 ) 4 0 ) 3 1 d ) 2 , 0 ) 1
X X X X P P x x p x x pBeberapa sifat probability
b P
a P t t p b X a X X b a X
d prob ) 5
0 d prob ) 6
c P c P t t p c X X X c c X
a X b
a X b
b X a b X a prob prob prob probKala Ulang
Jadi dalam definisi kala ulang
a. suatu kejadian yang menyamai atau melampaui suatu nilai tertentu
b. suatu kejadian yang melampaui suatu nilai tertentu
Kedua definisi, a dan b, adalah sama mengingat probability suatu kejadian (event) menyamai suatu nilai tertentu adalah nol
X
a
prob
X
a
prob
Contoh
Bivariate Distributions
(1) Apabila diinginkan untuk mengetahui perilaku dua
atau lebih random variables joint probabilities
Joint probability density function
P
x y y x y x pX Y , X,Y , 2 , PX ,Y(x, y)= prob X(
< x and Y < y)
= pX ,Y( )
s,t dt ds -¥ +¥ò
-¥ +¥ò
Bivariate Distributions
(2) Beberapa persamaan
,, x
pX Y is a cumulative univariate probability function of X only
y
PX,Y , is a cumulative univariate probability function of Y only
,
,
0 1 , 0 , , , , , x P y P P y x p Y X Y X Y X Y XMarginal Distributions
(1) Two random variables, X and Y
Ingin diketahui perilaku X tanpa mempertimbangkan nilai
variabel Y Marginal density:
t t x p x p x p y x p Y X X X Y X d , , , ,Marginal Distributions
(2) Two random variables, X and Y
Cumulative marginal distribution:
x X x Y X X X s s p s t t s p x X Y x X x P x P d d d , prob dan prob , ,
x y P
x PX,Y , XMarginal Distributions
(3) Untuk variabel Y
Marginal density
Cumulative marginal distribution:
y Y Y Y t t p y Y y Y X y P y P d prob dan prob ,
s y s p y p y p y x p Y X Y Y Y X d , , , ,Conditional Distributions
Two random variables, X and Y
Ingin diketahui perilaku X yang bergantung pada Y
Distribusi X jika Y = y0 Distribusi Y jika x1 ≤ X ≤ x2
y p y x p y x p y p y x p y y x p x S y x p S y R x t t p t t x p S y x p Y X Y X Y Y X Y X R X Y S Y S X Y i Y X , dituliskan sering lebih yang , d dalam di dalam di dalam di prob d d , dalam di , 0 0 , 0 , ,
Independence
Two random variables, X dan Y
Kedua variabel independence jika
Joint probabilities: perkalian density marginal kedua
variabel adalah
x y p
x p y y x p X Y X Y X fungsi bukan
x y p
x p y pX,Y , X YContoh
Random Variables
Samples Observasi statistik Samples (belum diukur) Populasi estimasi
Statistik
Langkah
1. Pengambilan sampel
2. Observasi (analisis) terhadap sampel
3. Penyimpulan tentang perilaku sampel
4. Estimasi tentang perilaku populasi berdasarkan butir (3)
5. Estimasi tentang sampel lain (yang belum diambil) berdasarkan butir (3)
Statistik
Contoh
Data debit suatu sungai selama 50 yang telah lalu
dipakai sebagai dasar untuk melakukan estimasi debit sungai tersebut selama periode tak terbatas (estimasi tentang perilaku populasi).
Informasi tersebut dapat pula dipakai untuk
estimasi debit sungai tersebut selama periode tertentu pada masa yang akan datang (sampel yang belum diambil).
Moment and Expectation:
Univariate Distributions
x pX x x p A X d d
x x p x A x X A d d 1 A dA x Y O X pdfMoment pertama terhadap O
Untuk suatu random variable
Ax A A x d d d 1 1Moment and Expectation:
Univariate Distributions
Secara umum berlaku bahwa momen ke-i
terhadap O adalah
continuous random variables
discrete random variables
i xi pX x d x
j j X i j i x f xMoment and Expectation:
Univariate Distributions
Momen sentral ke-i: momen ke-i terhadap mean
(nilai rata-rata)
i x i pX x d xMoment and Expectation:
Univariate Distributions
j j X j X x f x X E x x p x X E dNilai expektasi suatu random variable X
X continuous X discrete Dengan demikian:
i i i X E X E Statistical Measures
Common statistical measures
Measure of central tendency
Mean Mode Median Measure of variability Range Variance Standard deviation
Measure of an individual in a population
z score
Measure of Central Tendency
(1)
Nilai rata-rata (average)
rata-rata (mean)
mode score yang paling sering muncul
median score yang berada di tengah dari suatu
rangkaian score urut (dari nilai kecil ke besar atau sebaliknya)
Measure of Central Tendency
(2)
Contoh
Jumlah hari hujan selama 11 bulan terakhir
adalah sbb.
21, 21, 21, 20, 18, 16, 12, 12, 6, 2, 1
rata-rata = 14 =AVERAGE(...)
mode = 21 =MODE(...)
median = 16 =MEDIAN(...)
Dari ketiga ukuran statistik tersebut,
manakah yang paling baik menceritakan
tentang pola jumlah hari hujan dalam 11
bulan tersebut?
Measure of Central Tendency
(3)
Contoh
Carilah contoh sejenis, yang berhubungan
dengan pengelolaan sumberdaya air; misal:
perilaku penduduk dalam pemakaian air (waktu, volume,
debit, dsb.)
data klimatologi (temperatur udara, kelembaban udara,
lama penyinaran matahari, dsb.)
Diskusikan
nilai rata-rata mode
Measure of Central Tendency
(4)
Contoh
Cari dan diskusikan contoh-contoh yang
berhubungan dengan bencana alam
debit dan tinggi muka air banjir sungai lama genangan banjir di suatu kawasan banjir lahar, debris flow
Measure of Central Tendency
(5)
Simbol dan rumus
Nilai rata-rata (variabel random kontinu)
x x p x X E X X d 1Measure of Central Tendency
(6)
Simbol dan rumus
Rata-rata (variabel random diskrit)
X n X 1
X n X 1 Nilai rata-rata sampel
n = jumlah anggota sampel
Nilai rata-rata populasi
n = jumlah anggota populasi
besaran statistik: hanya berdasarkan sebagian anggota populasi parameter: berdasarkan seluruh anggota populasi
estimasi nilai
rata-rata populasi
Measure of Central Tendency
(6) Beberapa sifat nilai rata-rata
C X n X C 1
C X n X C 1 C = konstantaMeasure of Central Tendency
(7) Nilai rata-rata Arithmetic mean Geometric mean Harmonic mean Weighted mean
X n X 1
n X X
1
X n X 1 =AVERAGE(...) =GEOMEAN(...) =HARMEAN(...)
w X w XWMeasure of Central Tendency
(8)
Nilai rata-rata
Root mean square
n i i RMS x n X 1 2 1Measure of Central Tendency
(9) Median
Variabel random kontinu
Variabel random diskrit
d 0.5
md x x pX md p md x
0.5 1
p i i X x fMeasure of Central Tendency
(10) Mode, nilai yang paling sering muncul/terjadi
Variabel random kontinu
Variabel random diskrit
0 d d dan 0 d d hingga sedemikian dihitung populasi, mode 2 2 x x p x x pX X mo
i X n i x f X 1 max hingga sedemikian nilai suatu adalah mode Measure of Variability
(1)
Keragaman
Variability, scatter, spread
menunjukkan apakah angka dalam distribusi saling
berdekatan atau berjauhan
Range beda antara nilai tertinggi dan terendah
dalam distribusi
mungkin biasa digunakan dalam permasalahan
sehari-hari
Standard deviation (simpangan baku)
Measure of Variability
(2)
Simbol dan rumus
Variance (ragam) variabel random kontinu
merupakan momen kedua terhadap nilai rata-rata
X E
X E X E X 2 2 2 2 2 var Measure of Variability
(3)
Simbol dan rumus
Variance (ragam) variabel random diskrit
n X
2 2 variance populasi
1 2 2
n X X s variance sampel estimasi nilai variance populasi =VAR(...)Measure of Variability
(4) Kenapa penyebut n − 1
menghasilkan nilai yang lebih besar daripada dibagi
dengan n; ini untuk mengompensasi kecenderungan variabilitas sampel yang lebih kecil daripada variabilitas populasi
dari sisi praktis, hal ini juga menunjukkan variabilitas
dari sampel beranggota 1 adalah tidak ada (tidak ada variabilitas dari 1 score)
Measure of Variability
(5)
1
2 2
n
X
X
s
1
2 2 2
n
X
n
X
s
Cobalah Saudara uraikanMeasure of Variability
(6)
1 1 1 2 1 2 1 2 1 2 2 2 2 2 2 2 2 2 2 2 2
n X n X n n X X n n X n X n X X n X n X X X n X X X X n X X sMeasure of Variability
(7)
Simbol dan rumus
Standard deviation (deviasi standar,
simpangan baku)
n X
2 deviasi standar populasi
1 2
n X Xs deviasi standar sampel
estimasi nilai deviasi standar
Measure of Variability
(8) Coefficient of variation catatanX
s
c
v
a bX
b
X X c cX c var var var var 0 var 2 2 Simetri
mode = median = mean mode median mean simetris
3 3 2 2 1 t, coefficien skewness sampel skewness populasi skewness X s mo mo s M n n n c s X X Simetri
dalam persamaan di atas:
n = jumlah sampel
M3 = momen ke-3 (sampel)
Peakedness
leptokurtic, k > 3, e > 0 normal, mesokurtic, k = 3, e > 0 platykurtic, k < 3, e < 0 kurtosis: 3 4 4 2 2 4 k e k X s M k (populasi) (sampel)Sample Moments
Some Measures of An Individual in
A Population
(1) z scores Percentile rank X zX
100 2 1 n E B PRX B = jumlah score yang bernilai di bawah X
E = jumlah score yang bernilai sama dengan X n = jumlah score seluruhnya
untuk menunjukkan posisi suatu score dalam populasi untuk populasi besar s X X zX
Some Measures of An Individual in
A Population
(2) Beberapa fungsi di dalam MS Excel
=RANK(...)
posisi suatu nilai (angka) pada suatu urutan angka
=PERCENTILE(...)
nilai percentile dalam suatu kisaran angka
=PERCENTRANK(...)
posisi suatu nilai (angka) dalam suatu urutan angka, dalam
persen
100 ) (B A B B = jumlah score yang bernilai lebih kecil daripada X A = jumlah score yang bernilai lebih besar daripada X