STATISTICS
STATISTICS
Confidence Intervals
Confidence Intervals
(Rentang Keyakinan)
(Rentang Keyakinan)
Confidence Intervals
Confidence Intervals
(1)(1)•
•
Estimasi Parameter
Estimasi Parameter
–
– Distribusi probabilitas memiliki sejumlah parameter.Distribusi probabilitas memiliki sejumlah parameter. –
– Parameter-Parameter-parameter tsb umumnya tak diketahui.parameter tsb umumnya tak diketahui. –
– Nilai parameter tersebut diperkirakan (di-Nilai parameter tersebut diperkirakan (di-estimasiestimasi- -kan) berdasarkan nilai yang diperoleh dari
kan) berdasarkan nilai yang diperoleh dari pengolahan data.
pengolahan data. –
– EstimasiEstimasi
•
• Estimasi tunggal (Estimasi tunggal (point estimatespoint estimates)) •
Statistika Confidence Intervals 3
Confidence Intervals
Confidence Intervals
(2)(2)•
•
Estimasi Tunggal
Estimasi Tunggal
–
– ContohContoh
•
• Nilai rata-Nilai rata-rata sampel sbg estimasi nilai ratarata sampel sbg estimasi nilai rata--rata populasi.rata populasi.
•
• Nilai simpangan baku sampel sbg estimasi nilai simpangan Nilai simpangan baku sampel sbg estimasi nilai simpangan baku populasi. baku populasi.
μ
→
X
X X s →σConfidence Intervals
Confidence Intervals
(3)(3)•
•
Estimasi parameter
Estimasi parameter
θ
θ
{
{
parameter estimasi
ˆ
→
θ
θ
Dicari suatu interval [
Dicari suatu interval [LL,,UU] yang memiliki probabilitas (1 –] yang memiliki probabilitas (1 –α) α) bahwa interval tsb mengandung
bahwa interval tsb mengandung θθ..
prob(L < θ < U) = (1 – α)
L
L= batas bawah rentang keyakinan.= batas bawah rentang keyakinan.
U
U= batas atas rentang keyakinan.= batas atas rentang keyakinan. (1
(1 ––α) = tingkat keyakinan (α) = tingkat keyakinan (confidence levelconfidence level, , confidence coefficientconfidence coefficient).).
L
Ldan dan UU= variabel random= variabel random
Æ
Statistika Confidence Intervals 5
Confidence Intervals
Confidence Intervals
(4)(4)•
•
Contoh
Contoh
–– Data debit Sungai A selama tahun 1981 s.d. 2000 Data debit Sungai A selama tahun 1981 s.d. 2000 menunjukkan bahwa debit rata
menunjukkan bahwa debit rata--rata adalah 77 mrata adalah 77 m33/s./s.
•
• Kita dapat memperkirakan debit rata-Kita dapat memperkirakan debit rata-rata Sungai A adalah rata Sungai A adalah 77 m
77 m33/s./s.
•
• Kita menyadari bahwa perkiraan tsb dapat salah; bahkan Kita menyadari bahwa perkiraan tsb dapat salah; bahkan dari sisi pengertian probabilitas, kita tahu bahwa debit dari sisi pengertian probabilitas, kita tahu bahwa debit rata
rata--rata sama dengan 77 mrata sama dengan 77 m33/s adalah hampir tidak /s adalah hampir tidak
mungkin terjadi: mungkin terjadi:
(
77m s)
0 probQ = 3 =Batas Bawah dan Atas
Batas Bawah dan Atas
(1)(1)•
•
Metode Ostle:
Metode Ostle:
method of pivotal quantities
method of pivotal quantities
–
– Dicari variabel random Dicari variabel random VVyang merupakan fungsi yang merupakan fungsi parameter
parameter θθ (θ(θ= = unknownunknown), tetapi distribusi ), tetapi distribusi VVini ini tidak bergantung pada parameter yang tidak tidak bergantung pada parameter yang tidak diketahui.
diketahui. –
– Ditentukan Ditentukan vv11dan dan vv22sedemikian hingga:sedemikian hingga:
(
< <)
=1−αStatistika Confidence Intervals 7
Batas Bawah dan Atas
Batas Bawah dan Atas
(2)(2)•
•
Metode Ostle:
Metode Ostle:
method of pivotal quantities
method of pivotal quantities
–
– Persamaan di atas diubah kedalam bentuk Persamaan di atas diubah kedalam bentuk prob(
prob(LL< θ< θ < < UU) = 1-) = 1-αα –
– LLdan dan UUadalah variabel random dan fungsi adalah variabel random dan fungsi VV, tetapi , tetapi bukan fungsi bukan fungsi θθ..
(
< <)
=1−α prob v1 V v2Confidence interval:
Confidence interval:
µ
µ
suatu distribusi normal
suatu distribusi normal
•
•
Mencari interval [
Mencari interval [
L
L
,
,
U
U
] yang mengandung
] yang mengandung
µ
µ
,
,
prob(
prob(
L
L
<
<
µ
µ
<
<
U
U
) = 1
) = 1
–
–
α
α
•
•
Misal variabel random
Misal variabel random
V
V
:
:
–
– VVberdistribusi t dengan (berdistribusi t dengan (nn––1) degrees of fredom1) degrees of fredom –
– nnadalah jumlah sampel yang dipakai untuk adalah jumlah sampel yang dipakai untuk menghitung nilai rata
menghitung nilai rata--rata sampel, rata sampel,
X
s
X
V
=
−
μ
Statistika Confidence Intervals 9 X
s
X
V
=
−
μ
ÆÆberdistribusi t?berdistribusi t?•
•
Bukti
Bukti
Distribusi t:Distribusi t: = ν , ν=degreeof freedom U Y X
(
)
(
)
(
)
(
X X)
Y U n n X s n X n s X n s X s X V i X X X X ν ⋅ = σ − − ⋅ σ μ − = σ ⋅ σ μ − = σ σ μ − = μ − = μ − =∑
2 2 2 2 2 2 1 1(
)
1 , , 2 2 − = ν σ − = ν μ − = → U∑
X X n n X Y i•
•
Pers (2):
Pers (2):
(
)
⎟⎟= −α ⎠ ⎞ ⎜⎜ ⎝ ⎛ < μ − < ⇒ α − = < < 1 prob 1 prob 1 2 1 v2 s X v v V v X luas = (1 luas = (1 ––αα)) luas =luas = ααaa luas = luas = ααbb
a tα b t1−α α αaa+ + ααbb= α= α prob( prob(tt< < vv11) = ) = ααaa prob( prob(tt> > vv22) = ) = ααbb dengan (
Statistika Confidence Intervals 11
(
+ ⋅ <μ< + ⋅)
= −α α − = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ < μ − < α − = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ < μ − < − α − α − α − α 1 prob 1 prob 1 prob 1 , 1 , 1 , 1 , 2 1 X n X n n X n X s t X s t X t s X t v s X v b a b a ℓu
X n X n s t X u s t X b a ⋅ + = ⋅ + = − α − α 1 , 1 , lJadi, confidence limits: Jadi, confidence limits:
t distribusi tabel 1 , → = − α n X X a t n s s •
• Jika dikehendaki probabilitas confidence interval simetris, makaJika dikehendaki probabilitas confidence interval simetris, maka
v
v11dan dan vv22dipilih sedemikian hingga prob(dipilih sedemikian hingga prob(tt< < vv11) = prob() = prob(tt> > vv22).). •
• Karena simetri, maka Karena simetri, maka ααaa= α= αbb= = αα/2/2
•
• Yang dicari adalah (1 Yang dicari adalah (1 ––α) = 100(1 α) = 100(1 ––α)% confidence interval α)% confidence interval ÆÆ maka: prob(
maka: prob(tt< < vv11) = α) = α/2 = prob(/2 = prob(tt> > vv22))
luas = (1
luas = (1 ––αα)/2)/2 luas = (1 luas = (1 ––αα)/2)/2
luas =
luas = αα/2/2 luas = luas = αα/2/2
2 1 2 −α α = t−
Statistika Confidence Intervals 13 luas = 1 luas = 1 ––αα/2/2 luas = 1 luas = 1 ––αα/2/2 luas =
luas = αα/2/2 luas = luas = αα/2/2
2 α t t1−α2 2 α t t1−α2 luas = 1
luas = 1 ––αα luas = luas = αα/2/2 luas = luas = αα/2/2 2 1−α − t
Distribusi t
Distribusi t
X n X n s t X u s t X ⋅ + = ⋅ − = − α − − α − 1 , 2 1 1 , 2 1 l •• Dengan demikian, confidence limits jika probabilitas Dengan demikian, confidence limits jika probabilitas confidence interval simetri adalah:
Statistika Confidence Intervals 15 luas = 1 luas = 1 ––αα luas = 1 luas = 1 ––αα luas =
luas = αα luas = luas = αα
•
• Kadang dikehendaki probabilitas confidence interval Kadang dikehendaki probabilitas confidence interval satu sisi
satu sisi
–
– batas bawah batas bawah ÆÆ prob(prob(tt< < vv11) = α) = α –
– batas atasbatas atas ÆÆ prob(prob(tt> > vv22) = α) = α
(
)
(
)
⎟⎟= −α ⎠ ⎞ ⎜⎜ ⎝ ⎛ < μ − ⇒ α − = < α − = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ > μ − ⇒ α − = > 1 prob 1 prob 1 prob 1 prob 2 2 1 1 v s X v V v s X v V X X α t t1−αDistribusi t
Distribusi t
•
•
Notasi
Notasi
–– ttγγ,,n n = nilai = nilai ttsedemikian hingga probabilitas variabel sedemikian hingga probabilitas variabel random
random ttdengan dengan nndegrees of freedom adalah lebih degrees of freedom adalah lebih kecil daripada
kecil daripada γ.γ. –
– misal:misal: t
t0.95,500.95,50= nilai = nilai ttsedemikian hingga prob(sedemikian hingga prob(tt< < tt0.95,500.95,50) = ) = 0.95 untuk
Statistika Confidence Intervals 17
Distribusi t
Distribusi t
•
• Dapat dibaca di tabel distribusi tDapat dibaca di tabel distribusi t
–
– Tabel Distribusi tTabel Distribusi t
•
• Dapat dihitung dengan perintah/fungsi MSExcelDapat dihitung dengan perintah/fungsi MSExcel
–
– TDIST(t,TDIST(t,νν,tails),tails)
•
• menghitung nilai prob(T > t)menghitung nilai prob(T > t)
•
• untuk menghitung nilai prob(T < t) untuk menghitung nilai prob(T < t) ÆÆ1 1 ––TDIST(t,TDIST(t,νν,tails),tails)
•
• t = nilai yang diinginkan untuk dicari distribusinyat = nilai yang diinginkan untuk dicari distribusinya
•
• νν= degree of freedom= degree of freedom •
• tails = 1 (onetails = 1 (one--tailed distribution) atau 2 (twotailed distribution) atau 2 (two--tailed distribution)tailed distribution)
–
– TINV(p,TINV(p,νν))
•
• mencari nilai t jika nilai p = prob(T > t) diketahuimencari nilai t jika nilai p = prob(T > t) diketahui
•
• twotwo--tailed distributiontailed distribution
•
• jika ingin mencari nilai t untuk onejika ingin mencari nilai t untuk one--tailed distribution, p diganti dengan 2ptailed distribution, p diganti dengan 2p
Distribusi t
Distribusi t
untuk 50 degrees of freedom
untuk 50 degrees of freedom
t = 1.6
prob(T < 1.6) = 1
prob(T < 1.6) = 1 ––TDIST(1.6,50,1) = 0.942TDIST(1.6,50,1) = 0.942
t = 1.6
prob(
prob(–1.6 < T < 1.6) = 1 1.6 < T < 1.6) = 1 ––TDIST(1.6,50,2) = 0.884TDIST(1.6,50,2) = 0.884 t = –1.6 t 0.95 0.95 prob(T < prob(T < t t ) = 0.95) = 0.95 t t= TINV(2*(1= TINV(2*(1--0.95),50) 0.95),50) ÆÆtt= 1.68= 1.68 t –t 0.95 0.95 prob( prob(--tt< T < < T < t t ) = 0.95) = 0.95 t t= TINV(1= TINV(1--0.95,50) 0.95,50) ÆÆtt= 2= 2
Statistika Confidence Intervals 19
Confidence interval:
Confidence interval:
µ
µ
suatu distribusi normal
suatu distribusi normal
•
• Apabila varian populasi diketahui, maka variabel Apabila varian populasi diketahui, maka variabel random
random VVdidefinisikan sbb.:didefinisikan sbb.: n X V X X X σ = σ σ μ − = , Æ
Æ VV berdistribusiberdistribusinormalnormal
Confidence interval:
Confidence interval:
µ
µ
suatu distribusi normal,
suatu distribusi normal,
σ
σ
diketahui
diketahui
•
• Confidence limitsConfidence limits
X b X a s z X u s z X ⋅ + = ⋅ + = l –
– Jika probabilitas rentang keyakinan diinginkan simetri, maka Jika probabilitas rentang keyakinan diinginkan simetri, maka confidence limits nilai rata
confidence limits nilai rata--rata populasi rata populasi µµadalah sbb:adalah sbb:
a z zb α − 1 αb a α X X s z X u s z X ⋅ + = ⋅ − = α − α − 2 1 2 1 l − = z α − 1 α 2 2 α
Statistika Confidence Intervals 21
Confidence interval:
Confidence interval:
σ
σ
22suatu distribusi normal
suatu distribusi normal
•
• Mencari interval [Mencari interval [LL,,UU] yang mengandung σ] yang mengandung σ22dengan dengan peluang prob(
peluang prob(LL< σ< σ22< < UU) = 1 –) = 1 – αα..
•
• Didefinisikan variabel random Didefinisikan variabel random VV::
(
)
2 2 1 X X s n V σ − = ÆÆ VV berdistribusi chi-berdistribusi chi-squared dengan squared dengan (
(nn––1) degrees of freedom.1) degrees of freedom.
(
)
(
)
= −α ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ < σ − < α − = < < 1 1 prob 1 prob 2 2 2 1 2 1 v s n v v V v X X Pilih: Pilih: 2 1 , 2 1 2 2 1 , 2 1 − α − − α χ = χ = n n v v(
)
= −α ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ χ < σ − < χα − 1 −α − 1 prob 2 12 2, 1 2 2 1 , 2 n X X n s n sehingga: sehingga: atau: atau:(
)
(
)
= −α ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ χ − < σ < χ − − α − α − 1 1 1 prob 2 1 , 2 2 2 2 1 , 2 1 2 n X X n X n s s nStatistika Confidence Intervals 23 Jadi batas bawah dan batas atas rentang yang
Jadi batas bawah dan batas atas rentang yang mengandung
mengandung σσXX22dengan tingkat keyakinan (1 –dengan tingkat keyakinan (1 – α) α) adalah: adalah:
(
)
(
)
2 1 , 2 2 2 1 , 2 1 2 1 1 − α − α − χ − = χ − = n X n X s n u s n l •• batas bawah:batas bawah:
•
• batas atas:batas atas:
Catatan:
Catatan: XXberdistribusi normalberdistribusi normal χ
χ22berdistribusi chi-berdistribusi chi-squaredsquared
Distribusi chi
Distribusi chi--squared tidak simetris:squared tidak simetris:
2 2 X X u s s − l≠ − n
n »»→→((nn––1) »1) »→→ distribusi mendekati distribusi distribusi mendekati distribusi simetris,
simetris, s
sXX22berada kira-berada kira-kira di tengahkira di tengah- -tengah rentang [ tengah rentang [LL,,UU].]. 2 2 α χ 2 2 1−α χ α − 1
Statistika Confidence Intervals 25
One
One
-
-
sided confidence intervals
sided confidence intervals
•
•
Hanya diinginkan satu sisi rentang keyakinan
Hanya diinginkan satu sisi rentang keyakinan
saja
saja
–
– batas bawah saja untuk rentang keyakinan µbatas bawah saja untuk rentang keyakinan µ
–
– batas atas saja untuk rentang keyakinan µbatas atas saja untuk rentang keyakinan µ
(
)
1 1 , 1prob L<θ = −α ⇒ l =X −t −αn−