PENGUJIAN HIPOTESIS DENGAN METODE BAYESIAN OBYEKTIF
Adi Setiawan
Program Studi Matematika Industri dan Statistika, Fakultas Sains dan Matematika Universitas Kristen Satya Wacana JlDiponegoro 52-60 Salatiga 50711, Indonesia
e-mail: [email protected]
Abstrak
Pengujian hipotesis merupakan hal yang sangat penting dalam inferensi statistika. Dalam makalah ini dibahas tentang bagaimana melakukan pengujian hipotesis dengan menggunakan metode Bayesian obyektif. Untuk menggambarkan penggunaan metode ini digunakan sampel yang diperoleh dari populasi yang berdistribusi Bernouli atau yang berdistribusi Normal. Studi simulasi dilakukan untuk memberikan gambaran yang lebih jelas penggunaan metode.
Kata kunci : pengujian hipotesis, Bayesian obyektif, reference prior, reference posterior,intrinsic discrepancy loss function,intrinsic statistic.
1. Pendahuluan
Metode Bayesian obyektif untuk menentukan estimasi titik dan estimasi interval (kredibel) telah dijelaskan berturut-turut dalam makalah Setiawan (2009a) dan Setiawan (2009b). Dalam makalah ini akan dijelaskan tentang pengujian hipotesis dengan menggunakan metode Bayesian obyektif. Selanjutnya sampel dari populasi yang berdistribusi Bernoulli digunakan untuk memberikan gambaran bagaimana metode ini digunakan.
2. Dasar Teori
Inferensi Bayesian sering kali dikritik karena mendasarkan diri pada pemilihan distribusi prior sehingga akan mempengaruhi kesimpulan yang diambil. Khususnya pemberian prior pada hipotesis nol dan hipotesis alternatif akan sangat janggal. Metode Bayesian obyektif yang digunakan dalam pengujian hipotesis diharapkan akan dapat mengatasi masalah ini. Dengan menggunakan metode ini, akan dihasilkan inferensi yang hanya tergantung pada data dan distribusi anggapan populasi yang menjadi asal sampel.
Diskrepansi intrinsik (intrínsic discrepancy) (p1,p2) antara dua fungsi densitas p1(x)
denganxX1danp2(x) denganxX2didefinisikan sebagai
( ( )| ( )), ( ( )| ( ))
min ) ,
(p1 p2 K p2 x p1 x K p1 x p2 x
dengan
X
dx x p
x p x p x p x p K
) (
) ( log ) ( )) ( | ) ( (
2 1 1
2
1 .
Untuk dua keluarga fungsi densitas
1( |), 1(), 1 p x x
M dan
2( |), 2(), 2 p x x
dapat didefinisikan diskrepansi intrinsik
Diskrepansi intrinsik diusulkan sebagai fungsi kerugian (loss function) obyektif untuk estimasi titik.
Misalkan bahwa gambaran yang sesuai dari tingkah laku probabilistik dari kuantitas randomxdiberikan oleh model
} Diskrepansi intrinsik antara p(x|,) dan keluarga densitas
} digunakan untuk menggambarkan tingkah laku kuantitas random x. Statistik intrinsik
(intrinsic statistic) didefinisikan sebagai
dengan *(,|x) adalah posterior referensi untuk parameter dari model
) , | (x
p bila *(,;0) adalah parameter yang menjadi perhatian. Apabila diinginkan untuk melakukan pengujian hipotesis H0 { = 0 } maka statistik
intrinsik merupakan ukuran dari kekuatan bukti melawan penggunaan model M0
dengan
(Juarez, 2004). Bernardo dan Rueda (2002) mengusulkan untuk menggunaka aturan sebagai berikut : jika d* 1 maka tidak ada bukti untuk menolak H0, jikad* 2,5
maka terdapat bukti lemah (mild) untuk menolak dan jikad* > 5 maka terdapat bukti kuat (strong) untuk menolakH0.
Metode di atas dapat diterapkan pada sampel berikut ini. Misalkan dimiliki x= ( x1,x2,
....,xn) yang terdiri dari pengamatan Bernoulli yang saling bebas dan tergantung pada
sehingga mempunyai fungsi kepadatan probabilitas
i
dengan xi = { 0, 1 }. Berdasarkan data x, akan dilakukan pengujian hipotesis nol
Dalam hal iniprior yang digunakan adalahpriorJeffry yaitu
2 1 , 2 1 )
(
Beta dan
reference posterior yang bersesuaian adalah
2 1 ,
2 1 )
|
( x Beta r n r
dengan
n
i i x r
1
. Selanjutnya diperoleh intrinsik statistik
x Beta r n r d
d
2 1 ,
2 1 )
, ( )
,
( 1
0 0
0 . (1)
Jika statistik intrinsik yang dihitung menggunakan persamaan (1) berdasarkan sampelx
lebih dari 5 maka terdapat bukti yang kuat untuk menolak H0:=0(Bernardo, 2009).
3. Studi Simulasi dan Pembahasan
Apabila berdasarkan ukuran sampel n dan statisik cukup t, akan dilakukan pengujian hipotesis bahwa H0 : = 0, maka dapat ditentukan nilai statistik intrinsik yang dapat
digunakan untuk ukuran penolakan hipotesisH0. Apabila statistik intrinsik lebih besar 5
maka dipunyai bukti yang kuat untuk menolak hipotesis H0. Pada Gambar 1 diberikan
nilai statistik intrinsik untuk ukuran sampel n=10 dan statistik cukupt=1. Berdasarkan Gambar 1, dapat disimpulkan bahwa untuk ukuran sampel n=10 dan statistik cukup t =1, hipotesis H0 : = 0 akan mempunyai nilai statistik intrinsik yang kecil jika 0
dekat dengan 0,1 dan nilai statistik intrinsik akan makin membesar jika0 jauh dari 0,1.
Interpretasi yang analog dapat dilakukan untuk hal yang serupa. Pada Gambar 2 diberikan nilai statistik intrinsik untuk ukuran sampeln=10 dan statistik cukupt=2, 4, 6, 8 berturut-turut untuk (a), (b), (c ) dan (d) serta 0 (0,1). Demikian juga cara yang
sama dapat dilakukan untukn=30 dan statistik cukup t=6, 12, 18, 24 berturut-turut untuk (a), (b), (c ) dan (d) serta 0(0,1). Hasil dari penggunaann=30 dapat dilihat
pada Gambar 3. Terlihat jelas dari Gambar 2 dan Gambar 3 bahwa makin besar ukuran sampelndan untuk statistik cukuptyang bersesuaian maka akan semakin besar statistik intrinsik yang diperoleh.
0.0 0.2 0.4 0.6 0.8 1.0
0
1
0
2
0
3
0
4
0
(a) n=10,t=1, Ho : theta=theta0, theta0 dalam (0,1)
theta
S
ta
ti
s
ti
k
In
tr
in
s
ik
0.0 0.2 0.4 0.6 0.8 1.0
(a) n=10,t=2, Ho : theta=theta0, theta0 dalam (0,1)
theta
(b) n=10, t=4, Ho : theta=theta0, theta0 dalam (0,1)
theta
(c) n=10, t=6, Ho : theta=theta0, theta0 dalam (0,1)
theta
(d) n=10, t=8, Ho : theta=theta0, theta0 dalam (0,1)
theta
Gambar 2. Nilai statistik intrinsik jika diberikan usuran sampeln= 10 dan statistik cukup (a)t=2, (b)t=4, (c)t=6 dan (d)t=8 serta hipotesis nol H0:=0dengan 0(0,1).
(a) n=30,t=6, Ho : theta=theta0, theta0 dalam (0,1)
theta
(b) n=30, t=12, Ho : theta=theta0, theta0 dalam (0,1)
theta
(c) n=30, t=18, Ho : theta=theta0, theta0 dalam (0,1)
theta
(d) n=30, t=24, Ho : theta=theta0, theta0 dalam (0,1)
theta
Gambar 3. Nilai statistik intrinsik jika diberikan usuran sampel n = 30 dan statistik cukup (a) t=6, (b)
Histogram 1000 nilai Statistik Intrinsik
Statistik Intrinsik
D
e
n
s
it
y
0 2 4 6 8
0
.0
0
.1
0
.2
0
.3
0
.4
0
.5
0
.6
Gambar 4. Histogram B=1000 nilai statistik intrinsik dari sampel yang digunakan untuk pengujian hipotesis H0: = 0,1 jika sampel ukuran sampel ukurann=100 dibangkitkan dari distribusi Bernoulli dengan parameter= 0,1.
Simulasi dilakukan dengan cara membangkitkan sampel ukurann = 100 yaitu x = (x1,
x2,..., xn ) dari distribusi Bernoulli dengan parameter = 0,1 sehingga akan diperoleh
statistik cukup
n
i i
x t
1
. Berdasarkan n dan t maka dapat ditentukan nilai intrinsik
statistik d untuk pengujian hipotesis H0 : = 0,1. Apabila hal ini diulang sebanyak
(a) theta =0,2
Statistik Intrinsik
D
e
n
s
it
y
0 5 10 15 20
0
.0
0
0
.0
4
0
.0
8
0
.1
2
(b) theta =0,4
Statistik Intrinsik
D
e
n
s
it
y
10 20 30 40 50 60
0
.0
0
0
.0
2
0
.0
4
(c) theta =0,6
Statistik Intrinsik
D
e
n
s
it
y
40 60 80 100 120
0
.0
0
0
0
.0
1
5
0
.0
3
0
(d) theta =0,8
Statistik Intrinsik
D
e
n
s
it
y
100 120 140 160 180
0
.0
0
0
0
.0
1
0
0
.0
2
0
Gambar 5. Histogram B=1000 nilai statistik intrinsik dari sampel yang digunakan untuk pengujian hipotesis H0 : = 0,1 jika sampel ukuran sampel ukuran n=100 dibangkitkan dari distribusi Bernoulli dengan parameter (a)= 0,2, (b) = 0,4, (c) = 0,6, dan (d) = 0,8.
4. Kesimpulan
Metode Bayesian obyektif dalam pengujian hipotesis dalam kasus sampel dianggap berasal dari populasi yang berdistribusi Bernuolli telah dijelaskan di atas. Penelitian ini dapat diperluas untuk kasus distribusi-distribusi yang biasa dikenal baik yang mempunyai parameternuisancemaupun yang tidak.
Daftar Pustaka
[1] Bernardo, J. dan R. Rueda (2002) Bayesian Hypotesis Testing : A Reference Approach,International Statistical Review70, 351-372.
[2] Juarez, M. A. ( 2004 ) Objective Bayesian Methods for Estimation and Hypothesis Testing, Valencia : University of Valencia.
[3] Setiawan, A. (2009a) Estimasi Titik Bayesian Obyektif, Prosiding Seminar Sains dan Pendidikan SainsIV FSM UKSW, Salatiga ISBN 978-979-1098-63-9.