PENDUGA SELANG KEPERCAYAAN NILAI TENGAH
DENGAN PENDEKATAN KLASIK, BAYES, DAN BOOTSTRAP
*Adji Achmad Rinaldo Fernandes, SSi, MSc **
ABSTRAK
Pada suatu penelitian, terkadang diamati karakteristik dari sebuah populasi (misalnya nilai tengah, ragam, median, maupun proporsi). Dengan berbagai keterbatasan dan kendala, tidak dimungkinkan mengamati keseluruhan dari elemen populasi. Langkah alternatif yaitu dilakukan pendugaan populasi dengan menggunakan sampel yang diambil secara acak dari sebuah populasi.
Pada penelitian ini dilakukan pendugaan selang nilai tengah satu populasi (). Terdapat tiga metode yang akan dikaji yaitu metode klasik, pendekatan bayes, dan pendekatan bootstrap. Penelitian ini difokuskan pada pendugaan nilai tengah menggunakan ketiga pendekatan dan membandingkan hasil yang diperoleh dari ketiga pendekatan tersebut.
Hasil pengujian menggunakan sebuah data satu populasi diperoleh penduga nilai tengah populasi ketiga metode relatif sama, di mana metode Bootstrap menghasilkan selang kepercayaan terkecil.
Kata kunci: selangkepercayaan, klasik, bayes, dan bootstrap
I. PENDAHULUAN
1. Latar Belakang
Keseluruhan pengamatan yang menjadi perhatian baik terhingga maupun takhingga menyusun apa yang disebut populasi. Pada suatu penelitian, terkadang diamati karakteristik dari sebuah populasi. Beberapa macam ukuran statistik digunakan untuk mengetahui karakteristik dari populasi, misalnya nilai tengah, ragam, median, atau proporsi.
Dalam inferensia statistik kita ingin memperoleh kesimpulan mengenai populasi, meskipun kita tidak mungkin atau tidak praktis untuk mengamati keseluruhan individu yang menyusun populasi. Dengan berbagai keterbatasan dan kendala, tidak dimungkinkan mengamati keseluruhan dari elemen populasi. Langkah alternatif yaitu dilakukan pendugaan populasi dengan menggunakan sampel yang diambil secara acak dari sebuah populasi.
Salah satu sistem pendugaan parameter populasi berdasarkan statistik sampel adalah dengan selang kepercayaan (confidence interval) di mana sistem ini menghasilkan dugaan parameter yang representatif.
Teori inferensia statistik mencakup semua metode yang digunakan dalam penarikan kesimpulan atau generalisasi mengenai suatu populasi. Kecenderungan yang terjadi pada masa kini dalam hal pendugaan suatu parameter populasi adalah terdapatnya perkembangan dari metode klasik yang mendasarkan kesimpulannya semata-mata pada informasi yang diperoleh dari suatu contoh acak yang ditarik dari populasi tersebut. Dua metode baru yang diangkat pada penelitian ini adalah metode Bayes dan Bootstrap. Metode Bayes menggunakan atau menggabungkan pengetahuan subyektif mengenai sebaran peluang parameter yang tidak diketahui dengan informasi yang diperoleh dari data sampel. Metode bootstrap menggunakan pendekatan klasik yang menggunakan pengulangan sampel.
2. Perumusan Masalah
Berdasarkan latar belakang di atas, permasalahan yang ingin dikemukakan adalah Bagaimana penggunaan pendugaan selang nilai tengah satu populasi dengan menggunakan metode klasik, pendekatan bayesian, dan pendekatan bootstrap dan perbandingan ketiga metode tersebut?
3. Tujuan dan Manfaat
Tujuan dari penelitian ini adalah menggunakan pendugaan selang nilai tengah satu populasi dengan menggunakan metode klasik, pendekatan bayesian, dan pendekatan boostrap dan perbandingan ketiga metode. Manfaat dari penelitian ini adalah agar para peneliti dapat menggunakan metode pendekatan bayesian dan pendekatan bootstrap sebagai alternatif dalam pendugaan parameter, selain metode klasik yang saat ini populer.
II. TINJAUAN PUSTAKA
1. Pendugaan Selang Kepercayaan dengan Metode Klasik
Populasi dari sebuah data diasumsikan berdistribusi normal dengan X N(µ, 2) di mana nilai harapan dari X adalah dengan nilai tengah µ dan ragam 2. Parameter populasi µ dan 2 tidak diketahui.
Nilai tengah contoh X dan ragam s2 adalah penduga dari nilai tengah dan ragam
populasi:
n i Xi n X 1 1 ˆ dan
n i Xi X n s 1 2 2 2 1 1 ˆ di mana Xi adalah peubah acak yang diambil secara acak dari suatu populasi. Nilai harapan dari rata-rata sampel adalah E( X ) = µ dan standar deviasi Se( X ) = n. Untuk ukuran sampel kecil (n < 30) maka populasi menyebar normal (X N(µ, 2)) dan 2 tidak diketahui dan diduga dengan s2, sehingga dapat ditulis:
n
s µ
X t
n-1
di mana tn-1 diperoleh dari distribusi t dengan derajat bebas sebesar n-1, sehingga diperoleh selang kepercayaan untuk nilai tengah adalah:
P(X t1/2,n1 s n < µ < X t1/2,n1 s n) = 95%
2. Pendugaan Selang Kepercayaan dengan Pendekatan Bayes
Pada pendekatan klasik, pendugaan selang kepercayaan berasal dari teori penarikan contoh asimptotik, di mana untuk pendekatan Bayes, pendugaan selang kepercayaan berasal dari distribusi posterior yang diperoleh dari bangkitan data contoh yang berasal dari data dan beberapa kepekatan distribusi prior dari parameter.
Pada level pertama dari model diasumsikan bahwa distribusi dari contoh adalah normal Level 1 (DATA): Xi N(µ, 2)
Pada level kedua, dispesifikasikan distribusi prior untuk μ Level 2 (PRIOR): µ N(μμ , 2μ )
Pada level ketiga atau terakhir, dispesifikasi distribusi hiperprior untuk 2, μμ, 2μ Level 3 (HYPERPRIOR): P(2), P(μμ) and P(2μ)
Pada pendekatan bayes ini, akan dibangkitkan sebuah contoh untuk parameter yang tak teramati µ(1), µ(2),…, µ(k) dari distribusi µ. Setiap pembangkitan contoh, dilakukan pendugaan distribusi posterior untuk µ dan dihitung nilai tengah posterior. Penduga selang kepercayaan nilai tengah dengan taraf kepercayaan 95% diperoleh dari persentil ke 2.5% dan 97.5% dari simulasi.
3. Pendugaan Selang Kepercayaan dengan Pendekatan Bootstrap
Pendekatan bootstrap ini menggunakan metode resampling (pengambilan contoh berulang). Diasumsikan bahwa distribusi dari data tidak diketahui. Pandang x1,x2,...,xn adalah
contoh acak dari F, yang merumakan distribusi yang tidak diketahui, di mana =(F) adalah parameter dan ˆT(x1,....,xn) adalah pendugaan untuk . Penduga ˆ* T(x1*,....,xn* ) yang
diperoleh dari contoh bootstrap (x ,....,x * )
n *
1 dinamakan replikasi bootstrap untuk ˆ.
Algoritma yang digunakan untuk menghitung selang kepercayaan adalah sebagai berikut: a) Bangkitkan B contoh bootstrap x (b)
x (b),...,x *(b)
n *
*
1
dengan pengulangan dari
n
x ,..., x ,
x1 2 , di mana n adalah ukuran contoh, dan b = 1, …., B di mana B adalah
pengulangan bootstrap. Dalam penelitian ini digunakan B sebesar 1000. b) Hitung replikasi bootstrap ˆ*(b)T(x*(b)), b=1,…, B
c) Dengan metode pendugaan maximum likelihood diperoleh
B b * * ˆ (b) B ˆ 1 1
d) Pendugaan selang kepercayaan 95% diperoleh dari persentil ke 2,5% dan 97,5% untuk masing-masing batas bawah dan batas atas selang
III. METODE PENELITIAN
Pada penelitian ini menggunakan data skor permainan bowling yang disajikan secara lengkap pada Tabel 1.
Tabel 1: Data Skor Permainan Bowling
No Skor No Skor 1 93 12 72 2 119 13 118 3 110 14 73 4 72 15 102 5 99 16 122 6 85 17 70 7 53 18 81 8 70 19 130 9 66 20 97 10 142 21 89 11 63 22 27
Dengan menggunakan tiga metode yaitu klasik, bayes dan bootstrap dilakukan pendugaan selang kepercayaan satu populasi. Software yang digunakan adalah SPLUS dan Winbugs:
IV. HASIL DAN PEMBAHASAN
standar deviasi sebesar 5,90. Selang kepercayaan 95% untuk pendugaan nilai tengah populasi adalah [76,51; 101.05]. 20 40 60 80 100 120 140 160 0 2 4 6 data data 0 50 100 150 0. 0 0. 00 2 0. 00 4 0. 00 6 0. 00 8 0. 01 0 0. 01 2 0. 01 4
Gambar 1: Histogram dan Fungsi Kepekatan Data 2. Pendugaan Selang Kepercayaan dengan Pendekatan Bayes
Pendekatan Bayes ini menggunakan software Winbugs. Pertama, didefinisikan model data dan taksiran nilai awal. Berikutnya, dilakukan simulasi dengan iterasi sebesar 10000. Gambar 2 menunjukan nilai tengah yang diperoleh pada setiap simulasi. Bagian terakhir, digunakan analisis berdasarkan iterasi ke 1001 sampai 10000.
mu iteration 1000 2500 5000 7500 10000 40.0 60.0 80.0 100.0 120.0
Gambar 2: Trace plot untuk nilai tengah populasi (setelah pembuangan 1000 observasi pertama)
Pendugaan fungsi kepekatan untuk distribusi posterior untuk nilai tengah populasi disajikan pada Gambar 3. Pendugaan selang kepercayaan nilai tengah populasi diperoleh dari nilai kuantil 2,5% dan 97,5% dari hasil simulasi.
mu sample: 9001 40.0 60.0 80.0 100.0 0.0 0.02 0.04 0.06 0.08
Gambar 3: Fungsi kepekatan pada Distribusi Posterior untuk nilai tengah populasi
Penduga nilai tengah distribusi posterior adalah 88,58 dan standar deviasi adalah 6,18. Selang kepercayaan 95% untuk nilai tengah populasi adalah [76,46; 100,30].
3. Pendugaan Selang Kepercayaan dengan Pendekatan Bootstrap
Pendugaan menggunakan Maximum Likelihood pada pendekatan Bootstrap sebesar 88,78 dengan standar deviasi sebesar 5,75. Selang kepercayaan 95% untuk nilai tengah populasi adalah [77,50; 99,95]. Gambar 4 menunjukkan histogram dan fungsi kepekatan untuk nilai tengah contoh berdasarkan hasil 1000 pengulangan bootstrap.
70 80 90 100 110 0 20 0 40 0 60 0 80 0 10 00 12 00 14 00 theta.x theta dx $y 70 80 90 100 110 0. 0 0. 02 0. 04 0. 06
Gambar 4: Histogram dan Fungsi Kepekatan Nilai Tengah Sampel Berdasarkan 1000 Pengulangan Bootstrap
4. Perbandingan Hasil Metode Klasik, Bayes dan Bootstrap
Hasil dari ketiga metode disajikan lengkap pada Tabel berikut ini:
Tabel 1: Pendugaan Nilai Tengah, Standar Deviasi dan Selang Kepercayaan Metode Klasik, Bayes dan Bootstrap
Metode Tengah Nilai Standar Deviasi Selang Kepercayaan
Batas Bawah Batas Atas Lebar
Klasik 88,77 5,90 76,51 101,05 24,54
Bayes 88,58 6,18 76,46 100,30 23,84
Bootstrap 88,78 5,74 77,50 99,95 22,45
Tabel 1 menunjukkan nilai tengah yang diperoleh dari ketiga pendekatan hampir sama, terutama pada metode klasik dan bootstrap. Demikian pula untuk standar deviasi, di mana untuk metode Bayes memiliki standar deviasi terbesar, dan metode Bootstrap memiliki standar deviasi terkecil. Demikian pula untuk selang kepercayaan, di mana untuk metode Bootstrap memiliki lebar selang kepercayaan terkecil.
Perbedaan utama dari ketiga metode adalah: 1) pada metode klasik dan bayes diperlukan asumsi distribusi yang melandasi data, sedangkan pada metode bootstrap tidak diasumsikan data berdistribusi tertentu. 2) Metode klasik diperoleh dari multiplikasi dengan nilai kritis. Hal ini menyebabkan selang kepercayaan yang dihasilkan adalah simetrik dengan penduga nilai tengah. Sedangkan untuk metode Bayes dan Bootstrap, pendekatan selang kepercayaan menggunakan pendekatan kuantil ke 2,5% dan 97,5% yang akan menghasilkan selang kepercayaan yang tidak simetris.
V. PENUTUP
Pendugaan selang kepercayaan dapat digunakan dengan metode Klasik, Bayes dan Bootstrap. Pada aplikasi dengan menggunakan data satu populasi diperoleh ketiga metode relatif hampir sama, di mana metode Bootstrap memiliki lebar selang kepercayaan yang paling kecil, mengindikasikan bahwa metode ini lebih teliti dan direkomendasikan untuk digunakan.
DAFTAR PUSTAKA
Dukic, V., dan Hogan, J.W. A hierarchical bayesian approach to modeling embryo implantation
following in vitro fertilization.
http://biostatistics.oxfordjournals.org/cgi/reprint/3/3/361.pdf. Akses Desember 2007. Akses Desember 2007.
Friedman, N., Goldszmidt, M., and Wyner, A. Data analysis with bayesian networks: a bootstrap approach. Http://www.cs.huji.ac.il/~nir/Abstracts/FGW2.html. Akses Desember 2007.
Matthew, J. B., Falciani, F., Ghahramani, Z., Rangel, C., dan Wild, D.L.. A Bayesian approach to reconstructing genetic regulatory networks with hidden factors. Http://bioinformatics.oxfordjournals.org/cgi/content/full/21/3/349. Akses Desember 2007.
Lampiran 1. Kode Splus dan Winbugs Kode Splus untuk Metode Klasik
data<-c(93,119,110,72,99,85,53,70,66,142,63,72,118,73,102,122,70,81,130,97,89,27 )
par(mfrow=c(1,2))
hist(data,col=0,nclass=7) # histogram of replicates dx<-density(data) # density estimate
data<-dx$x
plot(data,dx$y,type="l")
s.data<-sum(data) # sum the data
ssq.data<-sum(data^2) # sum of square the data n<-length(data) # sample size
ml.x<-s.data/n # maximum likelihood estimator for mean
ml.sd<-sqrt((ssq.data-s.data^2/n)/(n-1)) # maximum likelihood estimator for standard deviation
ml.se<-ml.sd/sqrt(n) # standard error df<-n-1 # degree of freedom CIL<-ml.x-qt(0.975,df)*ml.se # lower limit CI CIU<-ml.x+qt(0.975,df)*ml.se # upper limit CI ml.x
ml.se CIL CIU
Kode Winbugs untuk Metode Bayes
model { for( i in 1 : N ) { data[i] ~ dnorm(mu,tau.c) } tau.c ~ dgamma(0.001,0.001) mu ~ dnorm(alpha,tau.alpha) alpha ~ dnorm(0.0,1.0E-6) tau.alpha ~ dgamma(0.001,0.001) } list(N=22, data=c(93,119,110,72,99,85,53,70,66,142,63,72,118,73,102,122,70,81,130,97,89, 27))
Kode Splus untuk Metode Bootstrap
data<-c(93,119,110,72,99,85,53,70,66,142,63,72,118,73,102,122,70,81,130,97, 89,27)
B<-10000 # number of bootstrap theta.x<-c(1:B) # vector to keep the theta for (i in 1:B)
{
data.boot<-sample(data,size=n,replace=T) # draw non-parametric bootstrap sample
theta.x[i]<-mean(data.boot) # calculate theta }
mu<-mean(theta.x) # mean of theta
sd<-stdev(theta.x) # standard deviation of theta CIL<-quantile(theta.x,probs=0.025) # lower limit confidence interval CIU<-quantile(theta.x,probs=0.975) # upper limit confidence interval mu
sd CIL CIU
par(mfrow=c(1,2))
hist(theta.x,col=0,nclass=n) # histogram of replicates dx<-density(theta.x) # density estimate
theta<-dx$x