ESTIMASI TITIK BAYESIAN OBYEKTIF
Adi Setiawan (adi_setia_03@yahoo.com)Program Studi Matematika, Fakultas Sains dan Matematika
Universitas Kristen Satya Wacana JlDiponegoro 52-60 Salatiga 50711, Indonesia
Abstrak
Estimasi titik Bayesian mendasarkan diri pada pemilihan prior dan loss function. Dalam estimasi titik Bayesian obyektif dipilih prior Jeffry dan menggunakan intrinsic discrepancy loss functionyang nantinya akan mempunyai pengaruh minimum dari data pada distribusi posterior. Estimator titik Bayesian obyektif akan memberikan estimasi tentang parameter populasi yang hanya didasarkan pada anggapan distribusi populasi dan data. Dalam makalah ini, dijelaskan bagaimana metode Bayesian obyektif digunakan untuk estimasi titik pada parameter populasi yang berdistribusi Bernoulli.
Kata kunci : distribusi prior, prior Jeffry loss function, distribusi posterior, intrinsic discrepancy loss function,estimasi titik Bayesian obyektif.
1.Pendahuluan
Estimasi titik Bayesian mendasarkan diri pada pemilihan prior dan loss
function. Dalam makalah ini akan dipaparkan tentang estimasi titik Bayesian obyektif
akan memberikan estimasi tentang parameter populasi yang hanya didasarkan pada anggapan distribusi populasi dan data. Pada dasar teori diberikan penjelasan tentang
reference prior, reference posterior, descrepancy intrinsic, dan instrinsic statistic.
Studi simulasi digunakan untuk memberikan penjelasan dari dasar teori yang sudah dipaparkan.
2.Dasar Teori
Paradigma Bayesian menyatakan bahwa hasil dari sembarang masalah inferensi (distribusi posterior) merupakan gabungan dari informasi yang disediakan oleh data dan informasi prior relevan yang tersedia. Akan tetapi jika tidak ada informasi prior yang tersedia maka sangat beralasan untuk memilih fungsi prior yang telatif uninformative artinya distribusi prior yang memberikan pengaruh minimum pada inferensi posterior. Secara lebih formal, misalkan bahwa mekanisme probabilitas yang membangkitkan data yang tersedia x dianggap sebagai p(x|) untuk suatu
dan kuantitas yang menjadi perhatian adalah fungsi yang bernilai real () dari . Dengan tanpa menghilangkan keumuman, misalkan model probabilitas yang digunakan berbentuk {p(x|,)} dengan adalah parameternuisance yang dipilih. Dalam hal ini diperlukan untuk mengidentifikasi fungsi prior bersama (,) yang akan mempunyai pengaruh minimal pada distribusi posterior marginal dengan kuantitas yang menjadi perhatianyaitu
( |x) p(x| , ) ( , )d
yang dapat memberikan pengaruh minimal pada distribusi posterior. Dalam kasus dimensi satu, reference prior merupakan prior Jeffry. Dengan menggunakan prior ini maka penyelesaian masalah estimasi hanya tergantung pada model anggapan dan data pengamatan. Dengan alasan ini maka estimasi titik yang menggunakan metode ini dinamakan sebagai estimasi titik Bayesian obyektif (Bernardo dan Juarez, 2003).
Diskrepansi intrinsik (intrínsic discrepancy) (p1, p2) antara dua fungsi densitasp1(x) denganxX1danp2(x) denganxX2didefinisikan sebagai
Untuk dua keluarga fungsi densitas
dapat didefinisikan diskrepansi intrinsik
( | ), ( | )
Diskrepansi intrinsik diusulkan sebagai fungsi kerugian ( loss function ) obyektif untuk estimasi titik. Misalkan bahwa deskripsi yang sesuai dari tingkah laku probabilistik dari kuantitas randomxdiberikan oleh model
} Diskrepansi intrinsik antara p(x|,) dan keluarga densitas
} digunakan untuk menggambarkan tingkah laku kuantitas random x. Didefinisikan
intrinsik statistik (intrinsic statistic) sebagai
dengan *(,|x) adalah posterior referensi untuk parameter dari model
) , | (x
p bila *(,;0) adalah parameter yang menjadi perhatian. Intrinsik
statistik merupakan ukuran dari kekuatan bukti melawan penggunaanp(x|0,) sebagai proxy untuk p(x|,). Proxy terbaik dicapai pada suatu nilai yang menghasilkan kerugian terkecil.
Misalkan {p(x|,),x,,} adalah model parametrik yang sesuai untuk menggambarkan tingkah laku probabilistik dari kuantitas random x.
)
Metode yang telah dijelaskan di atas dapat diterapkan pada data hasil sampel berikut ini. Misalkan dimiliki data x= { x1,x2, ....,xn } yang terdiri dari pengamatan
Bernoulli yang saling bebas dan tergantung padasehingga x
dengan x = { 0, 1 }. Mudah dibuktikan bahwa Kullback-Leibler divergence antara )
dan diskrepansi intrinsik antara ( | e)
x
Dalam hal ini prior Jeffry adalah
Beta danreference posterior yang
bersesuaian adalah
diperoleh intrinsik statistik
dan estimator titik Bayesian obyektif adalah * yang meminimumkan intrinsik statistik yaitu
yang dengan mudah dapat ditentukan dengan menggunakan integrasi numerik satu dimensi (Bernardo, 2009).
3.Studi Simulasi dan Pembahasan
Pada persamaan (1) terlihat bahwa intrinsik statistik ditentukan oleh n dan r
sehingga dalam studi simulasi ini diambil beberapa nilai ndanr. Apabila diketahui n
dan r maka estimator titik Bayesian obyektif dapat ditentukan dengan menggunakan persamaan (2). Tabel 1 memberikan hasil estimasi titik Bayesian obyektif * jika diberikan berturut-turut n = 10, 50, 100, 1000 dan statistik cukup untuk yaitu r. Terlihat bahwa untuk r = 0 estimasi titik Bayesian obyektif tidak memberikan nilai nol dan berarti hal ini kontras dengan estimasi titik dengan metode MLE (maximum
likelihood estimator) yang bernilai nol. Hal ini dapat dijelaskan bahwa jika kita
Tabel 1. Hasil estimasi titik Bayesian obyektif untuk* jika diberikanndanr.
r
n
0 2 4 6 8
10 0,0399 0,2113 0,4012 0,5908 0,7727
r
n
0 10 20 30 40
50 0,0119 0,2026 0,4006 0,5980 0,7941
r
n
0 20 40 60 80
100 0,0075 0,2014 0,4004 0,5990 0,7970
r
n
0 200 400 600 800
1000 0,0024 0,2001 0,4000 0,5999 0,7997
0.0 0.2 0.4 0.6 0.8 1.0
Gambar 1. Grafik hubungan antara statistik intrinsik pada interval (0,1) untukn=100 dan r masing-masing 20 (kiri atas), 40 (kanan atas), 60 (kiri bawah), 80 (kanan bawah).
Simulasi Monte Carlo dilakukan dengan cara membangkitkan sampel ukuran
Histogram dari Estimasi Titik
0.10 0.20 0.30
0
Histogram dari Estimasi Titik
theta = 0.4
0.25 0.35 0.45 0.55
0
Histogram dari Estimasi Titik
theta = 0.6
0.45 0.55 0.65 0.75
0
Histogram dari Estimasi Titik
theta = 0.8
0.70 0.80 0.90
0
Gambar 2. Histogram dari estimasi titik dari sampel hasil simulasi bila digunakann= 100 dan= 0,2; 0,4; 0,6 dan 0,8.
Histogram dari Estimasi Titik
theta = 0.2
0.16 0.18 0.20 0.22 0.24
0
Histogram dari Estimasi Titik
theta = 0.4
0.36 0.38 0.40 0.42 0.44
0
Histogram dari Estimasi Titik
theta = 0.6
0.56 0.58 0.60 0.62 0.64
0
Histogram dari Estimasi Titik
theta = 0.8
0.76 0.78 0.80 0.82 0.84
0
4.Kesimpulan dan Saran
Dalam makalah ini telah dijelaskan tentang bagaimana mengestimasi parameter populasi berdasarkan sampel bila dianggap bahwa populasi mengikuti distribusi tertentu yang diketahui dan hanya tergantung pada parameter yang tidak diketahui. Dengan menggunakan metode Bayesian obyektif maka estimasi titik yang diperoleh nantinya hanya didasarkan pada anggapan distribusi populasi dan data. Penelitian ini dapat diperluas untuk distribusi anggapan yang lain maupun estimasi interval dengan metode Bayesian obyektif.
5.Daftar Pustaka
[1] Bernardo, J. M. dan M. A. Juarez, 2003, Intrinsic Estimation, Bayesian
Statistics 7, Oxford : University Press.
[2] Bernardo, J. M. and Rueda, R. , 2002, Bayesian hypothesis testing: A reference approach.International Statistical Review70, 351-372.
[3] Bernardo, J. M., 2009, Statistics : Bayesian Methodology in Statistics,
Comprehensive Chemometrics ( S. Brown, R. Tauler dan R. Walczak eds)
Oxford : Elsevier.
[4] Juarez, M. A. , 2004,Objective Bayesian Methods for Estimation and Hypothesis