M00417

(1)

ESTIMASI TITIK BAYESIAN OBYEKTIF

Adi Setiawan (adi_setia_03@yahoo.com)

Program Studi Matematika, Fakultas Sains dan Matematika

Universitas Kristen Satya Wacana JlDiponegoro 52-60 Salatiga 50711, Indonesia

Abstrak

Estimasi titik Bayesian mendasarkan diri pada pemilihan prior dan loss function. Dalam estimasi titik Bayesian obyektif dipilih prior Jeffry dan menggunakan intrinsic discrepancy loss functionyang nantinya akan mempunyai pengaruh minimum dari data pada distribusi posterior. Estimator titik Bayesian obyektif akan memberikan estimasi tentang parameter populasi yang hanya didasarkan pada anggapan distribusi populasi dan data. Dalam makalah ini, dijelaskan bagaimana metode Bayesian obyektif digunakan untuk estimasi titik pada parameter populasi yang berdistribusi Bernoulli.

Kata kunci : distribusi prior, prior Jeffry loss function, distribusi posterior, intrinsic discrepancy loss function,estimasi titik Bayesian obyektif.

1.Pendahuluan

Estimasi titik Bayesian mendasarkan diri pada pemilihan prior dan loss

function. Dalam makalah ini akan dipaparkan tentang estimasi titik Bayesian obyektif

akan memberikan estimasi tentang parameter populasi yang hanya didasarkan pada anggapan distribusi populasi dan data. Pada dasar teori diberikan penjelasan tentang

reference prior, reference posterior, descrepancy intrinsic, dan instrinsic statistic.

Studi simulasi digunakan untuk memberikan penjelasan dari dasar teori yang sudah dipaparkan.

2.Dasar Teori

Paradigma Bayesian menyatakan bahwa hasil dari sembarang masalah inferensi (distribusi posterior) merupakan gabungan dari informasi yang disediakan oleh data dan informasi prior relevan yang tersedia. Akan tetapi jika tidak ada informasi prior yang tersedia maka sangat beralasan untuk memilih fungsi prior yang telatif uninformative artinya distribusi prior yang memberikan pengaruh minimum pada inferensi posterior. Secara lebih formal, misalkan bahwa mekanisme probabilitas yang membangkitkan data yang tersedia x dianggap sebagai p(x|) untuk suatu

  dan kuantitas yang menjadi perhatian adalah fungsi yang bernilai real () dari . Dengan tanpa menghilangkan keumuman, misalkan model probabilitas yang digunakan berbentuk {p(x|,)} dengan  adalah parameternuisance yang dipilih. Dalam hal ini diperlukan untuk mengidentifikasi fungsi prior bersama (,) yang akan mempunyai pengaruh minimal pada distribusi posterior marginal dengan kuantitas yang menjadi perhatianyaitu





      



( |x) p(x| , ) ( , )d

(2)

yang dapat memberikan pengaruh minimal pada distribusi posterior. Dalam kasus dimensi satu, reference prior merupakan prior Jeffry. Dengan menggunakan prior ini maka penyelesaian masalah estimasi hanya tergantung pada model anggapan dan data pengamatan. Dengan alasan ini maka estimasi titik yang menggunakan metode ini dinamakan sebagai estimasi titik Bayesian obyektif (Bernardo dan Juarez, 2003).

Diskrepansi intrinsik (intrínsic discrepancy) (p1, p2) antara dua fungsi densitasp1(x) denganxX₁danp₂(x) denganxX₂didefinisikan sebagai

Untuk dua keluarga fungsi densitas



 



dapat didefinisikan diskrepansi intrinsik



( | ), ( | )



Diskrepansi intrinsik diusulkan sebagai fungsi kerugian ( loss function ) obyektif untuk estimasi titik. Misalkan bahwa deskripsi yang sesuai dari tingkah laku probabilistik dari kuantitas randomxdiberikan oleh model

} Diskrepansi intrinsik antara p(x|,) dan keluarga densitas

} digunakan untuk menggambarkan tingkah laku kuantitas random x. Didefinisikan

intrinsik statistik (intrinsic statistic) sebagai



dengan *(,|x) adalah posterior referensi untuk parameter dari model

) , | (x  

p bila *(,;0) adalah parameter yang menjadi perhatian. Intrinsik

statistik merupakan ukuran dari kekuatan bukti melawan penggunaanp(x|0,) sebagai proxy untuk p(x|,). Proxy terbaik dicapai pada suatu nilai yang menghasilkan kerugian terkecil.

Misalkan {p(x|,),x,,} adalah model parametrik yang sesuai untuk menggambarkan tingkah laku probabilistik dari kuantitas random x.

(3)

)

Metode yang telah dijelaskan di atas dapat diterapkan pada data hasil sampel berikut ini. Misalkan dimiliki data x= { x₁,x₂, ....,x_n } yang terdiri dari pengamatan

Bernoulli yang saling bebas dan tergantung padasehingga x

dengan x = { 0, 1 }. Mudah dibuktikan bahwa Kullback-Leibler divergence antara )

dan diskrepansi intrinsik antara ( | e)

x

Dalam hal ini prior Jeffry adalah



 Beta danreference posterior yang

bersesuaian adalah

diperoleh intrinsik statistik



dan estimator titik Bayesian obyektif adalah * yang meminimumkan intrinsik statistik yaitu

yang dengan mudah dapat ditentukan dengan menggunakan integrasi numerik satu dimensi (Bernardo, 2009).

3.Studi Simulasi dan Pembahasan

Pada persamaan (1) terlihat bahwa intrinsik statistik ditentukan oleh n dan r

sehingga dalam studi simulasi ini diambil beberapa nilai ndanr. Apabila diketahui n

dan r maka estimator titik Bayesian obyektif dapat ditentukan dengan menggunakan persamaan (2). Tabel 1 memberikan hasil estimasi titik Bayesian obyektif * jika diberikan berturut-turut n = 10, 50, 100, 1000 dan statistik cukup untuk  yaitu r. Terlihat bahwa untuk r = 0 estimasi titik Bayesian obyektif tidak memberikan nilai nol dan berarti hal ini kontras dengan estimasi titik dengan metode MLE (maximum

likelihood estimator) yang bernilai nol. Hal ini dapat dijelaskan bahwa jika kita

(4)

Tabel 1. Hasil estimasi titik Bayesian obyektif untuk* jika diberikanndanr.

r

n

0 2 4 6 8

10 0,0399 0,2113 0,4012 0,5908 0,7727

r

n

0 10 20 30 40

50 0,0119 0,2026 0,4006 0,5980 0,7941

r

n

0 20 40 60 80

100 0,0075 0,2014 0,4004 0,5990 0,7970

r

n

0 200 400 600 800

1000 0,0024 0,2001 0,4000 0,5999 0,7997

0.0 0.2 0.4 0.6 0.8 1.0

Gambar 1. Grafik hubungan antara statistik intrinsik pada interval (0,1) untukn=100 dan r masing-masing 20 (kiri atas), 40 (kanan atas), 60 (kiri bawah), 80 (kanan bawah).

Simulasi Monte Carlo dilakukan dengan cara membangkitkan sampel ukuran

(5)

Histogram dari Estimasi Titik

0.10 0.20 0.30

0

theta = 0.4

0.25 0.35 0.45 0.55

0

theta = 0.6

0.45 0.55 0.65 0.75

0

theta = 0.8

0.70 0.80 0.90

0

Gambar 2. Histogram dari estimasi titik dari sampel hasil simulasi bila digunakann= 100 dan= 0,2; 0,4; 0,6 dan 0,8.

theta = 0.2

0.16 0.18 0.20 0.22 0.24

0

theta = 0.4

0.36 0.38 0.40 0.42 0.44

0

theta = 0.6

0.56 0.58 0.60 0.62 0.64

0

theta = 0.8

0.76 0.78 0.80 0.82 0.84

0

(6)

4.Kesimpulan dan Saran

Dalam makalah ini telah dijelaskan tentang bagaimana mengestimasi parameter populasi berdasarkan sampel bila dianggap bahwa populasi mengikuti distribusi tertentu yang diketahui dan hanya tergantung pada parameter yang tidak diketahui. Dengan menggunakan metode Bayesian obyektif maka estimasi titik yang diperoleh nantinya hanya didasarkan pada anggapan distribusi populasi dan data. Penelitian ini dapat diperluas untuk distribusi anggapan yang lain maupun estimasi interval dengan metode Bayesian obyektif.

5.Daftar Pustaka

[1] Bernardo, J. M. dan M. A. Juarez, 2003, Intrinsic Estimation, Bayesian

Statistics 7, Oxford : University Press.

[2] Bernardo, J. M. and Rueda, R. , 2002, Bayesian hypothesis testing: A reference approach.International Statistical Review70, 351-372.

[3] Bernardo, J. M., 2009, Statistics : Bayesian Methodology in Statistics,

Comprehensive Chemometrics ( S. Brown, R. Tauler dan R. Walczak eds)

Oxford : Elsevier.

[4] Juarez, M. A. , 2004,Objective Bayesian Methods for Estimation and Hypothesis