• Tidak ada hasil yang ditemukan

ESTIMASI TITIK BAYESIAN OBYEKTIF

N/A
N/A
Protected

Academic year: 2021

Membagikan "ESTIMASI TITIK BAYESIAN OBYEKTIF"

Copied!
6
0
0

Teks penuh

(1)

ESTIMASI TITIK BAYESIAN OBYEKTIF

Adi Setiawan ([email protected])

Program Studi Matematika, Fakultas Sains dan Matematika

Universitas Kristen Satya Wacana Jl Diponegoro 52-60 Salatiga 50711, Indonesia

Abstrak

Estimasi titik Bayesian mendasarkan diri pada pemilihan prior dan loss function. Dalam estimasi titik Bayesian obyektif dipilih prior Jeffry dan menggunakan intrinsic discrepancy loss function yang nantinya akan mempunyai pengaruh minimum dari data pada distribusi posterior. Estimator titik Bayesian obyektif akan memberikan estimasi tentang parameter populasi yang hanya didasarkan pada anggapan distribusi populasi dan data. Dalam makalah ini, dijelaskan bagaimana metode Bayesian obyektif digunakan untuk estimasi titik pada parameter populasi yang berdistribusi Bernoulli.

Kata kunci : distribusi prior, prior Jeffry loss function, distribusi posterior, intrinsic discrepancy loss function, estimasi titik Bayesian obyektif.

1. Pendahuluan

Estimasi titik Bayesian mendasarkan diri pada pemilihan prior dan loss

function. Dalam makalah ini akan dipaparkan tentang estimasi titik Bayesian obyektif

akan memberikan estimasi tentang parameter populasi yang hanya didasarkan pada anggapan distribusi populasi dan data. Pada dasar teori diberikan penjelasan tentang

reference prior, reference posterior, descrepancy intrinsic, dan instrinsic statistic.

Studi simulasi digunakan untuk memberikan penjelasan dari dasar teori yang sudah dipaparkan.

2. Dasar Teori

Paradigma Bayesian menyatakan bahwa hasil dari sembarang masalah inferensi (distribusi posterior) merupakan gabungan dari informasi yang disediakan oleh data dan informasi prior relevan yang tersedia. Akan tetapi jika tidak ada informasi prior yang tersedia maka sangat beralasan untuk memilih fungsi prior yang telatif uninformative artinya distribusi prior yang memberikan pengaruh minimum pada inferensi posterior. Secara lebih formal, misalkan bahwa mekanisme probabilitas yang membangkitkan data yang tersedia x dianggap sebagai p(x|) untuk suatu    dan kuantitas yang menjadi perhatian adalah fungsi yang bernilai real () dari . Dengan tanpa menghilangkan keumuman, misalkan model probabilitas yang digunakan berbentuk {p(x|,)} dengan  adalah parameter nuisance yang dipilih. Dalam hal ini diperlukan untuk mengidentifikasi fungsi prior bersama (,) yang akan mempunyai pengaruh minimal pada distribusi posterior marginal dengan kuantitas yang menjadi perhatian yaitu

      

( |x) p(x| , ) ( , )d

sehingga akan memenuhi istilah “would let the data speak for themselves”. Bernardo dan Rueda (2002) mengusulkan untuk menggunakan reference prior sebagai prior

(2)

yang dapat memberikan pengaruh minimal pada distribusi posterior. Dalam kasus dimensi satu, reference prior merupakan prior Jeffry. Dengan menggunakan prior ini maka penyelesaian masalah estimasi hanya tergantung pada model anggapan dan data pengamatan. Dengan alasan ini maka estimasi titik yang menggunakan metode ini dinamakan sebagai estimasi titik Bayesian obyektif (Bernardo dan Juarez, 2003).

Diskrepansi intrinsik (intrínsic discrepancy) (p1, p2) antara dua fungsi densitas p1(x) dengan x X1dan p2(x) dengan x X2didefinisikan sebagai

( ( )| ( )), ( ( )| ( ))

min ) , (p1 p2K p2 x p1 x K p1 x p2 x  dengan

X dx x p x p x p x p x p K ) ( ) ( log ) ( )) ( | ) ( ( 2 1 1 2 1 .

Untuk dua keluarga fungsi densitas

 

1( |), 1(), 1 p x x M dan

 

2( |), 2(), 2 p x x M

dapat didefinisikan diskrepansi intrinsik

( | ), ( | )

min ) , ( * 1 2 , 2 1       p x p x M M      .

Diskrepansi intrinsik diusulkan sebagai fungsi kerugian ( loss function ) obyektif untuk estimasi titik. Misalkan bahwa deskripsi yang sesuai dari tingkah laku probabilistik dari kuantitas random x diberikan oleh model

} , , ), , | ( {p x   x  . Diskrepansi intrinsik antara p(x|,) dan keluarga densitas

} ), , | ( {p x 0   adalah ) , ; , ( inf ) ; , ( * 0 0 0 0             dengan

( , | , ) , ( , | , )

min ) , ; , (  0000     00   K K .

Misalkan {p(x|,),x,,} adalah model parametrik yang dapat digunakan untuk menggambarkan tingkah laku kuantitas random x. Didefinisikan intrinsik statistik (intrinsic statistic) sebagai

 

               x E xx d d d( 0| ) [ *| ] *( , ; 0) *( , | ) *

dengan *(,|x) adalah posterior referensi untuk parameter dari model )

, | (x  

p bila *(,;0) adalah parameter yang menjadi perhatian. Intrinsik statistik merupakan ukuran dari kekuatan bukti melawan penggunaanp(x|0,) sebagai proxy untuk p(x|,). Proxy terbaik dicapai pada suatu nilai yang menghasilkan kerugian terkecil.

Misalkan {p(x|,),x,,} adalah model parametrik yang sesuai untuk menggambarkan tingkah laku probabilistik dari kuantitas random x. Estimator intrinsik (intrinsic estimator) atau estimasi titik Bayesian obyektif didefinisikan sebagai yaitu parameter yang meminimalkan statistik intrinsik

(3)

) | ( min arg ) ( * * ~ ~ x d x        . (Juarez, 2004).

Metode yang telah dijelaskan di atas dapat diterapkan pada data hasil sampel berikut ini. Misalkan dimiliki data x = { x1, x2, ...., xn } yang terdiri dari pengamatan Bernoulli yang saling bebas dan tergantung pada sehingga

x x  1 ) 1 (  

dengan x = { 0, 1 }. Mudah dibuktikan bahwa Kullback-Leibler divergence antara ) | (x2 p dan p(x|1) adalah )] 1 /( ) 1 ( log[ ) 1 ( ] / log[ ) | (21 112  1 1 2 K

dan diskrepansi intrinsik antara ( | e)

x

p  dan p(x|) dapat dinyatakan sebagai

      lain yang K K n e e e e e ) | ( ) 1 , ( ) | ( ) , (           .

Dalam hal ini prior Jeffry adalah        2 1 , 2 1 ) ( 

Beta dan reference posterior yang

bersesuaian adalah           2 1 , 2 1 ) | ( x Betar n r  dan

  n i i x r 1 . Selanjutnya diperoleh intrinsik statistik

      x Beta r n r d d e e      

2 1 , 2 1 ) , ( ) , ( 1 0

dan estimator titik Bayesian obyektif adalah * yang meminimumkan intrinsik statistik yaitu ) | ( min arg ) ( * * ) 1 , 0 ( x d x e e       

yang dengan mudah dapat ditentukan dengan menggunakan integrasi numerik satu dimensi (Bernardo, 2009).

3. Studi Simulasi dan Pembahasan

Pada persamaan (1) terlihat bahwa intrinsik statistik ditentukan oleh n dan r sehingga dalam studi simulasi ini diambil beberapa nilai n dan r. Apabila diketahui n dan r maka estimator titik Bayesian obyektif dapat ditentukan dengan menggunakan persamaan (2). Tabel 1 memberikan hasil estimasi titik Bayesian obyektif * jika diberikan berturut-turut n = 10, 50, 100, 1000 dan statistik cukup untuk  yaitu r. Terlihat bahwa untuk r = 0 estimasi titik Bayesian obyektif tidak memberikan nilai nol dan berarti hal ini kontras dengan estimasi titik dengan metode MLE (maximum

likelihood estimator) yang bernilai nol. Hal ini dapat dijelaskan bahwa jika kita

mempunyai sampel ukuran 100 orang misalnya dan bila tidak menemui adanya orang yang berpenyakit tertentu yang jarang dijumpai maka tidaklah berarti prevalensinya nol tetapi estimasi titik Bayesian obyektif akan memberikan estimasi sebesar 0,0075. Untuk r yang lain, makin besar ukuran sampel n maka estimasi titik yang diperoleh makin dekat dengan estimasi titik MLE. Di samping itu, pada Gambar 1 juga digambarkan nilai statistik intrinsik pada saat n = 100 dan r = 20, 40, 60 dan 80. Terlihat bahwa estimasi titik Bayesian obyektif memberikan nilai estimasi  yang beralasan.

(4)

Tabel 1. Hasil estimasi titik Bayesian obyektif untuk* jika diberikan n dan r. r n 0 2 4 6 8 10 0,0399 0,2113 0,4012 0,5908 0,7727 r n 0 10 20 30 40 50 0,0119 0,2026 0,4006 0,5980 0,7941 r n 0 20 40 60 80 100 0,0075 0,2014 0,4004 0,5990 0,7970 r n 0 200 400 600 800 1000 0,0024 0,2001 0,4000 0,5999 0,7997 0.0 0.2 0.4 0.6 0.8 1.0 0 2 0 0 4 0 0 6 0 0 theta in tr in s ic s ta ti s ti c s 0.0 0.2 0.4 0.6 0.8 1.0 0 1 0 0 3 0 0 5 0 0 theta in tr in s ic s ta ti s ti c s 0.0 0.2 0.4 0.6 0.8 1.0 0 1 0 0 3 0 0 5 0 0 theta in tr in s ic s ta ti s ti c s 0.0 0.2 0.4 0.6 0.8 1.0 0 2 0 0 4 0 0 6 0 0 theta in tr in s ic s ta ti s ti c s

Gambar 1. Grafik hubungan antara statistik intrinsik pada interval (0,1) untuk n=100 dan r masing-masing 20 (kiri atas), 40 (kanan atas), 60 (kiri bawah), 80 (kanan bawah).

Simulasi Monte Carlo dilakukan dengan cara membangkitkan sampel ukuran

n = 100 dari distribusi Bernoulli dengan probabilitas sukses  yang dipilih yaitu 0,2

dan kemudian dihitung estimasi titik parameter  dengan metode Bayesian obyektif dan apabila hal itu diulang sebanyak B = 500 kali maka akan diperoleh histogram dari hasil estimasi titik tersebut. Cara ini dapat juga dilakukan untuk n = 100 dan parameter  yang digunakan untuk membangkitkan adalah 0,4; 0,6 dan 0,8. Histogram dari hasil-hasil tersebut dinyatakan pada Gambar 2. Hasil yang sama juga dapat dilihat pada Gambar 3 untuk n = 1000 dan  yang digunakan untuk membangkitkan adalah 0,2; 0,4; 0,6 dan 0,8. Terlihat bahwa untuk n membesar, rentang hasil estimasi cenderung mengecil.

(5)

Histogram dari Estimasi Titik theta = 0.2 D e n s it y 0.10 0.20 0.30 0 5 1 0 1 5

Histogram dari Estimasi Titik

theta = 0.4 D e n s it y 0.25 0.35 0.45 0.55 0 5 1 0 1 5

Histogram dari Estimasi Titik

theta = 0.6 D e n s it y 0.45 0.55 0.65 0.75 0 5 1 0 1 5

Histogram dari Estimasi Titik

theta = 0.8 D e n s it y 0.70 0.80 0.90 0 5 1 0 1 5

Gambar 2. Histogram dari estimasi titik dari sampel hasil simulasi bila digunakan n = 100 dan= 0,2; 0,4; 0,6 dan 0,8.

Histogram dari Estimasi Titik

theta = 0.2 D e n s it y 0.16 0.18 0.20 0.22 0.24 0 5 1 5 2 5 3 5

Histogram dari Estimasi Titik

theta = 0.4 D e n s it y 0.36 0.38 0.40 0.42 0.44 0 5 1 5 2 5 3 5

Histogram dari Estimasi Titik

theta = 0.6 D e n s it y 0.56 0.58 0.60 0.62 0.64 0 5 1 5 2 5 3 5

Histogram dari Estimasi Titik

theta = 0.8 D e n s it y 0.76 0.78 0.80 0.82 0.84 0 5 1 5 2 5 3 5

Gambar 3. Histogram dari estimasi titik dari sampel hasil simulasi bila digunakan n = 1000 dan

(6)

4. Kesimpulan dan Saran

Dalam makalah ini telah dijelaskan tentang bagaimana mengestimasi parameter populasi berdasarkan sampel bila dianggap bahwa populasi mengikuti distribusi tertentu yang diketahui dan hanya tergantung pada parameter yang tidak diketahui. Dengan menggunakan metode Bayesian obyektif maka estimasi titik yang diperoleh nantinya hanya didasarkan pada anggapan distribusi populasi dan data. Penelitian ini dapat diperluas untuk distribusi anggapan yang lain maupun estimasi interval dengan metode Bayesian obyektif.

5. Daftar Pustaka

[1] Bernardo, J. M. dan M. A. Juarez, 2003, Intrinsic Estimation, Bayesian

Statistics 7, Oxford : University Press.

[2] Bernardo, J. M. and Rueda, R. , 2002, Bayesian hypothesis testing: A reference approach. International Statistical Review 70, 351-372.

[3] Bernardo, J. M., 2009, Statistics : Bayesian Methodology in Statistics,

Comprehensive Chemometrics ( S. Brown, R. Tauler dan R. Walczak eds)

Oxford : Elsevier.

[4] Juarez, M. A. , 2004, Objective Bayesian Methods for Estimation and Hypothesis

Gambar

Tabel 1. Hasil estimasi titik Bayesian obyektif untuk  * jika diberikan n dan r. r n 0 2 4 6 8 10 0,0399 0,2113 0,4012 0,5908 0,7727 r n 0 10 20 30 40 50 0,0119 0,2026 0,4006 0,5980 0,7941 r n 0 20 40 60 80 100 0,0075 0,2014 0,4004 0,5990 0,7970 r n 0 200
Gambar 2. Histogram dari estimasi titik dari sampel hasil simulasi bila digunakan n = 100 dan  = 0,2;

Referensi

Dokumen terkait

analisis eror untuk membandingkan estimasi model regresi berdasar distribusi.. prior noninformatif dan distribusi prior sekawan pada

Informasi prior dan informasi sampel merupakan fungsi yang diketahui, dimana informasi prior dalam kasus ini yaitu distribusi gamma, mean dari distribusi �� � , sekaligus

Dalam makalah ini, akan dilakukan studi simulasi tentang estimasi Bayesian obyektif untuk berbagai distribusi anggapan populasi yang biasa digunakan metode Bayesian obyektif

Tujuan dari penelitian ini adalah menentukan estimasi parameter model survival yang berdistribusi Pareto pada data tersensor dengan metode Bayesian LINEX Loss Function

Berdasarkan penelitian tersebut, Tugas Akhir ini membahas tentang estimasi parameter distribusi Log-Normal untuk non-informatif prior dengan menggunakan pendekatan metode

Di samping itu, inferensi dengan menggunakan metode bayesian obyektif tentang parameter mean populasi normal telah dijelaskan dalam makalah Setiawan (2011b) dan

Estimasi parameter model survival distribusi Eksponensial data tersensor dengan menggunakan metode MLE dan metode Bayesian SELF dilakukan dengan data waktu survival 137

Tujuan pada penelitian ini adalah menentukan estimasi parameter model survival distribusi Eksponensial pada data tersensor dengan metode Bayesian GELF menggunakan