Oleh:
Dr. Dadang Juandi, M.Si Rani G Yuniar, S.Si.
Jurusan Pendidikan Matematika FPMIPA UPI JL. DR. Setiabudhi 229, Bandung 40154
ABSTRAK
Konsep deficiency diperkenalkan oleh Hodges dan Lehmann (Hodges dan Lehmann, 1970) yang digunakan untuk membandingkan dua buah penaksir pada sampel berukuran besar. Deficiency adalah suatu besaran yang diperoleh dari hasil membandingkan mean square error (MSE) dua buah penaksir pada sampel berukuran besar. MSE penaksir Maksimum Likelihood dan penaksir UMVU dari fungsi yang estimable
g
diperoleh pada order diatasn
2, dimana n merupakan ukuran sampel. Distribusi yang diangkat pada karya tulis ini adalah distribusi keluarga eksponensial dengan satu parameter .Kata kunci: Distribusi Keluarga Eksponensial, penaksir Maksimum Likelihood, penaksir UMVU.
1. Pendahuluan
Dalam statistika, sebuah penaksir adalah sebuah fungsi dari sampel data observasi yang digunakan untuk menaksir parameter populasi yang tidak diketahui. Ada dua jenis penaksir, yaitu penaksir titik dan penaksir interval. Dalam penaksiran titik, kita mencoba langsung menaksir suatu nilai. Penaksiran itu menginginkan agar suatu parameter ditaksir dengan memakai satu bilangan saja. Misalnya kita menaksir parameter-parameter , atau p dengan memakai statistik-statistik x , s atau
x n.
Penaksiran seperti ini dapat kita ibaratkan sebagai penembakan titik tertentu dengan panah. Sudahlah pasti bahwa kita akan sering sekali tidak mengenai titik ini. Kebanyakan dari panah kita itu akan berserak di sekitar titik tadi, ada yang sampai, ada yang terlalu jauh, ada yang terlalu kekiri ada yang terlalu ke kanan. Sangat sulit bagi kita untuk tepat mengenainya. Oleh karena itu, kita hanyalah berusaha agar penaksir itu tidak terlalu sering melewati atau tidak sampai kepada yang ditaksir. Kita berusaha agar tersebarnya penaksir-penaksir yang dibuat tidak terlalu jauh dari yang ditaksir.
Pada umumnya dapat dikatakan disini, bahwa probabilitas suatu penaksiran titik untuk tepat sekali sangat kecil dan ketidakakurasian sebuah penaksir dalam menaksir disebut fungsi resiko. Fungsi resiko dalam setiap penaksiran besarnya berbeda-beda, bergantung pada ukuran sampel. Biasanya semakin besar ukuran sampel yang digunakan maka resikonya pun akan semakin kecil. Hal ini dikarenakan semakin besar ukuran sampel maka informasi yang diperlukan tentang yang akan ditaksir semakin tersedia.
Teori ukuran sampel besar adalah teori dimana sampel yang digunakan yaitu vektor
1,..., n
X X X dengan n adalah anggota dari barisan yang berkorespodensi dengan n 1, 2,...(atau secara umum n n n0, 0 1,...dengan kata lain n ). Secara matematis hasil dari penaksiran pada
sampel besar berupa nilai limit. Pada aplikasinya, hasil limit ini digunakan untuk mengaproksimasi kondisi di mana n menjadi suatu nilai yang terbatas.
Pembahasaan deficiency merupakan bagian dari pembahasan teori sampel besar. Pada teori sampel besar dibahas bagaimana membandingkan penaksir yang berbeda. Karena tidak seperti pada sampel kecil, sampel besar memiliki beberapa hukum. Deficiency sendiri adalah suatu metode untuk membandingkan dua buah penaksir yang saling asimtotically efficient, dilihat dari nilai fungsi
resikonya. Fungsi resiko disini dapat juga berupa nilai dari mean square error (MSE). Menurut Hodges dan Lehmann (1970) untuk mencari deficiency tersebut digunakan MSE dari kedua buah penaksir, yang diperoleh pada order diatas
n
2, di mana n adalah ukuran sampel.penaksir yang dipilih adalah penaksir maksimum likelihood (ML), dan penaksir uniformly minimum-variance unbiased (UMVU/MVUE). Hal ini dikarenakan meski secara umum ML dan UMVU merupakan dua buah penaksir yang berbeda, namun kedua penaksir tersebut dapat diasumsikan identik, jika parameter natural dari distribusi keluarga eksponensial adalah [Greenwood and Nikulin, 1996].
Karena adanya asumsi identik dari kedua penaksir ini, maka dapat dibandingkan mana dari kedua penaksir tersebut yang lebih deficient, dilihat dari nilai MSE nya. Menurut [Gudi dan Nagnur, 2004], jika deficiency bernilai positif maka menunjukan bahwa penaksir ML deficient terhadap penaksir UMVU, dan jika deficiency bernilai negatif menunjukan bahwa penaksir UMVU deficient terhadap penaksir ML.
2. Tinjauan Pustaka
Diketahui fungsi kepadatan peluang dari distribusi keluarga eksponensial adalah
1 2
; exp
f x T x Q x ; x , (2.1) Misalkan variabel acak
X X
1,
2,
,
X
niid pada (2.1). Dan misalkang
adalah fungsi yang estimable untuk . Maka berlaku asumsi berikut:a. Persamaan (2.1) memenuhi kondisi
1 2 0 dan 1 0 , .
dimana adalah suatu fungsi dari .
b. *adalah statistik cukup untuk distribusi keluarga eksponensial, dimana *
1 1 n i i T x n dan E *
c. Fungsi log-likelihood l log Ln x, adalah unimodal dan penaksir maksimum Likelihood yang merupakan fungsi dari *adalah unik. Sehingga g * adalah penaksir Maksimum Likelihood dari g (Zehna, 1966).
d. U * adalah penaksir UMVU dari g , dimana penaksir UMVU adalah fungsi dari *. e. Penaksir Maksimum Likelihood g * dan penaksir UMVU U * dapat menjadi identik,
dengan kata lain g * U * , jika parameter natural dari distribusi keluarga eksponensial adalah [Greenwood and Nikulin, 1996]. Secara umum ML dan UMVU berbeda.
f. Fungsi g * dan U * konvergen pada ekspansi taylor, untuk semua titik dalam . g. Diasumsikan terdapat turunan dari g * dan U * pada ekspansi taylor
h. Diasumsikan penaksir Maksimum likelihood asymptotically efficient, yaitu mencapai batas bawah dari Cramer-Rao ketika ukuran sampel besar dan menuju tak hingga. Hal ini berarti tidak ada penaksir tak bias yang memiliki nilai MSE lebih kecil dibanding penaksir Maksimum Likelihood.
i. Untuk setiap penaksir yang asymptotically efficient, berlaku n * N 0, 1 I
j. Jika
I
adalah informasi Fisher seperti pada definisi 2.16, maka menurut (Gudi dan Nagnur, 2004) 1I memiliki turunan terhadap , yaitu
2
11 30
1 2
Dari asumsi diatas, misalkan l adalah turunan pertama dari l terhadap . Seperti diketahui jika pada persamaan likelihood l 0, maka penaksiran tersebut memiliki solusi *, yang memiliki peluang mendekati . Hal ini juga membuat fungsi likelihood maksimal.
Dari asumsi (f), (g) dan (h) dan menggunakan hasil dari (Gudi dan Nagnur, 2004) maka diperoleh
* n 2 5 2 3 2 2 2 5 2 3 l l l nI l l O n nI n I n I 2 3 2 2 2 5 2 3 l l l nI l E l nI n I n I 2 5 2 5 2 3 2 l l E l O n n I (2.2) Misalkan 2 log , i log , j ij f X f X K E I (2.3) Maka, i j ij E l l nI nK (2.4)
Dengan menggunakan hasil pada (Cox dan Hinkley, 1974)
E l 3E l l nI E l 3
11 30
3
n K K
Maka persamaan (2.2) dapat dirubah menjadi
* n 2 11 11 5 2 3 2 2 3 2 3 3 2 l l l nI l K K O n nI n I n I (2.5)
Dari (2.5) dapat dicari pendekatan moment dari n * pada order ke n 2. Misalkan
* i
i E ; untuk i= 1, 2, 3, 4. Dengan menggunakan hasil pada (Aithal, 1992; Gudi, 2002; Rao,
1961) diperoleh 1. 0
1
(2.6) 2. 1 * E 11 30 2 2 2 K K b O n n nI (2.7) 3. 2 2 * E 2 3 2 2 2 2 1 b b O n nI n I n n (2.8) 4. 3 3 * E 11 30 3 2 3 9 7 2 K K O n n I (2.9) 5. 4 4 * E 3 2 2 3 O n n I (2.10)Dimana b
n adalah order bias pertama dari penaksir
*
,
b
adalah turunan darib
terhadap , adalah koefisien dari n 2pada varians dari penaksir
(yaitu, penaksir * dikoreksi untuk bias order yang pertama) dan ditunjukan dengan2 2 02 11 11 30 4 2 2 IK K K K I Sehingga, * var 2 2 * * E E (2.11) * var 2 2 3 2 2 2 2 2 1 b b b O n O n nI n I n n n 3 2 2 2 1 b O n nI n I n (2.12) MSE * 2 3 2 2 2 2 1 b b O n nI n I n n (2.13)
3. Perhitungan Means Square Error untuk Penaksir Maximum Likelihood dan Penaksir UMVU
Seperti telah disebutkan sebelumnya, deficiency ditentukan dari nilai MSE dari kedua penaksir. Maka langkah berikut adalah menentukan nilai MSE dari kedua buah penaksir.
Perhitungan Means Square Error untuk Penaksir Maximum Likelihood
Dengan menggunakan asumsi bahwa terdapat turunan dari g * dan U * pada ekspansi taylor, maka dapat diperlihatkan rangkaian Ekspansi Taylor dari g * diberikan oleh
* g 2 3 * * * 1! 2! 3! g g g g 4 * 4! g (3.1) Dimana gi ,i 1, 2,; adalah turunan ke-i dari
g
terhadap .Lemma 1
Order bias yang pertama dari penaksir
g
* adalah* E g g 11 230 1 2 2 K K g g nI nI (3.2) Teorema 1
Varians dari penaksir Maksimum likelihoodg * adalah
* var g = 2 * 11 30 2 2 3 2 2 4 3 1 var 2 K K g g g g n I n I 3 2 2 1 g g O n n I (3.3)
Sehingga dari teorema tersebut diperoleh nilai dari MSE dari penaksir Maksimum likelihood * g yaitu, * MSE g 2 2 11 30 2 2 2 2 2 1 4 K K b g g g nI n I n n I
11 30 11 30 2 2 3 2 3 2 2 2 2 4 3 1 1 2 2 4 K K K K g n I n I n I n I
2 2 1 g g n I
(3.4) Perhitungan Means Square Error untuk Penaksir UMVU
Misalkan U * adalah penaksir UMVU dari g , dengan asumsi U * konvergen terhadap ekspansi Taylor, maka
* U = 2 3 * * * 1! 2! 3! U U U U 4 * 4! U (3.5) Dimana Ui ,i 1, 2,; adalah turunan ke-i dari
U
terhadap . Perhitungan MSE dari penaksir UMVUU
* dapat dihitung dengan menggunakan persamaan (3.5).Teorema 2
Mean Square Error (MSE) dari penaksir UMVU
U
* adalah* MSE U = var U * = 2 * E U g = 2 11 30 2 2 3 1 2 K K g g g nI n n I 2 3 2 2 1 2 g O n n I (3.6) Perhitungan Deficiency dari Penaksir Maksimum Likelihood terhadap Penaksir UMVU
Setelah diperoleh hasil MSE g * dan MSE U * maka dapat dicari nilai dari deficiency. Berikut akan ditunjukan nilai deficiency dari penaksir maksimum Likelihood terhadap penaksir UMVU
Teorema 3
Deficiency dari penaksir maksimum Likelihood g * terhadap penaksir UMVU U * ditunjukan sebagai berikut : * * , HL D g U = '' 11 30 2 ' 7 5 2 g K K I g 2 ''' '' ' ' 1 1 4 g g I g g 2 ' 2b I b (3.7)
4. Deficiency dari Penaksir Maksimum Likelihood terhadap penaksir UMVU pada
persamaaan
g
,
, dan turunannya.Pada bagian ini,, akan ditunjukan nilai deficiency dari penaksir maksimum Likelihood terhadap penaksir UMVU pada persamaan
g
,
, dan turunannya.Karena,
1 2
exp T x Q x dx 1 (4.1)
Dengan asumsi,
1 2
0
dan 10
, untuk setiapMaka,
2 1
(4.2) Sehingga, dengan menggunakan hasil pada (Gudi dan Nagnur, 2004), diperoleh
E T X T x exp 1 T x 2 Q x dx (4.3) 2 E T X T x 2exp 1 T x 2 Q x dx 2 1 (4.4) 3 E T X T x 3exp 1 T x 2 Q x dx 3 1 3 2 1 1 1 3 (4.5) dan 2 1 2 log ; I E f X (4.6) 1 1 , , . i j i j ij K E T X i j (4.7)
Dengan menggunakan (4.3) dan (4.4) diperoleh nilai dari var T x yaitu,
var T x 1 (4.8) Dari (4.7) diperoleh 11 K 1 1 1 1E T X 2 2 2 1 1 E T X 2E T X 2 2 2 1 1 1 2 1 (4.9) 02 K 1 0 1 2E T X 2
2 2 2 1 E T X 2E T X 2 2 2 2 1 1 2 1 1 (4.10) dan 30 K 1 3 1 0E T X 3 3 3 2 2 3 1 E T X 3E T X 3E T X 3 1 3 1 3 2 1 1 1 3 2 2 3 1 3 3 3 1 1 11 1 K (4.11)
Dengan menggunakan beberapa persamaan diatas diperoleh,
b
11 30 2 2 K K I 2 1 2 2 1 2 (4.12) Dan 2 2 02 11 11 30 4 2 2 IK K K K I 1 1 1 1 2 4 1 2 2 2 4 1 2 (4.13) Dengan menurunkan 2.2.12 terhadap , diperolehb 2 2 1 1 1 2 2 1 2 2 4 2 2 2 2 1 1 1 4 2 1 2 2 4 4
2 1 2 2 2 3 1 1 4 1 (4.14) * * , HL D g U 1 2 2 1 1 5 2 g 2 3 1 1 g g (4.15) Jika diperhatikan nilai deficiency pada persamaan (4.15) bergantung pada nilai
1 2
, , ,
g dan turunannya terhadap
5. Ilustrasi
Untuk kepentingan ilustrasi, berikut akan diberikan sebuah contoh kasus. Variabel acak X dikatakan beristribusi geometris jika fungsi kepadatan peluangnya berbentuk:
; 1 x
f x P X x , x 0,1, 2,;0 1 (5.1) fungsi kepadatan peluang diatas dapat dinyatakan sebagai berikut:
, exp log 1 log
f x x (5.2)
statistik cukup yang lengkap berdasar pada suatu sampel berukuran n untuk keluarga eksponensial adalah 1 n i i T X , dengan 1 log 1 , 2 log , T x x , Q x 0 (5.3) Dari (5.3) diperoleh, 1 1 1 , 2 1 , 1 2 1 1 1 , 12 , 23 (5.4)
Dengan mensubtitusi hasil dari (5.4) terhadap beberapa persamaan pada bagian b, diperoleh:
2 1 1 I , 11 2 1 1 K , 30 2 3 2 1 K 11 30 3 2 1 K K , 11 30 2 3 12 10 7 5 1 K K 1 b , b 1 2 (5.5)
* * , HL D g U = 11 30 2 7 5 2 K K I g1 2 g I g3 = 11 30 2 7 5 2 K K I g1 2 g I 2 b I b = 2 4 2 3 1 12 10 2 1 1 g 2 1 g2 2 1 2 2 1 2 1 2 1 = 5 6 g1 2 1 g2 3 5 (5.6)
Jika fungsi yang estimable adalah
1 m
g (5.7)
Dapat ditunjukan bahwa penaksir Maksimum Likelihood untuk g adalah
*
m T g
n T , (5.8)
Dari persamaan (5.7), diperoleh
g m 1 m 1 (5.9) g m m 1 1 m 2 (5.10) g m m 1 m 2 1 m 3 (5.11) Maka, 1 g g g 2 1 1 1 1 m m m m m 1 1 m (5.12) 2
g
1 2 1 4 g g g 3 2 1 1 2 1 1 1 4 1 1 m m m m m m m2 2 2 1 2 1 1 4 1 m m m 2 2 5 14 9 4 1 m m (5.13) Sehingga diperoleh * * , HL D g U 5 6 g1 2 1 g2 3 5 2 2 2 1 5 14 9 5 6 1 3 5 1 4 1 m m m 2 2 2 2 2 2 1 1 5 6 5 14 9 3 5 1 4 1 m m m 2 2 2 2 2 2 5 5 6 6 5 14 9 3 5 1 4 1 m m m m 2 2 2 2 2 2 2 12 32 20 20 20 24 24 5 14 9 4 1 m m m m 2 2 2 2 12 52 53 20 38 5 4 1 m m m (5.14)
Dari (5.14) terlihat bahwa, deficiency dari penaksir bergantung pada nilai m dan . Sekarang, dengan menggunakan program Microsoft Office Excel 2007, akan diperlihatkan nilai deficiency dari penaksir maksimum likelihood terhadap penaksir UMVU untuk beberapa nilai m dan .
Tabel 5.1 Nilai parameter * * , HL D g U 2 2 2 2 12 52 53 20 38 5 4 1 m m m Nilai m 1 2 3 4 5 0.01 2.9500 2.9001 2.8505 2.8011 2.7520 0.1 2.5000 2.0138 1.5556 1.1250 0.7222 0.2 2.0000 1.0625 0.2500 -0.4375 -1.0000 0.25 1.7500 0.6041 -0.3333 -1.0625 -1.5833 0.3 1.5000 0.1607 -0.8571 -1.5535 -1.9285 0.35 1.2500 -0.2644 -1.3076 -1.8798 -1.9807
Pada tabel 5.1 di atas, untuk nilai m dan yang diberikan, nilai positif dari deficiency menunjukan bahwa penaksir maksimum likelihood deficient terhadap penaksir UMVU, dan nilai negatif dari deficiency menunjukan bahwa penaksir UMVU deficient terhadap penaksir maksimum likelihood.
6. Daftar Pustaka
Aithal, B. U. (1992). A Study of Higher Order Asymptotic Properties of the Estimators. Tesis pada Shivaji University, Kolhapur, India: tidak diterbitkan
Aldrich, John (1997). "R.A. Fisher and the making of maximum likelihood 1912-1922". Paper pada sejarah dari Maksimum Likelihood
Cox, D. R., Hinkley, D. V. (1974). Theoretical Statistics. London: Chapman and Hall.
Greenwood, P. E., Nikulin, M. S. (1996). A Guide to Chi-Squared Testing. New York: John Wiley and Sons.
Gudi, S. V. (2002). On Some Asymptotic Results in Estimation. Tesis pada Karnatak University, Dharwad, India: tidak diterbitkan.
Gudi, V. S. V. and Nagnur, B. N. (2004). Deficiency of Two Estimators in One-Parameter. Communication In Statistics. Vol. 33, No. 8, pp. 1779–1800. New York: Marcel Dekker, Inc. Herrhyanto, N. (2003). Statistika Matematis Lanjutan. Bandung : Pustaka Setia.
Hodges, J. L., Lehmann, E. L. (1970). Deficiency. Ann. Math. Statist.41(3):783–801
Johnson, D. (2004, November 22). Minimum Mean Squared Error Estimators. [online]. Tersedia: http://en.wikipedia.org/wiki/Mean_squared_error. [11 April 2008] 0.4 1.0000 -0.6667 -1.6667 -2.0000 -1.6667 0.45 0.7500 -1.0397 -1.9090 -1.8579 -0.8863 0.5 0.5000 -1.3750 -2.0000 -1.3750 0.5000 0.55 0.2500 -1.6597 -1.8888 -0.4375 2.6944 0.6 0.0000 -1.8750 -1.5000 1.1250 6.0000 0.65 -0.2500 -1.9910 -0.7142 3.5803 10.8928 0.7 -0.5000 -1.9583 0.6667 7.3750 18.1667 0.75 -0.7500 -1.6875 3.0000 13.3125 29.2500 0.8 -1.0000 -1.0000 7.0000 23.0000 47.0000 0.85 -1.2500 0.5208 14.3333 40.1875 78.0833 0.9 -1.5000 4.1250 30.0000 76.1250 142.5000 0.95 -1.7500 16.0625 79.0000 187.0625 340.2500 0.99 -1.9500 115.6125 478.20000 1085.8130 1938.4500
Kay, Steven M. (1993). Fundamentals of Statistical Signal Processing: Estimation Theory. Prentice Hall, Ch. 7.
Keener, Robert W. (2006). Statistical Theory: Notes for a Course in Theoretical Statistics. Springer, 47-48, 57-58.
Lehmann, E. L.; Casella, G. (1998). Theory of Point Estimation. New York: John Wiley and Sons. Lehmann, E.L. (1983). Theory of Point Estimation. New York: John Wiley and Sons.
Rao, C. R. (1961). Asymptotic efficiency and limiting information. Proc. Fourth. Berk. Symp. Math. Statist. Prob. 1:531–546.
Sudjana. (1992). Metoda Statistika Edisi Ke 5. Bandung : Tarsito.
Utami Maolida, Dian. (2007). Estimasi Varians Modifikasi Tau Kendall dengan Menggunakan Metode Delta dan Perluasan Persamaan Gamma Goodman-Kruskall. Skripsi pada FPMIPA UPI Bandung. Bandung : tidak diterbitkan.