PENGGUNAAN METODEEMPIRICAL BEST LINEAR UNBIASED PREDICTION (EBLUP) PADAGENERAL LINEAR MIXED MODEL
Tri Handhika
Pusat Studi Komputasi Matematika (PSKM), Kampus D 139 Universitas Gunadarma
Abstrak
Makalah ini bertujuan untuk mencari taksiran parameter padaGeneral Linear Mixed Model. Parameter-parameter pada General Linear Mixed Model merupakan parameter untuk melihat efekfixeddan efekrandomdari variabel-variabel prediktor terhadap variabel respon. Dalam hal ini, metode yang digunakan untuk mencari taksiran parameter pada General Linear Mixed Model adalah Metode Empirical Best Linear Unbiased Prediction (EBLUP). Berbeda dengan Metode Best Linear Unbiased Prediction (BLUP) di mana parameter dari variansi efek random-nya diketahui, Metode EBLUP memerlukan penaksiran terhadap parameter tersebut yang pada kenyataannya tidak diketahui nilainya. Metode yang digunakan untuk menaksir parameter dari variansi efek random adalah MetodeMaximum Likelihood(ML).
Kata kunci:Best Linear Unbiased Prediction;Empirical Best Linear Unbiased Prediction; General Linear Mixed Model.
Abstract
This paper aims to find the estimated parameters in the General Linear Mixed Model. Parameters in the General Linear Mixed Model are the parameter to see the fixed effects and the random effects of the predictor variables on the response variable. In this case, the estimation methods used to search the parameters in the General Linear Mixed Model is the Empirical Best Linear Unbiased Prediction (EBLUP) method. Unlike the Best Linear Unbiased Prediction (BLUP) method where the variance parameters of the random effects is known, the EBLUP method requires estimation of the variance parameters that in fact the value is not known. The method used to estimate the variance parameters of the random effects is the Maximum Likelihood (ML) method.
Key word: Best Linear Unbiased Prediction; Empirical Best Linear Unbiased Prediction; General Linear Mixed Model.
1. PENDAHULUAN
dengan satu variabel respon disebut model regresi linier berganda. Pada model ini diasumsikan bahwa variansierror spherical.
Jika asumsi tersebut tidak dapat terpenuhi maka model tersebut dinamakan Generalized Linear Regression Model(GLRM) dengan asumsi variansierror nonspherical. Model GLRM yang dipengaruhi tidak hanya oleh efek fixed tetapi juga oleh efek random disebut General Linear Mixed Model. Makalah ini bertujuan untuk mencari taksiran parameter padaGeneral Linear Mixed Modelsehingga dapat dilihat efek-efek dari variabel prediktor tersebut terhadap variabel respon.
Terdapat bermacam-macam metode penaksiran parameter pada General Linear Mixed Model, di antaranya adalah Best Linear Unbiased Prediction (BLUP) dan EBLUP. Pada Makalah ini akan dibahas metode penaksiran parameter pada General Linear Mixed Modeldengan Metode EBLUP yang merupakan perluasan dari Metode BLUP.
Pada metode EBLUP, asumsi bahwa parameter dari variansi efekrandom diketahui tidak digunakan seperti halnya pada BLUP, melainkan akan diestimasi melalui Metode Maximum Likelihood (ML) yang akan dijelaskan lebih lanjut. Penaksiran ini dilakukan karena pada kenyataannya sulit untuk mengetahui parameter dari variansi efek random tersebut.
2. MODEL
Pada bagian ini diberikanGeneral Linear Mixed Modeladalah sebagai berikut:
y X Zb e (2.1)
di mana
y : vektorrandomdari variabel respon yang terobservasi berukuran n1 di mana nilai observasinya disebut vektor data.
X : matriks full rankberukuran n k dari variabel prediktor yang elemen-elemennya diketahui.
: vektor parameter bersifatfixed berukuran k1 yang tidak diketahui dan tidak terobservasi.
Z : matriks full rankberukuran n h dari variabel prediktor yang elemen-elemennya diketahui.
dengan asumsi
E b 0, E
e 0,
TVar b E bb G, Var
e E
eeT R, di mana b dan e independently distributed sedangkan G dan R adalah matriks varians kovarians yang tergantung pada vektor parameter dari variansi efek random, yaitu
1, 2, ,
b e be eb 0. Berikut ini diberikan bentuk dari matriksGdanR:
Prosedur penaksiran parameter dengan menggunakan Metode Best Linear Unbiasd Prediction (BLUP) dimulai dengan memisalkan nilai-nilai dari vektor random b yang dapat dinotasikan dengan di mana berbentuk vektor. Ingin diketahui pengaruh dari efekfixed dan efek random (tetapi bukan error) yang merupakan kombinasi linier dari dan . Misalkan T
y c lTy adalah sembarang penaksir dari kombinasi linierT T
di mana c suatu nilai konstanta dan l suatu vektor konstanta sedangkan berukuran k1 dan berukuran h1. T
y dapat mengestimasi kombinasi linier tersebut jika T
y merupakan penaksir yang unbiaseddan linier di mana definisi masing-masingnya adalah sebagai berikut, T
y disebutunbiased jika E T
y
E
T Tb
, dan disebut linier jika T a
y1by2
aT
y1 bT
y2 .Diketahui bahwa T T dapat diestimasi oleh T
y jika dan hanya jika c0 dan T merupakan kombinasi linier dari baris-baris X. Selanjutnya, ambil sembarangDengan menggunakan Metode Best Linear Unbiased Prediction (BLUP) di mana
Dengan demikian, Best Linear Unbiased Predictor(BLUP) dari adalah
ˆ
ˆ
ˆ T T
y y y (2.4) yang memiliki MSE terkecil dari semua taksiran yang unbiased dan linier. Detail penurunan rumus dapat dilihat pada Makalah Phydelya dengan judul “Penggunaan Metode Best Linear Unbiased PredictionpadaGeneralized Linear Mixed Model”.
3. HASIL
3.1. Penaksiran Parameter padaGeneral Linear Mixed Modeldengan Asumsi b dan e Berdistribusi Normal
Pada Bagian sebelumnya telah dijelaskan mengenai penggunaan Metode Best Linear Unbiased Prediction (BLUP) dalam penaksiran pada General Linear Mixed Model tanpa asumsi distribusi. Pada dasarnya Metode EBLUP adalah suatu metode penaksiran parameter pada General Linear Mixed Model yang merupakan perluasan dari Metode BLUP dengan menggunakan taksiran parameter dari variansi efek random
ˆ yang pada kenyataannya parameter tersebut tidak diketahui nilainya. Metode penaksiran yang digunakan pada Makalah ini adalah Metode ML yang memerlukan asumsi distribusi. Oleh sebab itu, diasumsikan bahwabdaneberdistribusi normal. Dikarenakan taksiran parameter padaGeneral Linear Mixed Model yang telah didapat sebelumnya ((2.2)) dan (2.3)), yaituˆ
Dengan asumsibdaneberdistribusi normal, parameter padaGeneral Linear Mixed Model, yaitu dan dapat ditaksir menggunakan Metode ML. Metode ini memerlukan fungsi likelihood yang merupakan joint pdf dari
y , y ,1 2 , y
.Joint pdftersebut dapat dinyatakan sebagai berikut:
,
|
f y g y h (3.1.1)
di mana
|
g y g (3.1.2)
Oleh sebab itu, (3.1.1) dapat ditulis sebagai
,
lebih mudah dalam hal perhitungannya akan digunakan fungsilog-likelihood, yaitu:
-1 -1 -1 -1 -1 -1-1 -1 -1
Selanjutnya, dengan proses eliminasi didapat
yang merupakan taksiran parameter pada General Linear Mixed Model dengan mengasumsikan b dan e berdistribusi normal. Selanjutnya, untuk penaksiran menggunakan Metode ML seharusnya memerlukan dan yang didapat dengan asumsi b dan e berdistribusi normal. Akan tetapi, berikutnya akan dibuktikan bahwa dan yang didapat dengan asumsi bdan eberdistribusi normal tersebut, ternyata identik denganˆ
dan ˆ yang diperoleh tanpa asumsi distribusi. Oleh karena itu, untuk seterusnya penaksiran akan menggunakan ˆ dan ˆ.
3.2. Memeriksa bahwa Taksiran Parameter pada General Linear Mixed Model yang didapat dengan atau tanpa Asumsi b dan e Berdistribusi Normal adalah Identik
Telah diketahui dari (2.2) dan (2.3) bahwa taksiran parameter padaGeneral Linear Mixed Modeltanpa asumsi distribusi adalah ˆ dan ˆ. Sedangkan, taksiran parameter pada General Linear Mixed Modeldengan asumsibdaneberdistribusi normal diberikan oleh (3.1.6) dan (3.1.7). Dari (3.1.6), misalkan:
1Oleh karena dapat dibuktikan bahwa WI, maka terbukti pula bahwa ˆ
Selain itu, dapat dibuktikan pula bahwa
berdistribusi normal kedua jenis taksiran parameter pada General Linear Mixed Model tersebut identik sehingga taksiran parameter yang didapat dengan asumsi b dan e berdistribusi normal juga memiliki sifatlinear,unbiased, danbest.3.3. Penaksiran Parameter dari Variansi EfekRandom
Pada Makalah ini, Metode ML digunakan untuk menaksir pada General Linear Mixed Model. Oleh karena itu, dibutuhkan fungsilikelihood yang merupakanjoint pdf dari
y , y ,1 2 , y
T n
y sehingga fungsilikelihood-nya adalah sebagai berikut:
Sebagaimana sebelumnya, Metode ML menggunakan fungsilog-likelihood, yaitu:
1
-1
c adalah suatu konstanta. Selanjutnya, fungsi log-likelihood tersebut
diturunkan terhadap , dinotasikan dengan s
,
, sehingga untuk elemen ke-j didapatSesuai dengan Metode ML, berikutnya (3.3.3) dicari solusinya menjadi
-1
ˆ
T
-1
-1
ˆ
j j
Terlihat dari (3.3.4) tidak dapat diselesaikan secara analitik. Oleh karena itu, taksiran dengan Metode ML kemudian diselesaikan secara numerik. Pada Makalah ini, algoritma yang digunakan adalah Scoring Algorithm di mana iterasi ke-a1, yaitu ˆa1, secara iteratif menggunakan formula sebagai berikut:
1
1
Berdasarkan penjabaran di atas, didapatkan taksiran parameter dari variansi efek random
ˆ secara numerik yang selanjutnya akan digunakan dalam penaksiran parameter padaGeneral Linear Mixed Modelsesuai dengan Metode EBLUP.3.4. Penaksiran Parameter pada General Linear Mixed Model dengan Metode EBLUP
Taksiran parameter pada General Linear Mixed Model dengan menggunakan Metode EBLUP didapat dengan mensubstitusikan taksiran , dinotasikan dengan ˆ
y ,Berdasarkan (2.4) taksiran kombinasi linier yang baru adalah sebagai berikut:
ˆ
ˆ
ˆ
ˆ ˆ
ˆ T T .
Oleh karena ˆ
ˆ
y y
tersebut didapat dengan mensubstitusikan ˆ
y ke ˆ dan ˆ, maka perlu dibuktikan ketakbiasan dari taksiran tersebut. Sebelumnya diketahui lemma berikut ini:Lemma3.1
Jika z adalah vektor random berdistribusi simetris di sekitar nol sedemikian sehingga z dan z identically distributed, dan f
z adalah variabel random yang merupakan fungsi ganjil dari z sehingga f
z f
z , maka f
z berdistribusi simetris di sekitar nol.Sebelumnya diketahui bahwa E
ˆ
ˆ
y y
berhingga dan ˆ
y merupakan fungsi genap sertatranslation-invariantdari ysehingga didapat
Sebuah Waralaba makanan cepat saji ingin menambahkan produk makanan baru dalam daftar menunya. Oleh sebab itu, pihakmarketingmengusulkan kepada pihak manajemen tiga pilihan bentuk promosi ataucampaign
X yang akan diujicobakan di enam lokasi Waralaba ataulocation
Z yang dipilih secara acak dari sepuluh Waralaba yang ada. Namun, selama satu bulan pertama pihak manajemen ingin melihat terlebih dahulu seberapa besar pengaruh masing-masing bentuk promosi dan lokasi Waralaba dalam meningkatkan penjualannya (sales). Diasumsikan bahwa matriks-matriks varians kovarians dariedanb, yaitu R0Ir dan G1Ig di mana 0 dan 1 merupakan parameter darivariansiedanbsedangkan Ir dan Ig merupakan matriks identitas berukuran 30 30 dan 6 6 . Sebelum melakukan penaksiran parameter padaGeneral Linear Mixed Model, perlu diperiksa terlebih dahulu kenormalan dari variabel dependen (Sales). Dengan menggunakan Metode EBLUP didapatkan taksiran dari parameter-parameter tersebut, yaitu sebagai berikut.
230 0812 191.1613 218.5482
5. KESIMPULAN
Dari pembahasan Makalah ini dapat disimpulkan bahwa Metode Empirical Best Linear Unbiased Prediction(EBLUP) yang merupakan perluasan dari Metode Best Linear Unbiased Prediction (BLUP) dapat digunakan untuk menaksir parameter pada General Linear Mixed Modeldengan terlebih dahulu melakukan penaksiran terhadap parameter dari variansi efekrandomyang pada kenyataannya tidak diketahui nilainya.
REFERENSI
Anton, H. (2000),Dasar-Dasar Aljabar Linier, Batam: Interaksara.
Jiang, J. (2007), Linear and Generalized Linear Mixed Models and Their Applications, New York: Springer.
Harville, D. A. (1997), Matrix Algebra from A Statistician’s Perspective, New York: Springer.
Kackar, R. N., and Harville, D. A. (1981), Unbiasedness of Two-stage Estimation and Prediction Procedures for Mixed Linear Models, Communications in Statistics, Series A,10, 1249-1261.
McCulloch, C. E., and Searle, S. R. (2001), Generalized, Linear, and Mixed Models, New York: John Wiley and Sons.
Phydelya, A. (2007), Penggunaan Metode Best Linear Unbiased Prediction pada Generalized Linear Mixed Model, Depok: Departemen Matematika FMIPA UI. Searle, S.R., Casella, G., and McCulloch, C. E. (1992),Variance Components, New York: