• Tidak ada hasil yang ditemukan

PENGEMBANGAN ALGORITMA EXPECTATION MAXIMIZATION (EM) PADA METODE PENDUGAAN RANDOM DAN FIXED EFFECT PADA MODEL GLMMs

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENGEMBANGAN ALGORITMA EXPECTATION MAXIMIZATION (EM) PADA METODE PENDUGAAN RANDOM DAN FIXED EFFECT PADA MODEL GLMMs"

Copied!
7
0
0

Teks penuh

(1)

PENGEMBANGAN ALGORITMA EXPECTATION MAXIMIZATION (EM) PADA

METODE PENDUGAAN RANDOM DAN FIXED EFFECT PADA MODEL GLMMs

A. A. R. Fernandes1) dan W. H. Nugroho1)

1) Staf Pengajar Program Studi Statistika Jurusan Matematika FMIPA UB

ABSTRAK

Beberapa variabel respon berkategori yang hanya memiliki dua kelompok atau golongan dalam pengamatan pada setiap subyeknya diklasifikasikan menjadi sukses atau gagal. Kondisi seperti ini cenderung berdistribusi binomial. Kejadian berdistribusi binomial seringkali ditemukan pada variabel respon yang saling berkorelasi untuk data longitudinal. Data longitudinal dengan variabel respon berdistribusi binomial dapat dimodelkan dalam Generalized Linear Mixed Models (GLMMs). GLMMs biasa digunakan untuk memodelkan data longitudinal pada penelitian klinik maupun studi epidemiologi seperti penyakit kanker dan lainnya. Tujuan dari penelitian ini adalah ingin menguji apakah algoritma Expecation Maximization (EM) untuk menduga parameter model GLMMs lebih baik daripada algoritma yang biasa digunakan yaitu algoritma Newton Rhapson

(NR). Penelitian ini menggunakan simulasi empat data penelitian di bidang kesehatan. Berdasarkan atas data penelitian, dapat disimpulkan bahwa algoritma EM lebih baik untuk menduga parameter model GLMMs dibandingkan dengan algoritma NR.

Kata kunci: GLMMs, algoritma EM, dan algoritma NR

ABSTRACT

Some uncategorized response variables having only two groups or classes in the observations on each subject should be classified as successful or failed. Conditions such as these tend to the binomial distribution. Genesis binomial distribution is often found in the response variables correlated to longitudinal data. Longitudinal data with binomial distributed response variables can be modeled in Generalized Linear Mixed Models (GLMMs). GLMMs are a popular way to model longitudinal data arising in clinical trials and epidemiological studies of cancer and other diseases. The purpose of this research is to consider the use of the Expecation Maximization (EM) algorithm for parameter estimation of GLMMs model, and comparing the result with classical algorithm, called Newton Rhapson (NR). The approach is illustrated by application to four datasets which applied in medical research for simulation study. Based from the four datasets, we can conclude that the EM algorithm is the best solution to estimate the parameter in GLMMs rather than NR algorithm.

(2)

PENDAHULUAN

Dalam dunia nyata sering ditemui kejadian yang memiliki dua kemungkinan, misalkan sehat atau sakit, hujan atau tidak, dan lain sebagainya, di mana tipe data tersebut disebut data biner. Secara umum data biner ini diasumsikan menyebar binomial, yang dinotasikan dalam bentuk sukses (angka 1), atau gagal (angka 0). Data longitudinal adalah data yang diperoleh dari pengukuran berulang (repeated measures) pada beberapa individu (unit cross-sectional) dalam waktu berturut-turut (unit waktu). Verbekke dan Molenberghs [1] memperkenalkan metode analisis Generalized Linear Mixed Model (GLMMs) yang digunakan pada data longitudinal dengan respon binom.

Pada model GLMMs, terdapat dua efek yang diduga, yaitu pertama, efek tetap (fixed effect) adalah efek dari adanya perlakuan (treatment) dan efek dari adanya concomittant variables (variabel penyerta), dan kedua, efek acak (random effect) yaitu efek dari adanya perbedaan antar individu (subject specific). Kedua metode tersebut secara simultan diduga dengan pendekatan Maximum Likelihood (ML) untuk pendugaan efek tetap, dan Restricted Maximum Likelihood (REML) untuk pendugaan efek acak, dengan bantuan pendekatan iterasi

Newton Rhapson (NR). Belakangan ini, muncul beberapa kelemahan yang terjadi dalam algoritma

Newton Rhapson (NR) seperti hasil yang muncul dalam algoritma tersebut adalah ragam yang negatif, yang menimbulkan inadmissible solution yaitu solusi yang tidak dapat diterima.

Meng dan Dyk [2] telah mengembangkan algoritma Expectation Maximization yang menggunakan dua langkah (penduga, dan maksimisasi), pada model mixed effect dengan kasus respon kuantitatif (data berskala interval dan rasio). Oleh karena itu, pada penelitian ini mengangkat pengembangan algoritma Expectation Maximization

(EM) pada metode pendugaan efek tetap (fixed effect) dengan menggunakan ML, dan pada metode pendugaan efek acak (random effect) dengan menggunakan REML pada model GLMMs, yang merupakan keberlanjutan dari penelitian yang dilakukan oleh Meng dan Dyk [2], di mana perbedaannya, pada penelitian ini melibatkan variabel respon binom. Pada penelitian ini ingin sekaligus membandingkan apakah algoritma EM lebih baik dibandingkan algoritma NR, dengan melihat nilai goodness of fit yaitu Akaike Information Criterion (AIC) dari kedua algoritma tersebut.

Tujuan dan Manfaat Penelitian

Adapun tujuan penelitian yang akan diperoleh adalah melakukan pendugaan parameter pada model GLMMs menggunakan algoritma EM, sekaligus, menguji kebaikan algoritma EM dengan NR, menggunakan nilai AIC yang terkecil. Sedangkan

manfaat penelitian adalah sebagai alternatif penyelesaian masalah pada analisis data longitudinal dengan respon binom, dan pengembangan algoritma EM pada model longitudinal diharapkan agar dapat digunakan sebagai alternatif terbaik untuk pendugaan parameter model, sehingga tidak akan terjadi lagi in admissible solution.

TINJAUAN TEORI

Generalized Linear Mixed Model (GLMMs)

Generalized Linear Mixed Model (GLMMs) adalah pengembangan dari Generalized Linear Model (GLMs). Model GLMs untuk respon binom dikenal dengan regresi logistik. Agresti [3] menyatakan, jika terdapat variabel respon Yi dan

i

adalah peluang sukses bagi variabel Yi , maka:

           i i i i i 0,,1PP((YY 10)) 1 Y

Jika banyaknya percobaan yang dinotasikan dengan n sebanyak 1 maka Yi mengikuti sebaran

Bernoulli, dan jika n ≥ 2 maka Yi mengikuti sebaran

Binomial (ni, i). Sehingga diperoleh model logistik

sebagai berikut (Fahrmeir, dan Gerhard, [4]):

ip p 1 i 1 0 i i

X

...

X

1

ln





) x ... x exp( 1 ) x ... x exp( ip p 1 i 1 o ip p 1 i 1 o i         g(

i) =       i i 1 ln

g(i) adalah link function logit dari sebaran binom

Generalized Linear Mixed Models (GLMMs) merupakan perluasan dari Generalized Linear Models (GLMs) untuk data berkorelasi seperti pada data longitudinal dengan menambahkan efek acak pada persamaannya. Variabel respon dalam GLMMs diasumsikan saling bebas dengan penambahan efek acak pada masing-masing subyek. Secara umum model dalam GLMMs adalah :

g(

i) = XT β + ZT bi + ei

bi N (0,D), dan ei N (0,Ri)

di mana :

Si : subyek pengamatan, i=1,2,3,…,N

Wj : pengamatan masing-masing subyek,

j=1,2,3,…,n g(

i) : fungsi link (logit)

ij

: nilai tengah untuk subyek ke-i, pengamatan ke-j

X : vektor kovariat untuk efek tetap subyek ke-i, pengamatan ke-j

: penduga efek tetap

Z : vektor kovariat efek acak untuk subyek ke-i, pengamatan ke-j

i

(3)

ei : galat model

D : ragam efek acak Ri : ragam galat

Menurut Saavedra [5], asumsi dalam GLMMs adalah :

1.Nilai ekspektasi dari variabel respon berhubungan dengan kovariat dan efek acak seperti :

g(

i) =

g

E

(

Y

ij

b

i

)

= XT β + ZT bi

2.Pemberian

b

iuntuk masing-masing subyek sehingga

y

i1

,...,

y

in diasumsikan saling bebas, dan mengikuti GLMs di mana y memiliki fungsi kepekatan keluarga eksponensial

f( y | β,D,σ2) di mana D merupakan matriks

peragam.

3.Efek acak

b

isaling bebas dengan mengikuti distribusi normal,

b

i~N(0,D)

GLMMs dapat digunakan untuk menganalisis data longitudinal diskrit, termasuk untuk respon binom (Hardin dan Hilbe, [6]). Hubungan antara variabel respon dengan parameter efek tetap dan efek acak seperti pada persamaan berikut :

) ( Bernoulli ~ b| Yij i ij i ii ij 1 ln    = XT β + ZT bi

Perbedaan antara persamaan di atas dengan persamaan sebelumnya adalah pada penyertaan efek acak bi di dalam model, fungsi efek acak dalam persamaan di atas adalah untuk mengatasi korelasi antar masing-masing pengamatan yang mungkin timbul dalam data longitudinal. Efek acak merupakan komponen variasi yang tidak dijelaskan dalam variabel prediktor. Sedangkan efek tetap merupakan pengaruh yang ditimbulkan oleh variabel prediktor.

Menurut Molenberghs dan Verbekke [1] efek acak dapat diduga dengan metode Maximum Likelihood (ML), yaitu didapatkan dengan mengintegralkan efek acak. Menurut Jiang [7], persamaan likelihood untuk masing-masing subyek adalah :

 N i f yi D D L 1 , ) , ( 

  

   N i n j fij yij bi f bi D dbi 1 1 ,

Algoritma Newton Rhapson (NR)

Untuk menyelesaikan persamaan dalam model GLMMs tidaklah mudah karena βj yang akan diduga bersifat nonlinier, untuk itu diperlukan metode iterasi. Menurut Khuri [8], iterasi perlu dilakukan jika nilai optimum tidak dapat diperoleh secara langsung. Metode iterasi yang digunakan adalah algoritma Newton Raphson (NR). Pendekatan NR secara umum didefinisikan sebagai berikut: Suatu titik x pada suatu fungsi f(x) yang nonlinier didekati dengan menggunakan metode Newton Raphson adalah (Verbekke dan Molenberghs, [1]) :

'

('

()

)

1

('

()

)

) ( ) 1 (t

x

t

f

x

t

f

x

t

x

 di mana :

x(t+1): titik hasil iterasi ke-t+1

x(t) : titik awal atau titik hasil iterasi ke-t

f’(x) : turunan pertama dari f(x) f’’(x): turunan kedua dari fungsi f(x)

Analog dengan persamaan di atas , maka persamaan pendekatan untuk parameter β adalah :

) ( 1 ) ( ) ( ) 1 (t

t

(

H

t

)

g

t

di mana j k j t H    2 ( ) ) ( 

         i i j ij i j ij i ik ij k j j x x N x x 2 2 ) exp( 1 ) exp( ) (       

 i xijxikNi

i(1

i) = XT V-1X

V-1adalah matriks diagonal dengan elemen

)

1

(

i i i

N

H-1 adalah matriks ragam koragam yang merupakan

invers dari H

i j i i i ij i j j t

x

y

Nx

x

g

()

(

)

(

)

  i xij(yi Nii) = XT (Yi- i

)

maka penduga efek tetap

β(r+1)= β(r) + (XT V-1 X)-1 (XT (Yi-

i))

dengan cara yang sama, penduga efek tetap diperoleh:

b(r+1)= b (r) + DZT V-1(Yi-

i)

Persamaan ini harus diselesaikan secara iterasi (r adalah indeks untuk tiap iterasi, dengan r = 0, 1, 2, …), proses ini diulang sampai diperoleh β dan b

yang konvergen atau  (1) (t) 

j t

j . β dianggap

konvergen jika nilai δ kurang dari 10-6. Adanya

keterkaitan antara kedua persamaan di atas menyebabkan kemungkinan algoritma NR memberikan hasil yang tidak konvergen, dan bahkan menciptakan ragam yang negatif karena adanya dua ragam yang digunakan untuk kedua persamaan, yaitu ragam galat model dan ragam efek acak.

Algoritma Expectation Maximization (EM)

Algoritma EM pada hakekatnya seperti yang telah diteliti oleh Meng [2] adalah perbaikan dari algoritma NR untuk pendekatan model longitudinal pada respon kontinyu. Pada persamaan sebelumnya, Ri adalah ragam galat, dengan menggunakan

pendekatan berikut:

Ri = 2 Ini, untuk i = 1, 2, …, n

di mana bidan ei dibawah asumsi normalitas yaitu bi

 N (0,D), dan ei N (0,Ri), maka metode Maximum

(4)

  ˆ2 N 1 eiTei

  T i i 1 bb n Dˆ

Persamaan di atas adalah M-step (Maximization Step) pada EM-Algoritma, karena ei dan bi adalah

tidak dketahui. Langkah algoritma EM adalah mengganti 2 dan D dengan:

2 = E(

ˆ

2| y, =

ˆ

) 2 = = 

1

i 2 i 2 i T i 1 e e n tr(V N D = E(

| y, =

ˆ

) D = n

bb

DDZ VZD

i 1 i T i T i i 1

Bagian kanan persamaan di atas, ragam 2 dan D

belum diketahui, sehingga diganti dengan

ˆ

2 dan

pada persamaan di atas sebagai nilai awal. Dengan iterasi, nilai ˆ2 dan

akan di update

menggunakan persamaan di atas dengan menggunakan pendekatan algoritma EM, sehingga skema algoritma EM adalah sebagai berikut:

Tetapkan r = 0, 1, 2, ... adalah urutan iterasi, dan ˆ(r) dan

(r) adalah nilai duga parameter efek tetap dan efek acak pada iterasi ke r. Langkah-langkah pendugaan parameter dengan algoritma EM adalah sebagai berikut:

Langkah 0:

Menetapkan r = 0,

ˆ

2(r) = 1 dan Dˆ = (r) In

Langkah 1:

Menetapkan r = r + 1, update persamaan ˆ(r) dan

) r ( bˆ menggunakan:

 

iT i(r1) 1 i

1 i 1 ) 1 r ( i T i ) r ( X Vˆ X X Vˆ y ˆ         

)

ˆ

X

y

(

Z

D

(r)

(r1) iT (ir1)1 i

(r) di mana n ) 1 r ( 2 T i ) 1 r ( i ) 1 r (i ZDˆ Z ˆ I Vˆ   Langkah 2:

Memperbaharui nilai

ˆ

2(r) dan

(r) ) r ( 2 ˆ  = N1

e(ir1)Teir1) ˆ2(r1)

ni ˆ2(r1)tr(V~(ir1)1

) r ( Dˆ =

    ) 1 r ( i 1 ) 1 r (i T i ) 1 r ( ) 1 r ( T ) ir ) r ( i 1 b b Z Z n di mana ei(r) = yi - Xi

ˆ

(r) - Zi

(r) Langkah 3:

Mengulang langkah 1 dan 2 hingga konvergen yaitu

6 ) r (j ) 1 r (j  10 

Indikator Pembanding Algoritma NR dan EM

Pemilihan algoritma terbaik dengan menggunakan AIC (Akaike Information Criteria), yang didefinisikan pada persamaan berikut:

AIC = -2loglikelihood + 2p

p adalah banyaknya parameter yang diestimasi. Menurut Agresti (2002), algoritma terbaik adalah algoritma yang menghasilkan nilai AIC terkecil.

METODE PENELITIAN

Data yang diperoleh adalah dua data primer dari pasien penderita demam berdarah, dan pasien penderita decubitus wound, dan dua data sekunder dari pasien Age Related Macular Degeneration

(ARMD), dan percobaan pada tikus hamil.

Metode yang digunakan dalam penelitian ini adalah teringkas pada langkah-langkah berikut: 1.Pembentukan model regresi logistik sebagai

inisialisasi efek tetap dalam GLMMs 2.Eksplorasi data :

a.Mean profile, untuk mengetahui pengaruh efek tetap

b.Variance profile, untuk mengetahui pengaruh efek acak

c.Concomitant variable, untuk mengetahui pengaruh variabel penyerta.

3.Pembentukan model tentatif dengan penentuan jumlah efek tetap awal dan efek acak sementara. Efek tetap dan efek acak sementara diperoleh dari eksplorasi data, jika mean profile dan variance profile berpengaruh maka perlu adanya penyertaan efek acak dan efek tetap dalam model.

4.Pendugaan parameter efek tetap dan acak menggunakan metode Maximum Likelihood (ML) dan Restricted Maximum Likelihood (REML) dengan algoritma NR dan EM. Apabila diperoleh nilai yang signfikan maka beranjak ke tahap selanjutnya, namun bila kondisi ini tidak dipenuhi kembali ke tahap pembentukan model awal (tahap 3).

5.Pemeriksaan signifikansi penduga parameter efek tetap pada model awal, bila terdapat efek tetap (selain efek tetap waktu) yang tidak signifikan maka kembali ke tahap 3 dan membentuk kembali model awal tanpa mengikutsertakan efek tetap selain waktu yang tidak signifikan tersebut ke dalam model.

6.Menghitung nilai loglikelihood semua model efek acak. Nilai loglikelihood dibandingkan dengan menggunakan likelihood ratio test, model efek acak didapat dari nilai likelihood ratio test yang signifikan dengan nilai -2loglikelihood terkecil. 7.Pemilihan efek tetap berdasarkan efek acak yang

telah ditentukan pada tahap 5. Model efek tetap diperoleh dari nilai AIC model secara keseluruhan dengan menyertakan efek acak yang telah diketahui.

8.Pemeriksaan signifikansi kembali terhadap efek tetap setelah penyertaan efek acak ke dalam model.

9.Membandingkan hasil pendekatan pendugaan parameter dengan metode ML menggunakan algoritma NR dan EM menggunakan nilai AIC.

(5)

Pembentukan model longitudinal Generalized Linear Mixed Model (GLMMs) menggunakan bantuan software SAS 9.1.3 dan Splus 3. Penggunaan Splus 3 untuk membentuk macro Algoritma NR, sedangkan penggunaan SAS 9.1.3 untuk menjalankan GLMMs dengan algoritma EM.

HASIL DAN PEMBAHASAN Eksplorasi Data

Eksplorasi data yang meliputi mean profile, variance profile dan concomintant structure

merupakan tahap awal pembentukan model data longitudinal menggunakan Generalized Linear Mixed Model (GLMMs) yang berguna untuk membentuk model awal Eksplorasi mean profile

menggambarkan perubahan perubahan proporsi kejadian sukses untuk keseluruhan subyek setiap unit waktu. Eksplorasi variance profile bertujuan untuk mengetahui adanya pengaruh efek acak. Efek acak perlu ditambahkan pada model jika dalam grafik variance profile terdapat fluktuasi nilai residual setiap unit waktu. Eksplorasi terhadap

concomitant variable perlu juga untuk dilakukan. Pengaruh variabel pengiring tidak dapat diabaikan karena variabel pengiring dapat mempengaruhi respon.

Berikut disajikan eksplorasi data pertama tentang pasien penderita demam berdarah (data pertama), sebagai berikut:

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 1 2 3 4 Waktu (Hari) Pr op or si K es em bu ha n Kontrol

Gambar 1. Mean profile

0 5 10 15 20 25 0 1 2 3 4 Waktu (Hari) Re si du al Keragaman

Gambar 2. Variance profile

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 Jenis Kelamin 2 Pr op or si K es em bu ha n 1 = Pria 2 = Wanita

Gambar 3. Concomitant: Jenis Kelamin

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 10 20 30 40 50 Um ur (tahun) Pr po rs i K es em bu ha n

Gambar 4. Concomitant: Usia

Berdasarkan Gambar 1 di atas menunjukkan adanya kecenderungan peningkatan proporsi kesembuhan pasien yang menunjukkan adanya penambahan efek tetap dalam model GLMMs yang akan dibentuk . Gambar 2 menunjukkan adanya perubahan keragaman respon mengindikasikan perlu menyertakan efek acak selain efek tetap ke dalam model tentatif. Dari Gambar 3 dan 4 dapat diketahui bahwa masing-masing variabel yaitu jenis kelamin (sex) memiliki pengaruh yang relatif sama antara pria dan wanita, sehingga perlu dipertimbangkan penyertaan variabel sex. Sedangkan pada variabel usia (age), grafik yang terbentuk relatif berbeda untuk masing-masing umur, sehingga variabel usia tetap disertakan dalam model.

Pembentukan Model GLMMs

Dari hasil eksplorasi memperlihatkan bahwa keempat data layak untuk dilakukan pemodelan. Hasil pendugaan model Generalized Linear Mixed Model (GLMMs) untuk data pertama yaitu data mengenai pasien penderita demam berdarah, disajikan sebagai berikut:

Tabel 1 Pendugaan Parameter GLMMs Model dengan Algoritma NR data pertama

Parameter Penduga SE P-value

Intersep -4.1526 0.8227 0.0001

Waktu 1.5233 0.2243 0.0001

Perlakuan 0.0134 0.0245 0.5835 J. Kelamin -0.0381 0.4127 0.9264

Tabel 2 Pendugaan Parameter GLMMs Model dengan Algoritma EM data pertama

Parameter Penduga SE P-value

Intersep -4.1145 0.8121 0.0001

Waktu 1.5233 0.2243 0.0001

Perlakuan 0.0134 0.0244 0.6865 J. Kelamin -0.0381 0.4127 0.9269 Dari tabel di atas dapat kita lihat bahwa variabel time signifikan pada α sebesar 5% untuk kedua algoritma. Nilai penduga bertanda positif mengindikasikan adanya peningkatan kesembuhan pasien penderita demam berdarah sepanjang waktu 1

(6)

hingga 4 hari. Sedangkan untuk variabel penyerta usia, terlihat adanya pengaruh yang signifikan dan positif pada kedua algoritma. Artinya, semakin muda pasien, tingkat kesembuhan semakin tinggi. Terlihat pula pada kedua algoritma untuk variabel penyerta jenis kelamin terlihat pengaruh yang signifikan terhadap peningkatan kesembuhan pasien penderita demam berdarah. Mengingat jenis kelamin adalah variabel dummy (1: pria, dan 0: wanita), mengindikasikan wanita memiliki tingkat kesembuhan yang lebih cepat jika dibandingkan pria. Secara keseluruhan, dua penduga parameter, dengan menggunakan metode Newton Rhapson

maupun Expectation Maximization tidak menunjukkan perbedaan yang berarti.

Hasil pendugaan model Generalized Linear Mixed Model (GLMMs) untuk data kedua tentang pasien penderita decubitus wound sebagai berikut:

Tabel 3 Pendugaan Parameter GLMMs Model dengan Algoritma NR data kedua

Parameter Penduga SE P-value

Intersep -7.9810 1.3731 0.0001

Waktu 0.4663 0.0410 0.0001

Perlakuan 0.3773 0.2295 0.0985

Usia 0.0367 0.0180 0.0415

J. Kelamin 1.7048 0.2435 0.0001

Tabel 4 Pendugaan Parameter GLMMs Model dengan Algoritma EM data kedua

Parameter Penduga SE P-value

Intersep -22.3161 9.8084 0.0267

Waktu 1.4297 0.1795 0.0001

Perlakuan 0.7373 1.7504 0.6752

Usia 0.0757 0.1335 0.5730

J. Kelamin 5.6219 1.9092 0.0047 Dari Tabel 3 dan 4 memperlihatkan bahwa kedua algoritma pendugaan parameter menunjukkan perbedaan yang cukup besar, baik itu dilihat dari signifikansi nilai pendugaan, maupun besarnya nilai dugaan itu. Pada pendugaan parameter dengan algoritma NR memperlihatkan adanya pengaruh waktu, usia, dan jenis kelamin pasien terhadap respon penderita decubitus wound. Sedangkan pada pendugaan parameter dengan algoritma EM memperlihatkan hanya pengaruh waktu dan jenis kelamin pasien saja yang berpengaruh terhadap respon penderita decubitus wound.

Hasil pendugaan GLMMs untuk data ketiga tentang pasien penderita Age Related Macular Degeneration (ARMD) sebagai berikut:

Tabel 5 Pendugaan Parameter GLMMs Model dengan Algoritma NR data ketiga

Parameter Penduga SE P-value

Intersep -4.9556 1.2192 0.0001

Waktu 0.4024 0.0357 0.0001

Usia 0.0144 0.0158 0.3890

Tabel 6 Pendugaan Parameter GLMMs Model dengan Algoritma EM data ketiga

Parameter Penduga SE P-value

Intersep -3.0394 255.6900 0.9909

Waktu 0.2540 0.0059 0.0001

Usia 1.2234 1.2475 0.3278

Dari tabel di atas terlihat kedua metode pendugaan parameter pada model GLMMs memperlihatkan hasil yang serupa pada signifikansi nilai pendugaan, akan tetapi menunjukkan hasil yang berbeda pada nilai duganya. Terlihat adanya evolusi (perubahan pada tiap waktu) dari respon pasien penderita Age Related Macular Degeneration

(ARMD). Untuk pendugaan dengan menggunakan algoritma NR, terlihat bahwa dari minggu ke minggu, pasien penderita ARMD dapat sembuh sebesar exp(0.4024) atau 1.495 kali lebih baik dari minggu sebelumnya. Sedangkan untuk pendugaan dengan menggunakan algoritma EM, terlihat bahwa dari minggu ke minggu, pasien penderita ARMD dapat sembuh sebesar exp(0.2540) atau 1.289 kali lebih baik dari minggu sebelumnya.

Hasil pendugaan GLMMs untuk data keempat tentang pemberian daun sirih dan hidrogen peroksida pada tikus hamil sebagai berikut:

Tabel 7 Pendugaan Parameter GLMMs Model dengan Algoritma NR data keempat

Parameter Penduga SE P-value

Intersep -0.8451 1.2888 0.5120

Time 0.8751 0.1322 0.0001

Perlakuan -0.6082 0.1715 0.0004

Bobot -0.0105 0.0092 0.2529

Tabel 8 Pendugaan Parameter GLMMs Model dengan Algoritma EM data keempat

Parameter Penduga SE P-value

Intersep -4.2533 10.8690 0.6999

Time 4.1998 1.5615 0.0145

Perlakuan -2.7751 1.6630 0.1116

Bobot -0.0537 0.0801 0.5112

Pada tabel di atas memperlihatkan bahwa kedua algoritma pendugaan parameter menunjukkan perbedaan yang cukup besar, baik itu dilihat dari

(7)

signifikansi nilai pendugaan, maupun besarnya nilai dugaan itu. Pada pendugaan parameter dengan algoritma NR memperlihatkan adanya pengaruh waktu dan efek perlakukan pemberian daun sirih dan hidrogen peroksida dengan peningkatan jaringan nekrotik pada tikus hamil. Sedangkan pada pendugaan parameter dengan algoritma EM memperlihatkan hanya pengaruh waktu saja yang berpengaruh terhadap peningkatan jaringan nekrotik pada tikus hamil.

Perbandingan Algoritma NR dan EM pada Model GLMMs

Berdasarkan hasil pendugaan parameter model GLMMs, baik itu dari signifikansi nilai pendugaan, maupun besarnya nilai duga cenderung memberikan perbedaan pada kedua algoritma yaitu Algoritma NR dan Algoritma EM. Untuk menguji algoritma mana yang terbaik, menggunakan kriteria Akaike Information Criterion (AIC), di mana algoritma terbaik adalah algoritma yang menghasilkan nilai AIC terkecil. Tabel berikut merangkum nilai AIC maupun jumlah iterasi pada masing-masing algoritma, dan persen keefektifan.

Tabel 9 Hasil Perbandingan Algoritma NR dan EM

Data ke- Jumlah Iterasi AIC

NR EM NR EM

Data 1 23 22 169.1 163.0

Data 2 41 27 410.2 312.8

Data 3 39 11 1255.8 915.4

Data 4 46 21 113.2 81.9

Dari tabel di atas dapat dilihat bahwa nilai AIC terendah pada keempat data penelitian dihasilkan oleh algoritma Expectation Maximization (EM). Terlihat pula jumlah iterasi yang diperlukan algoritma EM untuk mencapai titik konvergen dalam pendugaan parameter lebih sedikit jika dibandingkan jumlah iterasi dengan algoritma NR pada data yang sama. Dengan demikian dapat disimpulkan bahwa pendugaan parameter model Generalized Linear Mixed Model (GLMMs) dengan algoritma

Expectation Maximization (EM) memberikan hasil yang lebih baik dibandingkan dengan algoritma

Newton Rhapson (NR).

KESIMPULAN DAN SARAN Kesimpulan

Dari hasil penelitian yang dilakukan dapat diambil kesimpulan sebagai berikut:

1. Algoritma Expectation Maximization (EM) dapat digunakan untuk menduga parameter pada model Generalized Linear Mixed Model

(GLMMs). Hal ini terlihat dengan terbentuknya

model pada keempat data penelitian dengan menggunakan algoritma EM.

2. Algoritma Expectation Maximization (EM) lebih baik dibandingkan algoritma Newton Rhapson (NR) yang saat ini kerapkali digunakan dalam menduga parameter model GLMMs. Hal ini terlihat dari keempat data penelitian, nilai AIC algoritma EM lebih kecil daripada nilai AIC algoritma NR.

Saran

Dari hasil penelitian ini disarankan beberapa hal sebagai berikut:

1. Algoritma EM dapat digunakan sebagai penyelesaian masalah pada analisis data longitudinal dengan respon binom, dan cenderung dapat meningkatkan akurasi model yang lebih baik, jika dibandingkan algoritma NR yang saat ini lebih sering digunakan. Sehingga dapat disarankan bahaw pengembangan EM ini adalah alternatif terbaik pendugaan parameter model GLMMs.

2. Pada penelitian selanjutnya disarankan untuk menggunakan kriteria p-value yang ikut menetapkan pemilihan algoritma terbaik. Disarankan pula untuk mempelajari pengembangan algoritma EM pada analisis data longitudinal dengan respon ordinal maupun respon poison.

DAFTAR PUSTAKA

[1] Molenbergs.G., dan Verbekke, G., 2005.

Model for Discrete Longitudinal Data.

Springer Series in statistics. New – York:Springer –Verlag.

[2] Meng, X, dan Dyk, D. 2008. Fast EM Type

Implementations for Mixed Effect Models.

Journal of the Royal Statistical Society. Series B. Vol. 60, No. 3. Pp 559-578.

[3] Agresti, A. 2002. An Introduction to

Categorical Data Analysis. John Wiley &

Sons. New York.

[4] Fahrmeir, L. dan T. Gerhard. 1994 .

Multivariate Statistical Modelling Based on

Generalized Linier Models. John Willey dan

Sons , New York.

[5] Saavedra, P.A.T. 2006. Percentile Curves In

Binary Longitudinal Data.

http://grad.uprm.edu/tesis/torressaavedra.pdf. Tanggal akses : 18 Oktober 2010.

[6] Hardin, J. W. dan J. Hilbe. 2007. Generalized

Linear Models and Extensions. Stata Press.

Texas

[7] Jiang, J. 2007. Linear and Generalized Linear Mixed Models and Their Application.

Springer Series in Statistics. New York.

[8] Khuri, A. 2003. Advanced Calculus with

Application In Statistics. John Wiley and Son.

Gambar

Gambar 2. Variance profile
Tabel 5  Pendugaan  Parameter  GLMMs  Model  dengan Algoritma NR data ketiga  Parameter  Penduga  SE  P-value
Tabel 9  Hasil  Perbandingan  Algoritma  NR  dan  EM

Referensi

Dokumen terkait

Resting upon the critical approaches in TESOL and applied linguistics that aim to redefine the tra- ditional and prevalent NSist discourses shaping the legitimacy in language

PT SUMI INDO KABEL Tbk... PT SUMI INDO

Ada 2 soal yang diberikan peneliti kepada narasumber, yaitu (1) menentukan nilai kuartil untuk data tunggal dan (2) menentukan nilai kuartil untuk data berkelompok.

f) Berhasil mewujudkan tujuan madrasah secara produktif sesuai dengan ketentuan yang ditetapkan. Menjadi guru professional.. Kepemimpinan kepala madrasah yang efektif dapat

Hal tersebut menunjukkan bahwa kemampuan perusahaan dalam menarik minat investor untuk berinvestasi tidak dapat dilihat seberapa besar nilai aset yang dimiliki

Tempat kediaman di : Jalan Gagak No. 321 Bandung Selanjutnya disebut sebagai Termohon. Bahwa Pemohon dan Termohon adalah suami istri yang melangsungkan pernikahan pada tanggal

Penelitian ini bertujuan untuk menganalisis pengaruh pengetahuan pajak dan sistem administrasi perpajakan modern terhadap kepatuhan wajib pajak studi kasus pada wajib pajak

Alkohol yang dihasilkan dapat digunakan sebagai bahan baku dalam pembuatan senyawa organik antara lain seperti asam asetat, sebagai pelarut pembuat pernis, minyak