• Tidak ada hasil yang ditemukan

PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE) UNTUK MULTIPLE-RANDOM EFFECTS"

Copied!
19
0
0

Teks penuh

(1)

PENAKSIRAN PARAMETER MODEL REGRESI POISSON DENGAN

METODE EXACT GENERALIZED ESTIMATING EQUATIONS (EGEE)

UNTUK MULTIPLE-RANDOM EFFECTS

Anisah Nurul Hayati

Pembimbing : Dr. Yekti Widyaningsih, M.Si dan Dr. Dian Lestari

Program Studi Matematika, Fakultas MIPA

Abstrak

Salah satu metode yang cocok untuk mengatasi data berkorelasi adalah Generalized Estimating Equations (GEE). GEE dibagi menjadi 2 model regresi, yaitu model regresi population-averaged

(PA) dan model regresi cluster-specific (CS). Pada kenyataannya, apabila model regresi CS-GEE yang lebih sesuai, namun model regresi PA-GEE yang digunakan, maka GEE akan menghasilkan penaksiran yang bias. Untuk mengatasinya, dapat digunakan metode yang menggabungkan model regresi PA dan model regresi CS. Metode tersebut dinamakan Exact Generalized Estimating Equations (EGEE). EGEE merupakan perluasan dari Generalized Estimating Equations (GEE) dengan menggunakan matriks varians-kovarians yang sebenarnya yang diperoleh dari variansi total. EGEE dibagi menjadi 2 model regresi, yaitu model regresi dengan single-random effect dan model regresi dengan multiple-random effects. Tugas akhir ini membahas mengenai penaksiran parameter model regresi dengan metode EGEE untuk multiple-random effects pada kasus variabel respon yang berdistribusi Poisson.

Kata Kunci: Generalized Estimating Equations (GEE), model regresi Poisson, multiple-random effects, maksimum likelihood

Abstract

One of the appropriate method to solve the correlated data is Generalized Estimating Equations (EGEE). GEE is divided into 2 regression models, there are population average (PA) regression model and clustered-specific (CS) regression model. In fact, if the data follow CS regression model, but PA regression model is used, then GEE leads to biased estimates. To solve this problem, it can be used the method for combining PA regression model and CS regression model. The method is Exact Generalized Estimating Equations. EGEE is an extension of Generalized Estimating Equations (GEE) with the exact variance-covariance matrix. EGEE is divided into 2 regression models, there are regression model for single-random effect and regression model for multiple-random effects. This thesis discussed about estimating regression parameter of EGEE for multiple-random effects with the response variable from Poisson distribution.

Keywords: Generalized Estimating Equations (GEE), Poisson regression model, multiple-random effects, maximum likelihood

(2)

Pendahuluan

Statistika merupakan salah satu cabang ilmu matematika yang sudah tidak asing lagi dan tentunya sering diaplikasikan di dunia nyata. Statistika sangat erat hubungannya dengan data. Secara umum, statistika dikenal sebagai suatu ilmu yang mempelajari bagaimana mendisain, mengumpulkan, menyajikan, menganalisis, dan menginterpretasikan data. Ilmu statistika dibagi menjadi 2 bagian, yaitu statistika deskriptif dan statistika inferensi. Statistika deskriptif mempelajari bagaimana menyajikan atau mendeskripsikan data. Hasil keluarannya dapat berupa tabel frekuensi, histogram, diagram lingkaran, diagram batang, dan lain-lain. Sedangkan statistika inferensi mempelajari bagaimana menganalisis data sampel dan memberlakukannya pada populasi. Analisis regresi merupakan salah satu metode yang ada dalam statistika inferensi.

Analisis regresi digunakan untuk menganalisis hubungan antar variabel melalui pemodelan (Montgomery et al., 2001). Dalam menganalisis hubungan antar variabel, ditentukan terlebih dahulu variabel apa yang dipengaruhi dan variabel apa saja yang mempengaruhi. Biasanya variabel yang dipengaruhi disebut sebagai variabel respon dan variabel yang mempengaruhi disebut sebagai variabel penjelas.

Langkah awal dalam analisis regresi adalah menentukan model regresi, dengan parameter-parameter di dalam model regresi tersebut perlu ditaksir. Salah satu metode penaksiran parameter dalam model regresi adalah ordinary least squares (OLS). Namun, agar OLS dapat digunakan, terdapat beberapa asumsi yang harus dipenuhi, salah satunya adalah data yang tidak berkorelasi.

Apabila datanya berkorelasi, maka OLS tidak dapat digunakan. Salah satu metode yang dapat digunakan untuk mengatasi masalah ini adalah Generalized Estimating Equations (GEE). Terdapat beberapa model regresi yang dapat menggunakan metode GEE, yaitu model regresi dengan variabel respon yang berdistribusi normal, binomial, Poisson, Gamma, dan invers Gaussian. Kegunaan yang paling utama dari GEE adalah mengatasi ketidak-bebasan pada data longitudinal dan data terklaster.

Data dapat dikatakan sebagai data longitudinal, apabila individu yang sama diukur berulang-ulang pada waktu yang berbeda-beda. Sedangkan data dapat dikatakan sebagai data terklaster, apabila terdapat klasifikasi alami pada pengamatan yang terbentuk menjadi klaster-klaster.

(3)

GEE memiliki 2 model regresi, yaitu model regresi population-averaged (PA) dan model regresi cluster-specific (CS). Model regresi PA merupakan model regresi yang memberikan rata-rata individu terhadap populasi. Sedangkan model regresi CS merupakan model regresi yang memberikan bentuk spesifik untuk tiap-tiap klaster (Hardin and Hilbe, 2003). Perbedaan antara model regresi PA dan model regresi CS adalah model regresi CS memberikan pengaruh acak untuk tiap klaster, sedangkan model regresi PA tidak demikian.

Beberapa peneliti menyebutkan bahwa apabila model cluster-specific (CS) yang lebih sesuai, namun model population-averaged (PA) yang digunakan, maka GEE akan memberikan penaksiran yang bias (Zeger et al., 1988; Heagerty and Kurland, 2001). Cara untuk mengatasinya, adalah dengan memberikan model regresi gabungan dari model regresi PA dan model regresi CS. Metode ini dikenal dengan Exact Generalized Estimating Equations (EGEE). Dikatakan exact, karena metode ini memberikan matriks varians-kovarians yang sebenarnya. Terdapat 2 bentuk model regresi dengan EGEE berdasarkan jumlah pengaruh acak klasternya, yaitu model regresi dengan single-random effect (satu pengaruh acak klaster) dan model regresi dengan multiple-random effects (lebih dari satu pengaruh acak klaster). Dalam metode EGEE, variabel respon dapat berdistribusi selain normal seperti pada GEE, yaitu Binomial, Poisson, Gamma, ataupun invers Gaussian.

Metode EGEE dapat digunakan pada data longitudinal dan data terklaster. Sebagai aplikasi yang akan digunakan selanjutnya, akan dibahas mengenai data terklaster, yaitu banyaknya kasus gizi buruk di Kediri, Jawa Timur. Kondisi Kota Kediri sudah terbentuk secara alami sebagai data terklaster, dengan klasternya adalah kecamatan, sedangkan pengamatan-pengamatan di dalam klasternya adalah desa. Kota Kediri merupakan kota yang cukup besar dan maju dalam bidang industri, sehingga dapat disimpulkan bahwa kota ini merupakan kota yang cukup makmur. Dengan keadaan tersebut, maka banyaknya kasus gizi buruk merupakan fenomena/kasus yang jarang terjadi. Jadi, banyaknya kasus gizi buruk dapat diasumsikan berdistribusi Poisson.

Dengan data tersebut,ingin dicari faktor yang dianggap mempengaruhinya, dengan faktor-faktornya adalah variabel-variabel yang dapat bernilai tetap dan acak. Untuk variabel yang bernilai acak, yang akan dipakai adalah sejumlah 2 variabel. Sehingga, untuk menganalisis banyaknya kasus gizi buruk di Kediri, akan digunakan model regresi EGEE dengan multiple-random effects.

(4)

Oleh karena itu, sesuai dengan penjelasan di atas, maka tujuan dari penelitian ini adalah membahas mengenai bagaimana cara menaksir parameter model regresi Poisson dengan metode

Exact Generalized Estimating Equations (EGEE) untuk multiple random-effects.

Pembahasan

Pada tahun 1986, Liang dan Zeger memperkenalkan suatu pendekatan alternatif untuk melakukan penaksiran parameter model regresi apabila pengamatannya berkorelasi. Pendekatan tersebut adalah Generalized Estimating Equations atau dikenal dengan GEE. Korelasi ini dapat muncul karena individu yang sama diukur berulang-ulang pada waktu yang berbeda (data longitudinal) atau terjadi klasifikasi alami pada pengamatan yang terbentuk menjadi klaster-klaster (data terklaster-klaster).

Dalam metode GEE, pada data longitudinal, individu-individu diasumsikan saling bebas, sedangkan hasil-hasil pengamatan dari setiap individu tersebut saling berkorelasi. Pada data terklaster, klaster-klaster diasumsikan saling bebas, sedangkan hasil-hasil pengamatan di dalam setiap klaster saling berkorelasi. Pada proses penaksiran parameter dengan metode GEE, terdapat pemilihan working correlation matrix (WCM) yang disesuaikan dengan kondisi data. Akan tetapi, pemilihan WCM tidak akan dibahas pada tulisan ini.

Ekspektasi model regresi GEE secara umum adalah sebagai berikut:

( )

dengan klaster dan pengamatan pada klaster ke- . Terdapat tiga komponen penting yang dimiliki oleh GEE, yaitu:

1. Komponen acak, yaitu variabel respon berdistribusi acak tertentu, seperti normal, binomial, poisson, gamma, atau invers Gaussian, yang mengikuti distribusi keluarga eksponensial.

2. Komponen sistematik, yaitu variabel penjelas yang dikombinasikan dalam model sebagai fungsi linier dari parameter-parameter. Komponen ini memiliki penduga linier , dengan .

(5)

3. Fungsi penghubung, yaitu suatu fungsi yang menghubungkan kombinasi linier dari variabel penjelas, dengan taksiran µ yang disesuaikan dengan distribusi dari variabel respon , dinyatakan dengan lambang ( ).

GEE memiliki 2 model regresi, yaitu model regresi population-averaged (PA) dan model regresi cluster-specific (CS). Model regresi PA merupakan model regresi yang memberikan rata-rata individu terhadap populasi, sedangkan model regresi CS merupakan model regresi yang memberikan bentuk spesifik untuk tiap-tiap klaster (Hardin and Hilbe, 2003). Maksud dari tiap klaster memiliki bentuk spesifik dalam model regresi CS adalah terdapat pengaruh acak klaster untuk masing-masing klaster yang ada. Agar lebih jelas, dapat dilihat pada bentuk model regresi yang akan dijelaskan selanjutnya.

Model regresi CS dibagi menjadi 2, yaitu model regresi CS dengan single-random effect

dan model regresi CS dengan multiple-random effects. Dikatakan single-random effect, karena model GEE hanya memberikan satu pengaruh acak klaster. Sedangkan, untuk model CS-GEE dengan multiple-random effects memberikan pengaruh acak klaster lebih dari satu.

Berikut ini merupakan gambar dari pembagian model regresi GEE.

Gambar 3.1. Pembagian model regresi Generalized Estimating Equations (GEE) Secara umum, ekspektasi model regresi PA adalah:

( ) Ekspektasi model regresi CS dengan single-random effect adalah:

( ) Sedangkan ekspektasi model regresi CS dengan multiple-random effects adalah:

( ) GEE Model population-averaged (PA) Model cluster-specific (CS) Single-random effect Mutiple-random effects

(6)

dengan (indeks untuk klaster) dan (indeks untuk pengamatan pada klaster ke- ), serta variabel penjelas sebanyak buah, dan variabel desain untuk pengaruh acak (random-effect) sebanyak faktor.

Dari persamaan (3.3) terlihat bahwa model regresi CS dengan single-random effect

memberikan satu pengaruh acak klaster, yaitu . Sedangkan dari persamaan (3.4) yang

merupakan model regresi CS dengan multiple-random effects memberikan pengaruh acak klaster lebih dari satu, sebanyak , yaitu . Untuk menaksir parameter model regresi GEE, dapat digunakan maksimum likelihood.

Model regresi PA-GEE lebih dikenal dibandingkan model regresi CS-GEE, sehingga akan dilihat terlebih dahulu bagaimana cara penaksiran parameter model regresi PA-GEE. Penaksiran parameter model regresi PA-GEE menggunakan maksimum likelihood.

Diasumsikan variabel respon memiliki distribusi dari keluarga eksponensial, secara umum bentuk pdf dari variabel respon dapat ditulis sebagai berikut (Mc Cullagh and Nelder, 1989):

(

+ dengan merupakan parameter kanonik yang diketahui and merupakan parameter dispersi yang diketahui. Parameter kanonik merupakan parameter yang bentuknya menyesuaikan dengan fungsi penghubung dari variabel respon . Sedangkan parameter dispersi digunakan untuk mengatasi masalah over-dispersi maupun under-dispersi.

Sebagai contoh, apabila ingin dibentuk menjadi anggota distribusi keluarga eskponensial, maka: { ( )} { ( ) } { } Sehingga, persamaan di atas dapat disesuaikan dengan persamaan (3.5) dengan:

(7)

Dapat dilihat bahwa parameter kanoniknya adalah , yang bentuknya menyesuaikan dengan fungsi penghubung seperti pada tabel fungsi penghubung dan parameter dispersinya adalah .

Mean dan variansi dari yang termasuk dalam anggota distribusi keluarga eksponensial secara berturut-turut adalah dan . Selanjutnya, akan dicari bentuk likelihood. Bentuk pdf dari yang termasuk dalam anggota distribusi keluarga eksponensial adalah sebagai berikut.

(

+ Dan pdf bersamanya adalah:

( + ( + ( + ∏ ( +

Sehingga likelihood-nya menjadi,

| ∏ ( + (∑ + Jadi, log-likelihood-nya adalah:

( (∑ ++ ∑

(8)

Berdasarkan persamaan di atas, telah diketahui bentuk log-likelihood dari distribusi keluarga eksponensial. Dari bentuk ini, akan dicari persamaan penaksiran parameternya. Dengan menggunakan aturan rantai,

∑ ( ) ( * ∑

Persamaan di atas dapat dibuat dalam bentuk matriks menjadi:

∑ ( * dengan ( ) ( ⁄ )

merupakan matriks berukuran

sebagai turunan ekspektasi dari model regresi terhadap masing-masing unsur dalam , merupakan invers dari matriks varians-kovarians dari berukuran , dan merupakan matriks residual berukuran untuk klaster ke- .

Taksiran akhir parameternya dapat dicari dengan bentuk persamaan:

∑ ( * Persamaan di atas dikenal dengan Generalized Estimating Equations (GEE). Jika hasil dari tidak dalam bentuk tertutup, maka dibutuhkan iterasi Newton-Raphson untuk menyelesaikannya. Iterasi dilakukan berulang kali hingga diperoleh taksiran parameter yang konvergen. Namun sebaliknya, apabila hasil dari memiliki bentuk tertutup, maka dapat dicari secara langsung tanpa menggunakan iterasi tersebut.

(9)

Sudah dijelaskan sebelumnya, bahwa GEE memiliki 2 model regresi, yaitu model regresi PA dan model regresi CS. Namun, apabila model regresi CS yang lebih sesuai, tetapi model regresi PA yang digunakan, maka GEE akan memberikan penaksiran yang bias (Zeger et al., 1988; Heagerty and Kurland, 2001). Cara untuk mengatasinya, adalah dengan memberikan model gabungan dari model PA dan model CS. Cara ini dikenal dengan Exact Generalized Estimating Equations (EGEE). Dikatakan exact, karena dapat memberikan matriks varians-kovarians sebenarnya. Matriks varians-varians-kovarians sebenarnya dapat dihitung dengan menggunakan variansi total.

EGEE memiliki 2 model regresi, yaitu model regresi dengan single-random effect dan model regresi dengan multiple-random effects. Single-random effect dan multiple-random effects pada EGEE memiliki makna yang sama dengan single-random effect dan multiple-random effects pada GEE.

Berikut ini merupakan gambar dari pembagian model regresi EGEE.

Gambar 3.2. Pembagian model regresi Exact Generalized Estimating Equations (EGEE) Ekspektasi model regresi EGEE dengan single-random effect adalah:

( ) Pada model regresi ini, dapat dikatakan sebagai single-random effect karena klaster-klaster yang terpilih sebagai sampel merupakan hasil dari pengambilan secara acak (random).

Sedangkan ekspektasi model regresi EGEE untuk multiple-random effects adalah:

( ) dengan dan sama seperti dengan yang dijelaskan pada persamaan (3.4), variabel penjelas sebanyak buah, dan variabel desain untuk pengaruh acak (random-effect) sebanyak faktor. Untuk menaksir parameternya pun, EGEE juga menggunakan maksimum likelihood sama seperti GEE.

EGEE

Model dengan s

ingle-random effect

Model dengan

(10)

Persamaan (3.11) merupakan ekspektasi model regresi EGEE untuk multiple-random effects secara umum. Untuk variabel respon yang berdistribusi Poisson, bentuk model regresi EGEE dengan multiple-random effects-nya adalah:

( ) ( ( ) ( ) ( ) ( ) ) ( ) dengan merupakan vektor kolom parameter berukuran ), merupakan vektor kolom variabel penjelas berukuran dengan variabel independen, merupakan vektor kolom random-effect berukuran , dan merupakan vektor kolom variabel desain untuk pengaruh acak (random-effect) berukuran . Random-effect, , diasumsikan

berdistribusi , dengan ( ,.

Pada kasus random slopes, diasumsikan . Sehingga, untuk kasus ini, bentuk model regresinya adalah:

Namun, apabila tidak menggunakan kasus random slopes, maka model regresinya seperti pada persamaan (3.12). Pada tulisan ini, yang akan dibahas adalah model regresi yang tidak menggunakan kasus random slopes.

Variabel desain untuk pengaruh acak (random-effect) memiliki kegunaan yang sama dengan variabel penjelas , namun letak perbedaanya adalah variabel merupakan hasil dari pengambilan beberapa kategori secara acak (random). Misalnya kategori dari kategori yang ada ( ). Sedangkan variabel merupakan faktor tetap. Perbedaan keduanya dapat terlihat pada aplikasi data yang akan dibahas pada bab 4.

Selanjutnya, untuk ekspektasi model regresinya memiliki bentuk sebagai berikut:

(11)

Karena dan berdasarkan MGF dari distribusi multivariate-normal, maka persamaan di atas menjadi: ( ) ( )

Karena dapat direpresentasikan sebagai kombinasi linier dari elemen matriks yang unik dari , yaitu , maka ekspektasi dari model regresi dapat ditulis sebagai berikut:

dengan [ ] merupakan matriks berukuran ( ) dan [ ] merupakan kombinasi vektor parameter berukuran ( ) . Baris ke- dari matriks adalah dan baris ke- dari matriks adalah ( ) , dengan merupakan perkalian kronecker berukuran dan merupakan matriks duplikasi berukuran

(Magnus and Abadir, 2005).

Agar lebih jelas, dapat dilihat penurunan rumusnya sebagai berikut. Akan dilihat bentuk dan . Pertama, untuk . [ ] [ ( ) ] [ ( ) ] [ ]

(12)

Dan kedua, untuk . [ ] [ ] [( ) ( )] [ ]

Dengan mensubstitusi dan ke dalam persamaan (3.13), maka: ( ( ) ( ) ( ) ) Pembentukan ekspektasi model regresi dalam bentuk matriks ini dilakukan untuk mempermudah penaksiran parameternya. Selanjutnya untuk melakukan penaksiran parameter pada model regresi Poisson untuk multiple-random effects-nya, dapat digunakan metode EGEE.

Penaksiran parameter model regresi Poisson dengan metode EGEE untuk multiple-random effects menggunakan maksimum likelihood. Hasil dari persamaan penaksiran parameter tersebut memiliki bentuk yang similar dengan GEE. Hanya saja terdapat perbedaan pada penurunan rumusnya. Agar lebih jelas, dapat dilihat penurunannya sebagai berikut.

(13)

Sebelumya akan dilihat bentuk pdf dari multiple-random effects, yaitu . Telah disebutkan

sebelumnya bahwa , dengan (

,, sehingga bentuk pdf dari

adalah sebagai berikut:

( ) ( )

Setelah diketahui bentuk pdf dari multiple-random effects, , kemudian akan dicari bentuk pdf dari dan . Dengan menggunakan pdf bersyarat, diperoleh bentuk pdf keduanya adalah sebagai berikut:

| (

| + (

) Dan pdf bersamanya adalah:

( | + ( ) ( | + ( ) ( | + ( ) ∏ ( | )

Sehingga likelihood-nya menjadi: | ∏ ( | )

(14)

(∑

|

+ Jadi, log-likelihood-nya adalah:

| ( (∑ | ++ ∑ |

Untuk mendapatkan persamaan penaksiran parameternya, digunakan aturan rantai sebagai berikut. ∑ ( | * ( * ∑ ( ) ∑

Persamaan di atas dapat dibuat dalam bentuk matriks menjadi:

∑ ( * dengan ( ) ( ⁄ ⁄ ⁄ ⁄ ⁄ ⁄ ⁄ )

merupakan matriks berukuran

sebagai turunan dari ekspektasi model regresi terhadap masing-masing unsur dalam , merupakan invers dari matriks varians-kovarians dari berukuran , dan merupakan matriks residual berukuran untuk klaster ke- .

(15)

Terbukti bahwa persamaan (3.8) memiliki bentuk yang similar dengan persamaan (3.14). Taksiran akhir parameter model regresinya dapat dicari dengan bentuk persamaan berikut:

∑ ( * Persamaan di atas merupakan persamaan yang dikenal sebagai Exact Generalized Estimating Equations (EGEE) untuk multiple-random effects. Jadi, untuk variabel respon yang berdistribusi Poisson, persamaan (3.14) dapat diubah menjadi bentuk:

∑ ( * ∑ dengan, ( )

merupakan transpos dari matriks [ ]

yang berukuran dan (

, merupakan matriks

diagonal berukuran yang merupakan fungsi variansi untuk distribusi Poisson dengan elemen ke- adalah ( ).

Apabila variabel respon yang berdistribusi Poisson ingin dibentuk menjadi distribusi keluarga eksponensial, maka bentuknya akan menjadi seperti pada persamaan (3.6), yang kemudian diperoleh . Karena , maka persamaan (3.16) menjadi:

(16)

Matriks kovariansi diadaptasi dari bentuk total variansi yang terdapat pada persamaan (2.18), yaitu ( ) ( ( | )) ( ( | )) dan ( ) *( ) ( )+ ( ) ( ( | )) ( ( | )) ( ) ( ) ( ) ( ) *( ) ( )+ ( ) ( ( ) ( ) ( ) ) ( ( ) )

Variansi dan kovariansi di atas jika dibentuk menjadi matriks varians-kovarians akan memiliki bentuk:

dengan, merupakan matriks diagonal berukuran dengan elemen ke- adalah

( ) dan elemen ke- dari adalah: ( ) ( ). Sedangkan untuk elemen ke- dari

adalah:

( ( ) ( ) ( ) ) ( ( ) ) Sehingga bentuk matriks varians-kovariansi menjadi:

( )

Jadi, Exact Generalized Estimating Equations (EGEE) untuk multiple-random effects

dengan variabel respon yang berdistribusi Poisson adalah sebagai berikut:

(17)

Karena taksiran akhir parameternya tidak dalam bentuk tertutup, maka diperlukan proses iterasi untuk mendapatkan hasil akhirnya. Iterasi yang digunakan adalah iterasi Newton-Raphson, dengan pada metode ini, parameter awal yang diambil haruslah tepat agar hasil akhir menjadi konvergen.

Langkah-langkah iterasi Newton-Raphson untuk menyelesaikan sistem persamaan di atas adalah sebagai berikut.

1. Hitung nilai taksiran awal , yang terdiri dari dan dengan menggunakan model regresi Poisson sederhana.

2. Hitung matriks kovariansi .

3. Hitung kembali [∑ ] [∑ ] 4. Lakukan prosedur 2 hingga 3 sampai nilai taksiran parameter konvergen.

Data yang digunakan pada aplikasi pemodelan adalah membahas mengenai kasus gizi buruk di Kediri, Jawa Timur. Data diperoleh dari Potensi Desa Tahun 2008 (BPS, 2009). Faktor-faktor yang dianggap mempengaruhi banyaknya kasus gizi buruk adalah jumlah keluarga yang anggotanya menjadi buruh tani, jumlah sekolah, dan jumlah tenaga medis (Martinah, 2008). Sedangkan faktor acak yang digunakan dalam pemodelan ini adalah industri (industri kulit, industri kain-tenun, dan industri makanan dan minuman yang diambil secara acak dari 7 kategori) dan penyandang cacat (tuna netra, tuna rungu-wicara, dan tuna laras yang diambil secara acak dari 9 kategori).

Sebelumnya ditentukan terlebih dahulu bahwa “kecamatan” dibentuk sebagai klaster, dengan simbol dan “desa” sebagai pengamatan-pengamatan di dalam setiap klaster, dengan simbol . Dari 24 kecamatan, diambil secara acak 14 kecamatan, dari setiap kecamatan dipilih 2 desa secara acak juga.

Dengan menggunakan software, diperoleh model regresi Poisson awalnya adalah: ( )

(18)

dengan,

= banyaknya kasus gizi buruk dalam 3 tahun terakhir pada kecamatan ke- desa ke- .

= banyaknya keluarga yang anggotanya menjadi buruh tani pada kecamatan ke- desa ke- . = banyaknya sekolah (TK, SD, SMP, SMU, dan SMK) pada kecamatan ke- desa ke- . = banyaknya tenaga medis (dokter, dokter gigi, bidan, dukun dayi, dan tenaga kesehatan lainnya) pada kecamatan ke- desa ke- .

= banyaknya industri pada kecamatan ke- desa ke- (faktor acak).

= banyaknya penyandang cacat pada kecamatan ke- desa ke- (faktor acak).

Kemudian, dengan menggunakan software lain, diperoleh model regresi Poisson yang optimal sebagai berikut:

( )

dengan kecamatan dan desa pada kecamatan ke- .

Penutup

Berdasarkan uraian sebelumnya, terdapat simpulan sebagai berikut:

1. Exact Generalized Estimating Equations (EGEE) merupakan solusi yang digunakan ketika ingin memakai model regresi PA-GEE dan CS-GEE secara bersamaan dengan memberikan matriks varians-kovarians yang sebenarnya.

2. Model regresi EGEE tidak menggunakan Working Correlation Matrix (WCM) seperti yang terdapat pada model regresi GEE, dikarenakan EGEE telah menggunakan matriks varians-kovarians yang sebenarnya.

3. EGEE memiliki 2 model regresi, yaitu model regresi dengan single-random effect dan model regresi dengan multiple-random effects.

4. Pada model regresi EGEE dengan multiple-random-effects, diasumsikan bahwa random-effects tersebut berdistribusi multivariate-normal.

5. Taksiran parameter model regresi EGEE dapat dicari dengan menggunakan maksimum

(19)

6. Dalam kasus khusus, dengan variabel responnya berdistribusi Poisson, diperlukan pendekatan Newton-Raphson. Hal ini dikarenakan hasil akhirnya tidak dalam bentuk tertutup, sehingga diperlukan iterasi untuk menyelesaikannya.

Daftar Pustaka

Badan Pusat Statistika. (2009). Statistika Potensi Desa Provinsi Jawa Timur. Jawa Timur : BPS. Demidenko, Eugene. (2007). Poisson Regression for Clustered Data. International Statistical

Review, 75, 96-113.

Demidenko, Eugene. (2004). Mixed Model: Theory and Applications. Canada : John Wiley & Sons, Inc.

Hardin, Joseph M. and Hilbe, James W. (2003). Generalized Estimating Equations. London : Chapman & Hall/CRC.

Heagerty, P. J. and Kurland, B. F. (2001). Misscpecified Maximum Likelihood Estimates And Generalized Linear Mixed Model. Biometrika, 88, 973-985.

Magnus, J. R. and Abadir, K. M. (2005). Matrix Algebra. Cambridge : Cambridge University Press.

Martinah. (2008). Meluasnya Fenomena Gizi Buruk. Dikutip dari: Koran Republika yang diterbitkan pada tahun Selasa, 18 Maret 2008.

McCullagh, P. and Nelder J.A. (1989). Generalized Linear Models. London : Chapman & Hall. Montgomery, D. C., Peck, E. A.,and Vining, G.G. (2001). Introduction to Linear Regression

Analysis (3rd ed.). Canada : John Wiley & Sons, Inc.

Zeger, S. L., Liang, K. Y., & Albert, P. A. (1988). Models for Longitudinal Data: A Generalized Estimating Equations Approach. Biometrics, 44, 1049-1060.

Zorn, Christopher J. W. (2001). Generalized Estimating Equations for Correlated Data: A Review with Applications. American Journal of Political Sciences, 470-490.

Gambar

Gambar 3.1. Pembagian model regresi Generalized Estimating Equations (GEE)  Secara umum, ekspektasi model regresi PA adalah:
Gambar 3.2. Pembagian model regresi Exact Generalized Estimating Equations (EGEE)  Ekspektasi model regresi EGEE dengan single-random effect adalah:

Referensi

Dokumen terkait

Penelitian ini menghasilkan 5 tema antara lain faktor-faktor pendorong keluarga dalam pemberian ASI bagi bayi pada umur 6 bulan pertama, faktor-faktor penghambat keluarga

1) Mengakses Informasi tentang perbaikan sistem pengapian sepeda motor dengan benar. 2) Melakukan pengujian kinerja sistem pengapian sesuai petunjuk buku manual

Kondisi saat ini teknologi yang digunakan tidak lagi budidaya lele dalam kolam terpal akan tetapi lele dipelihara dalam keramba jaring apung (KJA) ukuran kecil (1x1)

Biaya-biaya setelah perolehan awal diakui sebagai bagian dari biaya perolehan aset atau sebagai aset yang terpisah hanya apabila kemungkinan besar Perusahaan akan mendapatkan

Berdasarkan hasil dari penelitian yang telah dilaksanakan dapat disimpulkan bahwa: Terdapat peningkatan aktivitas belajar Biologi siswa kelas X3 SMAN

Kantor-kantor lain milik Kantor Pusatnya (selain penggantian biaya yang benar-benar dikeluarkan) berupa royalti, biaya atau pembayaran-pembayaran serupa lainnya karena penggunaan

Memperhatikan program termasuk modus transaksional yang dilakukan oleh BPJS khususnya BPJS Kesehatan dari perspektif ekonomi Islam dan fikih muamalah, dengan merujuk

PINDAD (Persero) masih ada pegawai yang belum melaksanakan audit internal pada bagian operasional yang dilakukan untuk triwulan pertama pada tahun 2014 belum sesuai dengan