PEMODELAN GENERALIZED REGRESI POISSON PADA FAKTOR-FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN BAYI DI PROVINSI JAWA
TIMUR TAHUN 2007 Yayuk Listiani1dan Purhadi2
1Mahasiswa S1 Statistika ITS,2Dosen statistika ITS 1yayuk.yangce@gmail.com,2Purhadi@Statistika.its.ac .id
Abstrak. Regresi Poisson adalah salah satu regresi nonlinier yang sering kali digunakan untuk menganalisis data diskrit. Metode regresi Poisson mempunyai asumsi equi-dispersion, yaitu kondisi dimana nilai mean dan varians dari variabel respon bernilai sama. Suatu model regresi count yang dapat mengatasi masalah over/under dispersion dalam keadaan data tidak terlalu banyak nol adalah regresi Generalized Poisson (GP). Pada makalah ini Regresi Pois-son tidak dapat diaplikasikan untuk pemodelan faktor-faktor yang mempengaruhi angka ke-matian bayi di Provinsi Jawa Timur tahun 2007 karena variabel respon mengalami over-dispersion sehingga digunakan model Regresi Generalized Poisson. Dan hasilnya faktor yang mempengaruhi angka kematian bayi di Jawa Timur tahun 2007 yaitu jumlah sarana ke-sehatan, persentase persalinan yang dilakukan dengan bantuan non medis, rata-rata usia perkawinan pertama dan rata-rata jumlah pengeluaran rumah tangga (dalam rupiah) per bulan pada tiap kabupaten/kota.
Kata kunci : Overdispersi, Regresi Generalized Poisson
1. Pendahuluan
Salah satu alat untuk menilai keberhasilan program pembangunan kesehatan yang telah dilak-sanakan selama ini adalah dengan melihat perkembangan angka kematian dari tahun ke tahun, baik angka kematian bayi, balita, ibu maternal, kecacatan maupun kesakitan. Angka kematian bayi adalah indikator yang sensitif terhadap ketersediaan pemanfaatan dan kualitas pelayanan kesehatan terlebih-lebih terhadap pelayanan perinatal (Anonim, 2009). Beberapa penelitian sebelumnya juga telah meng-hasilkan banyak faktor terutama sosial ekonomi yang menyebabkan kematian bayi. Perlindungan dan pelayanan kesehatan bagi bayi dan balita dari keluarga miskin menjadi sangat penting, karena kondisi kesehatan dan gizi anak-anak itu secara umum jauh lebih rendah. Pemodelan angka kematian bayi per-nah dilakukan oleh Pramasita (2005) dengan menggunakan komponen utama.
Metode yang digunakan untuk memodelkan angka kematian bayi di Provinsi Jawa Timur tahun 2007 pada penelitian ini adalah dengan menggunakan regresi generalized poisson dengan pemilihan model terbaik menggunakan AIC (Akaike Information Criterion). AIC adalah kriteria pemilihan model yang mempertimbangkan banyaknya parameter dan semakin kecil nilai AIC maka model semakin baik. Regresi generalized poisson adalah salah satu model regresi yang dapat digunakan untuk meng-gambarkan hubungan antara variabel bebas dengan variabel respon, dimana variabel respon diskrit berdistribusi poisson. Suatu peristiwa akan mengikuti distribusi poisson jika peristiwa tersebut jarang terjadi pada selang waktu tertentu. Tujuan dalam penelitian ini adalah menentukan model regresi
gene-ralized poisson yang terbaik untuk angka kematian bayi dan menentukan faktor-faktor yang
mempe-ngaruhi angka kematian bayi di Provinsi Jawa Timur tahun 2007 dengan menggunakan model regresi
generalized poisson. Regresi generalized poisson juga pernah digunakan Sofro (2009) pada penelitian
sebelumnya.
2. Regresi Poisson
Analisis regresi merupakan metode statistika yang populer digunakan untuk menyatakan hubungan antara peubah tak bebas Y dengan peubah-peubah bebas X. Dari uraian tersebut maka regresi poisson adalah salah satu regresi yang dapat menggambarkan hubungan antara variabel respon (y) dimana variabel respon berdistribusi poisson dengan variabel bebas (x). Jika adalah rata-rata ba-i nyaknya sukses yang terjadi dalam selang waktu tertentu dan diasumsikan tidak berubah dari data i
point yang satu ke data point yang lain secara independen maka dapat dimodelkan sebagai fungsi i dari k variabel prediktor (Myers, 1990). Pada model regresi poisson, biasanya link function yang di-gunakan adalah log yaitu ln(i) = i, sehingga fungsi hubungan untuk model regresi poisson
mem-punyai logaritma seperti pada persamaan (1) dan persamaan (2).
yixi
i i xi xi kxik E ln 01 12 2 ln (1) ) exp( ) exp( T 0 1 i1 2 i2 k ik i i x x x x β (2)Khoshgoftaar,dkk (2004) mengatakan bahwa metode regresi Poisson mempunyai kondisi dima-na nilai mean dan varians dari variabel respon bernilai sama. Namun, ada kalanya terjadi fenomedima-na
over/under dispersion dalam data yang dimodelkan dengan distribusi Poisson yaitu varians lebih
besar/lebih kecil daripada mean. Taksiran dispersi diukur dengan nilai devians atau Pearson's Chi-Square yang dibagi derajat bebas. Data overdispersi jika taksiran dispersi lebih besar dari 1 dan under-dispersi jika taksiran under-dispersi kurang dari 1.
Ada suatu model regresi count yang dapat mengatasi masalah over/under dispersion dalam keadaan data tidak terlalu banyak nol, yaitu model Negative Binomial (NB) dan Generalized Poisson (GP). Model regresi GP mirip dengan model regresi Poisson yaitu merupakan suatu model GLM. Akan tetapi pada model regresi GP mengasumsikan bahwa komponen randomnya berdistribusi
Gene-ralized Poisson. Model regresi geneGene-ralized poisson mempunyai bentuk yang sama dengan model
regre-si poisson.
yi xi
i i xi xi kxik E ln 01 12 2 ln (3) ) exp( ) exp( iT 0 1 i1 2 i2 k ik i x x x x β (4)3. Penaksiran Parameter dan Pengujian Regresi Poisson
Metode MLE adalah salah satu metode penaksiran parameter yang dapat digunakan untuk me-naksir parameter suatu model yang diketahui distribusinya. Sebagaimana diketahui bahwa estimasi parameter melalui metode MLE adalah melakukan turunan parsial fungsi ln-likelihood terhadap para-meter yang akan diestimasi. Fungsi ln-likelihood untuk regresi poisson adalah sebagai berikut.
) ( lnLβ =
n i i T i T i i x x y y 1 ( β) exp( β) ln ! (5)Kemudian persamaan (4) diturunkan terhadap β disamakan dengan nol dan diselesaikan deng-an metode iterasi numerik yaitu Newton-Raphson. Untuk menguji kelayakdeng-an model regresi Poisson, terlebih dahulu ditentukan dua buah fungsi likelihood yang berhubungan dengan model regresi yang diperoleh. Fungsi-fungsi likelihood yang dimaksud adalahL( )ˆ yaitu nilai likelihood untuk model
lengkap dengan melibatkan variabel prediktor dan L(ˆ), yaitu nilai likelihood untuk model sederhana
tanpa melibatkan variabel prediktor. Salah satu metode yang digunakan untuk menentukan statistik uji dalam pengujian parameter model regresi Poisson adalah dengan menggunakan metode Maximum
Likelihood Ratio Test (MLRT) dengan hipotesis: H0: 12k 0
H1: paling tidak ada satu βj ≠ 0, j = 1,2,…,k
Statistik uji untuk kelayakan model regresi poisson adalah sebagai berikut.
G = ) ˆ ( ) ˆ ( ln 2 L L = 2
lnL(ˆ)lnL(ˆ)
(6) Keputusan:Tolak H0jika Ghitung v2,, dengan v adalah banyaknya parameter model dibawah populasi dikurangi
estimasi parameter belum tentu mempunyai pengaruh yang signifikan terhadap model. Untuk itu perlu dilakukan pengujian terhadap parameter model regresi poisson secara individu. Dengan menggunakan hipotesis sebagai berikut.
H0: βi = 0 (pengaruh variabel ke-i tidak signifikan) H1: βi ≠ 0 (pengaruh variabel ke-i signifikan)
Statistik uji yang digunakan adalah sebagai berikut. ˆ ˆ i i i t SE( ) (7)
daerah penolakannya adalah H0akan ditolak jika |thit| > tα/2;vdimana α adalah tingkat signifikansi dan v
adalah derajat bebas.
Terdapat beberapa metode dalam menentukan model terbaik pada regresi generalized poisson, salah satunya adalah Akaike Information Criterion (AIC). Menurut Bozdogan (2000) Akaike Information
Criterion (AIC) didefinisikan sebagai berikut.
k L
AIC2ln (
ˆ)2 (8) dimanaL(
ˆ)adalah nilai likelihood, dan k adalah jumlah parameter. Model terbaik regresigene-ralized poisson adalah model yang mempunyai nilai AIC terkecil. 4. Kematian Bayi
Kematian bayi adalah kematian yang terjadi antara saat setelah bayi lahir sampai bayi belum berusia tepat satu tahun. Banyak faktor yang dikaitkan dengan kematian bayi. Secara garis besar, dari sisi penyebabnya, kematian bayi ada dua macam yaitu endogen dan eksogen. Kematian bayi endogen atau yang umum disebut dengan kematian neonatal adalah kematian bayi yang terjadi pada bulan pertama setelah dilahirkan, dan umumnya disebabkan oleh faktor-faktor yang dibawa anak sejak lahir, yang diperoleh dari orang tuanya pada saat konsepsi atau didapat selama kehamilan. Kematian bayi eksogen atau kematian post neonatal, adalah kematian bayi yang terjadi setelah usia satu bulan sampai menjelang usia satu tahun yang disebabkan oleh faktor-faktor yang bertalian dengan pengaruh ling-kungan luar. Kematian bayi disebabkan oleh beberapa faktor yaitu: usia ibu pada saat melahirkan, jumlah pemeriksaan yang dilakukan oleh ibu pada saat hamil, tingkat pendidikan ibu, jumlah sarana kesehatan, dan persentase daerah yang berstatus desa, dan lain-lain.
5. Metodologi
Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari hasil Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2007 yang dilakukan oleh BPS (Badan Pusat Statistika). Pada penelitian ini menggunakan data angka kematian bayi pada tahun 2007 untuk tiap Kabupaten/Kota di Provinsi Jawa Timur yang terdiri dari 38 Kabupaten/Kota.
Variabel dalam penelitian ini terdiri dari variabel respon dan prediktor. Adapun variabel yang digunakan untuk penilitian ini adalah:
1. Variabel respon (Dependent variable)
Dalam penelitian ini yang menjadi variabel respon adalah data angka kematian bayi tahun 2007 pada Provinsi Jawa Timur.
2. Variabel bebas (independent variable) atau variabel prediktor
Sedangkan yang menjadi variabel bebas atau variabel independen pada penelitian ini adalah jumlah sarana kesehatan (RS & puskesmas) pada tiap kabupaten/kota, persentase persalinan yang dilakukan dengan bantuan non medis (dukun bayi) pada tiap kabupaten/ kota, rata-rata usia perkawinan pertama pada tiap kabupaten/kota, rata-rata lama sekolah wanita berstatus kawin pada tiap kabupaten/kota, rata-rata jumlah pengeluaran rumah tangga (dalam rupiah) pada tiap ka-bupaten/kota per bulan, persentase daerah yang berstatus desa pada tiap kaka-bupaten/kota, rata-rata lama pemberian ASI eksklusif pada tiap kabupaten/kota, persentase rumah tangga yang memiliki air bersih pada tiap kabupaten/ kota, dan persentase penduduk miskin pada tiap kabupaten/kota.
1. Mendapatkan model Regresi Generalized Poisson terbaik. a. Memeriksa hubungan antar variabel prediktor (kolinieritas) b. Menetukan model regresi poisson
c. Memeriksa kasus Over/under Dispersion d. Menentukan model Regresi Generalized Poisson
e. Menaksir parameter model regresi dengan menggunakan MLE
Pengujian signifikansi parameter regresi menggunakan metode Maximum Likelihood Ratio
Test (MLRT) Dengan hipotesis sebagai berikut. H0: 12k 0
H1: paling tidak ada satu βj ≠ 0, j = 1,2,…,k
Dengan statistik uji seperti pada persamaan (6). Untuk uji parameter regresi secara individual digunakan hipotesis sebagai berikut.
H0: βi = 0 (pengaruh variabel ke-i tidak signifikan) H1: βi ≠ 0 (pengaruh variabel ke-i signifikan)
Statistik uji: ˆ ˆ i i i t SE( )
daerah penolakannya adalah H0 akan ditolak jika |thit| > tα/2;v dimana α adalah tingkat
signifikansi dan v adalah derajat bebas.
f. Mendapatkan nilai AIC berdasarkan persamaan (8) untuk mendapatkan model regresi terbaik 2. Mendapatkan model terbaik
Untuk menentukan model terbaik yang menggambarkan hubungan antara variabel respon dan variabel prediktor yaitu dengan melihat nilai AIC pada masing-masing model. Model yang mem-punyai nilai AIC terkecil dan parameternya signifikan merupakan model regresi terbaik.
6. Pembentukan Model Regresi Poisson Angka Kematian Bayi di Provinsi Jawa Timur
Data jumlah angka kematian (Infant Mortality) dan penyebabkan dimodelkan dengan meng-gunakan model regresi poisson untuk mengetahui hubungan antar variabel respon dengan variabel prediktor. Hasil nilai estimasi parameter mencapai konvergen setelah iterasi ke-21. Selanjutnya, dilakukan pengujian parameter secara serentak untuk mengetahui ada tidaknya pengaruh variabel prediktor terhadap variabel respon dengan menggunakan hipotesis sebagai berikut:
H0:
1
2
9 0H1: paling tidak ada satu βj ≠ 0, j = 1,2,…,9
Nilai Ghitung pada analisis ini adalah 707,4 sedangkan 2 7 ; 05 , 0
= 14,067. Karena nilai Ghitung >
2 7 ; 05 , 0
maka tolak H0, yang berarti paling tidak ada satu βjyang berpengaruh terhadap model.
Untuk mengetahui pengaruh yang diberikan setiap variabel prediktor tersebut, dilakukan pengujian parameter secara parsial dengan menggunakan hipotesis sebagai berikut.
H0:i= 0 (pengaruh variabel ke-i tidak signifikan)
H1:i≠ 0 (pengaruh variabel ke-i signifikan)
Berdasarkan analisis diperoleh parameter model regresi untuk Provinsi Jawa Timur yang signifikan adalah β0, β1, β3, β4, β6, β7, dan β8,. Karena nilai Thitung > ttabel (2.0244) atau PValue <
α=0,05. Hal tersebut berarti variabel prediktor yang signifikan adalah X1, X3, X4, X6, X7, dan X8,
sehingga diperoleh model regresi Poisson berikut.
Analisis adanya kasus dispersion digunakan untuk mengetahui apakah model regresi poisson yang diperoleh memenuhi asumsi, dengan melihat nilai devian yang dibagi dengan nilai derajat be-basnya. Berikut ini adalah tabel nilai devian hasil output software SAS.
Tabel 1 Nilai Devians untuk Model Regresi Poisson Data Infant Mor-tality di Provinsi Jawa Timur pada Tahun 2007
Kriteria Nilai DF Nilai/DF
Deviance 542.6002 28 19.3786
Pearson Chi Square 601.9733 28 21.4990
Tabel 1 menunjukkan nilai devians dari model regresi poisson adalah 542,6002. Jika nilai devians tersebut dibagi dengan derajat bebasnya maka akan menghasilkan nilai sebesar 19,3786 yang nilai tersebut lebih besar dari 1. Dari hal tersebut maka dapat disimpulkan bahwa data jumlah angka kematian bayi di provinsi Jawa Timur mengalami overdispersion. Untuk mengatasi hal tersebut maka digunakan GPR (Generalized Poisson Regression) dalam pemodelan data.
Model regresi generalized poisson mengatasi asumsi pada model regresi poisson, karena model regresi generalized poisson tidak mengharuskan data berdistribusi poisson (equi-dispersion). Untuk tahap pertama dilakukan pemilihan model terbaik dengan melihat nilai AIC pada model regresi. Karena terdapat 9 variabel prediktor yang digunakan untuk pembentukan model Regresi Poisson maka didapatkan 512 kemungkinan model. Untuk model regresi generalized poisson yang mempunyai nilai AIC terkecil pada masing-masing kombinasi variabel disajikan pada Tabel 2 sebagai berikut.
Tabel 2 Nilai AIC pada Kemungkinan Model Regresi Generalized Poisson
Model AIC ) exp( 0 6x6i 315,2 ) exp(05x5i8x8i 316,6 ) exp(03x3i5x5i8x8i 318,4 ) exp(01x1i2x2i3x3i5x5i 320,3 ) exp(01x1i2x2i3x3i5x5i8x8i 321,8 ) exp(01x1i2x2i3x3i4x4i7x7i8x8i 323,2 ) exp(01x1i2x2i3x3i6x6i7x7i8x8i9x9i 324,7 ) exp(01x1i2x2i3x3i4x4i6x6i7x7i8x8i9x9i 326,1
Model yang mempunyai nilai AIC terkecil adalah model regresi generalized poisson dengan variabel yang masuk dalam model yaitu X6, tetapi ternyata variabel X6 tidak berpengaruh signifikan
terhadap model. Pada penelitian ini digunakan model regresi generalized poisson dengan variabel yang masuk dalam model yaitu X1, X2, X3, dan X5 dengan nilai AIC 320,3 karena model dengan
urutan nilai AIC ke-2 dan ke-3 dari terkecil ternyata variabel prediktornya yang masuk dalam model tidak signifikan. Berikut ini adalah estimasi parameter model regresi generalized poisson data jumlah kematian bayi di Provinsi Jawa Timur.
Tabel 3 Nilai Estimasi Parameter Model Regresi generalized Poisson
Parameter Estimasi SE DF T P-Value
β0 10,5728 0,00469 38 2254,3 <0,0001 β1 -0,00306 0,003713 38 -0,82 0,4153 β2 -0,01107 0,01128 38 -0,98 0,3325 β3 -0,3248 0,08632 38 -3,76 0,0006 β5 -0,00000242 0,0000053 38 -0,45 0,6524 ω 0,1946 0,03577 38 5,44 <0,0001
Nilai estimasi parameter mencapai konvergen setelah ite-rasi ke-31. Dengan menggunakan paket program SAS diperoleh hasil seperti pada Tabel 3. Selanjutnya dilakukan pengujian parameter secara serentak dengan menggunakan hipotesis sebagai berikut.
H0: 125 0
H1: paling tidak ada satu βj ≠ 0, j = 1,2,3,5
Dari hasil analisis diperoleh nilai Ghitungadalah 308,3 sedangkan 2 7 ; 05 , 0
= 14,067. Karena nilai Ghitung
> 2 7 ; 05 , 0
maka tolak H0, yang berarti paling tidak ada satu βj yang berpengaruh terhadap model.
Untuk mengetahui pengaruh yang diberikan oleh setiap variabel prediktor tersebut, dilakukan pengujian parameter secara parsial dengan menggunakan hipotesis sebagai berikut.
H0:i= 0 (pengaruh variabel ke-i tidak signifikan)
H1:i≠ 0 (pengaruh variabel ke-i signifikan)
Dari hasil analisis diperoleh parameter yang signifikan terhadap model regresi generalized poisson untuk Provinsi Jawa Timur tahun 2007 adalah β0dan β3. Karena nilai Thitung > ttabel(2.0244)
atau PValue < α untuk α = 0,05. Hal tersebut berarti variabel prediktor yang signifikan adalah X3
sedangkan variabel yang lain tidak berpengaruh signifikan. Nilai ω > 0 hal tersebut menunjukkan bahwa regresi generalized poisson merepresentasikan data yang overdispersi. Model regresi
ge-neralized poisson yang diperoleh adalah sebagai berikut.
10,5728-0,00306 1-0,01107 2-0,3248 3-0,00000242 5
exp
ˆ x x x x
Dari model regresi generalized poisson yang diperoleh dapat dilihat bahwa faktor yang mempengaruhi jumlah angka kematian bayi di Provinsi Jawa Timur adalah jumlah sarana kesehatan, persentase persalinan yang dilakukan dengan bantuan non medis, rata-rata usia perkawinan pertama dan rata-rata jumlah pengeluaran rumah tangga (dalam rupiah) per bulan pada tiap kabupaten/kota.
7. Kesimpulan
Berdasarkan analisis dan pembahasan model regresi poisson yang diperoleh ternyata tidak memenuhi asumsi equi-dispersion sehingga digunakan model regresi generalized poisson untuk pe-modelan data angka kematian bayi di provinsi Jawa Timur tahun 2007. Dari analisis dan pembahasan diperoleh model regresi generalized poisson dengan kriteria pemilihan model terbaik AIC adalah sebagai berikut.
10,5728-0,00306 1-0,01107 2-0,3248 3-0,00000242 5
exp
ˆ x x x x
Berdasarkan model regresi generalized poisson yang diperoleh dapat dilihat bahwa faktor yang mempengaruhi jumlah angka kematian bayi di Provinsi Jawa Timur adalah jumlah sarana kesehatan, persentase persalinan yang dilakukan dengan bantuan non medis, rata-rata usia perkawinan pertama dan rata-rata jumlah pengeluaran rumah tangga (dalam rupiah) per bulan pada tiap kabupaten/kota. DAFTAR PUSTAKA
Agresti, A.(2002). Categorical Data Analysis Second Edition, John Wiley & Sons, New York. Arriaga, A.E.(1979). Infant and Child Mortality in Selected Asian Countries. Proceding of The
Meeting on Socio economic Determinants of Consequences of Mortality, Mexico City.
Astuti, E.T & Yanagawa, T.(2002).Testing Trend for Count Data with Extra-Poisson Variability.
Biometrics, 58, 398-402
Badan Penelitian & Pengembangan Kesehatan.(1995). Survei Kesehatan Rumah Tangga 1995. Jakarta: Departemen Kesehatan RI.
Badan Pusat Statistik.(2001). Estimasi Fertilitas, Mortalitas dan Migrasi Hasil Sensus Penduduk
Tahun 2000. Jakarta :Badan Pusat Statistik.
Bappenas dan LD-UI.(2003). Kajian Awal Perencanaan Jangka Panjang bidang Sumber Daya
Manusia: Draft Awal, Jakarta.
Information Complexity, Mathematical Psychology, 44, 62-91.
Cameron & Trivedi.(1998). Regression Analysis of Count Data. United Kingdom: Cambridge University Press.
Draper, N.R., Smith, H.(1992). Analisis Regresi Terapan, Edisi Kedua, Alih Bahasa : Bambang Sumantri. Jakarta: PT Gramedia Pustaka Utama.
Famoye, F., Wulu, J.T. & Singh, K.P.(2004). On The Generalized Poisson Regression Model with an Application to Accident Data. Journal of Data Science 2 (2004) 287-295.
Hocking, R.(1996). Methods and Application og Linear Models, John Wiley and Sons, Inc., New York.
Khoshgoftaar, T.M., Gao, K, Szabo, R. M.(2004). “Comparing software fault predictions of pure and zero-inflated Poisson regression models”. International Journal of System Science 36,11: 705-715.
Komite Penanggulangan Kemiskinan, 2003. Interim Document on Strategy for Poverty Eradication, Jakarta.
Mantra, I.B.(1985). Pengantar Studi Demografi. Yogyakarta: Nurcahaya.
McCullagh, P. & Nelder, J.A.(1989), Generalized Linear Models Second Edition, Chapman & Hall, London.
Myers, R.H.(1990). Classical and Modern Regression with Aplication, Second Edition. Boston: PWS-KENT Publishing Company.
Patriani, A.A.(1995). Karakteristik Keluarga yang Berhubungan dengan Kematian Bayi di Desa
Tertinggal Propinsi Jawa Barat, Jawa Tengah dan Sumatera Selatan Tahun 1999. Thesis
Fakultas Kesehatan Masyarakat – Universitas Indonesia, Depok. Tidak dipublikasikan. Utomo, B.(1984). Kematian Bayi dan Anak di Indonesia: Beberapa Implikasi Kebijakan, Dalam
Laporan Seminar dalam Lokakarya Strategi Penelitian dan Strategi Program untuk Intensifikasi
Penurunan Mortalitas Bayi dan Anak di Indonesia. Jakarta, 25-29 Mei 1984, Jakarta,
Universitas Indonesi, Hal. 51-60.