Kajian Pendugaan Area Kecil Untuk Menduga Jumlah Kematian Bayi Di Jawa Barat

(1)

KAJIAN PENDUGAAN AREA KECIL UNTUK MENDUGA

JUMLAH KEMATIAN BAYI DI JAWA BARAT

ARIE ANGGREYANI

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(2)

(3)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa tesis berjudul Kajian Pendugaan Area Kecil untuk Menduga Jumlah Kematian Bayi di Jawa Barat adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Februari 2016

Arie Anggreyani

(4)

RINGKASAN

ARIE ANGGREYANI. Kajian Pendugaan Area Kecil untuk Menduga Jumlah Kematian Bayi di Jawa Barat. Dibimbing oleh INDAHWATI dan ANANG KURNIA.

Survei Demografi dan Kesehatan Indonesia (SDKI) menyediakan sebagian besar informasi kesehatan di Indonesia. SDKI dilaksanakan setiap lima tahun sekali sejak tahun 1994. Pendugaan berdasarkan data SDKI hanya dilakukan untuk skala nasional atau provinsi sedangkan untuk level kabupaten, kecamatan dan kelurahan/desa masih kurang memadai. Metode pendugaan yang biasa digunakan adalah metode pendugaan langsung. Namun, pendugaan ini menghasilkan galat baku penduga besar. Hal ini disebabkan karena teknik pengambilan contoh yang kompleks dan ukuran contoh yang relatif kecil. Metode yang digunakan untuk mengatasi ketidakstabilan pendugaan langsung adalah pendugaan tidak langsung. Beberapa pendugaan tidak langsung adalah pendugaan tidak langsung berdasarkan model campuran dan pendugaan komposit. Pendugaan dengan model campuran adalah memodelkan dengan mengabungkan pengaruh dan pengaruh tetap sedangkan pendugaan komposit adalah pendugaan yang dilakukan dengan memboboti penduga berdasarkan desain dan model.

Peubah jumlah kejadian yang memiliki peluang yang sangat kecil biasanya diasumsikan memiliki sebaran Poisson. Sebaran Poisson memiliki asumsi equidispersi yaitu nilai harapan sama dengan ragam. Berdasarkan kondisi data, jika ragam amatan lebih besar daripada ragam sebarannya mengindikasikan adanya overdispersi dan sebaliknya disebut underdispersi. Beberapa metode untuk menangani overdispersi adalah dengan sebaran binomial negatif, pendekatan quasi-likelihood dan sebaran Tweedie.

Pada SDKI, terdapat beberapa area yang tidak tersurvei atau disebut nircontoh. Padahal, area nircontoh sangat penting untuk diduga. Sehingga diperlukan pendekatan untuk menduga area yang tidak tersurvei. Salah satu pendekatan yang digunakan adalah mengasumsikan bahwa suatu area memiliki pola kedekatan hubungan dengan area lain. Pendekatan yang digunakan untuk menganalisis pola hubungan antar area tersebut adalah dengan teknik pengerombolan (clustering).

Pada penelitian ini dilakukan pendugaan jumlah kematian bayi untuk kabupaten/kota di Provinsi Jawa Barat dengan membandingkan pendugaan langsung dan tidak langsung menggunakan data SDKI Provinsi Jawa Barat. Provinsi Jawa Barat terdiri dari 26 kabupaten/kota, dan diantaranya ada dua area yang tidak tersurvei yaitu Kota Banjar dan Kota Sukabumi. Hasil analisis pada kasus kematian bayi di Provinsi Jawa Barat diketahui terdapat masalah underdispersi pada model linier campuran Poisson. Berdasarkan plot sisaan dan rasio generalized chi-square dengan derajat bebasnya diketahui model linier

campuran pendekatan quasi-likelihood dan sebaran Tweedie dapat mengatasi masalah dispersi. Pendugaan model terbaik adalah model linier campuran pendekatan quasi-likelihood pada pendugaan komposit dilihat dari nilai MAPE, MSD dan MAD yang paling kecil.

(5)

SUMMARY

ARIE ANGGREYANI. The Study of Small Area Estimation for Estimating the Number of Infant Mortality in West Java, Indonesia. Supervised by INDAHWATI and ANANG KURNIA.

The Indonesian Demographic and Health Survey (IDHS) provides data related to the health subject. IDHS conducts every five years since 1994. The estimation of IDHS data only performs for a national or a provincial scale but not for a district, a sub-district and a village level. Estimation method for a district, subdistrict or village is usually done with the direct estimation. However, the drawback of the direct estimation is standard error estimation will be large. The reason is because the sampling technique is quite complex and the sample size is relatively small. A method to overcome the drawbacks of the direct estimation is a indirect estimation based prediction models of small area estimation (SAE). The two methods in indirect estimation are mixed model and composites estimation. The mixed model is model that contain both fixed and random effects while the composite estimation is an estimation in which combination design based and model based.

The number of occurences variable which has small probability is assumed to have a Poisson distribution. In the Poisson distribution, the expected of mean is equal to variance, namely is called equidispersion. In case, the variance of data is greater than the theoretical variance of Poisson distribution is overdispersion, otherwise it is called underdispersion. Some methods to deal with overdispersion are negative binomial distribution, quasi-likelihood approach and Tweedie distribution.

In IDHS, there are some area not as samples and they are needed to estimate. Those areas are assumed having a close relationship with other areas based on certain variables. One approach to cluster the areas based on the pattern of the relationship is a cluster analysis.

The goal of this study is comparing the direct and indirect estimation of the number of infant deaths for the districts/cities in West Java province. In total, there are 26 districts/cities; 24 districs/cities were surveyed and 2 cities were not surveyed. The two cities were Banjar city and Sukabumi city. The analysis of cases of infant mortality in West Java Province was known having problems of underdispersion on Poisson linear mixed model. Based on the residual plot and generalized chi-square, quasi-likelihood approach and Tweedie distribution can overcome the problem of dispersion. The best estimation method is based on quasi-likelihood approach. It can be seen from the smallest value of MAPE, MAD, and MAD.

(6)

© Hak Cipta Milik IPB, Tahun 2016

Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

(7)

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Sains

pada

Program Studi Statistika

KAJIAN PENDUGAAN AREA KECIL UNTUK MENDUGA

JUMLAH KEMATIAN BAYI DI JAWA BARAT

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2016

(8)

(9)

(10)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala

atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Maret 2015 ini ialah pendugaan area kecil, dengan judul Kajian Pendugaan Area Kecil untuk Menduga Jumlah Kematian Bayi di Jawa Barat.

Terima kasih penulis ucapkan kepada semua pihak yang telah turut berperan serta dalam penyusunan karya ilmiah ini, terutama kepada :

1. Ibu Dr Ir Indahwati, MSi dan Bapak Dr Anang Kurnia, SSi, MSi selaku pembimbing yang telah banyak memberi saran,

2. Bapak Dr. Kusman Sadik, SSi, MSi sebagai dosen penguji pada ujian sidang tesis,

3. Penghargaan penulis sampaikan kepada seluruh staf dan jajaran Pemerintah Kota Pagar Alam atas beasiswa yang telah diberikan,

4. Tim Hibah Penelitian Unggulan Sesuai Mandat dan Tim Bimbingan

Small Area Estimation (SAE) atas bantuan biaya penelitian dan segala

kerjasamanya.

5. Keluarga Besar Program Studi Statistika Sekolah Pascasarjana IPB yang telah banyak membantu baik secara moril maupun nonmoril, 6. Badan Pusat Statistik (BPS) atas segala informasi yang telah diberikan, 7. Ungkapan terima kasih juga disampaikan kepada mama, papa, serta

seluruh keluarga, atas segala doa dan kasih sayangnya.

8. Serta berbagai pihak lain yang tidak dapat penulis sebutkan seluruhnya satu persatu.

Semoga semua bantuan yang diberikan kepada penulis mendapatkan balasan dari Allah SWT. Penulis juga menyadari bahwa tesis ini masih jauh dari kesempurnaan. Namun demikian, penulis berharap semoga karya ilmiah ini dapat bermanfaat bagi semua pihak yang membutuhkan. Aamiin.

Bogor, Februari 2016

(11)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

1 PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 2

2 TINJAUAN PUSTAKA 3

Pendugaan Langsung (Direct Estimation) 3

Pendugaan Tidak Langsung (Indirect Estimation) 4

Dispersi 5

Quasi-Likelihood 5

Sebaran Tweedie 6

Generalized Linear Mixed Model (GLMM) 7

Empirical Best Prediction (EBP) 9

3 METODE 10

Data 10

Prosedur Analisis Data 10

4 HASIL DAN PEMBAHASAN 13

Penduga Langsung 13

Uji Korelasi antar Peubah Penyerta 14

Mendeteksi Masalah Dispersi 14

Penduga Tidak Langsung 16

Ukuran Kebaikan Model 18

Pendugaan Nircontoh 19

5 SIMPULAN DAN SARAN 21

Simpulan 21

Saran 21

DAFTAR PUSTAKA 22

LAMPIRAN 23

(12)

DAFTAR TABEL

1 Peubah respon dan peubah penjelas 10

2 Penduga langsung jumlah kematian bayi di Provinsi Jawa Barat 13 3 Hasil uji korelasi antar peubah penyerta 14 4 Ukuran kesesuaian pendugaan tidak langsung 16 5 Ukuran kebaikan dari pendugaan titik berdasarkan dugaan

langsung, dugaan berdasarkan model campuran, model komposit dengan modifikasi, dan model komposit dengan modifikasi 19 6 Penggerombolan kabupaten/kota di Provinsi Jawa Barat 19 7 Prediksi tingkat kematian bayi per 1000 jiwa untuk area contoh

dan nircontoh 20

DAFTAR GAMBAR

1 Plot sisaan terhadap nilai prediksi (a) model-1, (b) model-2, (c)

model-3, dan (d) model-4 15

2 Hasil prediksi terhadap nilai respon aktual dengan nilai dugaan tidak langsung model-1, model-2, model-3, dan model-4 16 3 Hasil prediksi komposit tanpa modifikasi model-1, model-2,

model-3, dan model-4 17

4 Hasil prediksi komposit dengan modifikasi model-1, model-2,

model-3, dan model-4 18

DAFTAR LAMPIRAN

1 Nilai komponen utama 25

2 Nilai dugaan langsung, dugaan berdasarkan model campuran, dan

dugaan komposit dengan modifikasi 26

3 Dendogram analisis gerombol kota dan kabupaten di Provinsi

(13)

1

1 PENDAHULUAN

Latar Belakang

Informasi kesehatan merupakan salah satu indikator untuk mengukur tingkat pembangunan dan kualitas hidup di suatu wilayah atau negara. Survei Demografi dan Kesehatan Indonesia (SDKI) menyediakan sebagian besar informasi kesehatan. SDKI dilakukan setiap lima tahun sekali sejak tahun 1994. Berdasarkan data SDKI, pendugaan yang dilakukan masih berskala nasional atau provinsi namun dengan adanya sistem desentralisasi diperlukan prediksi untuk area yang lebih kecil seperti level kabupaten, kecamatan maupun kelurahan/desa. Pendugaan untuk level kabupaten, kecamatan maupun kelurahan/desa terkadang masih sulit dilakukan karena memiliki ukuran contoh yang relatif kecil atau terdapat area yang tidak tersurvei. Sadik (2009) dan Kurnia (2009) telah mengaplikasikan suatu metode pendugaan untuk mengatasi hal tersebut yang dikenal dengan metode pendugaan area kecil (small area estimation, SAE).

SDKI didesain berdasarkan teknik penarikan contoh yang kompleks. Pendugaan yang biasa digunakan adalah model desain penarikan contoh ( design-based) disebut juga pendugaan langsung (direct estimation). Namun, metode

pendugaan langsung memiliki galat baku penduganya besar dan tidak dapat dilakukan jika nilai responnya bernilai nol. Untuk menangani masalah tersebut, Rao (2003) telah banyak mengembangkan penelitian pendugaan area kecil dengan meminjam kekuatan pada daerah sekitar untuk menghasilkan presisi yang lebih baik. Peminjaman kekuatan dalam pendugaan area kecil dapat diperoleh dari area yang berdekatan menurut ruang, waktu atau melalui informasi tambahan yang diperkirakan berkorelasi dengan peubah yang diamati (Hajarisman 2013). Pendugaan tersebut biasa disebut pendugaan tidak langsung (indirect estimation). Sadik (2009) menjelaskan bahwa dalam pendugaan tidak

langsung mengasumsikan bahwa keragaman didalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi penyerta (auxiliary) yang berupa pengaruh tetap, sedangkan keragaman specifik

area kecil diasumsikan dapat diterangkan oleh informasi tambahan yang berupa pengaruh acak area.

Peubah jumlah kejadian dengan peluang kejadian sangat kecil biasanya diasumsikan menyebar Poisson. Sebaran Poisson memiliki asumsi equidispersi yaitu nilai harapan sama dengan ragam. Jika ragam lebih besar dari rata-rata mengindikasikan adanya overdispersi dan sebaliknya disebut underdispersi. Overdispersi/underdispersi disebabkan oleh beberapa kemungkinan seperti adanya pencilan, korelasi antar amatan dalam peubah respon, dan kesalahan pendefinisian sebaran. Cameron & Trivadi (1998) dan Stroup (2013) menyatakan jika overdispersi terjadi menyebabkan nilai dugaan galat baku yang lebih kecil (underestimate) dan meningkatnya kesalahan jenis I. Beberapa metode untuk

(14)

2

hanya mengenai fungsi ragam. Dunn & Smith (2005) menjelaskan sebaran Tweedie adalah sebaran keluarga dua parameter dari keluarga eksponensial linier dengan penambahan parameter dispersi.

Pendugaan tidak langsung berbasis model adalah mengabungkan Pendugaan tidak langsung menghasilkan nilai yang tertuju pada garis dugaannya sehingga memungkinkan terjadi bias yang cukup besar. Pendekatan lain yang digunakan dalam pendugaan area kecil adalah pendugaan komposit. Pendugaan komposit adalah pendugaan yang dilakukan dengan memboboti penduga langsung berbasis desain dan pendugaan tidak langsung berbasis model. Pendugaan ini digunakan untuk menyeimbangkan bias dari penduga tak langsung dengan ketidakstabilan dari penduga langsung yaitu dengan memberikan rata-rata terboboti untuk kedua penduga tersebut. Bobot yang digunakan adalah rasio ragam pengaruh acak terhadap total ragam pengaruh acak dan ragam penarikan contoh. Namun, penduga komposit menghasilkan nilai yang sama dengan penduga langsung jika ragam penarikan contoh per area mendekati nol.

Desain dan ukuran contoh yang kecil pada SDKI menyebabkan munculnya juga masalah lain yaitu ketika dilakukan pendugaan untuk area yang tidak tersurvei (nircontoh). Salah satu pendekatan yang digunakan oleh Anisa (2014) untuk menduga area nircontoh adalah dengan mengasumsikan bahwa suatu area memiliki pola kedekatan hubungan dengan area lain. Pendekatan yang digunakan untuk menganalisis pola hubungan antar area tersebut dengan teknik pengerombolan (clustering).

Beberapa penelitian pendugaan jumlah kematian bayi dengan pendekatan area kecil telah banyak dilakukan, seperti Yadav & Ladusingh (2013) di India menduga angka kematian bayi dengan model sintetis, sedangkan Hajarisman (2013) menghitung angka kematian bayi dengan pemodelan area kecil melalui pendekatan model regresi Poisson Bayes berhirarki dua level. Pada penelitian ini dilakukan pendugaan jumlah kematian bayi untuk kabupaten/kota di Provinsi Jawa Barat dengan membandingkan pendugaan langsung, tidak langsung dan komposit menggunakan data SDKI Provinsi Jawa Barat.

Tujuan Penelitian

Tujuan yang ingin dicapai pada penelitian ini adalah:

1. Membangun model pendugaan area kecil terbaik untuk menduga jumlah kematian bayi tingkat kabupaten/kota di Provinsi Jawa Barat,

2. Membandingkan metode terbaik dalam mengatasi masalah dispersi dalam pemodelan, dan

(15)

3

2 TINJAUAN PUSTAKA

Pendugaan Langsung (Direct Estimation)

Pendekatan klasik untuk menduga parameter suatu area didasarkan pada desain penarikan contoh (design-based). Pendugaan tersebut disebut pendugaan

langsung (direct estimation). Metode pendugaan langsung menimbulkan dua

permasalahan penting. Pertama, penduga yang dihasilkan merupakan penduga tak bias tetapi memiliki galat baku yang besar karena diperoleh dari ukuran contoh yang kecil. Kedua, apabila pada suatu area kecil ke-i tidak terwakili di dalam survei, maka tidak memungkinkan dilakukan pendugaan secara langsung (Kurnia 2009).

Penelitian ini menduga jumlah kematian bayi pada tingkat Kabupaten/Kota di Jawa Barat menggunakan data SDKI 2012. Berdasarkan BPS (2012), metode penarikan contoh yang digunakan pada SDKI 2012 dengan metode penarikan contoh tiga tahap. Tahap 1, memilih sejumlah primary sampling unit (PSU) dari kerangka contoh PSU secara probability proportional to size (PPS). Tahap 2, memilih blok sensus secara secara PPS. Dan tahap 3,

memilih jumlah rumah tangga di setiap blok sensus secara sistematik. Teknik penarikan contoh survei tersebut sangat kompleks sehingga pendugaan total dan ragam menjadi sulit.

Metode pendugaan yang digunakan pada penelitian ini adalah metode linierisasi Taylor (Lee & Forthofer 2006). Linierisasi Taylor didesain untuk memperoleh hampiran nilai dan fungsi yang sulit dihitung. Bentuk dari deret

Linierisasi Taylor banyak digunakan untuk memperoleh hampiran beberapa fungsi nonlinier dan ragam dari fungsi tersebut. Dalam aplikasi statistika, pendugaan dengan metode linierisasi Taylor dievaluasi dari nilai rataan atau nilai harapan.

= [� ] + ′[� ] − [� ] + ′′[� ] −[�_! ] + ⋯ (1)

Berdasarkan definisi ragam �[ ] = �[ ] − � [ ] , dan apabila digabungkan dengan persamaan (1), maka dapat diperoleh:

�[ ] = { ′_[� _{]} �} _{+ ⋯}

Dalam kasus fungsi dua peubah, nilai ragamlinierisasi Taylor adalah

�[ , ] ≅ _�� _�� , (2)

Berdasarkan persamaan (2), Jika terdapat ni peubah acak, maka pendekatan ragam dari � = , , … , maka,

(16)

4

Jika persamaan (3) diaplikasikan dengan bobot penduga maka dihasilkan penduga metode Taylor sebagai berikut:

� = �̂ = ∑�

=

, = , , … ,

Pendugaan ragam bagi penduga total area ke-i didefinisikan sebagai berikut:

�[� ] ≅ � [∑ ∑ ]

Pada penelitian ini, adalah total bobot wanita usia subur pada area ke – i

rumah tangga ke-j dan = jumlah kematian bayi area ke – i rumah tangga ke – j.

Pendugaan Tidak Langsung (Indirect Estimation)

Kurnia (2009) dan Sadik (2009) menjelaskan ukuran contoh pada area terkadang berukuran kecil sehingga pendugaan langsung menghasilkan galat baku yang besar. Rao (2003) telah banyak mengembangkan suatu metode pendugaan tidak langsung (indirect estimation). Pendugaan tidak langsung digunakan untuk

meningkatkan keefektifan ukuran contoh dan menurunkan keragaman sehingga lebih akurat. Penduga tak langsung “meminjam informasi” dengan menggunakan nilai peubah dari contoh pada area lain yang diamati. Sadik (2009) menjelaskan salah satu model yang digunakan dalam pendugaan tidak langsung mengasumsikan bahwa keragaman didalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi penyerta (auxiliary) yang berupa pengaruh tetap, sedangkan keragaman specifik area kecil

diasumsikan dapat diterangkan oleh informasi tambahan yang berupa pengaruh acak area. Model pendugaan area kecil terdiri dari model level area (Tipe-A) dan model level unit (Tipe-B).

a. Model level area (Tipe-A)

Model level area digunakan ketika informasi peubah penyerta pada level satuan tidak diketahui sehingga diasumsikan � = �̅ atau � = ∑ � untuk g(.)

tertentu berhubungan dengan peubah penyerta pada area, yaitu ′ ₌

, … , � ′, dengan model liniernya : � = ′ + � , i = 1, …, m, dengan

� ~� , �� merupakan peubah acak pada area ke-i. Penduga langsung �̅̂

diasumsikan diketahui untuk menarik kesimpulan tentang nilai tengah area kecil �̅, yaitu : �̂ = �̅ = � + , i = 1, …, m, dengan adalah galat

penarikan contoh yang menyebar normal ~� , � dan �� diketahui. Kedua model tersebut digabungkan sehingga diperoleh model deterministik pada �

sebagai berikut:

�̂ = �̅ = ′ + � + , i = 1, …, m.

Pada pendugaan area kecil terdapat unit yang terambil (contoh) dan unit yang tidak terambil (nircontoh), sehingga model dapat diuraikan menjadi:

� _{= [}y

(17)

5 b. Model level unit (Tipe-B)

Model level unit digunakan jika data peubah penyerta untuk setiap unit diketahu ′ ₌ _{, … ,}

� ′. Peubah yang diamati berhubungan dengan peubah penyerta melalui model regresi galat tersarang sebagai berikut:

= �̅ = ′ _{+ � +} _,_{i =}_{1, …,}_{m, j=}_{1, …, N}_i

Dispersi

Dispersi adalah ukuran penyebaran suatu kelompok data terhadap nilai tengah datanya. Sebaran Poisson memiliki asumsi nilai rataan sama dengan nilai ragam yang disebut equdispersi. Namun, kondisi yang sering terjadi adalah nilai ragam lebih besar dari rataan disebut overdispersi atau sebaliknya yang disebut underdispersi. Berdasarkan data, overdispersi dikatakan terjadi ketika ragam amatan lebih besar dari ragam secara teori dalam asumsi sebaran Poisson (Stroup 2013). Ketidak terpenuhinya asumsi Poisson memiliki kemiripan konsekuensi dengan ketidak terpenuhinya asumsi homoskedastisitas pada model linier regresi. Cameron & Trivadi (1998) dan Stroup (2013) menyatakan jika overdispersi terjadi menyebabkan nilai dugaan galat baku yang lebih kecil (underestimate) dan meningkatkan kesalahan jenis I, sehingga memberikan

kesimpulan yang keliru.

Beberapa penyebab yang menimbulkan overdispersi adalah ekstra keragaman di dalam peubah acak yang melebihi ragam peubah acak Poisson dan adanya pencilan pada data. Pada model campuran linier terampat, suatu kejadian Y yang mengikuti Poisson tetapi vektor acak v mengikuti suatu sebaran tertentu maka sebaran marginalnya menunjukkan perilaku overdispersi. Hinde & Demetrio (1998) menjelaskan penyebab lain terjadinya overdispersi adalah adamya keheterogenan antara amatan, korelasi antara respon amatan, dan teknik penarikan contohnya dengan gerombol.

Ada beberapa cara yang dapat digunakan untuk mendeteksi overdispersi yaitu nilai devians (deviance) dibagi dengan derajat bebasnya. Jika diperoleh nilai

lebih besar dari 1 maka menandakan adanya overdispersi, sedangkan jika nilai lebih kecil dari 1 maka menandakan adanya underdispersi. Stroup (2013) menjelaskan cara untuk mendeteksi overdispersi/underdispersi dapat dilihat plot sisaan baku, pearson dan studentized terhadap dugaan prediksi rata-rata. Kesimpulannya, dua diagnostik overdispersi yang dapat digunakan adalah plot sisaan dan nilai rasio khi-kuadrat dengan derajat bebas. McCullagh & Nelder (1989) dan Ver Hoef & Boveng (2007) menjelaskan cara yang umum digunakan untuk menangani overdispersi sebaran Poisson menggunakan pendekatan quasi-likelihood atau model binomial negatif.

Quasi-Likelihood

Sebaran data terkadang tidak jelas menyebabkan masalah pemodelan sehingga fungsi likelihood tidak selalu bisa diperoleh. Pendekatan yang dapat digunakan untuk mengatasi ketidakjelasan sebaran adalah melalui pendekatan quasi-likelihood. Quasi-likelihood merupakan suatu framework dalam pemodelan

(18)

6

Pendekatan quasi-likelihood mempunyai sifat-sifat yang penting (Hajarisman 2010) yaitu

1. Berbeda dengan pendekatan fungsi likelihood biasa, dalam fungsi quasi-likelihood tidak menentukan struktur peluang tertentu, tetapi hanya memerlukan asumsi mengenai dua buah momen pertama. Hal ini dapat disimpulkan bahwa fungsi quasi-likelihood mempunyai fleksibiltas tinggi. 2. Pemodelan terbatas, sehingga berbagai kemungkinan kesimpulan juga terbatas.

Pengujian dan selang kepercayaan mengandalkan pendugaan asimtotik.

McCullagh dan Nelder (1989) serta Pawitan (2001) menjelaskan mengenai konsep quasi-likelihood, dengan fungsinya sebagai berikut:

∑ �

=

� � − _{� − � =}

dengan asumsi �[� ] = � dan �[� ] = �� dengan � adalah parameter dispersi. Jika � > menunjukkan overdispersi pada model poisson. Quasi-likelihood dianggap mampu mengatasi masalah overdispersi maupun underdispersi, jika fungsi ragam yang diperoleh mampu mengambarkan ragam datanya.

Sebaran Tweedie

Model eksponensial dispersi (exponential dispersion model, EDM) adalah

sebaran keluarga dua parameter dari keluarga eksponensial linier dengan penambahan parameter dispersi (Jorgensen 1992; Dunn & Smyth 2005; Zhang 2013), dengan fungsi peluang sebagai berikut:

|�, � = , � exp ( � − � �_� )

Beberapa EDM dapat dikarakteristikkan oleh fungsi ragam yang mengambarkan hubungan rataan dan ragam dari sebaran ketika dispersi dianggap konstan. Bentuk khusus dari EDM dengan kekuatan hubungan rataan dan ragam

� = ��_{) dengan nilai}_p_{indeks kekuatan fungsi ragam disebut dengan model} Tweedie. Model Tweedie memuat beberapa sebaran yang penting seperti normal (p=0), Poisson (p=1), gamma (p=2), dan inverse Gaussian (p=3). Penelitian ini

menggunakan model eksponensial dispersi dengan nilai indeks kekuatan p berada pada selang 1 sampai 2 � = ��_{, 1<}_p_{<2). Sebaran Tweedie dengan indeks} 1<p<2 merepresentasikan campuran sebaran Poisson gamma dan memiliki massa

peluang disertai dengan sebaran kontinu menjulur ke garis positif. Sebaran ini disebut juga sebaran Tweedie compound Poisson.

Dunn & Smith (2004) dan Zhang (2013) menjelaskan bahwa fungsi kepekatan peluang sebaran Tweedie dengan p=0, 1, 2, dan 3 dapat ditulis dalam

bentuk tertutup (closed form) sedangkan sebaran Tweedie compound Poisson

(19)

7 secara tertutup. Fungsi ragam dan indeks parameter p ditentukan terlebih dahulu

sebelum dilakukan inferensia. Dalam beberapa aplikasi, nilai indeks parameter p

ditentukan terlebih dahulu oleh penelitinya (Zhang 2013). Generalized Linear Mixed Model (GLMM)

Model linear seperti regresi linear memerlukan asumsi bahwa peubah respon menyebar normal. Namun, pada kenyataannya data yang digunakan tidak selalu menyebar normal. Solusi yang dikemukakan adalah model linear terampat (generalized linear model, GLM). Berdasarkan McCullagh & Nelder (1983),

model linier terampat dapat didefinisikan dalam beberapa komponen model: 1. Komponen acak yang menentukan sebaran peluang peubah respon. Komponen

acak terdiri dari pengamatan independen y dari distribusi di keluarga eksponensial, dengan fungsi sebagai berikut:

|� |�, , � = ( � − �_� + , � )

dengan a(.), b(.), dan c(.) adalah fungsi spesifik, θ adalah parameter kanonik

dan ϕ adalah parameter dispersi.

2. Komponen sistematis, yang menentukan fungsi linear dari peubah penjelas yang digunakan sebagai prediktor,

3. Fungsi hubung yang berkaitan komponen sistematis dan nilai rata-rata dari komponen acak.

Model linear terampat digunakan untuk pengamatan tidak berkorelasi, sedangkan dalam beberapa penelitian didapatkan bahwa pengamatan-pengamatan berkorelasi satu sama lain. Model linear campuran terampat (generalized linear

mixed model, GLMM) mengembangkan model linear terampat dengan

memasukkan korelasi diantara respon, yaitu dengan meliputi pengaruh acak pada prediktor linear dan/atau memodelkan korelasi diantara data secara langsung. Model pendugaan area kecil merupakan bentuk khusus dari GLMM, dengan persamaan sebagai berikut:

� y|v = μ θ=g μ =Xβ+Zv

dengan y vektor N pengamatan, β vektor parameter pengaruh tetap, v vektor parameter pengaruh acak, X dan Z adalah matriks rancangan.

prediktor linear : θ = Xβ+Zv distribusi peubah acak : v ~ iid N ,G

distribusi peubah sisaan : ε ~ iid N ,G

Distribusi atau quasi-likelihood: � y|v = �|�, � � y|v = V_θ/ �V_θ/ , dengan

V_θ/ = [√� � ] = [√ � / � ] dan � = [ / � ].

Pendekatan pendugaan model linear campuran terampat umumnya berdasarkan prinsip kemungkinan (likelihood principle), dengan fungsi likelihood

sebagai berikut:

(20)

8

Bentuk fungsi likelihood pada persamaan (4) biasanya tidak dapat dievaluasi dalam bentuk tertutup dan memiliki integral dengan dimensi yang sama dengan jumlah level dari faktor acak v. Bentuk yang tidak tertutup (closed–form) menjadi

hambatan karena fungsi likelihood yang diperoleh menjadi tidak sederhana. Dua alternatif pendekatan yang dapat digunakan dalam pendugaan parameter adalah sebagai berikut:

- Linearisasi: secara khusus yaitu metode pseudo-likelihood.

- Pendekatan integral: Dua metode yang diterapkan oleh adalah pendekatan Laplace dan adaptif Gauss-Hermite quadrature.

Wolfinger & O’Connell (1993) mengembangkan prosedur pendugaan pseudo-likelihood. Prosedur ini diimplementasikan dengan ketepatan iterasi dari model linear campuran Gaussian terboboti (weighted gaussian linear mixed model) untuk memodifikasi peubah tak bebas. Metode pseudo-likelihood pada

model GLMM menggunakan prosedur sebagai berikut:

1. Hampiran analisis pertama adalah pendekatan deret Taylor. β̂ dan v̂ digunakan untuk menduga β dan v yang didefinisikan �̂ = − _{� =} − _{(Xβ̂ + Zv̂)}_._e̅ adalah pendekatan deret Taylor dengan formula sebagai berikut:

e̅ = − �̂ − − ′_{(Xβ̂ + Zv̂)(Xβ − Xβ̂ + Zv − Zv̂)}

2. Hampiran peluang dan pendekatan distribusi bersyarat e̅ jika diberikan β dan v

dengan sebaran Gaussian memiliki momen pertama dan dua e̅ |β,v yang menganggap bersesuaian dengan e̅ |μ. e̅ |β, � adalah sebaran Gaussian dengan rataan 0 and ragam R_�/ RR_�/ .

3. Hampiran analisis selanjutnya adalah mensubtitusikan μ̂ ke μdalam matriks ragam:

dengan = diag[ � �|� / �]. Bentuk dari model linear campuran terboboti dengan diagonal matriks bobot adalah ̂ = ��− [ ′ �̂ ]− . Fungsi log likelihood Gaussian berkorespondensi dengan model linear campuran y* adalah sebagai berikut:

� �, �, �∗_{, �}∗_| ∗ _{= − log|� | − �}− ∗_{− �} � − ∗_{− � − log �} dengan = − / _�∗ − / _{+ ��}∗_��_,_�_{adalah parameter dispersi,}_�∗_dan

�∗_{direparameterisasi dari matriks}_R_dan_D_.

(21)

9 dengan � = ∗₋ � − − � − ∗_.

4. Berdasarkan persamaan (5) dengan metode numerik, menduga �, v dan

� dihitung sebagai berikut:

�̂ = � − − � − ∗

�̂ = �̂∗ � − − _�̂

�̂ = �̂�_�− _�̂/ ₍₆₎ Persamaan (6) dimaksimumkan dengan memperbaiki matriks D dan R setiap iterasinya.

Empirical Best Prediction (EBP)

Rao (2003) menjelaskan beberapa metode seperti metode Empirical Bayes

(EB) dan Hierarhical Bayes (HB) yang berlaku secara umum dalam menangani

model untuk biner dan data cacahan serta model linear campuran. Metode EB merupakan metode pendugaan parameter yang didasarkan pada metode Bayes dimana inferensia yang diperoleh berdasarkan pada pendugaan distribusi posterior dari peubah yang diamati. Rao (2003) menjelaskan beberapa pendekatan EB diringkas sebagai berikut: (1) mendapatkan fungsi kepekatan peluang (posterior) dari parameter area kecil yang menjadi perhatian, (2) menduga parameter model dari fungsi kepekatan peluang marginal, (3) menggunakan fungsi kepekatan peluang posterior dugaan untuk membuat inferensi parameter area kecil yang menjadi perhatian.

Penduga �̂ disebut Empirical Best Predictor (EBP) dari �̂ karena

diperoleh dari distribusi bersyarat dari �̂ diketahui yi tanpa mengasumsikan sebaran prior pada parameter model. EBP �̂ identik dengan Empirical Best Linear Unbiased Predictor (EBLUP) dengan asumsi normal. �̂��adalah sebagai

berikut : �̂�� _{= ̂ �̂ +} _{− ̂ �̂}

(22)

10

3 METODE

Data

SDKI adalah survei nasional yang dirancang untuk menyajikan informasi mengenai tingkat kelahiran, kematian, keluarga berencana dan kesehatan. Studi kasus yang digunakan pada penelitian ini menggunakan data profil kesehatan Jawa Barat tahun 2012 yang dikeluarkan oleh Dinas Kesehatan Provinsi Jawa Barat dan SDKI tahun 2012 yang dilakukan oleh BPS, BKKBN, KEMENKES, dan dibantu oleh United States Agency for International Development (USAID).

Peubah respon yang diamati pada penelitian ini adalah jumlah kematian bayi untuk setiap rumah tangga dalam 5 tahun sebelum survei, yang diambil dari data SDKI tahun 2012. Peubah tambahan diperoleh dari data profil kesehatan 2012 merupakan hasil registrasi yang dilakukan oleh Dinas Kesehatan di seluruh Kabupaten/Kota di Jawa Barat dengan rincian pada tabel 1.

Kabupaten didefinisikan sebagai level area, dan rumah tangga didefinisikan sebagai unit terkecil. Berdasarkan data SDKI Provinsi Jawa Barat, kabupaten/kota terbagi menjadi dua area, yaitu area contoh dan nircontoh. Pada tahun 2012 Provinsi Jawa Barat terdiri dari 26 kabupaten/kota dengan area contoh sebanyak 24 kabupaten/kota sedangkan 2 area nircontoh yaitu Kota Banjar dan Kota Sukabumi.

Tabel 1 Peubah respon dan peubah penjelas

Peubah Keterangan Satuan

Y Jumlah kematian bayi per kabupaten/kota Jiwa

X1 Jumlah dokter Per 100000 Jiwa

X2 Jumlah puskesmas Per 100000 Jiwa

X3 Jumlah rumah tangga berperilaku hidup

bersih dan sehat (PHBS) Per 10 Rumah Tangga X4 Jumlah bayi yang gizi buruk dan kurang

Pendugaan langsung adalah prediksi respon berupa rataan atau total berdasarkan teknik penarikan contoh atau disebut design-based.

Langkah-langkahnya adalah sebagai berikut:

1. Menghitung jumlah kematian bayi per rumah tangga untuk periode 2007-2012 untuk masing-masing kabupaten/kota di Provinsi Jawa Barat dan mengidentifikasi bobot setiap rumah tangga,

(23)

11 Pendugaan Tidak Langsung

Pendugaan tidak langsung adalah prediksi respon dengan memodelkan peubah respon dengan peubah tambahan yang berkaitan dengan menambah pengaruh acak. Pendugaan tidak langsung yang digunakan berbasis model campuran, dengan langkah-langkah sebagai berikut:

1. Menghitung jumlah kematian bayi untuk periode 2007-2012 untuk masing-masing kabupaten/kota di Provinsi Jawa Barat,

2. Menentukan nilai peubah-peubah penyerta yang diasumsikan terkait dengan jumlah kematian bayi,

3. Memilih peubah penyerta dengan mengidentifikasi terdapat multikolinier antar peubah. Jika terdapat multikolinier maka dilakukan komponen utama agar diperoleh peubah yang saling bebas,

4. Memodelkan peubah respon dan peubah penyerta hasil komponen utama dengan menggunakan model linier campuran terampat. Secara umum model linier campuran terampat dinyatakan dalam bentuk persamaan sebagai berikut:

̂ = − _{� =} − _{(Xβ̂ + Zv̂)}

� = Xβ̂ + Zv̂

dengan y merupakan vektor N pengamatan, � vektor pengaruh tetap, � vektor pengaruh acak, � vektor sisaan, X dan Z adalah matriks rancangan. Prediktor linier � dan g(.) sebagai fungsi penghubung.

Dalam penelitian ini menggunakan 4 model GLMM, yaitu:

Model-1: Model linier campuran Poisson adalah model linier campuran yang peubah respon diasumsikan menyebar Poisson (E(y )=Var(y)=µ ).

Model-2: Model linier campuran binomial negatif adalah model linier campuran yang peubah respon diasumsikan menyebar binomial negatif yang merupakan perluasan dari sebaran Poisson Gamma yang memuat parameter dispersi ϕ dengan Var(y)=µ(1+ ϕµ ).

Model-3: Model linier campuran pendekatan quasi-likelihood. Pendekatan quasi-likelihood memiliki keuntungan tidak memerlukan diketahuinya bentuk sebaran dari peubah respon. Fungsi quasi-likelihood didefinisikan sebagai (McCullagh & Nelder 1989):

Model-4: Model linier campuran pendekatan sebaran Tweedie. Sebaran Tweedie adalah keluarga eksponensial linier dengan menambahkan parameter dispersi dengan fungsi ragamnya

� = ��_{(Dunn & Smyth 2005).}

(24)

12

6. Memeriksa dispersi dengan plot sisaan dan nilai devians dibagi derajat bebas setiap model,

7. Menduga jumlah kematian bayi berdasarkan keempat model tersebut. Pendugaan Komposit

Pendugaan komposit adalah pendugaan yang dilakukan dengan memboboti antara penduga berbasis desain dan berbasis model, dengan langkah-langkah sebagai berikut:

1. Mengunakan nilai penduga langsung �̂� dan ragam penarikan contoh��, 2. Mengunakan nilai penduga tidak langsung �̂�. dan ragam pengaruh acak ��, 3. Menghitung penduga komposit dengan pedekatan pendugaan empirical best

prediction (EBP) dengan rumus: �̂_�� = ̂_��̂_�+ − ̂_� �̂_�.dengan �̂_�. =

� � � + �� sebagai penduga tidak langsung, ̂� =_�_��_+�� _� adalah bobot, dan

�̂�adalah penduga langsung,

4. Untuk beberapa area yang nilai responnya bernilai nol, menghasilkan ragam penarikan contohnya bernilai nol juga. Sehingga untuk mengatasi masalah tersebut dilakukan modifikasi dengan mengasumsikan bahwa suatu area memiliki hubungan kedekatan dengan area lain. Pendekatan ini menggunakan teknik pengerombolan. Penduga komposit modifikasi dihitung dengan rumus:

�̂��= ̂��̅̂� � + − ̂� �̂�.dengan �̂�. = � � � + �� sebagai penduga

Beberapa nilai statistik untuk menghitung ukuran kebaikan dengan menghitung nilai MAPE, MAD, dan MSD dengan formula sebagai berikut: - MAPE (Mean Absolute Percentage Error) = ∑ |� −�̂

1. Melakukan penggerombolan area berdasarkan peubah-peubah penjelas,

2. Mengindentifikasi area yang tidak tersurvei ke dalam gerombol yang terbentuk, 3. Menghitung nilai tengah pengaruh acak area yang segerombol, dengan formula

sebagai berikut:

�̅� = _�_�∑��=� �̂�,

4. Menduga jumlah kematian bayi untuk area yang tidak tersurvei, dengan model prediksi untuk area nircontoh sebagai berikut:

�̂�∗�= � � � + �̅�

(25)

13

4 HASIL DAN PEMBAHASAN

Penduga Langsung

Berdasarkan publikasi SDKI Tahun 2012, SDKI menggunakan empat macam kuesioner, yaitu rumah tangga, wanita usia subur, pria kawin, dan remaja pria. Pengukuran jumlah kematian bayi diperoleh dari kuesioner wanita usia subur (WUS) 15-49 tahun dengan bayi adalah anak berusia umur 0-12 bulan. Dalam SDKI 2012, jumlah WUS yang terambil menjadi contoh sebanyak 4132 jiwa dengan 1647 rumah tangga pada Tabel 2. Dari 4132 jiwa WUS, terdapat 727 jiwa WUS yang melahirkan pada tahun 2007-2012 dengan jumlah bayi lahir sebesar 814 jiwa. Jumlah kematian bayi (<12 bulan) sebanyak 29 jiwa dari 814 jiwa bayi lahir.

Tabel 2 Penduga langsung jumlah kematian bayi di Provinsi Jawa Barat

Kode

(26)

14

jumlah penduga yang cukup tinggi tidak sesuai jumlah penduduknya yang relatif kecil. Hal ini mengindikasikan kejadian kematian cukup tinggi di Kabupaten Kuningan. Jika dilihat berdasarkan ragam penarikan contohnya, Kabupaten Bogor, Kabupaten Kuningan, Kota Bandung, Kota Cirebon dan Kota Depok adalah lima teratas kabupaten/kota yang ragamnya besar. Ada beberapa area yang bernilai nol, hal ini disebabkan karena tidak ada kematian bayi dari contoh yang terambil.

Uji Korelasi antar Peubah Penyerta

Hasil pendugaan langsung pada Tabel 2 menunjukkan dugaan dan ragam penarikan contoh per kabupaten/kota yang masih cukup besar. Salah satu cara yang digunakan untuk mengatasi hal tersebut dilakukan pendugaan berbasis model dengan mencari peubah penyerta yang dianggap memiliki hubungan. Berdasarkan data profil kesehatan Provinsi Jawa Barat terpilih 5 buah peubah penyerta pada Tabel 1. Hasil uji korelasi dari kelima peubah tersebut yang tersaji pada Tabel 3. Tabel 3 menunjukkan terdapat beberapa peubah penyerta yang berkorelasi nyata yaitu jumlah dokter (X1) dengan jumlah puskesmas (X2), jumlah

puskesmas (X2) dengan jumlah PHBS (X3), dan jumlah puskesmas (X2) dengan

Jumlah BBLR (X5). Hal ini mengindikasikan adanya masalah multikolineritas

sehingga untuk mengatasi adanya korelasi antara peubah penyerta diterapkan komponen utama untuk mendapatkan peubah yang saling bebas. Semua komponen utama (Lampiran 1) digunakan tanpa mengurangi komponen agar informasi awal tidak hilang.

Tabel 3 Hasil uji korelasi antar peubah penyerta

(27)

15 2013). Pada kasus ini, diagnostik dispersi yang digunakan adalah plot sisaan dan rasio antara nilai devians dengan derajat bebasnya.

Gambar 1 menggambarkan pemeriksaan kelayakan keempat model dengan mendeteksi overdispersi dengan pola hubungan rata-rata prediksi (predicted mean) terhadap sisaan. Jika diidentifikasi lebih lanjut Gambar 1a dan 1b, nilai

rata-rata prediksi meningkat bersamaan dengan nilai sisaannya maka menunjukkan sisaan yang tidak homogen. Hal ini mengindikasikan masih adanya masalah dispersi. Pola hubungan rata-rata prediksi dengan sisaan yang cukup homogen terdapat pada Gambar 1c dan 1d. Hal ini berbeda pada Gambar 1a dan 1b, pada Gambar 1c dan 1d nilai sisaan cukup besar ketika rata-rata prediksi bernilai nol. Namun jika dilihat berdasarkan kebebasan sisaan, keempat model memiliki sisaan yang polanya tidak bebas.

\

Gambar 1 Plot sisaan terhadap nilai prediksi (a) model-1, (b) model-2, (c) model-3, dan (d) model-4

Cara lain untuk mendeteksi masalah overdispersi dapat dilihat berdasarkan nilai devians dibagi derajat bebas. Nilai generalized chi-square dibagi derajat

bebas model linier campuran poisson (model-1) pada Tabel 4 memiliki yang lebih kecil dari satu, sehingga menunjukkan adanya masalah underdispersi. Pada hakikatnya sebaran binomial negatif memiliki nilai ragam yang lebih besar dari sebaran Poisson dan bernilai sama ketika nilai ϕ = 0. Namun, model linier

campuran binomial negatif (model-2) memiliki nilai yang sama dengan model-1. Hal ini menunjukkan bahwa sebaran binomial negatif belum dapat menjelaskan keragaman datanya. Model-3 dengan fungsi ragam sebesar � � = . � dan

model-4 dengan fungsi ragam sebesar � � = . � . , nilai rasio antara

(a) (b)

(28)

16

generalized chi-square dan derajat bebas yang diperoleh sama dengan satu. Hal

ini mengambarkan karakteristik fungsi ragam dapat mengatasi masalah dispersi. Tabel 4 Ukuran kesesuaian pendugaan tidak langsung

Ukuran Kesesuaian Model-1 Model-2 Model-3 Model-4

-2 Res Log Pseudo-likelihood 69.17 69.05 77.23 78.64

Generalized Chi-Square 13.31 13.36 17.97 17.92

Gener. Chi-Square / df 0.74 0.74 1 1

Penduga Tidak Langsung

Pendugaan tidak langsung diperoleh dengan memodelkan peubah respon dan peubah tambahan untuk menduga parameter dan komponen ragam dari data contoh dengan menggunakan pendekatan pseudo-likelihood. Statistik itu kemudian digunakan untuk menduga nilai prediksi setiap model. Hasil prediksi keempat model dapat dilihat pada Gambar 3. Diagram batang tersebut menunjukkan bahwa nilai prediksi model yang mendekati nilai respon aktual adalah model linier campuran pendekatan quasi-likelihood dan model linier campuran pendekatan sebaran Tweedie dibandingkan dua model lainnya.

01 Kab. Bogor 07 Kab. Ciamis 13 Kab. Subang 73 Kota Bandung

Gambar 2 Hasil prediksi terhadap nilai respon aktual dengan nilai dugaan tidak langsung model-1, model-2, model-3, dan model-4

Nilai prediksi model linier campuran Poisson dan model campuran binomial negatif memberikan nilai dugaan yang terkadang lebih besar dari nilai aktualnya (overestimate) dan lebih kecil dari nilai aktualnya (underestimate).

Area yang terdeteksi nilai prediksinya terlalu overestimate terdapat pada sisi kiri

Gambar 2 yaitu Kota Sukabumi, Kabupaten Tasikmalaya, Kabupaten Bekasi,

0

Nilai Respon aktual Model-1 Model-2 Model-3 Model-4

(29)

17 Kabupaten Ciamis, Kabupaten Majalengka, Kabupaten Indramayu, Kabupaten Karawang, Kabupaten Bandung Barat, Kota Cirebon, Kota Cimahi dan Kota Tasikmalaya. Beberapa area yang terdeteksi yang terlalu underestimate terdapat

pada sisi kanan Gambar 2 adalah Kabupaten Bogor, Kabupaten Bandung, Kota Bandung, dan Kabupaten Kuningan.

Model dasar pendugaan area kecil mengunakan model level area yang dibangun dari Model Fay dan Herriot. Berdasarkan hasil estimasi berbasis desain dan berbasis model, dilakukan prediksi pendugaan area kecil untuk kabupaten dan kota dengan menggunakan model komposit yang setiap pendugaan memberikan bobot terhadap pendugaan pada Gambar 3. Jika diperbandingkan pendugaan tidak langsung dan pendugaan komposit, selisih nilai dugaan dengan nilai aktualnya yang memiliki nilai yang paling kecil adalah pendugaan komposit pendekatan quasi-likelihood. Hal ini mungkin didapatkan karena pemilihan fungsi ragam pada model quasi-likelihood yang lebih mengambarkan ragam data sebenarnya.

Nilai dugaan komposit untuk beberapa daerah masih bernilai nol terlihat pada Gambar 3. Kota dan kabupaten yang dugaannya masih bernilai nol adalah kabupaten Sukabumi, Kabupaten Tasikmalaya, Kabupaten Ciamis, Kabupaten Majalengka, Kabupaten Subang, Kabupaten Bekasi, Kota Cimahi dan Kota Tasikmalaya. Hal ini dikarenakan ragam penarikan contoh beberapa daerah bernilai nol yang menyebabkan bobotnya sama dengan satu sehingga diperoleh dugaan komposit sama dengan dugaan langsung.

01 Kab. Bogor 07 Kab. Ciamis 13 Kab. Subang 73 Kota Bandung

(30)

18

Salah satu pendekatan yang dapat digunakan untuk mengatasi masalah dugaan bernilai nol adalah mengasumsikan bahwa suatu area memiliki pola kedekatan hubungan dengan area lain dengan teknik pengerombolan. Bobot yang digunakan pada pendugaaan komposit adalah rasio ragam peubah acak terhadap total ragam peubah acak dan ragam penarikan contoh. Dugaan langsung dan ragam penarikan contohnya diperoleh dugaan langsung dan ragam penarikan contoh dari area yang segerombol. Hasil dugaan komposit dengan modifikasi tersaji pada Gambar 4.

Gambar 4 Hasil prediksi komposit dengan modifikasi 1, 2, model-3, dan model-4

Ukuran Kebaikan Model

(31)

19 Tabel 5 Ukuran kebaikan dari pendugaan titik berdasarkan dugaan langsung, dugaan berdasarkan model campuran, model komposit dengan modifikasi, dan model komposit dengan modifikasi

Ukuran

Campuran Dugaan Komposit tanpa Modifikasi Dugaan Komposit dengan Modifikasi Model

Pembentukan gerombol dilakukan dengan pendekatan analisis faktor dan gerombol berhirarki. Analisis faktor digunakan untuk melihat hubungan antar peubah-peubah yang diamati. Pengerombolan berdasarkan hasil skor faktor menggunakan metode analisis gerombol Berhirarki. Hasil analisis terasji pada Lampiran 3. Berdasarkan jarak antar gerombol yang paling jauh, jumlah gerombol yang terbentuk sebanyak 6 gerombol (Tabel 6). Daerah nircontoh yaitu Kota Banjar dan Kota Sukabumi segerombol dengan Kabupaten Subang, Kabupaten Ciamis, Kota Bandung, Kabupaten Garut dan Kab. Indramayu.

Tabel 6 Penggerombolan kabupaten/kota di Provinsi Jawa Barat Gerombol Jumlah _Anggota Anggota Gerombol

1 6 Kab. Kuningan (8), Kab. Cirebon (9), Kab. Majalengka (10), Kab. Tasikmalaya (6), Kab. Sumedang (11), Kab. Sukabumi (2)

2 6 Kota Tasikmalaya (78), Kab. Bandung (4), Kab. Bandung Barat (17), Kab. Cianjur (3), Kab. Karawang (15), Kab. Bogor (1)

3 7 Kota Sukabumi (72), Kota Banjar (79), Kab. Subang (13), Kab. Ciamis (7), Kota Bandung (73), Kab. Garut (5), Kab. Indramayu (12)

4 3 Kota Depok (76), Kab. Purwakarta (14)

5 4 Kota Cimahi (77), Kota Bogor (71), Kota Bekasi (75), Kab. Bekasi (16)

6 1 Kota Cirebon (74)

Prediksi area nircontoh dilakukan dengan pendekatan menambahkan rata-rata pengaruh acak dalam satu gerombol. Hasil gerombol pada Tabel 6 menunjukkan bahwa Kota Banjar dan Kota Sukabumi segerombol dengan Kabupaten Subang, Kabupaten Ciamis, Kota Bandung, Kabupaten Garut dan Kabupaten Indramayu. Pengaruh acak untuk Kota Banjar dan Kota Sukabumi diperoleh dari rata-rata pengaruh acak Kabupaten Subang, Kabupaten Ciamis, Kota Bandung, Kabupaten Garut dan Kabupaten Indramayu.

(32)

20

bayi per 1000 kelahiran untuk area nircontoh yaitu Kota Banjar dan Kota Sukabumi untuk model-3 sebesar 57.133 dan 59.083 tingkat kematian bayi dari 1000 kelahiran.

Tabel 7 Prediksi tingkat kematian bayi per 1000 jiwa untuk area contoh dan nircontoh

Kabupaten/Kota Jumlah kematian bayi (per 1000 jiwa kelahiran)

Model-1 Model-2 Model-3 Model-4

Area Contoh

Kab. Bogor 32.744 30.666 38.628 37.958

Kab. Sukabumi 33.675 40.873 11.913 12.145

Kab. Cianjur 24.288 24.540 22.816 22.436

Kab. Bandung 19.983 17.400 37.083 35.183

Kab. Garut 35.179 32.907 43.422 41.321

Kab. Tasikmalaya 29.958 31.815 17.854 17.471

Kab. Ciamis 40.149 40.492 31.786 30.973

Kab. Kuningan 101.16 83.745 152.892 140.132

Kab. Cirebon 44.205 42.874 51.747 51.732

Kab. Majalengka 33.241 34.933 20.619 20.062

Kab. Sumedang 49.201 46.471 66.221 65.361

Kab. Indramayu 45.083 42.667 58.528 57.452

Kab. Subang 18.477 18.363 15.05 14.519

Kab. Purwakarta 58.409 59.130 56.631 56.908

Kab. Karawang 26.860 26.758 26.748 26.383

Kab. Bekasi 14.855 17.081 8.465 8.295

Kab. Bandung Barat 20.751 21.487 14.114 13.671

Kota Bogor 41.799 42.766 37.677 37.503

Kota Bandung 42.748 36.157 66.707 61.622

Kota Cirebon 76.799 81.097 62.158 63.678

Kota Bekasi 20.794 19.458 25.677 25.02

Kota Depok 49.453 50.358 48.446 49.401

Kota Cimahi 59.059 53.187 73.094 73.247

Kota Tasikmalaya 23.624 20.294 43.265 43.27

Area Nircontoh

Kota Sukabumi 42.061 40.667 57.133 59.209

(33)

21

5 SIMPULAN DAN SARAN

Simpulan

Berdasarkan hasil analisis pada kasus kematian bayi di Provinsi Jawa Barat diketahui terdapat masalah underdispersi pada model linier campuran Poisson. Beberapa pendekatan digunakan untuk mengatasi masalah tersebut yaitu model linier campuran dengan sebaran binomial negatif, pendekatan quasi-likelihood dan sebaran Tweedie. Berdasarkan plot sisaan dan rasio generalized chi-square dengan derajat bebasnya diperoleh bahwa model linier campuran

pendekatan quasi-likelihood dan sebaran Tweedie dapat mengatasi masalah dispersi yang dihadapi. Pendugaan terbaik diperoleh berdasarkan pendugaan komposit dengan modifikasi pada model linier campuran pendekatan quasi-likelihood karena memberikan nilai MAPE, MAD, dan MSD lebih kecil dibandingkan pendekatan-pendekatan lainnya.

Saran

Overdispersi dalam data cacahan dapat disebabkan sejumlah alasan asumsi distribusi yang salah misalnya kesalahan asumsi sebaran, banyak respon bernilai nol atau ada pencilan. Berdasarkan keempat model GLMM yang dicobakan pada kasus jumlah kematian bayi di Provinsi Jawa Barat, model campuran pendekatan quasi-likelihood dan sebaran Tweedie dapat mengatasi overdispersi namun masih terindikasi pola sisaan yang tidak saling bebas. Analisis lebih lanjut yang disarankan pemodelan dengan peubah respon banyak bernilai nol yaitu zero inflated model serta dicobakan dengan menambah

(34)

22

DAFTAR PUSTAKA

Anisa R. 2014. Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi kasus pengeluaran per kapita kecamatan di Kota dan Kabupaten Bogor). [tesis]. Bogor (ID): Institut Pertanian Bogor. [BKKBN, BPS, KEMENKES, USAID] Badan Kependudukan dan Keluarga

Berencana Nasional, Badan Pusat Statistik, Kementerian Kesehatan, dan U.S. Agency for International Development. 2013. Laporan Pendahuluan Survei Demografi dan Kesehatan Indonesia 2012. [diunduh 2015 Sept 29]. Tersedia

pada :

http://www.bkkbn.go.id/litbang/pusdu/Hasil%20Penelitian/SDKI%202012/Lap oran%20Pendahuluan%20SDKI%202012.pdf.

[BPS] Badan Pusat Statistik. 2012. Profil Kesehatan Provinsi Jawa Barat 2012.

[diunduh 2015 Juli 2]. Tersedia pada :

http://www.depkes.go.id/resources/download/profil/PROFIL_KES_PROVINSI _2012/12_Profil_Kes.Prov.JawaBarat_2012.pdf.

Cameron AC, Trivedi PK. 1998. Regression Analysis of Count Data. New York:

Cambridge University Press.

Dunn PK, Smyth GK. 2005. Series Evaluation of Tweedie Dispersion Model Densities. J Stat Comp. 15:267-280.

Hadi AF, Notodiputro KA. 2009. Penduga Maksimum Likelihood untuk Parameter Dispersi Model Poisson–Gamma dalam Konteks Pendugaan Area Kecil. BIAStatistika. 3(1): 41-60.

Hajarisman N. 2013. Pemodelan Area Kecil untuk menduga angka kematian bayi melalui pendekatan model regresi Poisson bayes berhirarki dua-level. [disertasi]. Bogor (ID): Institut Pertanian Bogor.

Hinde J, Demetrio CGB. 2007. Overdispersion : Models and Estimation. [diunduh

2015 Desember 31]. Tersedia pada :

http://pointer.esalq.usp.br/departamentos/lce/arquivos/aulas/2011/LCE5868/Ov erdispersionBook.pdf

Jorgensen B. 1992. The Theory of Exponential Dispersion Models and Analysis of

Deviance. [diunduh 2015 Desember 31]. Tersedia pada :

http://www.impa.br/opencms/pt/biblioteca/mono/Mon_51.pdf

Kurnia A. 2009. Prediksi Terbaik Empirik untuk Model Transformasi Logaritma di dalam Pendugaan Area Kecil dengan Penerapan pada Data Susenas [disertasi]. Bogor (ID): Institut Pertanian Bogor.

Lee ES, Forthofer RN. 2006. Analyzing Complex Survey Data 2nd_{ed. USA :}

SAGE Publication.

McCullagh P, Nelder JA. 1989. Generalized Linier Models. New York: Chapman

and Hall.

Pawitan Y. 2001. In All Likelihood: Statistical Modelling and Inference Using Likelihood. New York: Oxford science publications.

Rao JNK. 2003. Small Area Estimation. New York: John Wiley & Sons.

(35)

23 Stroup WW. 2013. Generalized Linear Mixed Models: Modern Concepts,

Methods and Applications. New York: Chapman and Hall.

Ver Hoef JM, Boveng PL. 2007. Quasi-Poisson VS. Negative Binomial Regression: How Should We Model Overdispersed Count Data?. Publications, Agencies, and Staff of the U.S. Departement of Commerce. Paper 142.

http://digitalcommons.unl.edu/usdeptcommercepub/142

Wedderburn RWM. 1974. Quasi-Likelihood Functions, Generalized Linear Models, and the Gauss-Newton Method. Biometrika. 61(3): 439-447.

Wolfinger R, O’connell. 2007. Generalized linear mixed models a pseudo-likelihood approach. J Stat Comput Sim. 48(3-4): 233-243.

doi:10.1080/00949659308811554.

Yadav A, Ladusingh L. 2013. District Level Infant Mortality Rate: an Exposition of Small Area Estimation. Population Association of America–Applied Demography Newsletter Vol. 26 No.1.

(36)

(37)

25 Lampiran 1 Nilai komponen utama

KU1 KU2 KU3 KU4 KU5

-0.5951 0.5869 -0.1921 0.7179 0.2277

0.1513 0.2907 1.5243 0.0647 -0.0130

-0.9722 1.0675 0.3522 0.3432 -0.1587

-1.6003 1.7286 -0.8985 0.3539 -0.1088

-0.3380 -0.4515 0.3591 -0.2417 -0.3278

-0.3456 0.8780 0.7335 -0.5272 0.0108

0.6427 -1.9565 0.0429 -0.0582 -0.4623

1.6268 -0.1829 1.8196 -1.3449 -0.0389

0.6788 2.1309 0.7741 0.8487 0.2049

0.0469 0.2935 0.7442 -0.5074 -0.1799

0.5838 0.5747 0.9347 0.4122 -0.0607

0.4279 -0.6978 0.5004 0.7273 -0.2874

-1.2372 -0.9670 -0.3342 -0.553 -0.9225

0.6049 -2.1058 0.0145 1.4593 0.5436

-0.5961 -0.1016 -0.5022 0.4735 -0.0147

-2.1274 -0.6290 -0.3177 -0.7759 -0.0591

-1.2328 0.5749 -0.0742 -0.0827 -0.1598

0.4197 -0.0783 -0.8448 -1.3495 0.9709

0.0815 -1.0963 -0.3401 0.0846 -0.3229

5.8627 0.5560 -1.6698 -0.2666 -0.2667

-2.0298 -0.3192 -1.3682 -0.8741 0.4268

-0.0985 -1.2659 0.2337 0.9972 0.6956

0.3735 0.2549 0.0943 -0.5467 0.7202

-0.3279 0.9147 -1.5859 0.6454 -0.4175

(38)

26

Lampiran 2 Nilai dugaan langsung, dugaan berdasarkan model campuran, dan dugaan komposit dengan modifikasi

Kode Kabupaten

/ Kota

Dugaan Langsung

Dugaan Berdasarkan Model

Campuran Dugaan Komposit dengan Modifikasi Model

(39)

27 Lampiran 3 Dendogram analisis gerombol kota dan kabupaten di Provinsi Jawa

(40)

28

RIWAYAT HIDUP

Penulis lahir di Bandar Lampung, pada tanggal 28 Mei 1988 dari pasangan Budiman dan Lili Suryani. Namun sejak kecil, penulis tinggal di Kota Pagar Alam, Sumatera Selatan. Pada tahun 2002, penulis melanjutkan pendidikan di SMA Negeri I Pagar alam dan lulus pada tahun 2005. Pada tahun yang sama, penulis diterima sebagai mahasiswa di Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun kedua di IPB, penulis diterima di program studi Statistika sebagai mayor dengan minor Ekonomi Pertanian. Selama masa perkuliahan, penulis aktif dalam beberapa lembaga seperti Ikatan Mahasiswa Bumi Sriwijaya (IKAMUSI), himpunan keprofesian Gamma Sigma Beta (GSB), dan SERUM-G.