MODEL
BAYES
UNTUK
PENDUGAAN
AREA
KECIL
DENGAN
PENARIKAN
CONTOH
BERPELUANG
TIDAK
SAMA
PADA
KASUS
RESPON
BINOMIAL
DAN
MULTINOMIAL
APLIKASI :
PENDUGAAN INDEKS PENDIDIKAN LEVEL
KECAMATAN DI JAWA TIMUR
AGNES TUTI RUMIATI
G161080031
/
STK
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
MODEL
BAYES
UNTUK
PENDUGAAN
AREA
KECIL
DENGAN
PENARIKAN
CONTOH
BERPELUANG
TIDAK
SAMA
PADA
KASUS
RESPON
BINOMIAL
DAN
MULTINOMIAL
APLIKASI :
PENDUGAAN INDEKS PENDIDIKAN LEVEL
KECAMATAN DI JAWA TIMUR
Oleh:
A
GNES
T
UTI
R
UMIATI
G161080031
/
STK
Disertasi
sebagai salah satu syarat untuk memperoleh gelar Doktor
pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
J u d u l : Model Bayes untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama pada Kasus Respon Binomial dan Multinomial.
Aplikasi :
Pendugaan Indeks Pendidikan Level Kecamatan di Jawa Timur
Nama Mahasiswa : Agnes Tuti Rumiati Nomor Pokok : G161080031 Program Studi : Statistika
Menyetujui: Komisi Pembimbing
K e t u a
Prof. Dr. Ir. Khairil A. Notodiputro, MS
Dr. Ir. I Wayan Mangku, MSc
A n g g o t a A n g g o t a
Dr. Ir. Kusman Sadik, MS.
Mengetahui:
Koordinator Program Studi Statistika Dekan Sekolah Pascasarjana
PERNYATAAN MENGENAI DISERTASI DAN
SUMBER INFORMASI
Dengan ini saya menyatakan bahwa disertasi yang berjudul Model Bayes untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus Respon Binomial dan Multinomial adalah hasil karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya penulis lain telah dicantumkan di dalam teks dan daftar pustaka disertasi ini.
Bogor, September 2012
Agnes Tuti Rumiati
ABSTRACT
AGNES TUTI RUMIATI. Bayesian Models for Small Area Estimation Based on Unequal Probability Sampling of Binomial and Multinomial Responses. Under guidance of KHAIRIL ANWAR NOTODIPUTRO, I WAYAN MANGKU and KUSMAN SADIK
In this research a Bayesian Method of Small Area Estimation (SAE) has been developed based on binomial and multinomial response variables using Susenas data obtained from unequal probability sampling. Case study was carried out to predict education level of the population measured by literacy rate and mean years of schooling in sub-district level in East Java Province. The SAE model for binomial response was developed with two methods, i.e. using weighted logit normal mixed model and involving the probability of sampling selection model as exponential function into the SAE model. A simulation study was carried out by implementing 100 times sampling selection into population data. Penalized Quasi Likelihood (PQL) and Restricted Maximum Likelihood method (REML) was used to parameter estimation of SAE model. Based on the simulation result, we found that
the weighted logit normal mixed model gave the best estimate. In application, the weighted
logit normal mixed model also provided good prediction of literacy rate in Sumenep and Pasuruan regency.For the multinomial respons, we applied the weighted logit multinomial mixed model. MSE estimation was used Jackknife method and it gave very small MSE of
about 1,14 x10-7.
RINGKASAN
Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi,
kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau
dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah
yang lebih kecil, umumnya jumlah contoh kurang mencukupi jika digunakan
untuk menduga berdasarkan rancangan.
Di Indonesia, kebutuhan untuk melakukan pendugaan di area kecil mulai
dirasakan terutama untuk merancang dan mengevaluasi kebijakan dan program
pembangunan di level kabupaten /kota. Salah satu indikator yang mengukur hasil
pembangunan di suatu wilayah adalah Indeks Pembangunan Manusia (IPM).
IPM dihitung oleh Badan Pusat Satistik (BPS) dengan menggunakan data dasar
hasil Survai Sosial Ekonomi Nasional (Susenas). Susenas dilakukan oleh BPS
tiap tahun, dirancang untuk menduga parameter sosial-ekonomi level nasional
atau regional sehingga tidak cukup representatif untuk pendugaan parameter
tingkat kecamatan.
Penggunaan data Susenas untuk pendugaan parameter di tingkat
kecamatan atau desa akan menghadapi dua persoalan statistika yaitu:
1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter
berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan
contohnya memiliki peluang tidak sama karena rancangan penarikan contoh
dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil
blok sensus pada tahap pertama dan pada tahap ke dua mengambil rumah
tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam
Susenas memiliki peluang tidak sama.
Penelitian ini bertujuan untuk mengembangkan model SAE untuk
menduga Indeks Pendidikan yang merupakan salah satu komponen IPM. Indeks
Pendidikan diukur dengan angka melek huruf dan rata-rata lama sekolah di
suatu wilayah. Angka melek huruf diukur dengan proporsi penduduk berusia 10
tahun ke atas yang bisa baca tulis, sedangkan rata-rata lama sekolah diukur dari
proporsi penduduk berusia 10 tahun ke atas di tiap level pendidikan tertentu.
berusia 10 tahun ke atas di tiap level pendidikan tertentu merupakan parameter
dari distribusi Multinomial.
Dalam penelitian disertasi ini, pengembangan model SAE untuk peubah
respon Binomial dan Multinomial berbasis pada penarikan contoh berpeluang
tidak sama mengacu
kepada beberapa penelitian tentang pengembangan model
SAE untuk peubah respon binomial dan multinomial, serta pengembangan model
SAE yang memperhitungkan peluang penarikan contoh.
Pendugaan parameter area dilakukan dengan menggunakan pendekatan Bayes.Dengan melakukan simulasi, diperoleh bahwa model SAE untuk peubah
respon binomial menggunakan sebaran prior logit normal melalui pendekatan
Bayes empirik yang dikembangkan dengan memperhitungkan peluang penarikan
contoh memberikan penduga yang paling baik karena dapat menurunkan bias
dan KTG dari penduga. Dengan mengaplikasikan model SAE logit normal
terbobot melalui pendekatan Bayes, dihasilkan perbedaan antara nilai parameter
populasi dengan prediksinya relatif kecil. Kabupaten Sumenep memiliki
rata-rata bias sebesar 0,0628 dan nilai KTG sebesar 0,0149 dan untuk Kabupaten
Pasuruan rata-rata biasnya sebesar 0,0136 dengan KTG sebesar 0,0212.
Sementara itu metode pendugaan area kecil yang dikembangkan
berdasarkan penarikan contoh informatif yaitu dengan menyertakan model
peluang penarikan contoh dalam bentuk fungsi eksponensial memberikan
rata-rata bias relatif yang rendah namun memberikan akar rata-rata-rata-rata kuadrat bias
relatif maupun KTG yang lebih tinggi dibandingkan dengan metode pendugaan
menggunakan sebaran prior logit normal terbobot. Besarnya nilai KTG lebih
banyak disebabkan karena ragam pendugaan yang relatif besar sehingga
walaupun memberikan bias yang kecil maka KTG akan cenderung tinggi.
Penurunan bias dari model SAE eksponensial ini menunjukkan bahwa
memperhitungkan peluang penarikan contoh dalam model SAE akan dapat
menurunkan bias. Pfefferman (2010) mengatakan bahwa mengabaikan peluang
penarikan contoh dalam model SAE akan menghasilkan bias pendugaan karena
dengan mengabaikan peluang penarikan contoh, maka pendugaan parameter
model untuk area/unit yang terambil sebagai contoh sama dengan area/unit yang
tidak terambil sebagai contoh.
Berdasarkan hasil simulasi maupun aplikasi di Kabupaten Sumenep dan
menggunakan model campuran logit normal terbobot memberikan hasil yang
paling akurat dalam pendugaan parameter proporsi area kecil.
Selanjutnya pendugaan area kecil untuk respon multinomial dilakukan
dengan cara yang sama yaitu melalui model campuran logit multinomial terbobot.
Pendugaan KTG dilakukan dengan menggunakan metode Jackknife. Dari hasil
aplikasi di Kabupaten Sumenep dan Pasuruan, penduga KTG untuk logit
multinomial terbobot melalui pendekatan Bayes juga memberikan nilai penduga
KTG yang sangat kecil yaitu pada kisaran antara 1,14 x 10-7 sampai 8,17 x10-7 karena pada mumnya kondisi blok sensus di tiap kecamatan relatif sama.
Besarnya KTG tersebut sangat dipengaruhi oleh homogenitas atau heterogenitas
dari nilai respon dari area yang satu ke area yang lain.
Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk
pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada
heterogenitas nilai dugaan proporsi dari area ke area. Semakin heterogen maka
akan menghasilkan nilai dugaan KTG yang cenderung lebih besar. Hal yang
sama juga ditemui pada pendugaan area kecil yang memperhitungkan peluang
penarikan contoh.
Besarnya KTG yang dihasilkan oleh metode SAE yang menyertakan
fungsi eksponensial dari peluang percontohan perlu dikaji lebih dalam karena
bias yang dihasilkan relatif sangat kecil sehingga kemungkinan besarnya KTG
disebabkan oleh ragam pendugaan yang besar. Perlu dikembangkan model yang
@ Hak Cipta Institut Pertanian Bogor (IPB), Tahun 2012
Hak Cipta Dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruhnya karya tulis ini tanpa
mencantumkan atau menyebutkan sumber:
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau
tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar IPB
2. Dilarang mengumumkan atau memperbanyak sebagian atau seluruh
PRAKATA
Puji syukur penulis panjatkan kehadirat Allah SWT, karena atas rahmat dan
hidayah-Nyalah akhirnya disertasi dengan judul “Model Bayes untuk Pendugaan
Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus
Respon Binomial dan Multinomial”, dengan aplikasi Pendugaan Indeks
Pendidikan Level Kecamatan di Jawa Timur ini dapat diselesaikan dengan baik.
Selain untuk memenuhi syarat memperoleh gelar doktor pada program
studi Statistika-IPB, disertasi ditujukan untuk menghasilkan metode statistik yang
dapat digunakan oleh pemerintah atau pihak lain untuk melakukan pendugaan
area kecil yang memiliki jumlah data terbatas tanpa perlu menambah contoh
dengan memanfaatkan informasi yang ada sehingga dapat mengurangi biaya
penelitian.
Selama pelaksanaan penelitian dan penyelesaian disertasi ini, penulis
banyak mendapatkan bantuan dari berbagai pihak baik secara moril dan meteriil
sehingga disertasi ini dapat terselesaikan dengan baik. Pada kesempatan ini
secara khusus penulis mengucapkan terima kasih kepada :
1. Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, Bapak Dr. I Wayan
Mangku dan Bapak Dr Kusman Sadik selaku dosen pembimbing yang
telah banyak memberikan arahan, bimbingan dan saran hingga
disertasi ini bias diselesaikan dengan baik.
2. Seluruh dosen dan karyawan Departemen Statistika FMIPA IPB yang
telah menjadi teman diskusi, memberikan saran dan dorongan moril.
3. Seluruh dosen dan karyawan Sekolah Pascasarjana IPB yang telah
memberikan layanan pengajaran dan administrasi yang baik.
4. Seluruh dosen dan karyawan Jurusan Statistika FMIPA ITS,
5. Para peneilti dan karyawan BPS Pusat dan Provinsi Jawa Timur yang
banyak membantu memberikan data dan penjelasan terkait data
6. Para peneiliti dan karyawan Pusat Penelitian Potensi daerah dan
Pemberdayaan Masyarakat (PDPM), LPPM-ITS yang telah
memberikan bantuin moril dan materiil selama penulis melaksanakan
studi S3 dan menyelesaikan penelitian disertasi
7. Suami dan anak-anak tercinta serta seluruh keluarga yang senantiasa
memberikan dorongan semangat, doa yang ikhlas dan telah
mendampingi penulis selama studi S3 dan menyelesaikan penelitian
disertasi.
8. Teman-teman sesama mahasiswa program Pasca Sarjana di
Departemen Statistika-IPB serta berbagai pihak lain yang tidak dapat
penulis sebutkan satu persatu.
Akhir kata, dengan segala kerendahan hati, penulis menyadari bahwa
disertasi ini masih jauh dari sempurna, oleh karena itu penulis sangat
mengharapkan saran dan masukan yang bermanfaat untuk memperbaiki tulisan
disertasi ini. Namun demikian, penulis berharap tulisan ini dapat bermanfaat bagi
mereka yang memerlukannya. Semoga Allah SWT senantiasa memberikan
kebaikan untuk kita semua.
Bogor, September 2012
RIWAYAT HIDUP
Penulis dilahirkan di kota Mojokerto, Jawa Timur pada tanggal 24 Juli 1957 dari
pasangan Bapak JH Soeratman (alm) dan Ibu P Sri Woelan (alm). Penulis merupakan anak
pertama dari lima bersaudara dan menikah dengan Ir. Nus Irwansyah, MBA dan telah
dikaruniai dua anak yaitu Duta Perdana MA dan Rizqi Yoshita.
Pendidikan Sarjana ditempuh di Jurusan Matematika, FIPIA – ITS lulus pada tahun
1982 dengan pembimbing Bapak I Nyoman Latra, MS. Pada tahun 1996, penulis
memperoleh gelar Master of Science dari School of Mathematics and Statistics, The
University of Sheffield, United Kingdom dengan pembimbing tesis Professor John Biggins.
Sejak tahun 2008 penulis menempuh Program Doktor pada Program Studi Statistika
Sekolah Pascasarjana IPB. Sejak tahun 1985 sampai dengan saat ini penulis bekerja
sebagai dosen di Jurusan Statistika, FMIPA-ITS dan peneliti di Pusat Penelitian Potensi
daerah dan Pemberdayaan Masyarakat (PDPM), Lembaga Penelitian dan Pengabdian
Masyarakat (LPPM)-ITS
.
Selama mengikuti pendidikan Program Doktor, penulis telah menghasilkan beberapa
karya ilmiah yang telah dipublikasikan dalam seminar nasional serta jurnal ilmiah,
diantaranya :
1. Rumiati, AT, Notodiputro AK, Mangku IW dan Sadik K, 2012. Empirical Bayesian
Method for The Estimation of Literacy Rate at Sub-district Level. Case Study:
Sumenep District of East Java Province, IPTEK, The Journal for Technology and
Science, Vol. 23, No. 1, February 2012.
2. Rumiati, AT, Regresi Polinomial local untuk Data Survey Berskala Besar, Studi
kasus: Model Pengeluaran Rumah Tangga berdasarkan Data Susenas Jawa Timur
2006. Prosiding pada Seminar Nasional Statistika, 7 Nopember 2009. Jurusan
DAFTAR ISI
Halaman
DAFTAR TABEL ... v
DAFTAR GAMBAR ... vi
DAFTAR LAMPIRAN ... viii
I. Pendahuluan ... 1
1.1. Latar Belakang ... 1
1.2. Tujuan Penelitian ... 5
1.3. Ruang Lingkup ... 5
1.4. Kebaruan ... 7
1.5. Sistematika Disertasi... 8
II. Tinjauan pustaka ... 11
2.1. Pendahuluan ... 11
2.2 Model Dasar Pendugaan Area Kecil ... 11
2.2.1. Pendugaan Area Kecil Berbasis Area ... 12
2.2.2. Pendugaan Area Kecil Berbasis Unit ... 13
2.3 Pendugaan Parameter Model Pendugaan Area kecil ... 14
2.3.1. Metode Prediksi Tak-bias Linier Terbaik (PTLT) dan Prediksi Tak-bias Linier Terbaik Empirik (PTLTE) ... 14
2.3.2 Pendugaan Parameter Model SAE Melalui Pendekatan Bayes... 16
2.4. Peluang Penarikan Contoh ... 18
2.5. Model SAE dengan Memperhitungkan Peluang Penarikan Contoh ... 21
2.6 Indeks Pembangunan Manusia (IPM) ... 23
2.6.1. Cara Perhitungan IPM ... 24
2.6.2. Indikator Pendidikan/ Pengetahuan ... 26
2.7. Survei Sosial Ekonomi Nasional (Susenas) ... 27
2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh .... 27
III. Model Bayes untuk Pendugaan Area Kecil Berbasis Peubah
Respon Binomial ... 30
3.1 Pendahuluan ... 30
3.2 Metode Pendugaan Langsung Melalui Pendekatan Bayes... 32
3.2.1. Pendugaan Bayes Menggunakan Sebaran Prior Beta .... 32
3.2.2. Pendekatan Bayes Menggunakan Sebaran Prior Logit-Normal... 35
3.3. Metode Pendugaan Tak Langsung Melalui Pendekatan Bayes . . 36
3.4. Aplikasi : Pendugaan Angka Melek Huruf di Tingkat Kecamatan, Kabupaten Sumenep Berbasis Data Susenas ... 39
3.4.1. Pendugaan Langsung ... 40
3.4.2. Pendugaan Tak Langsung ... 43
3.5. Pembahasan ... 45
IV. Model SAE Berbasis Sebaran Respon Multinomial Melalui Pendekatan Bayes ... 47
4.1. Pendahuluan ... 47
4.2. Model SAE untuk Respon Multinomial ... 48
4.2.1. Pendugaan Parameter Model ... 49
4.2.2. Pendugaan Ragam ... 52
4.2.3. Pendugaan Parameter Area Melalui Pendekatan Bayes . 54 4.3. Aplikasi: Pendugaan Rata-Rata Lama Sekolah Tingkat Kecamatan di Jawa Timur Berbasis Data Susenas 2010 ... 56
4.3.1. Pengukuran Peubah Respon dan Peubah Penyerta ... 56
4.3.2. Hasil Eksplorasi Data ... 57
4.3.3. Pendugaan Rata-rata Lama Sekolah di Tingkat Kecamatan ... 58
4.4. Pembahasan ... 60
V. Model Bayes Pendugaan Area Kecil untuk Respon Binomial dan Multinomial Berbasis Penarikan Contoh Berpeluang Tidak Sama... 62
5.1. Pendahuluan ... 62
5.3. Pendugaan Area Kecil Menggunakan Model Campuran Linier
Terbobot ... 70
5.4. Pengembangan Model Bayes SAE Berbasis Penarikan Contoh
Berpeluang Tidak Sama untuk Respon Binomial ... 71
5.4.1. Penentuan Bobot ... 72
5.4.2. Metode Pendugaan Parameter Area Kecil dengan
Menyertakan Peluang Penarikan Contoh yang Bersifat
Eksponensial ... 73
5.4.3. Metode Pendugaan Parameter Area Kecil
menggunakan Model Linier Campuran Terbobot ... 74
5.4.4. Evaluasi Terhadap Penduga... 74
5.4.5. Simulasi... 75
5.4.6. Aplikasi : Pendugaan Angka Melek Huruf di Kabupaten
Sumenep dan Kabupaten Pasuruan Provinsi Jawa
Timur... 78
5.5 Model SAE Berbasis Penarikan Contoh Berpeluang Tidak
Sama Untuk Peubah Respon Multinomial ... 80
5.5.1. Pengembangan model SAE: Model Campuran Logit
Multinomial Terbobot... 80
5.5.2. Aplikasi: Pendugaan rata-rata lama sekolah di tingkat
kecamatan di Kabupaten Sumenep dan Kabupaten
Pasuruan... 82
5.6. Perhitungan Indeks Pendidikan di Kabupaten Sumenep dan
Pasuruan ... 84
5.7 Pembahasan... 86
5.7.1. Model SAE untuk respon Binomial dengan
memperhitungkan peluang penarikan contoh... 86
5.7.2. Model SAE untuk respon Multinomial dengan
memperhitungkan peluang penarikan contoh... 87
IV. Pembahasan ... 88
6.1. Pendahuluan………. 88
6.2. Perbandingan metode pendugaan langsung dan tak langsung
6.3. Pengaruh peluang penarikan contoh dalam Model SAE untuk
respon Binomial dalam peningkatan kualitas penduga... 90
6.4. Pengembangan model SAE berbasis pada peubah respon Multinomial dengan penarikan contoh berpeluang tidak sama... 90
VII Kesimpulan dan Saran ……… 93
7.1. Kesimpulan………. 93
7.2. Saran……… 94
Daftar Pustaka ………. 95
Daftar Istilah ………. 99
DAFTAR TABEL
Halaman
Tabel 2.1 Peubah dan sumber data dari masing-masing komponen IPM ... 24
Tabel 2.2. Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM ... 25
Tabel 2.3. Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan . 26
Tabel 3.2. Rata-rata pendugaan angka melek huruf dan KTG kecamatan di
Kabupeten Sumenep dan Kabupaten Pasuruan menggunakan
pendekatan Bayes ... 46
Tabel 4.1. Klasifikasi tingkat pendidikan tertinggi penduduk usia 10 tahun
ke atas ... 56
Tabel 4.2. Rata-rata dugaan proporsi penduduk pada jenjang pendidikan
tertentu dan rata-rata nilai KTG dugaan tiap kecamatan di
Kabupaten Sumenep dan Kabupaten Pasuruan ... 58
Tabel 5.1. Nilai rata-rata bias relatif dan rata-rata kuadrat bias relatif untuk
model terbobot dan model eksponensial ... 78
Tabel 5.2. Hasil Simulasi Dugaan pi
78 (proporsi penduduk usia 10 tahun ke
atas yang bisa baca tulis) untuk tiap blok sensus di Kecamatan
Lenteng, Kabupaten Sumenep...
Tabel 6.1 Perbandingan kualitas penduga untuk model SAE untuk respon
Binomial dengan dan tanpa memperhatikan peluang penarikan
DAFTAR GAMBAR
Halaman
Gambar 1.1 Kerangka Penelitian Pengembangan Model SAE untuk
Peubah Respon Binomial…... 6
Gambar 1.2 Kerangka Penelitian Pengembangan Model SAE untuk
Peubah Respon Multinomial... 7
Gambar 3.1 Proporsi Penduduk 10 tahun ke atas yang bisa baca tulis
berdasarkan data Susenas tahun 2010 di Kabupaten
Sumenep dan Pasuruan... 39
Gambar 3.2 Hasil Pendugaan angka melek huruf dengan menggunakan
metode klasik dan Metode Bayes ... 42
Gambar 3.3 Plot dari nilai dugaan KTG menggunakan sebaran prior Beta
dan Logit-Normal melalui metode pendugaan langsung... 43
Gambar 3.4 Hubungan kemampuan baca tulis dengan usia berdasarkan
jenis kelamin di Kabupaten Sumenep dan Kabupaten
Pasuruan ... 44
Gambar 3.5 Plot hasil dugaan angka melek huruf dan KTG di Kabupaten
Sumenep ... ………. 45
Gambar 3.6 Plot hasil dugaan paramater pi
Pasuruan... (angka melek huruf) dan KTG di Kabupaten
45
Gambar 4.1 Proporsi penduduk berusia 10 tahun ke atas berdasarkan
lama sekolah berdasarkan data Susenas 2010 di Kabupaten
Sumenep dan Kabupaten Pasuruan... 57
Gambar 4.2 Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas
di tiap jenjang pendidikan di Kabupaten Sumenep dan
Kabupaten Sumenep ... 59
Gambar 4.3 Plot Hasil Proporsi Penduduk Berusia 10 tahun keatas di tiap
jenjang pendidikan dan Nilai Dugaan KTG di Kabupaten
Pasuruan ... 59
Gambar 4.4 Plot Hasil Dugaan Angka Melek Huruf dan Nilai KTG Dugaan
Gambar 5.1 Plot hasil simulasi pendugaan pi (angka melek huruf) untuk
tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep 77
Gambar 5.2 Plot hasil simulasi bias pendugaan pi
77 untuk tiap blok sensus
di Kecamatan Lenteng, Kabupaten Sumenep ...
Gambar 5.3 Nilai dugaan, parameter populasi, dan bias dugaan angka
melek huruf di Kabupaten Sumenep... 79
Gambar 5.4 Nilai dugaan, parameter populasi, dan bias dugaan angka
melek huruf di Kabupaten Pasuruan... 79
Gambar 5.5 Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan
tertentu dan Dugaan KTG Menggunakan Model SAE logit
multinomial terbobot di Kabupaten Sumenep... 83
Gambar 5.6 Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan
tertentu dan Dugaan KTG menggunakan model SAE logit
multinomial terbobot di Kabupaten Pasuruan... 84
Gambar 5.7 Nilai dugaan rata-rata lama sekolah menggunakan model
SAE logit multinomial terbobot di Kabupaten Sumenep dan
Pasuruan... 84
Gambar 5.8 Prediksi Indeks Pendidikan di Kabupaten Sumenep dan
Kabupaten Pasuruan Menggunakan Model SAE………. 85
Gambar 5.9 Peta Tematik Indeks Pendidikan di Kabupaten Sumenep……. 85
DAFTAR LAMPIRAN
Halaman
Lampiran 1 Program SAS untuk pendugaan model SAE ... 100
Lampiran 2 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan langsung melalui sebaran prior logit
normal ... 101
Lampiran 3 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan langsung melalui sebaran prior beta .... 103
Lampiran 4 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan tak langsung (berbasis model) melalui
sebaran prior logit normal tanpa bobot ... 105
Lampiran 5 Program Matlab untuk perhitungan pendugaan area kecil
melalui pendugaan tak langsung melalui sebaran prior
logit normal dengan memperhitungkan bobot peluang ... 107
Lampiran 6 Jumlah penduduk usia 10 tahun keatas berdasarkan data
sensus dan susenas serta jumlah blok sensus di tiap
kecamatan di Kabupaten Sumenep ... 109
Lampiran 7 Jumlah penduduk usia 10 tahun keatas berdasarkan data
sensus dan susenas serta jumlah blok sensus di tiap
kecamatan di Kabupaten Pasuruan ... 110
Lampiran 8 Hasil Pendugaan Paramater pi (proporsi penduduk berusia
10 tahun ke atas yang bisa baca tulis) dan KTG untuk
masing-masing kecamatan di Kabupaten Sumenep ... 111
Lampiran 9 Hasil Pendugaan Paramater pi (proporsi penduduk berusia
10 tahun ke atas yang bisa baca tulis) dan KTG untuk
masing-masing kecamatan di Kabupaten Pasuruan ... 112
Lampiran 10 Hasil pendugaan proporsi penduduk pada tiap tingkat
pendidikan tertinggi di Kabupaten Sumenep ... 113
Lampiran 11 Hasil pendugaan KTG untuk pendugaan proporsi
penduduk pada tiap tingkat pendidikan tertinggi di
Kabupaten Sumenep ... 114
Lampiran 12 Hasil pendugaan proporsi penduduk pada tiap tingkat
Lampiran 13 Hasil pendugaan KTG untuk pendugaan proporsi
penduduk pada tiap tingkat pendidikan tertinggi di
Kabupaten Pasuruan ... 116
Lampiran 14 Hasil pendugaan angka melek huruf di tiap kecamatan
berdasarkan model campuran logit normal terbobot dan
model campuran logit normal terbobot di Kabupaten
Sumenep ... 117
Lampiran 15 Hasil pendugaan angka melek huruf di tiap kecamatan
berdasarkan model campuran logit normal terbobot di
Kabupaten Pasuruan ... 118
Lampiran 16 Hasil pendugaan angka melek huruf di tiap kecamatan
berdasarkan model campuran logit multinomial terbobot
di Kecamatan Pragaan, Kabupaten Sumenep ... 119
Lampiran 17 Pendugaan KTG untuk penduga proporsi penduduk di
tiap jenjang pendidikan berdasarkan model campuran logit
multinomial terbobot di Kabupaten Sumenep ... 120
Lampiran 18 Hasil pendugaan proporsi penduduk di tiap jenjang
pendidikan berdasarkan model campuran logit
multinomial terbobot di Kabupaten Pasuruan ... 121
Lampiran 19 Penduga KTG untuk penduga proporsi penduduk di tiap
jenjang pendidikan berdasarkan model campuran logit
multinomial terbobot di Kabupaten Pasuruan ... 122
Lampiran 20 Prediksi Indeks Pendidikan di Kabupaten Sumenep
menggunakan model SAE ………... 123
Lampiran 21 Prediksi Indeks Pendidikan di Kabupaten Pasuruan
menggunakan model SAE ……… 124
Lampiran 22 Hubungan antara Proprosi Penduduk untuk tiap jenjang
pendidikan Berdasarkan Usia dan jenis kelamin di
kabupaten Sumenep ... 125
Lampiran 23 Hubungan antara Proprosi Penduduk untuk tiap jenjang
pendidikan dengan Usia dan jenis kelamin di kabupaten
BAB
I
Pendahuluan
1.1. Latar Belakang
Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi,
kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau
dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah
yang lebih kecil, umumnya jumlah contoh kurang mencukupi jika digunakan
untuk pendugaan berdasarkan rancangan.
Dewasa ini telah dikembangkan sebuah metode pendugaan parameter di
suatu area dimana jumlah contohnya berukuran kecil dan bahkan tidak ada yaitu
Metode Pendugaan Area Kecil atau Small Area Estimation (SAE). Pendugaan
dalam SAE didasarkan pada model dan merupakan pendugaan tidak langsung.
Oleh karena itu dibutuhkan informasi tambahan dari peubah yang memiliki
hubungan dengan peubah yang sedang diamati yang disebut sebagai peubah
penyerta (auxiliary variable).
Model SAE pertama kali diperkenalkan oleh Fay & Heriot (1979), yaitu
model yang memperhitungkan dua jenis keragaman yang mencakup 1)
keragaman peubah respon yang tidak dapat diterangkan seluruhnya oleh
hubungan peubah respon dengan informasi tambahan yang disebut model
pengaruh tetap dan 2) keragaman spesifik area kecil yang tidak dapat
diterangkan oleh informasi tambahan, merupakan pengaruh acak area kecil.
Oleh karena itu model SAE mengandung dua komponen galat yaitu galat karena
model dan galat karena pendugaan parameter secara langsung. Rataan atau
tolal area kecil dapat dinyatakan sebagai kombinasi linier dari pengaruh tetap
dan pengaruh acak.
Secara aliran klasik, pendugaan parameter untuk model dasar SAE
biasanya menggunakan metode Prediksi Tak-bias Linier Terbaik (Best Linear
Unbiased Predictor) yaitu dengan meminimumkan Kuadrat Tengah Galat (KTG)
dari penduga. Pendugaan dengan Prediksi Tak-bias Linier Terbaik (PTLT) ini
tidak tergantung pada kenormalan dari pengaruh acak tetapi tergantung pada
ragam-koragam sering diduga dengan menggunakan metode Kemungkinan Maksimum
(Maximum Likelihood:ML) atau Kemungkinan Maksimum Berkendala (Restricted
Maximum Likelihood: REML) dengan mengasumsikan kenormalan. Dengan cara
tersebut pendugaan melalui proses dua tahap yang dikenal sebagai Prediksi
Tak-bias Linier Terbaik Empirik (PTLTE). Rao (2003) mengatakan bahwa
metode BLUP atau EBLUP hanya cocok untuk peubah kontinu, tetapi kurang
sesuai jika digunakan untuk pemodelan peubah respon bertipe diskrit.
Metode PTLT atau PTLTE dapat diaplikasikan untuk model linier
campuran yang banyak digunakan untuk pendugaan area kecil. Dalam
pendugaan parameter dari model linier campuran tersebut tidak dibutuhkan
kenormalan dari pengaruh acak dan galat , tetapi kenormalan dibutuhkan untuk
mendapatkan penduga KTG yang akurat (Rao, 2003). Model linier campuran itu
sendiri dirancang untuk peubah bertipe kontinu dan kurang sesuai untuk peubah
bertipe diskrit (biner atau cacahan). Untuk data biner atau cacahan, khususnya
model regresi logistik dan model log linier akan lebih tepat menggunakan
metode pendugaan melalui pendekatan Bayes, baik melalui metode Bayes
Empirik (Empirical Bayes) maupun metode Bayes Berhirarki (Hierarchical
Bayes).
Di Indonesia, beberapa peneliti yang mengembangkan model SAE
diantaranya adalah Kurnia et al. (2007), yang membahas pengaruh
mis-spesifikasi desain survey pada pendugaan area kecil. Selain itu Kurnia et al.
(2007) membahas tentang pendekatan non parameterik dalam SAE. Selanjutnya
Kurnia (2009) meneliti tentang prediksi terbaik empirik untuk model transformasi
logaritma di dalam pendugaan area kecil dengan penerapan pada data
Susenas. Peneliti yang lain adalah Sadik (2009) mengembangkan metode
prediksi tak-bias linear terbaik dan bayes berhirarki untuk pendugaan area kecil
berdasarkan model state space.
Beberapa peneliti yang telah mengembangkan model pendugaan area
kecil untuk data biner diantaranya adalah Malec et al. (1997), Boostra et al.
(2011), Jiang dan Lahiri (2001), Rao (2003), Clarke et al. (2006) dan Chandra et
al. (2009). Para peneliti tersebut umumnya menggunakan sebaran prior Beta
atau logit normal, sedangkan untuk pendugaan parameter digunakan metode
Kemungkinan Quasi Berpenalti (Penalized Quasi-Likelihood) dan pendugaan
data biner yang dikembangkan oleh para peneliti tersebut tidak
memperhitungkan peluang percontohan dari data yang digunakan.
Model SAE berbasis sebaran multinomial telah dikembangkan oleh Molina
et al. (2007) dengan metode yang didasarkan pada aplikasi dari Model
Campuran Logit Multinomial (Multinomial Logit Mixed Model). Model SAE untuk
peubah multinomial oleh Molina mengasumsikan pengaruh acak yang sama
untuk semua katagori. Scealy (2010) mengembangkan model Molina et al.
(2007) dengan memasukkan pengaruh acak katagori. Untuk pendugaan
parameter model Scealy (2010) mengaplikasikan metode Kemungkinan Quasi
Berpenalti (KQB), pendekatan ML dan/atau REML. Metode tersebut kemudian
diaplikasikan untuk pendugaan parameter angkatan kerja di area kecil.
Pendugaan KTG untuk penduga parameter didekati melalui dua metode yaitu
bootstrap parametrik dan pendekatan analitik serta kemudian membandingkan
keduanya. Sceally (2010) menghasilkan bahwa metode boostrap parametrik
memberikan hasil lebih baik dibandingkan dengan pendekatan analitik, namun
perbedaannya sangat kecil.
Pada umumnya di dalam model SAE dianggap semua area terwakili dalam
contoh atau dianggap bahwa contoh area dipilih dengan peluang yang sama
(Pfeffermann 2010). Hanya ada beberapa studi yang memperhatikan struktur
peluang percontohan dengan menggunakan peluang tidak sama, misalnya Kott
(1990), Arora dan Lahiri (1997) serta Prasad dan Rao (1999). Pfeffermann
(2010) berbendapat bahwa pendugaan yang dilakukan tanpa memperhatikan
peluang penarikan contoh akan menghasilkan penduga yang berbias. Demikian
juga Lehtonen (2009) menyatakan bahwa dengan menyertakan bobot peluang
penarikan contoh ke dalam model, misalkan proporsional terhadap ukuran
populasi atau proportional to size (pps), dapat dihasilkan peningkatan akurasi
dan pengurangan bias. Lehtonen (2009) mengembangkan pendugaan langsung
di area kecil yang mengaplikasikan Model Generalized Regression (GREG)
dimana pendugaan parameter menggunakan metode PTLTE yang menyertakan
bobot unit contoh.
Model SAE yang memperhitungkan struktur peluang penarikan contoh
yang telah dikembangkan oleh para peneliti tersebut adalah untuk model SAE
dengan peubah respon normal. Pendugaan parameter menggunakan
pendekatan klasik yaitu mengaplikasikan PTLT atau PTLTE. Pengembangan
biner dibahas oleh Chen et al. (2010) yang menggunakan pendekatan Bayes
Empirik dan Berhirarki.
Di Indonesia, kebutuhan untuk pendugaan area kecil misalkan kecamatan
atau desa makin meningkat, khususnya untuk menyusun kebijakan atau
perencanaan pembangunan oleh pemerintah daerah. Salah satu indikator yang
dijadikan dasar dalam perencanaan pembangunan adalah Indeks Pembangunan
Manusia (IPM) yang mengukur pencapaian hasil pembangunan di sebuah
wilayah (BPS 2005). IPM diukur dalam 3 dimensi dasar yaitu: 1)Hidup yang sehat
dan panjang umur yang diukur dengan
Pengetahuan yang diukur dengan angk
dan rata-rata lama sekolah serta 3) standar hidup layak yang diukur dengan daya
beli (UNDP 1998). IPM dapat digunakan untuk mengklasifikasikan apakah
sebuah wilayah adal
digunakan untuk mengukur pengaruh dari kebijakan ekonomi terhadap kualitas
hidup. Di Indonesia perhitungan IPM dilakukan oleh Badan Pusat Statistik (BPS)
yang secara resmi mempublikasikan IPM secara periodik setiap tahun untuk
tingkat provinsi dan kabupaten/kota.
Dewasa ini perhitungan IPM untuk tingkat kecamatan mulai dibutuhkan
untuk digunakan sebagai dasar perencanaan pembangunan di tingkat
Kabupaten. IPM untuk tingkat kecamatan, yang membandingkan hasil
pembangunan antar kecamatan, baru dilakukan oleh sebagian pemerintah
kabupaten/kota. Perhitungan IPM di tingkat kecamatan umumnya dilakukan
dengan cara klasik, yaitu menggunakan pendugaan langsung dengan cara
menambah jumlah contoh agar mencukupi. Sebagai contoh perhitungan IPM
untuk Kabupaten Probolinggo (Rumiati et al. 2007), Sumenep (Rumiati et al.
2008), Tuban (Rumiati et al. 2009) dilakukan dengan memanfaatkan data Survei
Sosial Ekonomi Nasional (Susenas) dan menambah jumlah data melalui survai.
Penggunaan data Susenas untuk pendugaan parameter di tingkat
kecamatan atau desa akan menghadapi dua persoalan statistik yaitu:
1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter
berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan
contohnya memiliki peluang tidak sama karena rancangan penarikan contoh
dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil
tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam
Susenas memiliki peluang tidak sama.
Dalam penelitian ini dibahas pengembangan metode SAE yang dapat
digunakan untuk menduga parameter pendidikan yang merupakan komponen
Indeks Pendidikan dalam IPM. Perhitungan Indeks Pendidikan melalui
pendugaan angka melek huruf dan rata-rata lama sekolah. Angka melek huruf
dihitung berdasarkan proporsi penduduk yang mampu baca dan tulis dari
penduduk yang berusia 10 tahun ke atas. Sedangkan rata-rata lama sekolah
dihitung berdasarkan proporsi penduduk yang telah berada pada jenjang
pendidikan tertentu yang dikalikan dengan lama menempuh pendidikan di
jenjang tersebut dibagi dengan jumlah penduduk. Jumlah penduduk yang bisa
baca tulis diasumsikan memiliki sebaran Binomial dan jumlah penduduk pada
tiap jenjang pendidikan diasumsikan memiliki sebaran Multinomial. Selanjutnya
karena perhitungan IPM menggunakan data Susenas, maka persoalan statistik
terkait dengan keterbatasan jumlah data dan ketidaksamaan peluang dalam
penarikan contoh. Oleh karena itu yang menjadi pertanyaan penelitian ini
adalah bagaimana model pendugaan area kecil untuk peubah respon binomial
dan multinomial pada kasus penarikan contoh berpeluang tidak sama.
Rao (2003) mengatakan bahwa untuk data biner atau cacahan, khususnya
model regresi logistik dan model log linier akan lebih tepat menggunakan
metode pendugaan melalui pendekatan Bayes. Oleh karena itu dalam penelitian
ini pendugaan area kecil dilakukan melalui pendekatan Bayes didasarkan pada
model SAE untuk peubah respon Binomial dan Multinomial berbasis peluang
penarikan contoh tidak sama. Selanjutnya model SAE yang dihasilkan
diaplikasikan untuk pendugaan Indeks Pendidikan kecamatan di Kabupaten
Sumenep dan Kabupaten Pasuruan, Provinsi Jawa Timur.
1.2. Tujuan Penelitian
1. Mengembangkan model SAE berbasis sebaran Binomial dan Multinomial
melalui pendekatan Bayes dengan penarikan contoh berpeluang tidak
sama.
2. Mengaplikasikan metode pendugaan area kecil yang diperoleh dari
tujuan pertama untuk menduga angka melek huruf dan rata-rata lama
sekolah ditingkat kecamatan dalam rangka menghitung Indeks Pendidikan
1.3. Ruang Lingkup
Ruang lingkup penelitian ini meliputi pengembangan metode pendugaan
area kecil untuk peubah respon Binomial dan Multinomial melalui pendekatan
Bayes. Pengembangan model SAE akan memperhatikan peluang penarikan
contoh mengingat penerapan dari metode SAE tersebut diaplikasikan untuk
menduga Indeks Pendidikan di tingkat kecamatan dengan data Susenas dimana
contohnya diambil berdasarkan peluang tidak sama.
Secara khusus model SAE yang akan dikaji merupakan model berbasis
unit dengan pendugaan parameter menggunakan metode Bayes Empirik
berdasarkan sebaran prior logit normal dari parameter (pi
Metode SAE yang dikembangkan untuk peubah respon Binomial dan
Multinomial berbasis peluang contoh tidak sama diaplikasikan untuk menduga
Indeks Pendidikan di tingkat kecamatan di Jawa Timur. Studi kasus yang diambil
adalah kabupaten Sumenep (yang mewakili daerah pertanian dan perkebunan)
dan Kabupaten Pasuruan (mewakili daerah industri) di Jawa Timur. Secara garis
besar kerangka penelitian dapat dilihat pada Gambar 1 dan Gambar 2.
) yang diduga. Metode
pendugaan parameter menggunakan integrasi numerik karena penyelesaian
persamaan secara analitik untuk model Bayes khususnya berbasis data biner
sulit ditemukan.
1.4. Kebaruan
Beberapa peneliti telah melakukan pengembangan model SAE untuk
peubah respon Binomial dan Multinomial yang berbasis data biner, baik melalui
pendekatan klasik maupun melalui pendekatan Bayes. Model SAE yang
dikembangkan umumnya tidak memperhatikan peluang penarikan contoh dan
menganggap contoh yang digunakan berdasarkan pada penarikan contoh secara
acak dengan peluang yang sama. Pendugaan parameter dalam penelitian ini
memperhitungkan cara penarikan contoh khususnya untuk penarikan contoh
berpeluang tidak sama.
Dengan menggunakan data Susenas, pendugaan IPM oleh BPS di
Indonesia hanya sampai tingkat kabupaten/ kota karena ketidak cukupan data
untuk area yang lebih kecil (kecamatan atau desa). Pendugaan IPM di level
kecamatan umumnya dilakukan dengan menambah jumlah contoh dimana
pendugaan parameter dilakukan secara langsung dan tanpa memperhitungan
Tanpa memperhatikan peluang penarikan contoh
Model logit normal terbobot
Pendugaan Parameter Area : Pendekatan Bayes Model logit normal
Pendugaan Parameter model SAE : PQL/REML
Model SAE dengan Fungsi Peluang Eksponensial Dengan memperhatikan peluang penarikan contoh
Pendugaan Parameter model : Metode KM
Simulasi
Aplikasi
Perhitungan bobot area kecil (bloksensus )
Lokasi: Kecamatan Lenteng , Kabupaten Sumenep
Data Sensus Penduduk 2010
Perhitungan bobot individu Penarikan contoh area
(blok sensus) : 5 area Penarikan contoh RT 16 RT
diulang 100 x
100 set contoh tanpa bobot
100 set contoh dengan bobot
Model logit normal terbobot Model logit normal 1
2
2
Model SAE dengan menyertakan fungsi peluang penarikan contoh
Lokasi: Kabupaten Sumenep dan Pasuruan
Data Sensus Penduduk 2010
Data Susenas 2010 Model logit
normal terbobot Perhitungan bobot area
kecil (bloksensus )
Perhitungan bobot individu
Perhitungan angka melek huruf di tiap kecamatan
Perhitungan bias Perhitungan KTG Model logit normal tanpa bobot
Perhitungan Bias, KTG
Perhitungan Bias, KTG Pengembangan Model
Gambar 1.1.
Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Binomial
Keterangan
1. Tahap pengembangan model SAE dengan respon binomial dengan memperhatikan struktur peluang
2. Simulasi dengan mengambil kecamatan Lenteng, yaitu dengan penarikan contoh gerombol dua tahap yang diulang sebanyak 100 kali
Pengembangan Model
Pendugaan Parameter model SAE : KQB/KMB
Pendugaan Parameter Area : Pendekatan Bayes
Tanpa memperhatikan peluang penarikan contoh
Model logit multinomial terbobot
Pendugaan Parameter Area : Pendekatan Bayes
Model logit multinomial
Pendugaan Parameter model SAE : KQB/KMB Dengan memperhatikan peluang penarikan contoh
Aplikasi 1
2 Lokasi: Kabupaten Sumenep dan Pasuruan
Data Susenas 2010
Model logit multinomial terbobot Perhitungan bobot area
kecil (bloksensus )
Perhitungan bobot individu
Perhitungan rata-rata lama sekolah di tiap kecamatan
Model logit multinomial tanpa bobot
Perhitungan KTG
Gambar 1.2.
Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Multinomial
Keterangan
1. Tahap pengembangan model SAE dengan respon multinomial dengan memperhatikan struktur peluang
2. Aplikasi, menerapkan model logit multinomial untuk pendugaan rata-rata lama sekolah di level kecamatan di Kabupaten Sumenep dan Pasuruan
Dalam disertasi ini dibahas tentang pendugaan Indeks Pendidikan sebagai
salah satu komponen IPM di area kecil (kecamatan) didasarkan pada sebaran
Binomial untuk pendugaan angka melek huruf dan sebaran Multinomial untuk
pendugaan rata-rata lama sekolah. Kebaruan dari penelitan ini adalah:
1. Disertasi ini mengembangkan Metode SAE berbasis respon Binomial dan
Multinomial melalui pendekatan Bayes dengan memperhitungkan peluang
penarikan contoh.
2. Disertasi ini mengembangkan Metode Bayes SAE yang dapat
diaplikasikan untuk menduga Indeks Pendidikan di tingkat kecamatan
semacam ini, yaitu pendugaan Bayes dengan memperhitungkan bobot
percontohan belum pernah dilakukan baik oleh BPS maupun oleh peneliti
lain. Oleh karena itu disertasi ini menghasilkan metode baru untuk
pendugaan Indeks Pendidikan dengan tingkat akurasi dan presisi yang
lebih tinggi.
1.5. Sistematika Disertasi
Disertasi ini terbagi menjadi 3 (tiga) bagian besar. Bagian pertama
membahas tentang pendugaan area kecil secara umum dan hal-hal yang terkait
dengan proses penarikan contoh serta perhitungan IPM. Bagian kedua
membahas perkembangan model SAE khususnya untuk sebaran respon
Binomial dan Multinomial dengan contoh penerapan dalam pendugaan angka
melek huruf dan rata-rata lama sekolah di level kecamatan di di dua kabupaten di
Jawa Timur. Bagian ketiga membahas pengembangan model SAE untuk
sebaran Binomial dan Multinomial berbasis pada penarikan contoh berpeluang
tidak sama dan penerapannya untuk pendugaan Indeks Pendidikan di level
Kecamatan di Jawa Timur. Secara rinci disertasi ini terbagi kedalam 7 bab. Bab 1
adalah pendahuluan yang berisi uraian latar belakang, yujuan, ruang lingkup dan
kebaruan dari disertasi.
Pada bab II dibahas tinjauan pustaka berisi tentang model dasar SAE dan
perkembangannya, meliputi pendugaan parameter menggunakan pendekatan
klasik dan pendekatan Bayes. Di dalam tinjauan pustaka juga dibahas tentang
metode penarikan contoh dalam Susenas serta penentuan bobot untuk
kepentingan pendugaan parameter dengan metode langsung. Selanjutnya pada
bab II ini juga dibahas tentang Indeks Pembangunan Manusia (IPM) dan Indeks
Pendidikan serta cara perhitungannya.
Pada bab III dibahas tentang pendugaan area kecil untuk respon Binomial,
khususnya untuk pendugaan parameter berbasis model dengan pendekatan
Bayes. Dalam bab ini juga disajikan pendugaan Bayes dengan metode langsung
(tidak berbasis model) yaitu dengan menggunakan sebaran prior Beta dan logit
normal. Model SAE untuk respon Binomial kemudian diaplikasikan untuk
pendugaan angka melek huruf di tingkat kecamatan di Kabupaten Sumenep dan
Kabupaten Pasuruan di provinsi Jawa Timur dengan menggunakan data
Susenas 2010.
berbasis peubah respon Multinomial. Dalam bab ini juga digunakan pendekatan
Bayes dengan mengembangkan model SAE untuk peubah respon Multinomial
yang dikembangkan oleh Sceally (2010) dimana pengaruh area dibedakan atas
katagori. Model SAE yang dikembangkan diaplikasikan untuk menduga rata-rata
lama sekolah untuk level kecamatan di kabupaten Sumenep berdasarkan
Susenas 2010.
Pada bab V dikaji pendugaan area kecil (SAE) berdasarkan penarikan
contoh berpeluang tidak sama. Kajian ini dimaksudkan untuk mempelajari cara
pemberian bobot terhadap unit percobaan maupun area yang terambil sebagai
contoh. Dalam bab ini dipelajari berbagai ide pengembangan model SAE terkait
dengan peluang penarikan contoh atau memperhitungkan peluang penarikan
contoh dalam pengembangan dalam pengembangan model SAE. Perhitungan
bobot penarikan contoh sesuai dengan proses penarikan contoh yang
diaplikasikan dalam Susenas. Model SAE yang memperhitungkan peluang
penarikan contoh diaplikasikan untuk menduga rata-rata lama sekolah untuk
level kecamatan di kabupaten Sumenep berdasarkan Susenas 2010.
Bab VI berisi pembahasan yang megintegrasikan semua hasil pengkajian
pengembangan metode SAE melalui pendekatan Bayes baik untuk respon
Binomial maupun Multinomial tanpa memperhitungkan atau dengan
memperhitungkan peluang penarikan contoh. Selain itu pada bab ini juga
dibahas hasil penerapan pendugaan Indeks Pendidikan di kabupaten Sumenep
dan Pasuruan
Bab VII adalah bab kesimpulan yang berisi rangkuman semua hasil
penelitian dan saran baik untuk penelitian ke depan maupun saran secara umum
BAB II
Tinjauan Pustaka
2.1. Pendahuluan
Dalam bab ini dibahas berbagai metode terkait dengan metode pendugaan
area kecil, dimulai dengan pembahasan model dasar pendugaan area kecil
meliputi metode pendugaan parameter dan pendugaan Kuadrat Tengah Galat
(KTG), baik menggunakan cara klasik maupun melalui pendekatan Bayes. Kajian
pustaka selanjutnya adalah tentang pengembangan pendugaan SAE yang
memperhitungkan proses pengambilan contoh khususnya untuk pengambilan
contoh yang berpeluang tidak sama.
Karena model SAE yang dibahas dalam penelitian ini diaplikasikan untuk
menghitung Indeks Pendidikan yang merupakan salah satu komponen dari
Indeks Pembangunan Manusia, sehingga pada bab ini juga akan dijelaskan cara
dan dasar perhitungan IPM khususnya untuk Indeks Pendidikan.
Data yang digunakan adalah data Susenas untuk Provinsi Jawa Timur
tahun 2010 dan data Sensus Penduduk tahun 2010 khususnya di Kabupaten
Sumenep dan Pasuruan. Oleh karena itu juga dibahas metode penarikan contoh
Susenas dan cara pembobotan untuk pendugaan parameter berbasis data
Susenas.
2.2. Model Dasar Pendugaan Area Kecil
Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk wilayah atau area yang besar, misalnya untuk wilayah nasional/ regional
(provinsi/kabupaten/kota) dan pendugaan parameternya didasarkan pada
rancangan. Karena itu untuk area kecil umumnya jumlah contoh menjadi kurang
mencukupi terutama jika ingin digunakan pendugaan berdasarkan rancangan.
Oleh karena itu beberapa peneliti statistik telah mengembangkan Metode
Pendugaan Area Kecil atau Small Area Estimation (SAE) untuk pendugaan
parameter di suatu area dimana jumlah contohnya berukuran kecil.
Metode SAE ini pertama kali diperkenalkan oleh Fay & Heriot (1979),
estimation). Oleh karena itu untuk membangun model SAE dibutuhkan informasi
tambahan dari peubah yang memiliki hubungan dengan peubah yang sedang
diamati yang disebut sebagai peubah penyerta (auxiliary variable). Peubah
penyerta ini dapat diukur dari survai yang lain atau dalam catatan administrasi
dan diharapkan memiliki korelasi dengan peubah yang diamati. Dengan metode
SAE diharapkan adanya perbaikan efisiensi dari pendugaan parameter dalam
area kecil jika peubah penyerta tersedia.
Model SAE memperkenalkan model campuran yang menyertakan
pengaruh area spesifik yang memperhitungkan variasi antar area diluar yang
dapat dijelaskan oleh peubah penyerta yang ada di dalam model. Ketersediaan
data dari peubah penyerta akan sangat menentukan kesuksesan dalam
pembuatan model SAE.
Rao (2003) menyatakan bahwa penggunaan model SAE ini memberikan
beberapa keuntungan yaitu: 1) Diagnostik model dapat digunakan untuk
mendeteksi kecocokan dengan data, misalkan menggunakan analisis sisaan 2)
Pengukuran presisi area-spesifik dapat diasosiasikan dengan setiap pendugaan
setiap area kecil, 3) Model linier campuran seperti model regresi logistik dengan
pengaruh acak area–spesifik tetap dapat dilakukan, demikian juga untuk struktur
data yang cukup kompleks misalkan struktur data time series atau spasial; 4)
pengembangan metode untuk model pengaruh acak dapat dimanfaatkan untuk
mencapai akurasi dalam area kecil.
2.2.1. Pendugaan Area Kecil Berbasis Area
Misalkan terdapat M area kecil di dalam populasi, maka untuk kepentingan
pendugaan area kecil hanya diambil contoh sebanyak m area. Diasumsikan
bahwa parameter yang diperhatikan dalam area kecil ke-i, misalkan θi dapat
dinyatakan sebagai sebuah fungsi yang menghubungkan parameter tersebut
dengan peubah pembantu yang diukur dari area kecil yaitu zi=(z1i,z2i,...,zpi)T.
Rao (2003) mengatakan bahwa model linier yang menjelaskan hubungan
tersebut adalah:
i i b T i
i
υ
θ
=z β+dimana bi
(
)
T Pβ
β
β
1, 2,...,= β
adalah konstanta positif yang diketahui dan
adalah vektor koefisien regresi berukuran p x 1. Selanjutnya υi adalah pengaruh
acak area spesifik diasumsikan memiliki sebaran
υ
i ~(0,σ
υ2)Jika penduga langsung
θ
ˆidiketahui, makaθ
ˆi dapat dinyatakan sebagai :i i i =
θ
+eθ
ˆ , untuk i=1,2,...m, (2.2)dimana :
i i i p i
i
p e V e
E ( θ)=0, ( θ)=ψ . (2.3)
Rao (2003) menjelaskan bahwa model SAE untuk tingkat area, terdiri dari
dua komponen model yaitu komponen model pendugaan langsung dan
pendugaan tak langsung. Kombinasi model pendugaan langsung (2.2) dan tak
langsung (2.1) dikenal sebagai Model Campuran Linier Terampat/MCLT
(Generalized Linear Mixed Model:GLMM) sebagai berikut:
i i i T i
i =z
β
+bυ
+eθ
ˆ . (2.4)Model area kecil seperti yang dijelaskan pada persamaan (2.4) di atas
dikenal sebagai model Fay-Heriot, dimana keragaman peubah respon di dalam
area kecil diasumsikan dapat diterangkan oleh hubungan peubah respon dengan
informasi tambahan yang disebut sebagai model pengaruh tetap. Selain itu
terdapat komponen keragaman spesifik area kecil yang tidak dapat diterangkan
oleh informasi tambahan dan disebut sebagai komponen pengaruh acak area
kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh
campuran.
2.2.2. Pendugaan Area Kecil Berbasis Unit
Pendugaan area kecil berbasis unit mengasumsikan bahwa data dari
peubah penyerta level unit xij=(xij1,...xijp)T tersedia untuk setiap elemen ke j
pada area ke-i. Peubah yang diperhatikan adalah yij yang diasumsikan memiliki
hubungan dengan xij
ij i T ij
ij x e
y = β+υ +
melalui model:
, j=1,...,ni
Pengaruh acak area
, i=1,...m. (2.5)
i
υ
diasumsikan merupakan peubah acak yang bersifat iidsedangkan eij =kije~ij dengan kij eij
~
yang bersifat iid dan bebas terhadap υidimana Em(~eij)=0e2 dan
2
) ~
( ij e
em e
V =σ .
Seringkali
υ
idan eij diasumsikan memiliki sebaran peluang normal.Dengan mengasumsikan bahwa percontohan si berukuran ni diambil dari
populasi di area ke-i berukuran Ni
+ + =
= * * * *
1 1
i i
i i i i i
i i i
e e
y y
υ β X X y
(i=1,2...m) dan penarikan contoh dalam setiap
area diambil secara acak sederhana, sehingga model (2.5) dapat dinyatakan
dalam bentuk matriks:
(2.6)
*
i
y menyatakan unit-unit yang tidak terambil dalam percontohan. Jika Yiadalah
rata-rata populasi di area ke-i, maka Yi dapat ditulis sebagai:
* ) 1
( i i
i i
i f y f Y
Y = + −
(2.7) dimana fi =ni/Ni dan yi adalah rata-rata dari seluruh contoh di area ke-i dan
*
i
Y menyatakan rata-rata elemen populasi dari bagian yang tidak terambil
sebagai contoh. Oleh karena itu untuk model SAE berbasis unit, pendugaan
parameter area kecil Yi sama dengan menduga *
i
Y jika data percontohan {yi}
dan {Xi} tersedia.
2.3. Pendugaan Parameter Model SAE
2.3.1. Metode Prediksi bias Linier Terbaik (PTLT) dan Prediksi Tak-bias Linier Terbaik Empirik (PTLTE)
Parameter di area kecil, misalkan rataan atau tolal, dapat dinyatakan
sebagai kombinasi linier dari efek tetap dan efek acak seperti dinyatakan pada
persamaan (2.1) untuk model berbasis area dan persamaan (2.5) untuk model
berbasis unit.
Melalui pendekatan klasik, pendugaan parameter model SAE umumnya
mengaplikasikan metode PTLT dengan meminimumkan Kuadrat Tengah Galat
(KTG). Metode PTLT ini tidak tergantung pada kenormalan dari efek acak tetapi
tergantung pada ragam atau koragam dari efek acak. Untuk menduga komponen
ragam dan koragam umumnya digunakan metode ML atau REML dengan
mengasumsikan kenormalan. Dengan cara tersebut pendugaan dilakukan
Misalkan data percontohan memenuhi model linier campuran terampat
berikut:
e Zv Xβ
y= + + (2.8)
dimana:
y adalah vektor data observasi berukuran n x 1
X dan Z adalah matriks berukuran n x p dan n x h yang diketahui
v dan e adalah berdistribusi saling bebas dengan rataan 0 dan ragam G
dan R yang tergantung pada parameter T
q) ,... (δ1 δ
=
δ , diasumsikan
bahwa δ adalah himpunan bagian dari ruang Euclidean sedemikian
hingga T
y
Var( )=V=V(δ)=R+ZGZ adalah non singular untuk semua δ
yang terdapat dalam himpunan bagian tersebut, dimana Var (y) adalah
matrik ragam-koragam dari y.
Parameter yang akan diduga merupakan kombinasi linier: µ=1Tβ+mTv
(Rao 2003). Penduga dari µ adalah µˆ=aTβ+b untuk a dan b diketahui dan
merupakan penduga tak bias jika E(µˆ)=E(µ). Selanjutnya Kuadrat Tengah
Galat (KTG) didefinisikan sebagai 2
) ( ) ˆ
(µ =E µ−µ
KTG dan jika
µ
adalahpenduga tak bias dari µ, maka KTG(µˆ)=Var(µ−µ) .
Pada Rao (2003), penduga PTLT µ yang meminimumkan KTG
dinyatakan dalam formula:
), ~ ~
~ ~
~ t(δ(y) 1 β m v 1 β m GZ V (y Xβ
μH = = T + T = T + T T −1 −
(2.9)
dimana:
y V X X) V (X (δ
β
β= = T −1 −1 T −1
) ~ ~
(2.10)
adalah penduga tak bias linier terbaik (Best Linear Estimator: BLUE) dari β dan
)
β
X (y V GZ (δ v
v ~ ) T 1 ~
~= = − − . (2.11)
Penduga PTLT tergantung pada ragam δ yang biasanya tidak diketahui.
Jikaδ diduga dengan δˆ=δˆ(y), maka akan diperoleh Prediksi Tak-bias Linier
Terbaik Empirik (PTLTE) yang tetap merupakan penduga tak bias bagi µ.
Penduga δ diperoleh melalui metode ML atau REML.
Untuk model berbasis unit, dimana rataan area kecil ke-i dinyatakan oleh
fungsi:µi =X~Tiβ+υi. Untuk model percontohan yij =X~ijTβ+υi+eij, j=1,..ni; i=1,....,m
i n i i
i =Xβ+υ1i +e
y . (2.12)
Model SAE yang dinyatakan oleh (2.12) merupakan bentuk khusus dari
persamaan (2.8), dimana Gi =συ2, dan 1 ( 2)
2
ij n j e
i diag k
R
i
≤ ≤
+σ sehingga:
− = − T i i i i ij j e
i aa
a a diag V γ σ ( ) 1 2
1 . (2.13)
Dengan mengambil (συ2/σe2)/(1−γi)=γi/aidimana =∑ j ij
i a
a , T
in i
i a a i
a =( 1,...., )
maka penduga PTLT dari µi
) ~ ( ~ ~ ~ β γ β µ T ia ia i T i H
i =X + y −x
adalah (Rao 2003):
(2.14)
dimana yia danxia adalah rataan terbobot:
∑ =∑
=
j ij ij i ia j ij ij i
ia a y a x a x a
y / ., / .,
β~ adalah penduga tak bias linier terbaik bagiβ
∑ − − ∑ −
=
i i i i
T i i
i T
iV X X V y
X ) ( )
(
~ 1 1 1
β (2.15)
∑ − = = − − j T ia ia i i T ij ij ij e i i i T
iV X A a x x a x x
X 1 σ 2( γ . ) (2.16)
∑ −
= −
−
j ij ij ij i i ia ij e
i i T
iV y a x y a x y
X 1 σ 2( γ . ). (2.17)
Penduga tak bias linier terbaik (2.14) dapat dinyatakan sebagai rata-rata terbobot
dari penduga regresi yia +(Xi−xia)Tβ~ dan penduga regresi sintetik β ~ T i
X
berikut:
[
( ) ~]
(1 ) ~.~ γ β γ β µ T i i T ia i ia i H
i = y + X −x + − X (2.19)
Bobot γi(0≤γi ≤1) mengukur ragam model ( 2
υ
σ ), relatif terhadap ragam total
i e /a
2
2 σ
συ + . Jika ragam model relatif kecil maka γi akan kecil dan bobotnya akan
lebih besar di komponen sintetik.
2.3.2. Pendugaan Parameter Model SAE Melalui Pendekatan Bayes
Melalui pendekatan Bayes, pendugaan parameter di area kecil dapat
dilakukan dengan 2 cara yaitu pendugaan Bayes Empirik/BE (Empirical Bayes:
EB) dan Bayes Berhirarki /BH (Hierarchical Bayes:HB). Untuk pendekatan Bayes
Empirik, pendugaan didasarkan pada sebaran posterior yang diduga dari data,
sedangkan pada pendekatan Bayes berhirarki parameter model yang tidak
tertentu. Model pendugaan area kecil menggunakan Bayes telah dikembangkan
oleh beberapa peneliti diantaranya Gosh dan Rao (1994), You dan Rao (2000).
Pendekatan Bayes, baik Bayes Empirik maupun Bayes Berhirarki
merupakan metode yang dapat diaplikasikan secara lebih umum sehingga
banyak digunakan untuk data diskrit, misalkan untuk data biner dan data
cacahan.
Untuk peubah respons dengan sebaran normal, model dasar area dapat
dinyatakan sebagai model Bayes berhirarki dua tahap yaitu:
1) ˆ / ~ ( i, i) ind
i
i
θ
Nθ
ψ
θ
, i: 1,2,3,……,m (2.20)2)
θ
~ ( Tiβ
, i2σ
υ2) indi N z b , i: 1,2,3,……,m (2.21)
Dimana β adalah vektor parameter regresi berukuran p x 1. Dalam pendekatan Bayes, parameter model β dan 2
υ
σ
adalah peubah acak, dan model hirarki duatahap disebut model hirarki bebas bersyarat (conditionally independent
hierarchical model : CIHM) karena pasangan
( )
θ
ˆi,θ
i adalah bebas di antara areai, untuk β dan
σ
υ2 tertentu.Penduga optimum dari θi merupakan nilai harapan bersyarat dari θi
β
θ
ˆi,jika
diberikan dan 2
υ
σ
:β γ θ
γ θ σ β θ
θ υ T
i i i
i B i i
i z
E( ˆ, , 2)= ˆ = ˆ +(1− ) (2.22)
dimana
(
)
i i
i i
b b
ψ σ
σ γ
υ υ +
= 2 22 2 . Nilai harapan dari θi merupakan nilai harapan dari
sebaran posterior (atau bersyarat) dari θi jika diberikan
θ
ˆi,β
dan2
υ
σ
:) ) ( , ˆ ( ~ , ,
ˆ 2
1 2
i i i
B i i
iθ β σ N θ g σ γψ
θ υ υ = . (2.23)
Penduga θˆ θˆiB(β,συ2)
B
i = adalah penduga Bayes dibawah squared error
loss dan merupakan nilai optimum dari KTG, dimana 2
) ˆ ( ) ˆ
( i
B i B
i E
KTGθ = θ −θ ,
selalu lebih kecil dibandingkan dengan θ dan linier atau non linier dalam
θ
ˆi.Jiang et al. (2002) menyatakan bahwa
θ
ˆiBdisebut prediksi terbaik (BestPrediction: BP) dari penduga θi karena diperoleh dengan tanpa mengasumsikan
Penduga Bayes B i
θ
ˆ tergantung pada parameter model β dan 2υ
σ
yangdiduga dengan menggunakan metode ML atau REML dari sebaran marjinal :
(
,)
.~
ˆ 2 2
i i
T i ind
i N z β b σ ψ
θ υ + .
(2.24)
Penduga parameter dinotasikan dengan
β
ˆdanσ
ˆυ2, sehingga denganmenggantikan
β
ˆ untuk β danσ
ˆυ2 untukσ
υ2, maka Penduga Bayes Empirik (Empirical Bayes Prediction: EBP) untukθ
iadalah:(
ˆ, ˆ)
ˆ ˆ (1 ˆ) ˆ. ˆˆ θ β σ2 γθ γ β
θ υ i i i iT
B i EB
i = = + − z (2.25)
Penduga BE, EB i
θ
ˆ adalah identik dengan penduga PTLTE yang dinotasikandengan H i
θ
ˆ juga merupakan rataan dari estimasi densitas posterior ,(
ˆ2)
, ˆ , ˆ
υ
σ β θ θi
f dari
θ
i, yaitu(
EB i i)
iNθˆ ,γˆψ .
2.4. Peluang Penarikan Contoh
Metode pengambilan contoh berbasis peluang telah banyak dibahas oleh
beberapa peneliti. Metode pengambilan contoh berbasis peluang yang banyak
dibahas dan sering diaplikasikan adalah metode pengambilan contoh acak
sederhana (simple random sampling), metode pengambilan contoh berstrata
(stratified sampling), metode pengambilan contoh bergerombol (cluster sampling)
dan metode pengambilan contoh sistematik (systematic sampling).
Masing-masing metode pengambilan contoh memiliki konsekuensi terhadap perhitungan
pendugaan parameter. Dalam rangka mendapatkan penduga yang tak berbias
maka bobot peluang tersebut harus diperhitungkan dalam pendugaan parameter.
Misalkan akan diduga parameter total Y =∑Uyj atau rataan Y