Bayesian models for small area estimation based on unequal probability sampling of binomial and multinomial responses

(1)

MODEL

BAYES

UNTUK

PENDUGAAN

AREA

KECIL

DENGAN

PENARIKAN

CONTOH

BERPELUANG

TIDAK

SAMA

PADA

KASUS

RESPON

BINOMIAL

DAN

MULTINOMIAL

APLIKASI :

PENDUGAAN INDEKS PENDIDIKAN LEVEL

KECAMATAN DI JAWA TIMUR

AGNES TUTI RUMIATI

G161080031

/

STK

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(2)

MODEL

BAYES

UNTUK

PENDUGAAN

AREA

KECIL

DENGAN

PENARIKAN

CONTOH

BERPELUANG

TIDAK

SAMA

PADA

KASUS

RESPON

BINOMIAL

DAN

MULTINOMIAL

APLIKASI :

PENDUGAAN INDEKS PENDIDIKAN LEVEL

KECAMATAN DI JAWA TIMUR

Oleh:

A

GNES

T

UTI

R

UMIATI

G161080031

/

STK

Disertasi

sebagai salah satu syarat untuk memperoleh gelar Doktor

pada

Program Studi Statistika

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(3)

J u d u l : Model Bayes untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama pada Kasus Respon Binomial dan Multinomial.

Aplikasi :

Pendugaan Indeks Pendidikan Level Kecamatan di Jawa Timur

Nama Mahasiswa : Agnes Tuti Rumiati Nomor Pokok : G161080031 Program Studi : Statistika

Menyetujui: Komisi Pembimbing

K e t u a

Prof. Dr. Ir. Khairil A. Notodiputro, MS

Dr. Ir. I Wayan Mangku, MSc

A n g g o t a A n g g o t a

Dr. Ir. Kusman Sadik, MS.

Mengetahui:

Koordinator Program Studi Statistika Dekan Sekolah Pascasarjana

(4)

PERNYATAAN MENGENAI DISERTASI DAN

SUMBER INFORMASI

Dengan ini saya menyatakan bahwa disertasi yang berjudul Model Bayes untuk Pendugaan Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus Respon Binomial dan Multinomial adalah hasil karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya penulis lain telah dicantumkan di dalam teks dan daftar pustaka disertasi ini.

Bogor, September 2012

Agnes Tuti Rumiati

(5)

ABSTRACT

AGNES TUTI RUMIATI. Bayesian Models for Small Area Estimation Based on Unequal Probability Sampling of Binomial and Multinomial Responses. Under guidance of KHAIRIL ANWAR NOTODIPUTRO, I WAYAN MANGKU and KUSMAN SADIK

In this research a Bayesian Method of Small Area Estimation (SAE) has been developed based on binomial and multinomial response variables using Susenas data obtained from unequal probability sampling. Case study was carried out to predict education level of the population measured by literacy rate and mean years of schooling in sub-district level in East Java Province. The SAE model for binomial response was developed with two methods, i.e. using weighted logit normal mixed model and involving the probability of sampling selection model as exponential function into the SAE model. A simulation study was carried out by implementing 100 times sampling selection into population data. Penalized Quasi Likelihood (PQL) and Restricted Maximum Likelihood method (REML) was used to parameter estimation of SAE model. Based on the simulation result, we found that

the weighted logit normal mixed model gave the best estimate. In application, the weighted

logit normal mixed model also provided good prediction of literacy rate in Sumenep and Pasuruan regency.For the multinomial respons, we applied the weighted logit multinomial mixed model. MSE estimation was used Jackknife method and it gave very small MSE of

about 1,14 x10-7.

(6)

RINGKASAN

Berbagai survei umumnya dirancang untuk menduga parameter populasi

untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi,

kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau

dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah

yang lebih kecil, umumnya jumlah contoh kurang mencukupi jika digunakan

untuk menduga berdasarkan rancangan.

Di Indonesia, kebutuhan untuk melakukan pendugaan di area kecil mulai

dirasakan terutama untuk merancang dan mengevaluasi kebijakan dan program

pembangunan di level kabupaten /kota. Salah satu indikator yang mengukur hasil

pembangunan di suatu wilayah adalah Indeks Pembangunan Manusia (IPM).

IPM dihitung oleh Badan Pusat Satistik (BPS) dengan menggunakan data dasar

hasil Survai Sosial Ekonomi Nasional (Susenas). Susenas dilakukan oleh BPS

tiap tahun, dirancang untuk menduga parameter sosial-ekonomi level nasional

atau regional sehingga tidak cukup representatif untuk pendugaan parameter

tingkat kecamatan.

Penggunaan data Susenas untuk pendugaan parameter di tingkat

kecamatan atau desa akan menghadapi dua persoalan statistika yaitu:

1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter

berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan

contohnya memiliki peluang tidak sama karena rancangan penarikan contoh

dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil

blok sensus pada tahap pertama dan pada tahap ke dua mengambil rumah

tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam

Susenas memiliki peluang tidak sama.

Penelitian ini bertujuan untuk mengembangkan model SAE untuk

menduga Indeks Pendidikan yang merupakan salah satu komponen IPM. Indeks

Pendidikan diukur dengan angka melek huruf dan rata-rata lama sekolah di

suatu wilayah. Angka melek huruf diukur dengan proporsi penduduk berusia 10

tahun ke atas yang bisa baca tulis, sedangkan rata-rata lama sekolah diukur dari

proporsi penduduk berusia 10 tahun ke atas di tiap level pendidikan tertentu.

(7)

berusia 10 tahun ke atas di tiap level pendidikan tertentu merupakan parameter

dari distribusi Multinomial.

Dalam penelitian disertasi ini, pengembangan model SAE untuk peubah

respon Binomial dan Multinomial berbasis pada penarikan contoh berpeluang

tidak sama mengacu

kepada beberapa penelitian tentang pengembangan model

SAE untuk peubah respon binomial dan multinomial, serta pengembangan model

SAE yang memperhitungkan peluang penarikan contoh.

Pendugaan parameter area dilakukan dengan menggunakan pendekatan Bayes.

Dengan melakukan simulasi, diperoleh bahwa model SAE untuk peubah

respon binomial menggunakan sebaran prior logit normal melalui pendekatan

Bayes empirik yang dikembangkan dengan memperhitungkan peluang penarikan

contoh memberikan penduga yang paling baik karena dapat menurunkan bias

dan KTG dari penduga. Dengan mengaplikasikan model SAE logit normal

terbobot melalui pendekatan Bayes, dihasilkan perbedaan antara nilai parameter

populasi dengan prediksinya relatif kecil. Kabupaten Sumenep memiliki

rata-rata bias sebesar 0,0628 dan nilai KTG sebesar 0,0149 dan untuk Kabupaten

Pasuruan rata-rata biasnya sebesar 0,0136 dengan KTG sebesar 0,0212.

Sementara itu metode pendugaan area kecil yang dikembangkan

berdasarkan penarikan contoh informatif yaitu dengan menyertakan model

peluang penarikan contoh dalam bentuk fungsi eksponensial memberikan

rata-rata bias relatif yang rendah namun memberikan akar rata-rata-rata-rata kuadrat bias

relatif maupun KTG yang lebih tinggi dibandingkan dengan metode pendugaan

menggunakan sebaran prior logit normal terbobot. Besarnya nilai KTG lebih

banyak disebabkan karena ragam pendugaan yang relatif besar sehingga

walaupun memberikan bias yang kecil maka KTG akan cenderung tinggi.

Penurunan bias dari model SAE eksponensial ini menunjukkan bahwa

memperhitungkan peluang penarikan contoh dalam model SAE akan dapat

menurunkan bias. Pfefferman (2010) mengatakan bahwa mengabaikan peluang

penarikan contoh dalam model SAE akan menghasilkan bias pendugaan karena

dengan mengabaikan peluang penarikan contoh, maka pendugaan parameter

model untuk area/unit yang terambil sebagai contoh sama dengan area/unit yang

tidak terambil sebagai contoh.

Berdasarkan hasil simulasi maupun aplikasi di Kabupaten Sumenep dan

(8)

menggunakan model campuran logit normal terbobot memberikan hasil yang

paling akurat dalam pendugaan parameter proporsi area kecil.

Selanjutnya pendugaan area kecil untuk respon multinomial dilakukan

dengan cara yang sama yaitu melalui model campuran logit multinomial terbobot.

Pendugaan KTG dilakukan dengan menggunakan metode Jackknife. Dari hasil

aplikasi di Kabupaten Sumenep dan Pasuruan, penduga KTG untuk logit

multinomial terbobot melalui pendekatan Bayes juga memberikan nilai penduga

KTG yang sangat kecil yaitu pada kisaran antara 1,14 x 10-7 sampai 8,17 x10-7 karena pada mumnya kondisi blok sensus di tiap kecamatan relatif sama.

Besarnya KTG tersebut sangat dipengaruhi oleh homogenitas atau heterogenitas

dari nilai respon dari area yang satu ke area yang lain.

Dengan menggunakan metode Jackknife, nilai dugaan KTG untuk

pendugaan area kecil di tiap-tiap katagori bervariasi tergantung kepada

heterogenitas nilai dugaan proporsi dari area ke area. Semakin heterogen maka

akan menghasilkan nilai dugaan KTG yang cenderung lebih besar. Hal yang

sama juga ditemui pada pendugaan area kecil yang memperhitungkan peluang

penarikan contoh.

Besarnya KTG yang dihasilkan oleh metode SAE yang menyertakan

fungsi eksponensial dari peluang percontohan perlu dikaji lebih dalam karena

bias yang dihasilkan relatif sangat kecil sehingga kemungkinan besarnya KTG

disebabkan oleh ragam pendugaan yang besar. Perlu dikembangkan model yang

(9)

@ Hak Cipta Institut Pertanian Bogor (IPB), Tahun 2012

Hak Cipta Dilindungi Undang-undang

1. Dilarang mengutip sebagian atau seluruhnya karya tulis ini tanpa

mencantumkan atau menyebutkan sumber:

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,

penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau

tinjauan suatu masalah

b. Pengutipan tidak merugikan kepentingan yang wajar IPB

2. Dilarang mengumumkan atau memperbanyak sebagian atau seluruh

(10)

PRAKATA

Puji syukur penulis panjatkan kehadirat Allah SWT, karena atas rahmat dan

hidayah-Nyalah akhirnya disertasi dengan judul “Model Bayes untuk Pendugaan

Area Kecil dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus

Respon Binomial dan Multinomial”, dengan aplikasi Pendugaan Indeks

Pendidikan Level Kecamatan di Jawa Timur ini dapat diselesaikan dengan baik.

Selain untuk memenuhi syarat memperoleh gelar doktor pada program

studi Statistika-IPB, disertasi ditujukan untuk menghasilkan metode statistik yang

dapat digunakan oleh pemerintah atau pihak lain untuk melakukan pendugaan

area kecil yang memiliki jumlah data terbatas tanpa perlu menambah contoh

dengan memanfaatkan informasi yang ada sehingga dapat mengurangi biaya

penelitian.

Selama pelaksanaan penelitian dan penyelesaian disertasi ini, penulis

banyak mendapatkan bantuan dari berbagai pihak baik secara moril dan meteriil

sehingga disertasi ini dapat terselesaikan dengan baik. Pada kesempatan ini

secara khusus penulis mengucapkan terima kasih kepada :

1. Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, Bapak Dr. I Wayan

Mangku dan Bapak Dr Kusman Sadik selaku dosen pembimbing yang

telah banyak memberikan arahan, bimbingan dan saran hingga

disertasi ini bias diselesaikan dengan baik.

2. Seluruh dosen dan karyawan Departemen Statistika FMIPA IPB yang

telah menjadi teman diskusi, memberikan saran dan dorongan moril.

3. Seluruh dosen dan karyawan Sekolah Pascasarjana IPB yang telah

memberikan layanan pengajaran dan administrasi yang baik.

4. Seluruh dosen dan karyawan Jurusan Statistika FMIPA ITS,

5. Para peneilti dan karyawan BPS Pusat dan Provinsi Jawa Timur yang

banyak membantu memberikan data dan penjelasan terkait data

(11)

6. Para peneiliti dan karyawan Pusat Penelitian Potensi daerah dan

Pemberdayaan Masyarakat (PDPM), LPPM-ITS yang telah

memberikan bantuin moril dan materiil selama penulis melaksanakan

studi S3 dan menyelesaikan penelitian disertasi

7. Suami dan anak-anak tercinta serta seluruh keluarga yang senantiasa

memberikan dorongan semangat, doa yang ikhlas dan telah

mendampingi penulis selama studi S3 dan menyelesaikan penelitian

disertasi.

8. Teman-teman sesama mahasiswa program Pasca Sarjana di

Departemen Statistika-IPB serta berbagai pihak lain yang tidak dapat

penulis sebutkan satu persatu.

Akhir kata, dengan segala kerendahan hati, penulis menyadari bahwa

disertasi ini masih jauh dari sempurna, oleh karena itu penulis sangat

mengharapkan saran dan masukan yang bermanfaat untuk memperbaiki tulisan

disertasi ini. Namun demikian, penulis berharap tulisan ini dapat bermanfaat bagi

mereka yang memerlukannya. Semoga Allah SWT senantiasa memberikan

kebaikan untuk kita semua.

Bogor, September 2012

(12)

RIWAYAT HIDUP

Penulis dilahirkan di kota Mojokerto, Jawa Timur pada tanggal 24 Juli 1957 dari

pasangan Bapak JH Soeratman (alm) dan Ibu P Sri Woelan (alm). Penulis merupakan anak

pertama dari lima bersaudara dan menikah dengan Ir. Nus Irwansyah, MBA dan telah

dikaruniai dua anak yaitu Duta Perdana MA dan Rizqi Yoshita.

Pendidikan Sarjana ditempuh di Jurusan Matematika, FIPIA – ITS lulus pada tahun

1982 dengan pembimbing Bapak I Nyoman Latra, MS. Pada tahun 1996, penulis

memperoleh gelar Master of Science dari School of Mathematics and Statistics, The

University of Sheffield, United Kingdom dengan pembimbing tesis Professor John Biggins.

Sejak tahun 2008 penulis menempuh Program Doktor pada Program Studi Statistika

Sekolah Pascasarjana IPB. Sejak tahun 1985 sampai dengan saat ini penulis bekerja

sebagai dosen di Jurusan Statistika, FMIPA-ITS dan peneliti di Pusat Penelitian Potensi

daerah dan Pemberdayaan Masyarakat (PDPM), Lembaga Penelitian dan Pengabdian

Masyarakat (LPPM)-ITS

.

Selama mengikuti pendidikan Program Doktor, penulis telah menghasilkan beberapa

karya ilmiah yang telah dipublikasikan dalam seminar nasional serta jurnal ilmiah,

diantaranya :

1. Rumiati, AT, Notodiputro AK, Mangku IW dan Sadik K, 2012. Empirical Bayesian

Method for The Estimation of Literacy Rate at Sub-district Level. Case Study:

Sumenep District of East Java Province, IPTEK, The Journal for Technology and

Science, Vol. 23, No. 1, February 2012.

2. Rumiati, AT, Regresi Polinomial local untuk Data Survey Berskala Besar, Studi

kasus: Model Pengeluaran Rumah Tangga berdasarkan Data Susenas Jawa Timur

2006. Prosiding pada Seminar Nasional Statistika, 7 Nopember 2009. Jurusan

(13)

DAFTAR ISI

Halaman

DAFTAR TABEL ... v

DAFTAR GAMBAR ... vi

DAFTAR LAMPIRAN ... viii

I. Pendahuluan ... 1

1.1. Latar Belakang ... 1

1.2. Tujuan Penelitian ... 5

1.3. Ruang Lingkup ... 5

1.4. Kebaruan ... 7

1.5. Sistematika Disertasi... 8

II. Tinjauan pustaka ... 11

2.1. Pendahuluan ... 11

2.2 Model Dasar Pendugaan Area Kecil ... 11

2.2.1. Pendugaan Area Kecil Berbasis Area ... 12

2.2.2. Pendugaan Area Kecil Berbasis Unit ... 13

2.3 Pendugaan Parameter Model Pendugaan Area kecil ... 14

2.3.1. Metode Prediksi Tak-bias Linier Terbaik (PTLT) dan Prediksi Tak-bias Linier Terbaik Empirik (PTLTE) ... 14

2.3.2 Pendugaan Parameter Model SAE Melalui Pendekatan Bayes... 16

2.4. Peluang Penarikan Contoh ... 18

2.5. Model SAE dengan Memperhitungkan Peluang Penarikan Contoh ... 21

2.6 Indeks Pembangunan Manusia (IPM) ... 23

2.6.1. Cara Perhitungan IPM ... 24

2.6.2. Indikator Pendidikan/ Pengetahuan ... 26

2.7. Survei Sosial Ekonomi Nasional (Susenas) ... 27

2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh .... 27

(14)

III. Model Bayes untuk Pendugaan Area Kecil Berbasis Peubah

Respon Binomial ... 30

3.1 Pendahuluan ... 30

3.2 Metode Pendugaan Langsung Melalui Pendekatan Bayes... 32

3.2.1. Pendugaan Bayes Menggunakan Sebaran Prior Beta .... 32

3.2.2. Pendekatan Bayes Menggunakan Sebaran Prior Logit-Normal... 35

3.3. Metode Pendugaan Tak Langsung Melalui Pendekatan Bayes . . 36

3.4. Aplikasi : Pendugaan Angka Melek Huruf di Tingkat Kecamatan, Kabupaten Sumenep Berbasis Data Susenas ... 39

3.4.1. Pendugaan Langsung ... 40

3.4.2. Pendugaan Tak Langsung ... 43

3.5. Pembahasan ... 45

IV. Model SAE Berbasis Sebaran Respon Multinomial Melalui Pendekatan Bayes ... 47

4.2. Model SAE untuk Respon Multinomial ... 48

4.2.1. Pendugaan Parameter Model ... 49

4.2.2. Pendugaan Ragam ... 52

4.2.3. Pendugaan Parameter Area Melalui Pendekatan Bayes . 54 4.3. Aplikasi: Pendugaan Rata-Rata Lama Sekolah Tingkat Kecamatan di Jawa Timur Berbasis Data Susenas 2010 ... 56

4.3.1. Pengukuran Peubah Respon dan Peubah Penyerta ... 56

4.3.2. Hasil Eksplorasi Data ... 57

4.3.3. Pendugaan Rata-rata Lama Sekolah di Tingkat Kecamatan ... 58

4.4. Pembahasan ... 60

V. Model Bayes Pendugaan Area Kecil untuk Respon Binomial dan Multinomial Berbasis Penarikan Contoh Berpeluang Tidak Sama... 62

(15)

5.3. Pendugaan Area Kecil Menggunakan Model Campuran Linier

Terbobot ... 70

5.4. Pengembangan Model Bayes SAE Berbasis Penarikan Contoh

Berpeluang Tidak Sama untuk Respon Binomial ... 71

5.4.1. Penentuan Bobot ... 72

5.4.2. Metode Pendugaan Parameter Area Kecil dengan

Menyertakan Peluang Penarikan Contoh yang Bersifat

Eksponensial ... 73

5.4.3. Metode Pendugaan Parameter Area Kecil

menggunakan Model Linier Campuran Terbobot ... 74

5.4.4. Evaluasi Terhadap Penduga... 74

5.4.5. Simulasi... 75

5.4.6. Aplikasi : Pendugaan Angka Melek Huruf di Kabupaten

Sumenep dan Kabupaten Pasuruan Provinsi Jawa

Timur... 78

5.5 Model SAE Berbasis Penarikan Contoh Berpeluang Tidak

Sama Untuk Peubah Respon Multinomial ... 80

5.5.1. Pengembangan model SAE: Model Campuran Logit

Multinomial Terbobot... 80

5.5.2. Aplikasi: Pendugaan rata-rata lama sekolah di tingkat

kecamatan di Kabupaten Sumenep dan Kabupaten

Pasuruan... 82

5.6. Perhitungan Indeks Pendidikan di Kabupaten Sumenep dan

Pasuruan ... 84

5.7 Pembahasan... 86

5.7.1. Model SAE untuk respon Binomial dengan

memperhitungkan peluang penarikan contoh... 86

5.7.2. Model SAE untuk respon Multinomial dengan

memperhitungkan peluang penarikan contoh... 87

IV. Pembahasan ... 88

6.1. Pendahuluan………. 88

6.2. Perbandingan metode pendugaan langsung dan tak langsung

(16)

6.3. Pengaruh peluang penarikan contoh dalam Model SAE untuk

respon Binomial dalam peningkatan kualitas penduga... 90

6.4. Pengembangan model SAE berbasis pada peubah respon Multinomial dengan penarikan contoh berpeluang tidak sama... 90

VII Kesimpulan dan Saran ……… 93

7.1. Kesimpulan………. 93

7.2. Saran……… 94

Daftar Pustaka ………. 95

Daftar Istilah ………. 99

(17)

DAFTAR TABEL

Halaman

Tabel 2.1 Peubah dan sumber data dari masing-masing komponen IPM ... 24

Tabel 2.2. Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM ... 25

Tabel 2.3. Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan . 26

Tabel 3.2. Rata-rata pendugaan angka melek huruf dan KTG kecamatan di

Kabupeten Sumenep dan Kabupaten Pasuruan menggunakan

pendekatan Bayes ... 46

Tabel 4.1. Klasifikasi tingkat pendidikan tertinggi penduduk usia 10 tahun

ke atas ... 56

Tabel 4.2. Rata-rata dugaan proporsi penduduk pada jenjang pendidikan

tertentu dan rata-rata nilai KTG dugaan tiap kecamatan di

Kabupaten Sumenep dan Kabupaten Pasuruan ... 58

Tabel 5.1. Nilai rata-rata bias relatif dan rata-rata kuadrat bias relatif untuk

model terbobot dan model eksponensial ... 78

Tabel 5.2. Hasil Simulasi Dugaan pi

78 (proporsi penduduk usia 10 tahun ke

atas yang bisa baca tulis) untuk tiap blok sensus di Kecamatan

Lenteng, Kabupaten Sumenep...

Tabel 6.1 Perbandingan kualitas penduga untuk model SAE untuk respon

Binomial dengan dan tanpa memperhatikan peluang penarikan

(18)

DAFTAR GAMBAR

Halaman

Gambar 1.1 Kerangka Penelitian Pengembangan Model SAE untuk

Peubah Respon Binomial…... 6

Gambar 1.2 Kerangka Penelitian Pengembangan Model SAE untuk

Peubah Respon Multinomial... 7

Gambar 3.1 Proporsi Penduduk 10 tahun ke atas yang bisa baca tulis

berdasarkan data Susenas tahun 2010 di Kabupaten

Sumenep dan Pasuruan... 39

Gambar 3.2 Hasil Pendugaan angka melek huruf dengan menggunakan

metode klasik dan Metode Bayes ... 42

Gambar 3.3 Plot dari nilai dugaan KTG menggunakan sebaran prior Beta

dan Logit-Normal melalui metode pendugaan langsung... 43

Gambar 3.4 Hubungan kemampuan baca tulis dengan usia berdasarkan

jenis kelamin di Kabupaten Sumenep dan Kabupaten

Pasuruan ... 44

Gambar 3.5 Plot hasil dugaan angka melek huruf dan KTG di Kabupaten

Sumenep ... ………. 45

Gambar 3.6 Plot hasil dugaan paramater pi

Pasuruan... (angka melek huruf) dan KTG di Kabupaten

45

Gambar 4.1 Proporsi penduduk berusia 10 tahun ke atas berdasarkan

lama sekolah berdasarkan data Susenas 2010 di Kabupaten

Sumenep dan Kabupaten Pasuruan... 57

Gambar 4.2 Plot Hasil dugaan proporsi penduduk berusia 10 tahun keatas

di tiap jenjang pendidikan di Kabupaten Sumenep dan

Kabupaten Sumenep ... 59

Gambar 4.3 Plot Hasil Proporsi Penduduk Berusia 10 tahun keatas di tiap

jenjang pendidikan dan Nilai Dugaan KTG di Kabupaten

Pasuruan ... 59

Gambar 4.4 Plot Hasil Dugaan Angka Melek Huruf dan Nilai KTG Dugaan

(19)

Gambar 5.1 Plot hasil simulasi pendugaan pi (angka melek huruf) untuk

tiap blok sensus di Kecamatan Lenteng, Kabupaten Sumenep 77

Gambar 5.2 Plot hasil simulasi bias pendugaan pi

77 untuk tiap blok sensus

di Kecamatan Lenteng, Kabupaten Sumenep ...

Gambar 5.3 Nilai dugaan, parameter populasi, dan bias dugaan angka

melek huruf di Kabupaten Sumenep... 79

Gambar 5.4 Nilai dugaan, parameter populasi, dan bias dugaan angka

melek huruf di Kabupaten Pasuruan... 79

Gambar 5.5 Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan

tertentu dan Dugaan KTG Menggunakan Model SAE logit

multinomial terbobot di Kabupaten Sumenep... 83

Gambar 5.6 Nilai dugaan proporsi penduduk pada tiap jenjang pendidikan

tertentu dan Dugaan KTG menggunakan model SAE logit

multinomial terbobot di Kabupaten Pasuruan... 84

Gambar 5.7 Nilai dugaan rata-rata lama sekolah menggunakan model

SAE logit multinomial terbobot di Kabupaten Sumenep dan

Pasuruan... 84

Gambar 5.8 Prediksi Indeks Pendidikan di Kabupaten Sumenep dan

Kabupaten Pasuruan Menggunakan Model SAE………. 85

Gambar 5.9 Peta Tematik Indeks Pendidikan di Kabupaten Sumenep……. 85

(20)

DAFTAR LAMPIRAN

Halaman

Lampiran 1 Program SAS untuk pendugaan model SAE ... 100

Lampiran 2 Program Matlab untuk perhitungan pendugaan area kecil

melalui pendugaan langsung melalui sebaran prior logit

normal ... 101

melalui pendugaan langsung melalui sebaran prior beta .... 103

melalui pendugaan tak langsung (berbasis model) melalui

sebaran prior logit normal tanpa bobot ... 105

melalui pendugaan tak langsung melalui sebaran prior

logit normal dengan memperhitungkan bobot peluang ... 107

Lampiran 6 Jumlah penduduk usia 10 tahun keatas berdasarkan data

sensus dan susenas serta jumlah blok sensus di tiap

kecamatan di Kabupaten Sumenep ... 109

Lampiran 7 Jumlah penduduk usia 10 tahun keatas berdasarkan data

sensus dan susenas serta jumlah blok sensus di tiap

kecamatan di Kabupaten Pasuruan ... 110

Lampiran 8 Hasil Pendugaan Paramater pi (proporsi penduduk berusia

10 tahun ke atas yang bisa baca tulis) dan KTG untuk

masing-masing kecamatan di Kabupaten Sumenep ... 111

Lampiran 9 Hasil Pendugaan Paramater pi (proporsi penduduk berusia

10 tahun ke atas yang bisa baca tulis) dan KTG untuk

masing-masing kecamatan di Kabupaten Pasuruan ... 112

Lampiran 10 Hasil pendugaan proporsi penduduk pada tiap tingkat

pendidikan tertinggi di Kabupaten Sumenep ... 113

Lampiran 11 Hasil pendugaan KTG untuk pendugaan proporsi

penduduk pada tiap tingkat pendidikan tertinggi di

Kabupaten Sumenep ... 114

Lampiran 12 Hasil pendugaan proporsi penduduk pada tiap tingkat

(21)

Lampiran 13 Hasil pendugaan KTG untuk pendugaan proporsi

penduduk pada tiap tingkat pendidikan tertinggi di

Kabupaten Pasuruan ... 116

Lampiran 14 Hasil pendugaan angka melek huruf di tiap kecamatan

berdasarkan model campuran logit normal terbobot dan

model campuran logit normal terbobot di Kabupaten

Sumenep ... 117

berdasarkan model campuran logit normal terbobot di

Kabupaten Pasuruan ... 118

berdasarkan model campuran logit multinomial terbobot

di Kecamatan Pragaan, Kabupaten Sumenep ... 119

Lampiran 17 Pendugaan KTG untuk penduga proporsi penduduk di

tiap jenjang pendidikan berdasarkan model campuran logit

multinomial terbobot di Kabupaten Sumenep ... 120

Lampiran 18 Hasil pendugaan proporsi penduduk di tiap jenjang

pendidikan berdasarkan model campuran logit

multinomial terbobot di Kabupaten Pasuruan ... 121

Lampiran 19 Penduga KTG untuk penduga proporsi penduduk di tiap

jenjang pendidikan berdasarkan model campuran logit

multinomial terbobot di Kabupaten Pasuruan ... 122

Lampiran 20 Prediksi Indeks Pendidikan di Kabupaten Sumenep

menggunakan model SAE ………... 123

Lampiran 21 Prediksi Indeks Pendidikan di Kabupaten Pasuruan

menggunakan model SAE ……… 124

Lampiran 22 Hubungan antara Proprosi Penduduk untuk tiap jenjang

pendidikan Berdasarkan Usia dan jenis kelamin di

kabupaten Sumenep ... 125

Lampiran 23 Hubungan antara Proprosi Penduduk untuk tiap jenjang

pendidikan dengan Usia dan jenis kelamin di kabupaten

(22)

BAB

I

Pendahuluan

1.1. Latar Belakang

untuk area besar, misalnya untuk wilayah nasional atau regional (provinsi,

kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan atau

dikatakan sebagai pendugaan langsung. Untuk pendugaan parameter wilayah

yang lebih kecil, umumnya jumlah contoh kurang mencukupi jika digunakan

untuk pendugaan berdasarkan rancangan.

Dewasa ini telah dikembangkan sebuah metode pendugaan parameter di

suatu area dimana jumlah contohnya berukuran kecil dan bahkan tidak ada yaitu

Metode Pendugaan Area Kecil atau Small Area Estimation (SAE). Pendugaan

dalam SAE didasarkan pada model dan merupakan pendugaan tidak langsung.

Oleh karena itu dibutuhkan informasi tambahan dari peubah yang memiliki

hubungan dengan peubah yang sedang diamati yang disebut sebagai peubah

penyerta (auxiliary variable).

Model SAE pertama kali diperkenalkan oleh Fay & Heriot (1979), yaitu

model yang memperhitungkan dua jenis keragaman yang mencakup 1)

keragaman peubah respon yang tidak dapat diterangkan seluruhnya oleh

hubungan peubah respon dengan informasi tambahan yang disebut model

pengaruh tetap dan 2) keragaman spesifik area kecil yang tidak dapat

diterangkan oleh informasi tambahan, merupakan pengaruh acak area kecil.

Oleh karena itu model SAE mengandung dua komponen galat yaitu galat karena

model dan galat karena pendugaan parameter secara langsung. Rataan atau

tolal area kecil dapat dinyatakan sebagai kombinasi linier dari pengaruh tetap

dan pengaruh acak.

Secara aliran klasik, pendugaan parameter untuk model dasar SAE

biasanya menggunakan metode Prediksi Tak-bias Linier Terbaik (Best Linear

Unbiased Predictor) yaitu dengan meminimumkan Kuadrat Tengah Galat (KTG)

dari penduga. Pendugaan dengan Prediksi Tak-bias Linier Terbaik (PTLT) ini

tidak tergantung pada kenormalan dari pengaruh acak tetapi tergantung pada

(23)

ragam-koragam sering diduga dengan menggunakan metode Kemungkinan Maksimum

(Maximum Likelihood:ML) atau Kemungkinan Maksimum Berkendala (Restricted

Maximum Likelihood: REML) dengan mengasumsikan kenormalan. Dengan cara

tersebut pendugaan melalui proses dua tahap yang dikenal sebagai Prediksi

Tak-bias Linier Terbaik Empirik (PTLTE). Rao (2003) mengatakan bahwa

metode BLUP atau EBLUP hanya cocok untuk peubah kontinu, tetapi kurang

sesuai jika digunakan untuk pemodelan peubah respon bertipe diskrit.

Metode PTLT atau PTLTE dapat diaplikasikan untuk model linier

campuran yang banyak digunakan untuk pendugaan area kecil. Dalam

pendugaan parameter dari model linier campuran tersebut tidak dibutuhkan

kenormalan dari pengaruh acak dan galat , tetapi kenormalan dibutuhkan untuk

mendapatkan penduga KTG yang akurat (Rao, 2003). Model linier campuran itu

sendiri dirancang untuk peubah bertipe kontinu dan kurang sesuai untuk peubah

bertipe diskrit (biner atau cacahan). Untuk data biner atau cacahan, khususnya

model regresi logistik dan model log linier akan lebih tepat menggunakan

metode pendugaan melalui pendekatan Bayes, baik melalui metode Bayes

Empirik (Empirical Bayes) maupun metode Bayes Berhirarki (Hierarchical

Bayes).

Di Indonesia, beberapa peneliti yang mengembangkan model SAE

diantaranya adalah Kurnia et al. (2007), yang membahas pengaruh

mis-spesifikasi desain survey pada pendugaan area kecil. Selain itu Kurnia et al.

(2007) membahas tentang pendekatan non parameterik dalam SAE. Selanjutnya

Kurnia (2009) meneliti tentang prediksi terbaik empirik untuk model transformasi

logaritma di dalam pendugaan area kecil dengan penerapan pada data

Susenas. Peneliti yang lain adalah Sadik (2009) mengembangkan metode

prediksi tak-bias linear terbaik dan bayes berhirarki untuk pendugaan area kecil

berdasarkan model state space.

Beberapa peneliti yang telah mengembangkan model pendugaan area

kecil untuk data biner diantaranya adalah Malec et al. (1997), Boostra et al.

(2011), Jiang dan Lahiri (2001), Rao (2003), Clarke et al. (2006) dan Chandra et

al. (2009). Para peneliti tersebut umumnya menggunakan sebaran prior Beta

atau logit normal, sedangkan untuk pendugaan parameter digunakan metode

Kemungkinan Quasi Berpenalti (Penalized Quasi-Likelihood) dan pendugaan

(24)

data biner yang dikembangkan oleh para peneliti tersebut tidak

memperhitungkan peluang percontohan dari data yang digunakan.

Model SAE berbasis sebaran multinomial telah dikembangkan oleh Molina

et al. (2007) dengan metode yang didasarkan pada aplikasi dari Model

Campuran Logit Multinomial (Multinomial Logit Mixed Model). Model SAE untuk

peubah multinomial oleh Molina mengasumsikan pengaruh acak yang sama

untuk semua katagori. Scealy (2010) mengembangkan model Molina et al.

(2007) dengan memasukkan pengaruh acak katagori. Untuk pendugaan

parameter model Scealy (2010) mengaplikasikan metode Kemungkinan Quasi

Berpenalti (KQB), pendekatan ML dan/atau REML. Metode tersebut kemudian

diaplikasikan untuk pendugaan parameter angkatan kerja di area kecil.

Pendugaan KTG untuk penduga parameter didekati melalui dua metode yaitu

bootstrap parametrik dan pendekatan analitik serta kemudian membandingkan

keduanya. Sceally (2010) menghasilkan bahwa metode boostrap parametrik

memberikan hasil lebih baik dibandingkan dengan pendekatan analitik, namun

perbedaannya sangat kecil.

Pada umumnya di dalam model SAE dianggap semua area terwakili dalam

contoh atau dianggap bahwa contoh area dipilih dengan peluang yang sama

(Pfeffermann 2010). Hanya ada beberapa studi yang memperhatikan struktur

peluang percontohan dengan menggunakan peluang tidak sama, misalnya Kott

(1990), Arora dan Lahiri (1997) serta Prasad dan Rao (1999). Pfeffermann

(2010) berbendapat bahwa pendugaan yang dilakukan tanpa memperhatikan

peluang penarikan contoh akan menghasilkan penduga yang berbias. Demikian

juga Lehtonen (2009) menyatakan bahwa dengan menyertakan bobot peluang

penarikan contoh ke dalam model, misalkan proporsional terhadap ukuran

populasi atau proportional to size (pps), dapat dihasilkan peningkatan akurasi

dan pengurangan bias. Lehtonen (2009) mengembangkan pendugaan langsung

di area kecil yang mengaplikasikan Model Generalized Regression (GREG)

dimana pendugaan parameter menggunakan metode PTLTE yang menyertakan

bobot unit contoh.

Model SAE yang memperhitungkan struktur peluang penarikan contoh

yang telah dikembangkan oleh para peneliti tersebut adalah untuk model SAE

dengan peubah respon normal. Pendugaan parameter menggunakan

pendekatan klasik yaitu mengaplikasikan PTLT atau PTLTE. Pengembangan

(25)

biner dibahas oleh Chen et al. (2010) yang menggunakan pendekatan Bayes

Empirik dan Berhirarki.

Di Indonesia, kebutuhan untuk pendugaan area kecil misalkan kecamatan

atau desa makin meningkat, khususnya untuk menyusun kebijakan atau

perencanaan pembangunan oleh pemerintah daerah. Salah satu indikator yang

dijadikan dasar dalam perencanaan pembangunan adalah Indeks Pembangunan

Manusia (IPM) yang mengukur pencapaian hasil pembangunan di sebuah

wilayah (BPS 2005). IPM diukur dalam 3 dimensi dasar yaitu: 1)Hidup yang sehat

dan panjang umur yang diukur dengan

Pengetahuan yang diukur dengan angk

dan rata-rata lama sekolah serta 3) standar hidup layak yang diukur dengan daya

beli (UNDP 1998). IPM dapat digunakan untuk mengklasifikasikan apakah

sebuah wilayah adal

digunakan untuk mengukur pengaruh dari kebijakan ekonomi terhadap kualitas

hidup. Di Indonesia perhitungan IPM dilakukan oleh Badan Pusat Statistik (BPS)

yang secara resmi mempublikasikan IPM secara periodik setiap tahun untuk

tingkat provinsi dan kabupaten/kota.

Dewasa ini perhitungan IPM untuk tingkat kecamatan mulai dibutuhkan

untuk digunakan sebagai dasar perencanaan pembangunan di tingkat

Kabupaten. IPM untuk tingkat kecamatan, yang membandingkan hasil

pembangunan antar kecamatan, baru dilakukan oleh sebagian pemerintah

kabupaten/kota. Perhitungan IPM di tingkat kecamatan umumnya dilakukan

dengan cara klasik, yaitu menggunakan pendugaan langsung dengan cara

menambah jumlah contoh agar mencukupi. Sebagai contoh perhitungan IPM

untuk Kabupaten Probolinggo (Rumiati et al. 2007), Sumenep (Rumiati et al.

2008), Tuban (Rumiati et al. 2009) dilakukan dengan memanfaatkan data Survei

Sosial Ekonomi Nasional (Susenas) dan menambah jumlah data melalui survai.

Penggunaan data Susenas untuk pendugaan parameter di tingkat

kecamatan atau desa akan menghadapi dua persoalan statistik yaitu:

1)terbatasnya jumlah data karena Susenas ditujukan untuk menduga parameter

berskala nasional atau regional (provinsi sampai kabupaten/kota). 2) penarikan

contohnya memiliki peluang tidak sama karena rancangan penarikan contoh

dalam Susenas adalah penarikan contoh gerombol dua tahap yaitu mengambil

(26)

tangga pada blok sensus yang terpilih. Oleh karena itu penarikan contoh dalam

Susenas memiliki peluang tidak sama.

Dalam penelitian ini dibahas pengembangan metode SAE yang dapat

digunakan untuk menduga parameter pendidikan yang merupakan komponen

Indeks Pendidikan dalam IPM. Perhitungan Indeks Pendidikan melalui

pendugaan angka melek huruf dan rata-rata lama sekolah. Angka melek huruf

dihitung berdasarkan proporsi penduduk yang mampu baca dan tulis dari

penduduk yang berusia 10 tahun ke atas. Sedangkan rata-rata lama sekolah

dihitung berdasarkan proporsi penduduk yang telah berada pada jenjang

pendidikan tertentu yang dikalikan dengan lama menempuh pendidikan di

jenjang tersebut dibagi dengan jumlah penduduk. Jumlah penduduk yang bisa

baca tulis diasumsikan memiliki sebaran Binomial dan jumlah penduduk pada

tiap jenjang pendidikan diasumsikan memiliki sebaran Multinomial. Selanjutnya

karena perhitungan IPM menggunakan data Susenas, maka persoalan statistik

terkait dengan keterbatasan jumlah data dan ketidaksamaan peluang dalam

penarikan contoh. Oleh karena itu yang menjadi pertanyaan penelitian ini

adalah bagaimana model pendugaan area kecil untuk peubah respon binomial

dan multinomial pada kasus penarikan contoh berpeluang tidak sama.

Rao (2003) mengatakan bahwa untuk data biner atau cacahan, khususnya

model regresi logistik dan model log linier akan lebih tepat menggunakan

metode pendugaan melalui pendekatan Bayes. Oleh karena itu dalam penelitian

ini pendugaan area kecil dilakukan melalui pendekatan Bayes didasarkan pada

model SAE untuk peubah respon Binomial dan Multinomial berbasis peluang

penarikan contoh tidak sama. Selanjutnya model SAE yang dihasilkan

diaplikasikan untuk pendugaan Indeks Pendidikan kecamatan di Kabupaten

Sumenep dan Kabupaten Pasuruan, Provinsi Jawa Timur.

1.2. Tujuan Penelitian

1. Mengembangkan model SAE berbasis sebaran Binomial dan Multinomial

melalui pendekatan Bayes dengan penarikan contoh berpeluang tidak

sama.

2. Mengaplikasikan metode pendugaan area kecil yang diperoleh dari

tujuan pertama untuk menduga angka melek huruf dan rata-rata lama

sekolah ditingkat kecamatan dalam rangka menghitung Indeks Pendidikan

(27)

1.3. Ruang Lingkup

Ruang lingkup penelitian ini meliputi pengembangan metode pendugaan

area kecil untuk peubah respon Binomial dan Multinomial melalui pendekatan

Bayes. Pengembangan model SAE akan memperhatikan peluang penarikan

contoh mengingat penerapan dari metode SAE tersebut diaplikasikan untuk

menduga Indeks Pendidikan di tingkat kecamatan dengan data Susenas dimana

contohnya diambil berdasarkan peluang tidak sama.

Secara khusus model SAE yang akan dikaji merupakan model berbasis

unit dengan pendugaan parameter menggunakan metode Bayes Empirik

berdasarkan sebaran prior logit normal dari parameter (pi

Metode SAE yang dikembangkan untuk peubah respon Binomial dan

Multinomial berbasis peluang contoh tidak sama diaplikasikan untuk menduga

Indeks Pendidikan di tingkat kecamatan di Jawa Timur. Studi kasus yang diambil

adalah kabupaten Sumenep (yang mewakili daerah pertanian dan perkebunan)

dan Kabupaten Pasuruan (mewakili daerah industri) di Jawa Timur. Secara garis

besar kerangka penelitian dapat dilihat pada Gambar 1 dan Gambar 2.

) yang diduga. Metode

pendugaan parameter menggunakan integrasi numerik karena penyelesaian

persamaan secara analitik untuk model Bayes khususnya berbasis data biner

sulit ditemukan.

1.4. Kebaruan

Beberapa peneliti telah melakukan pengembangan model SAE untuk

peubah respon Binomial dan Multinomial yang berbasis data biner, baik melalui

pendekatan klasik maupun melalui pendekatan Bayes. Model SAE yang

dikembangkan umumnya tidak memperhatikan peluang penarikan contoh dan

menganggap contoh yang digunakan berdasarkan pada penarikan contoh secara

acak dengan peluang yang sama. Pendugaan parameter dalam penelitian ini

memperhitungkan cara penarikan contoh khususnya untuk penarikan contoh

berpeluang tidak sama.

Dengan menggunakan data Susenas, pendugaan IPM oleh BPS di

Indonesia hanya sampai tingkat kabupaten/ kota karena ketidak cukupan data

untuk area yang lebih kecil (kecamatan atau desa). Pendugaan IPM di level

kecamatan umumnya dilakukan dengan menambah jumlah contoh dimana

pendugaan parameter dilakukan secara langsung dan tanpa memperhitungan

(28)

Tanpa memperhatikan peluang penarikan contoh

Model logit normal terbobot

Pendugaan Parameter Area : Pendekatan Bayes Model logit normal

Pendugaan Parameter model SAE : PQL/REML

Model SAE dengan Fungsi Peluang Eksponensial Dengan memperhatikan peluang penarikan contoh

Pendugaan Parameter model : Metode KM

Simulasi

Aplikasi

Perhitungan bobot area kecil (bloksensus )

Lokasi: Kecamatan Lenteng , Kabupaten Sumenep

Data Sensus Penduduk 2010

Perhitungan bobot individu Penarikan contoh area

(blok sensus) : 5 area Penarikan contoh RT  16 RT

diulang 100 x

100 set contoh tanpa bobot

100 set contoh dengan bobot

Model logit normal terbobot Model logit normal 1

2

Model SAE dengan menyertakan fungsi peluang penarikan contoh

Lokasi: Kabupaten Sumenep dan Pasuruan

Data Sensus Penduduk 2010

Data Susenas 2010 Model logit

normal terbobot Perhitungan bobot area

kecil (bloksensus )

Perhitungan bobot individu

Perhitungan angka melek huruf di tiap kecamatan

Perhitungan bias Perhitungan KTG Model logit normal tanpa bobot

Perhitungan Bias, KTG

Perhitungan Bias, KTG Pengembangan Model

Gambar 1.1.

Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Binomial

Keterangan

1. Tahap pengembangan model SAE dengan respon binomial dengan memperhatikan struktur peluang

2. Simulasi dengan mengambil kecamatan Lenteng, yaitu dengan penarikan contoh gerombol dua tahap yang diulang sebanyak 100 kali

(29)

Pengembangan Model

Pendugaan Parameter model SAE : KQB/KMB

Pendugaan Parameter Area : Pendekatan Bayes

Tanpa memperhatikan peluang penarikan contoh

Model logit multinomial terbobot

Pendugaan Parameter Area : Pendekatan Bayes

Model logit multinomial

Pendugaan Parameter model SAE : KQB/KMB Dengan memperhatikan peluang penarikan contoh

Aplikasi 1

2 Lokasi: Kabupaten Sumenep dan Pasuruan

Data Susenas 2010

Model logit multinomial terbobot Perhitungan bobot area

kecil (bloksensus )

Perhitungan bobot individu

Perhitungan rata-rata lama sekolah di tiap kecamatan

Model logit multinomial tanpa bobot

Perhitungan KTG

Gambar 1.2.

Kerangka Penelitian Pengembangan Model SAE untuk Peubah Respon Multinomial

Keterangan

1. Tahap pengembangan model SAE dengan respon multinomial dengan memperhatikan struktur peluang

2. Aplikasi, menerapkan model logit multinomial untuk pendugaan rata-rata lama sekolah di level kecamatan di Kabupaten Sumenep dan Pasuruan

Dalam disertasi ini dibahas tentang pendugaan Indeks Pendidikan sebagai

salah satu komponen IPM di area kecil (kecamatan) didasarkan pada sebaran

Binomial untuk pendugaan angka melek huruf dan sebaran Multinomial untuk

pendugaan rata-rata lama sekolah. Kebaruan dari penelitan ini adalah:

1. Disertasi ini mengembangkan Metode SAE berbasis respon Binomial dan

Multinomial melalui pendekatan Bayes dengan memperhitungkan peluang

penarikan contoh.

2. Disertasi ini mengembangkan Metode Bayes SAE yang dapat

diaplikasikan untuk menduga Indeks Pendidikan di tingkat kecamatan

(30)

semacam ini, yaitu pendugaan Bayes dengan memperhitungkan bobot

percontohan belum pernah dilakukan baik oleh BPS maupun oleh peneliti

lain. Oleh karena itu disertasi ini menghasilkan metode baru untuk

pendugaan Indeks Pendidikan dengan tingkat akurasi dan presisi yang

lebih tinggi.

1.5. Sistematika Disertasi

Disertasi ini terbagi menjadi 3 (tiga) bagian besar. Bagian pertama

membahas tentang pendugaan area kecil secara umum dan hal-hal yang terkait

dengan proses penarikan contoh serta perhitungan IPM. Bagian kedua

membahas perkembangan model SAE khususnya untuk sebaran respon

Binomial dan Multinomial dengan contoh penerapan dalam pendugaan angka

melek huruf dan rata-rata lama sekolah di level kecamatan di di dua kabupaten di

Jawa Timur. Bagian ketiga membahas pengembangan model SAE untuk

sebaran Binomial dan Multinomial berbasis pada penarikan contoh berpeluang

tidak sama dan penerapannya untuk pendugaan Indeks Pendidikan di level

Kecamatan di Jawa Timur. Secara rinci disertasi ini terbagi kedalam 7 bab. Bab 1

adalah pendahuluan yang berisi uraian latar belakang, yujuan, ruang lingkup dan

kebaruan dari disertasi.

Pada bab II dibahas tinjauan pustaka berisi tentang model dasar SAE dan

perkembangannya, meliputi pendugaan parameter menggunakan pendekatan

klasik dan pendekatan Bayes. Di dalam tinjauan pustaka juga dibahas tentang

metode penarikan contoh dalam Susenas serta penentuan bobot untuk

kepentingan pendugaan parameter dengan metode langsung. Selanjutnya pada

bab II ini juga dibahas tentang Indeks Pembangunan Manusia (IPM) dan Indeks

Pendidikan serta cara perhitungannya.

Pada bab III dibahas tentang pendugaan area kecil untuk respon Binomial,

khususnya untuk pendugaan parameter berbasis model dengan pendekatan

Bayes. Dalam bab ini juga disajikan pendugaan Bayes dengan metode langsung

(tidak berbasis model) yaitu dengan menggunakan sebaran prior Beta dan logit

normal. Model SAE untuk respon Binomial kemudian diaplikasikan untuk

pendugaan angka melek huruf di tingkat kecamatan di Kabupaten Sumenep dan

Kabupaten Pasuruan di provinsi Jawa Timur dengan menggunakan data

Susenas 2010.

(31)

berbasis peubah respon Multinomial. Dalam bab ini juga digunakan pendekatan

Bayes dengan mengembangkan model SAE untuk peubah respon Multinomial

yang dikembangkan oleh Sceally (2010) dimana pengaruh area dibedakan atas

katagori. Model SAE yang dikembangkan diaplikasikan untuk menduga rata-rata

lama sekolah untuk level kecamatan di kabupaten Sumenep berdasarkan

Susenas 2010.

Pada bab V dikaji pendugaan area kecil (SAE) berdasarkan penarikan

contoh berpeluang tidak sama. Kajian ini dimaksudkan untuk mempelajari cara

pemberian bobot terhadap unit percobaan maupun area yang terambil sebagai

contoh. Dalam bab ini dipelajari berbagai ide pengembangan model SAE terkait

dengan peluang penarikan contoh atau memperhitungkan peluang penarikan

contoh dalam pengembangan dalam pengembangan model SAE. Perhitungan

bobot penarikan contoh sesuai dengan proses penarikan contoh yang

diaplikasikan dalam Susenas. Model SAE yang memperhitungkan peluang

penarikan contoh diaplikasikan untuk menduga rata-rata lama sekolah untuk

level kecamatan di kabupaten Sumenep berdasarkan Susenas 2010.

Bab VI berisi pembahasan yang megintegrasikan semua hasil pengkajian

pengembangan metode SAE melalui pendekatan Bayes baik untuk respon

Binomial maupun Multinomial tanpa memperhitungkan atau dengan

memperhitungkan peluang penarikan contoh. Selain itu pada bab ini juga

dibahas hasil penerapan pendugaan Indeks Pendidikan di kabupaten Sumenep

dan Pasuruan

Bab VII adalah bab kesimpulan yang berisi rangkuman semua hasil

penelitian dan saran baik untuk penelitian ke depan maupun saran secara umum

(32)

BAB II

Tinjauan Pustaka

2.1. Pendahuluan

Dalam bab ini dibahas berbagai metode terkait dengan metode pendugaan

area kecil, dimulai dengan pembahasan model dasar pendugaan area kecil

meliputi metode pendugaan parameter dan pendugaan Kuadrat Tengah Galat

(KTG), baik menggunakan cara klasik maupun melalui pendekatan Bayes. Kajian

pustaka selanjutnya adalah tentang pengembangan pendugaan SAE yang

memperhitungkan proses pengambilan contoh khususnya untuk pengambilan

contoh yang berpeluang tidak sama.

Karena model SAE yang dibahas dalam penelitian ini diaplikasikan untuk

menghitung Indeks Pendidikan yang merupakan salah satu komponen dari

Indeks Pembangunan Manusia, sehingga pada bab ini juga akan dijelaskan cara

dan dasar perhitungan IPM khususnya untuk Indeks Pendidikan.

Data yang digunakan adalah data Susenas untuk Provinsi Jawa Timur

tahun 2010 dan data Sensus Penduduk tahun 2010 khususnya di Kabupaten

Sumenep dan Pasuruan. Oleh karena itu juga dibahas metode penarikan contoh

Susenas dan cara pembobotan untuk pendugaan parameter berbasis data

Susenas.

2.2. Model Dasar Pendugaan Area Kecil

untuk wilayah atau area yang besar, misalnya untuk wilayah nasional/ regional

(provinsi/kabupaten/kota) dan pendugaan parameternya didasarkan pada

rancangan. Karena itu untuk area kecil umumnya jumlah contoh menjadi kurang

mencukupi terutama jika ingin digunakan pendugaan berdasarkan rancangan.

Oleh karena itu beberapa peneliti statistik telah mengembangkan Metode

Pendugaan Area Kecil atau Small Area Estimation (SAE) untuk pendugaan

parameter di suatu area dimana jumlah contohnya berukuran kecil.

Metode SAE ini pertama kali diperkenalkan oleh Fay & Heriot (1979),

(33)

estimation). Oleh karena itu untuk membangun model SAE dibutuhkan informasi

tambahan dari peubah yang memiliki hubungan dengan peubah yang sedang

diamati yang disebut sebagai peubah penyerta (auxiliary variable). Peubah

penyerta ini dapat diukur dari survai yang lain atau dalam catatan administrasi

dan diharapkan memiliki korelasi dengan peubah yang diamati. Dengan metode

SAE diharapkan adanya perbaikan efisiensi dari pendugaan parameter dalam

area kecil jika peubah penyerta tersedia.

Model SAE memperkenalkan model campuran yang menyertakan

pengaruh area spesifik yang memperhitungkan variasi antar area diluar yang

dapat dijelaskan oleh peubah penyerta yang ada di dalam model. Ketersediaan

data dari peubah penyerta akan sangat menentukan kesuksesan dalam

pembuatan model SAE.

Rao (2003) menyatakan bahwa penggunaan model SAE ini memberikan

beberapa keuntungan yaitu: 1) Diagnostik model dapat digunakan untuk

mendeteksi kecocokan dengan data, misalkan menggunakan analisis sisaan 2)

Pengukuran presisi area-spesifik dapat diasosiasikan dengan setiap pendugaan

setiap area kecil, 3) Model linier campuran seperti model regresi logistik dengan

pengaruh acak area–spesifik tetap dapat dilakukan, demikian juga untuk struktur

data yang cukup kompleks misalkan struktur data time series atau spasial; 4)

pengembangan metode untuk model pengaruh acak dapat dimanfaatkan untuk

mencapai akurasi dalam area kecil.

2.2.1. Pendugaan Area Kecil Berbasis Area

Misalkan terdapat M area kecil di dalam populasi, maka untuk kepentingan

pendugaan area kecil hanya diambil contoh sebanyak m area. Diasumsikan

bahwa parameter yang diperhatikan dalam area kecil ke-i, misalkan θ_i dapat

dinyatakan sebagai sebuah fungsi yang menghubungkan parameter tersebut

dengan peubah pembantu yang diukur dari area kecil yaitu z_i=(z₁_i,z₂_i,...,z_pi)T.

Rao (2003) mengatakan bahwa model linier yang menjelaskan hubungan

tersebut adalah:

i i b T i

i

υ

θ

=z β+

(34)

dimana bi

(

)

T P

β

1, 2,...,

= β

adalah konstanta positif yang diketahui dan

adalah vektor koefisien regresi berukuran p x 1. Selanjutnya υ_i adalah pengaruh

acak area spesifik diasumsikan memiliki sebaran

υ

_i ~(0,

σ

_υ2)

Jika penduga langsung

θ

ˆ_idiketahui, maka

θ

ˆ_i dapat dinyatakan sebagai :

i i i =

θ

+e

θ

ˆ _{, untuk i=1,2,...m,} _(2.2)

dimana :

i i i p i

i

p e V e

E ( θ)=0, ( θ)=ψ . (2.3)

Rao (2003) menjelaskan bahwa model SAE untuk tingkat area, terdiri dari

dua komponen model yaitu komponen model pendugaan langsung dan

pendugaan tak langsung. Kombinasi model pendugaan langsung (2.2) dan tak

langsung (2.1) dikenal sebagai Model Campuran Linier Terampat/MCLT

(Generalized Linear Mixed Model:GLMM) sebagai berikut:

i i i T i

i =z

β

+b

υ

+e

θ

ˆ _. _(2.4)

Model area kecil seperti yang dijelaskan pada persamaan (2.4) di atas

dikenal sebagai model Fay-Heriot, dimana keragaman peubah respon di dalam

area kecil diasumsikan dapat diterangkan oleh hubungan peubah respon dengan

informasi tambahan yang disebut sebagai model pengaruh tetap. Selain itu

terdapat komponen keragaman spesifik area kecil yang tidak dapat diterangkan

oleh informasi tambahan dan disebut sebagai komponen pengaruh acak area

kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh

campuran.

2.2.2. Pendugaan Area Kecil Berbasis Unit

Pendugaan area kecil berbasis unit mengasumsikan bahwa data dari

peubah penyerta level unit xij=(xij1,...xijp)T tersedia untuk setiap elemen ke j

pada area ke-i. Peubah yang diperhatikan adalah yij yang diasumsikan memiliki

hubungan dengan xij

ij i T ij

ij x e

y = β+υ +

melalui model:

, j=1,...,ni

Pengaruh acak area

, i=1,...m. (2.5)

i

υ

diasumsikan merupakan peubah acak yang bersifat iid

sedangkan eij =kije~ij dengan kij eij

~

(35)

yang bersifat iid dan bebas terhadap υidimana Em(~eij)=0e2 dan

2

) ~

( ij e

em e

V =σ .

Seringkali

υ

_idan eij diasumsikan memiliki sebaran peluang normal.

Dengan mengasumsikan bahwa percontohan si berukuran ni diambil dari

populasi di area ke-i berukuran Ni

        +         +         =        

= _* _* _* _*

1 1

i i

i i i i i

i i i

e e

y y

υ β X X y

(i=1,2...m) dan penarikan contoh dalam setiap

area diambil secara acak sederhana, sehingga model (2.5) dapat dinyatakan

dalam bentuk matriks:

(2.6)

*

i

y menyatakan unit-unit yang tidak terambil dalam percontohan. Jika Y_iadalah

rata-rata populasi di area ke-i, maka Y_i dapat ditulis sebagai:

* ) 1

( i i

i i

i f y f Y

Y = + −

(2.7) dimana f_i =n_i/N_i dan y_i adalah rata-rata dari seluruh contoh di area ke-i dan

*

i

Y menyatakan rata-rata elemen populasi dari bagian yang tidak terambil

sebagai contoh. Oleh karena itu untuk model SAE berbasis unit, pendugaan

parameter area kecil Y_i sama dengan menduga *

i

Y jika data percontohan {y_i}

dan {X_i} tersedia.

2.3. Pendugaan Parameter Model SAE

2.3.1. Metode Prediksi bias Linier Terbaik (PTLT) dan Prediksi Tak-bias Linier Terbaik Empirik (PTLTE)

Parameter di area kecil, misalkan rataan atau tolal, dapat dinyatakan

sebagai kombinasi linier dari efek tetap dan efek acak seperti dinyatakan pada

persamaan (2.1) untuk model berbasis area dan persamaan (2.5) untuk model

berbasis unit.

Melalui pendekatan klasik, pendugaan parameter model SAE umumnya

mengaplikasikan metode PTLT dengan meminimumkan Kuadrat Tengah Galat

(KTG). Metode PTLT ini tidak tergantung pada kenormalan dari efek acak tetapi

tergantung pada ragam atau koragam dari efek acak. Untuk menduga komponen

ragam dan koragam umumnya digunakan metode ML atau REML dengan

mengasumsikan kenormalan. Dengan cara tersebut pendugaan dilakukan

(36)

Misalkan data percontohan memenuhi model linier campuran terampat

berikut:

e Zv Xβ

y= + + (2.8)

dimana:

y adalah vektor data observasi berukuran n x 1

X dan Z adalah matriks berukuran n x p dan n x h yang diketahui

v dan e adalah berdistribusi saling bebas dengan rataan 0 dan ragam G

dan R yang tergantung pada parameter T

q) ,... (δ1 δ

=

δ , diasumsikan

bahwa δ adalah himpunan bagian dari ruang Euclidean sedemikian

hingga T

y

Var( )=V=V(δ)=R+ZGZ adalah non singular untuk semua δ

yang terdapat dalam himpunan bagian tersebut, dimana Var (y) adalah

matrik ragam-koragam dari y.

Parameter yang akan diduga merupakan kombinasi linier: µ=1Tβ+mTv

(Rao 2003). Penduga dari µ adalah µˆ=aTβ+b untuk a dan b diketahui dan

merupakan penduga tak bias jika E(µˆ)=E(µ). Selanjutnya Kuadrat Tengah

Galat (KTG) didefinisikan sebagai 2

) ( ) ˆ

(µ =E µ−µ

KTG dan jika

µ

 adalah

penduga tak bias dari µ, maka KTG(µˆ)=Var(µ−µ) .

Pada Rao (2003), penduga PTLT µ yang meminimumkan KTG

dinyatakan dalam formula:

), ~ ~

~ ~

~ _t(_δ(_y) ₁ _β _m _v ₁ _β _m _GZ _V _(y _X_β

μH ₌ ₌ T ₊ T ₌ T ₊ T T −1 ₋

(2.9)

dimana:

y V X X) V (X (δ

β

β₌ ₌ T −1 −1 T −1

) ~ ~

(2.10)

adalah penduga tak bias linier terbaik (Best Linear Estimator: BLUE) dari β dan

)

β

X (y V GZ (δ v

v ~ ) T 1 ~

~₌ ₌ − ₋ _. _(2.11)

Penduga PTLT tergantung pada ragam δ yang biasanya tidak diketahui.

Jikaδ diduga dengan δˆ=δˆ(y), maka akan diperoleh Prediksi Tak-bias Linier

Terbaik Empirik (PTLTE) yang tetap merupakan penduga tak bias bagi µ.

Penduga δ diperoleh melalui metode ML atau REML.

Untuk model berbasis unit, dimana rataan area kecil ke-i dinyatakan oleh

fungsi:µ_i =X~T_iβ+υ_i. Untuk model percontohan y_ij =X~_ijTβ+υ_i+e_ij, j=1,..ni; i=1,....,m

(37)

i n i i

i =Xβ+υ1i +e

y . (2.12)

Model SAE yang dinyatakan oleh (2.12) merupakan bentuk khusus dari

persamaan (2.8), dimana G_i =σ_υ2, dan 1 ( 2)

2

ij n j e

i diag k

R

i

≤ ≤

+σ sehingga:

      − = − T i i i i ij j e

i aa

a a diag V γ σ ( ) 1 2

1 _. _(2.13)

Dengan mengambil (σ_υ2/σ_e2)/(1−γ_i)=γ_i/a_idimana =∑ j ij

i a

a , T

in i

i a a _i

a =( ₁,...., )

maka penduga PTLT dari µi

) ~ ( ~ ~ ~ _β _γ _β µ T ia ia i T i H

i =X + y −x

adalah (Rao 2003):

(2.14)

dimana yia danxia adalah rataan terbobot:

∑ =∑

=

j ij ij i ia j ij ij i

ia a y a x a x a

y / _., / _.,

β~ adalah penduga tak bias linier terbaik bagiβ

∑ − − ∑ −

=

i i i i

T i i

i T

iV X X V y

X ) ( )

(

~ ₁ ₁ ₁

β (2.15)

∑ − = = − − j T ia ia i i T ij ij ij e i i i T

iV X A a x x a x x

X 1 σ 2( γ _. ) (2.16)

∑ −

= −

−

j ij ij ij i i ia ij e

i i T

iV y a x y a x y

X 1 σ 2( γ _. ). (2.17)

Penduga tak bias linier terbaik (2.14) dapat dinyatakan sebagai rata-rata terbobot

dari penduga regresi yia +(Xi−xia)Tβ~ dan penduga regresi sintetik β ~ T i

X

berikut:

[

( ) ~

]

(1 ) ~.

~ _γ _β _γ _β µ T i i T ia i ia i H

i = y + X −x + − X (2.19)

Bobot γ_i(0≤γ_i ≤1) mengukur ragam model ( 2

υ

σ ), relatif terhadap ragam total

i e /a

2

2 σ

σ_υ + . Jika ragam model relatif kecil maka γi akan kecil dan bobotnya akan

lebih besar di komponen sintetik.

2.3.2. Pendugaan Parameter Model SAE Melalui Pendekatan Bayes

Melalui pendekatan Bayes, pendugaan parameter di area kecil dapat

dilakukan dengan 2 cara yaitu pendugaan Bayes Empirik/BE (Empirical Bayes:

EB) dan Bayes Berhirarki /BH (Hierarchical Bayes:HB). Untuk pendekatan Bayes

Empirik, pendugaan didasarkan pada sebaran posterior yang diduga dari data,

sedangkan pada pendekatan Bayes berhirarki parameter model yang tidak

(38)

tertentu. Model pendugaan area kecil menggunakan Bayes telah dikembangkan

oleh beberapa peneliti diantaranya Gosh dan Rao (1994), You dan Rao (2000).

Pendekatan Bayes, baik Bayes Empirik maupun Bayes Berhirarki

merupakan metode yang dapat diaplikasikan secara lebih umum sehingga

banyak digunakan untuk data diskrit, misalkan untuk data biner dan data

cacahan.

Untuk peubah respons dengan sebaran normal, model dasar area dapat

dinyatakan sebagai model Bayes berhirarki dua tahap yaitu:

1) ˆ / ~ ( _i, _i) ind

i

θ

N

θ

ψ

θ

, i: 1,2,3,……,m (2.20)

2)

θ

~ ( T_i

β

, _i2

σ

_υ2) ind

i N z b , i: 1,2,3,……,m (2.21)

Dimana β adalah vektor parameter regresi berukuran p x 1. Dalam pendekatan Bayes, parameter model β dan 2

υ

σ

adalah peubah acak, dan model hirarki dua

tahap disebut model hirarki bebas bersyarat (conditionally independent

hierarchical model : CIHM) karena pasangan

( )

θ

ˆ_i,

θ

_i adalah bebas di antara area

i, untuk β dan

σ

_υ2 tertentu.

Penduga optimum dari θi merupakan nilai harapan bersyarat dari θi

β

θ

ˆi,

jika

diberikan dan 2

υ

σ

:

β γ θ

γ θ σ β θ

θ _υ T

i i i

i B i i

i z

E( ˆ, , 2)= ˆ = ˆ +(1− ) (2.22)

dimana

(

)

i i

b b

ψ σ

σ γ

υ υ +

= ₂ 2₂ 2 . Nilai harapan dari θi merupakan nilai harapan dari

sebaran posterior (atau bersyarat) dari θi jika diberikan

θ

ˆi,

β

dan

2

υ

σ

:

) ) ( , ˆ ( ~ , ,

ˆ 2

1 2

i i i

B i i

iθ β σ N θ g σ γψ

θ _υ _υ = . (2.23)

Penduga θˆ θˆiB(β,σ_υ2)

B

i = adalah penduga Bayes dibawah squared error

loss dan merupakan nilai optimum dari KTG, dimana 2

) ˆ ( ) ˆ

( i

B i B

i E

KTGθ = θ −θ ,

selalu lebih kecil dibandingkan dengan θ dan linier atau non linier dalam

θ

ˆi.

Jiang et al. (2002) menyatakan bahwa

θ

ˆiBdisebut prediksi terbaik (Best

Prediction: BP) dari penduga θi karena diperoleh dengan tanpa mengasumsikan

(39)

Penduga Bayes B i

θ

ˆ _{tergantung pada parameter model β dan} 2

υ

σ

yang

diduga dengan menggunakan metode ML atau REML dari sebaran marjinal :

(

,

)

.

~

ˆ 2 2

i i

T i ind

i N z β b σ ψ

θ _υ + .

(2.24)

Penduga parameter dinotasikan dengan

β

ˆdan

σ

ˆ_υ2, sehingga dengan

menggantikan

β

ˆ untuk β dan

σ

ˆ_υ2 untuk

σ

_υ2, maka Penduga Bayes Empirik (Empirical Bayes Prediction: EBP) untuk

θ

_iadalah:

(

ˆ, ˆ

)

ˆ ˆ (1 ˆ) ˆ. ˆ

ˆ θ β σ2 γθ γ β

θ υ i i i iT

B i EB

i = = + − z (2.25)

Penduga BE, EB i

θ

ˆ _{adalah identik dengan penduga PTLTE yang dinotasikan}

dengan H i

θ

ˆ _{juga merupakan rataan dari estimasi densitas posterior ,}

(

_ˆ2

)

, ˆ , ˆ

υ

σ β θ θi

f dari

θ

_i, yaitu

(

EB _i _i

)

i

Nθˆ ,γˆψ .

2.4. Peluang Penarikan Contoh

Metode pengambilan contoh berbasis peluang telah banyak dibahas oleh

beberapa peneliti. Metode pengambilan contoh berbasis peluang yang banyak

dibahas dan sering diaplikasikan adalah metode pengambilan contoh acak

sederhana (simple random sampling), metode pengambilan contoh berstrata

(stratified sampling), metode pengambilan contoh bergerombol (cluster sampling)

dan metode pengambilan contoh sistematik (systematic sampling).

Masing-masing metode pengambilan contoh memiliki konsekuensi terhadap perhitungan

pendugaan parameter. Dalam rangka mendapatkan penduga yang tak berbias

maka bobot peluang tersebut harus diperhitungkan dalam pendugaan parameter.

Misalkan akan diduga parameter total Y =∑_Uy_j atau rataan Y