• Tidak ada hasil yang ditemukan

Study on the Effects of Cluster Information in Prediction of Non-sampled Area (A Case Study of per Capita Expenditures at Subdistrict Level in Regency and Municipality of Bogor).

N/A
N/A
Protected

Academic year: 2017

Membagikan "Study on the Effects of Cluster Information in Prediction of Non-sampled Area (A Case Study of per Capita Expenditures at Subdistrict Level in Regency and Municipality of Bogor)."

Copied!
70
0
0

Teks penuh

(1)

KAJIAN PENGARUH PENAMBAHAN

INFORMASI GEROMBOL TERHADAP HASIL

PREDIKSI AREA NIRCONTOH

(Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan

Kabupaten Bogor)

RAHMA ANISA

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*

Dengan ini saya menyatakan bahwa tesis berjudul Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Maret 2014

Rahma Anisa

(4)

RINGKASAN

RAHMA ANISA. Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan Kabupaten Bogor). Dibimbing oleh ANANG KURNIA dan INDAHWATI.

Metode Prediksi Takbias Linear Terbaik Empirik atau Empirical Best Linear Unbiased Prediction (EBLUP) telah banyak digunakan untuk memprediksi parameter pada area dengan ukuran contoh yang kecil atau bahkan area nircontoh (non-sample area). Permasalahan yang terjadi adalah ketika model ini digunakan untuk memprediksi parameter area nircontoh. EBLUP baku memprediksi parameter menggunakan model sintetik yang mengabaikan pengaruh acak area karena kurangnya informasi pada area nircontoh. Akibatnya, seluruh nilai penduga parameter yang dihasilkan untuk area nircontoh akan terdistorsi pada satu garis model sintetik. Salah satu gagasan yang dikembangkan dalam penelitian ini adalah dengan menganggap bahwa terdapat kemiripan karakteristik antar-area tertentu. Hubungan antar-area tersebut dapat dianalisis dengan teknik penggerombolan (clustering). Informasi dari hasil penggerombolan ini ditambahkan ke dalam model untuk memodifikasi titik potong model prediksi EBLUP baku atau memodifikasi baik titik potong maupun kemiringan model EBLUP baku. Modifikasi ini dilakukan dengan menambahkan nilai tengah penduga pengaruh acak dari area dan peubah penyerta (auxiliary variable) pada setiap gerombol. Pada penelitian ini, kebaikan model yang diusulkan dibandingkan dengan model EBLUP baku berdasarkan simulasi. Seluruh model dievaluasi berdasarkan nilai Bias Relatif atau Relative Bias (RB) dan Akar Kuadrat Tengah Galat Relatif atau Relative Root Mean Squares Error (RRMSE). Hasil simulasi menunjukkan bahwa penambahan informasi gerombol dapat meningkatkan kebaikan model dalam memprediksi parameter pada area nircontoh.

Pendugaan ragam pada model linier campuran EBLUP umumnya menggunakan pendekatan Kemungkinan Maksimum Terbatas atau Restricted Maximum Likelihood (REML) yangmemerlukan asumsi kenormalan. Pelanggaran asumsi ini banyak ditemukan pada kasus-kasus terapan. Skenario yang berbeda, yaitu salah satu atau seluruh komponen acak tidak berasal dari sebaran normal, ditambahkan kedalam simulasi untuk mengkaji kebaikan model yang diusulkan pada kondisi tersebut. Hasilnya menunjukkan bahwa pada kondisi tersebut, model yang diusulkan mampu memprediksi dengan nilai RB dan RRMSE yang lebih kecil dibandingkan dengan EBLUP baku, terutama pada area nircontoh.

(5)

menunjukkan kemampuan yang lebih baik dibandingkan dengan EBLUP baku dalam memprediksi nilai tengah kecamatan nircontoh.

(6)
(7)

SUMMARY

RAHMA ANISA. Study on the Effects of Cluster Information in Prediction of Non-sampled Area (A Case Study of per Capita Expenditures at Subdistrict Level in Regency and Municipality of Bogor). Supervised by ANANG KURNIA and INDAHWATI.

Empirical Best Linear Unbiased Predictor (EBLUP) has been widely used to predict parameters in area with small or even zero sample size, known as non-sampled area. It has been noted that there is a problem when this model will be used to predict the parameters of non-sampled area. Usually EBLUP is used to predict the parameters using a synthetic model ignoring the area random effects due to lack of non-sampled area information. Hence, this prediction will be distorted based on a single line of the synthetic model. The idea developed in this thesis is to modify the prediction model by adding cluster information assuming that there are similiarities among particular areas. These information have been incorporated into the model to modify the intercept of prediction models as well as both intercept and slope of the prediction model. In this paper, a simulation is carried out to study the performance of the proposed models compared with ordinary EBLUP. All models wereevaluated based on the value of Relative Bias (RB) and Relative Root Mean Squares Error (RRMSE). It was shown, by mean of simulation, that the addition of cluster information has improvedthe ability of the model to predict non-sampled areas.

Restricted Maximum Likelihood(REML), a common method for estimating variance component in EBLUP models, requires normality assumption. But the conditions in which the area random effects or sampling error are not normally distributed may encountered in many applications. Therefore we also used different scenarios, such as either one of random component was not normally distributed or both of area random effects and sampling error area were not normally distributed, to study the performance of the proposed models when the area random effects or auxiliary variables are not normally distributed. The result showed that under these conditions, the proposed models has been able to estimate the parameter with smaller Relative Bias (RB) and Relative Root Mean Squares Error (RRMSE) than ordinary EBLUP, especially in non-sampled areas.

It was shown that all models could be used to predict average per capita expenditures per month at subdistrict level in regency and municipality in Bogor. The analysis was based on SUSENAS 2010 and PODES 2011 data sets. Even though the resulting predictions of the models were different, similar pattern among them has been observed. Clustering technique played an important role in implementing the proposed model in the case study. Clustering pattern which tend not to be linearly correlated with response variable can lead to the result that proposed model was not better than standard EBLUP model. However, there were some proposed models that showed a better accuracy than the standard EBLUP prediction of non-sampled subdistrict parameter.

(8)

© Hak Cipta Milik IPB, Tahun 2014

Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

(9)

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Sains

pada

Program Studi Statistika

KAJIAN PENGARUH PENAMBAHAN

INFORMASI GEROMBOL TERHADAP HASIL

PREDIKSI AREA NIRCONTOH

(Studi Kasus Pengeluaran per Kapita Kecamatan di Kota dan

Kabupaten Bogor)

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2014

(10)
(11)

Judul Tesis : Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area Nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatandi Kota dan Kabupaten Bogor)

Nama : Rahma Anisa NIM : G151110011

Disetujui oleh Komisi Pembimbing

Dr. Anang Kurnia Ketua

Dr. Ir. Indahwati, MSi Anggota

Diketahui oleh

Ketua Program Studi Magister Statistika

Dr. Ir. Anik Djuraidah, MS

Dekan Sekolah Pascasarjana

Dr. Ir. Dahrul Syah, MSc.Agr.

(12)
(13)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Sholawat serta salam semoga selalu tercurah kepada pemimpin umat nabi Muhammad SAW, beserta keluarga, sahabat, dan umatnya. Karya ilmiah ini “Kajian Pengaruh Penambahan Informasi Gerombol terhadap Hasil Prediksi Area nircontoh (Studi Kasus Pengeluaran per Kapita Kecamatan Kota dan Kabupaten Bogor)”.

Terima kasih yang sebesar-besarnya kepada semua pihak yang telah turut peran serta dalam penyusunan karya ilmiah ini, terutama kepada :

1. Bapak Dr. Anang Kurnia dan Ibu Dr. Ir. Indahwati, MSi selaku dosen pembimbing,

2. Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, MS sebagai dosen penguji pada ujian sidang tesis,

3. Badan Pusat Statistik (BPS), atas segala informasi yang telah diberikan, 4. Keluarga Besar Program Studi Statistika IPB,

5. Ayah, ibu, serta seluruh keluarga dan sahabat, atas segala dukungan, doa dan kasih sayangnya.

Semoga semua bantuan yang diberikan kepada penulis mendapatkan balasan dari Allah SWT, dan semoga karya ilmiah ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Maret 2014

(14)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vii

1 PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 2

2 TINJAUAN PUSTAKA 2

Pendugaan Area Kecil (Small Area Estimation (SAE)) 2

Empirical Best Linear Unbiased Predictor (EBLUP) 3

Restricted Maximum Likelihood (REML) 4

Analisis Gerombol (Clustering) 4

3 METODE 5

Pengembangan Model 6

Kajian Simulasi 7

Studi Kasus 10

4 HASIL DAN PEMBAHASAN 11

Kajian Simulasi 11

Studi Kasus 15

5 SIMPULAN DAN SARAN 20

Simpulan 20

Saran 20

DAFTAR PUSTAKA 20

(15)

DAFTAR TABEL

1 Titik potong dan kemiringan pada populasi skenario 1 8 2 Titik potong dan kemiringan pada populasi skenario 2 8 3 Jumlah area contohdan nircontohpada gerombol ke- 9 4 Kuadrat tengah sisaan prediksi area nircontoh 12 5 Median dari Relative Bias (RB) pada area contoh (%) 13

6 Median dari RRMSE pada area contoh (%) 13

7 Median dari Relative Bias (RB) pada area nircontoh (%) 14

8 Median dari RRMSE pada area nircontoh (%) 14

9 Uji Kenormalan Anderson-Darling 17

10 Penggerombolan kecamatan di Kota dan Kabupaten Bogor 17 11 Prediksi rata-rata pengeluaran per kapita dan evaluasi pemodelan

pada kecamatan nircontoh 19

DAFTAR GAMBAR

1 Garis prediksi area nircontoh skenario 1 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan oleh Model-0, Model-1, Model-2, Model-3, Model-4, dan Model-5 11 2 Boxplot nilai RB dari prediksi nilai tengah area nircontoh skenario 2 14 3 Nilai RRMSE (%) prediksi area nircontoh model modifikasi EBLUP

pada seluruh skenario simulasi 15

4 Nilai RB (%) prediksi area nircontoh model modifikasi EBLUP pada

seluruh skenario simulasi 15

5 Kepekatan peluang peubah , yaitu rata-rata pengeluaran per kapita per bulan dan bentuk tranformasi logaritma peubah Y 16

6 Plot kuantil-kuantil peubah 16

7 Hubungan antara peubah penyerta jumlah poliklinik dan jumlah

(16)

DAFTAR LAMPIRAN

1 Garis prediksi area nircontoh skenario 2 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh

model 23

2 Garis prediksi area nircontoh skenario 3 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh

model 24

3 Garis prediksi area nircontoh skenario 4 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh

model 25

4 Garis prediksi area nircontoh skenario 5 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan seluruh

model 26

5 Relative Bias (RB) prediksi nilai tengah area contoh pada

skenario 1 27

6 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area contoh pada skenario 1 28

7 Relative Bias (RB) prediksi nilai tengah area contoh pada

skenario 2 29

8 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area contoh pada skenario 2 30

9 Relative Bias (RB) prediksi nilai tengah area contoh pada

skenario 3 31

10 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area contoh pada skenario 3 32

11 Relative Bias (RB) prediksi nilai tengah area contoh pada

skenario 4 33

12 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area contoh pada skenario 4 34

13 Relative Bias (RB) prediksi nilai tengah area contoh pada

skenario 5 35

14 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area contoh pada skenario 5 36

15 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 1 37

16 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area nircontoh pada skenario 1 37

17 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 2 38

18 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area nircontoh pada skenario 2 38

19 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 3 39

20 Relative Root Mean Squares Error (RRMSE) prediksi nilai

(17)

21 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 4 40

22 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area nircontoh pada skenario 4 40

23 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 5 41

24 Relative Root Mean Squares Error (RRMSE) prediksi nilai

tengah area nircontoh pada skenario 5 41

25 Peubah yang terpilih sebagai dasar penggerombolan kecamatan di

Kota dan Kabupaten Bogor 42

26 Korelasi antar peubah dasar penggerombolan kecamatan di Kota

dan Kabupaten Bogor 43

27 Dendogram analisis gerombol kecamatan di Kota dan Kabupaten

Bogor 44

28 Rataan setiap peubah pada masing-masing gerombol 45 29 Pemilihan peubah untuk pemodelan dengan seleksi model regresi

stepwise 46

30 Prediksi rata-rata pengeluaran per kapita per bulan pada

kecamatan contoh di Kota dan Kabupaten Bogor 47 31 Prediksi rata-rata pengeluaran per kapita kecamatan contoh pada

masing-masing gerombol 48

32 Root Mean Squares Error (RMSE) dari prediksi rata-rata pengeluaran per kapita per bulan pada kecamatan contoh di Kota

dan Kabupaten Bogor 49

32 Root Mean Squares Error (RMSE) dari prediksi rata-rata pengeluaran per kapita per bulan pada kecamatan contoh di Kota

dan Kabupaten Bogor ( Lanjutan ) 50

33 Prediksi rata-rata pengeluaran per kapita pada kecamatan

nircontoh menggunakan seluruh model 50

34 Evaluasi pemodelan pada kecamatan nircontoh menggunakan

(18)

1

PENDAHULUAN

Latar Belakang

Pengumpulan data banyak dilakukan melalui survei contoh karena dapat memperkecil biaya dibandingkan apabila melakukan sensus. Pendugaan parameter berdasarkan informasi yang diperoleh dari suatu survei dapat dilakukan dengan pendugaan langsung (direct estimation). Pendugaan langsung akan memberi hasil yang baik ketika ukuran contoh untuk setiap area cukup besar. Namun, survei untuk memperoleh informasi rinci pada setiap area akan memerlukan waktu dan biaya yang besar. Ketika terdapat area contoh dengan ukuran yang sangat kecil atau bahkan nol, maka pendugaan langsung tidak lagi baik untuk digunakan karena dapat menghasilkan galat baku yang sangat besar (Rao 2003). Oleh karenanya, telah dikembangkan metode pendugaan tidak langsung (indirect estimation) yang diperoleh dengan memanfaatkan peubah lain (auxiliary variable), serta menambahkan pengaruh acak dari area. Pendekatan ini dikenal sebagai metode Empirical Best Linear Unbiased Prediction (EBLUP).

Permasalahan lain yang muncul adalah ketika melakukan pendugaan parameter untuk area yang tidak disurvei (nircontoh). Penduga EBLUP baku untuk area nircontoh menggunakan model sintetik yang bersifat global. Model sintetik akan mengabaikan pengaruh acak area karena tidak adanya informasi pengaruh acak pada area nircontoh (Saei dan Chambers 2005). Akibatnya, nilai prediksi yang dihasilkan untuk semua area nircontoh akan terdistorsi menuju satu garis model sehingga memungkinkan terjadi bias yang cukup besar.

Salah satu gagasan yang dikembangkan pada penelitian ini adalah dengan mengasumsikan bahwa suatu area memiliki pola kedekatan hubungan dengan area lain. Pola kedekatan tersebut dapat dianalisis berdasarkan karakteristik peubah tertentu untuk setiap area. Informasi dari pola hubungan tersebut akan ditambahkan ke dalam model sehingga diharapkan mampu memperbaiki pendugaan pada area nircontoh. Salah satu pendekatan untuk menganalisis pola hubungan antar-area tersebut adalah dengan teknik penggerombolan (clustering). Pendekatan lain yang dikembangkan pada penelitian ini adalah dengan menambahkan nilai tengah penduga pengaruh acak dari area dan peubah penyerta pada setiap gerombol ke dalam model prediksi. Penambahan pengaruh tetap gerombol serta pengaruh acak area dan peubah penyerta secara bersamaan pada model diharapkan mampu menghasilkan pendugayang lebih baik, terutama untuk area nircontoh.

(19)

2

Tujuan Penelitian

Tujuan yang ingin dicapai pada penelitian ini adalah:

1. memodifikasi model prediksi EBLUP baku dengan menambahkan informasi gerombol, dengan pendekatan sebagai pengaruh tetap maupun sebagai pengaruh acak,

2. mengkaji kebaikan model yang diusulkan dibandingkan dengan model dasar yaitu EBLUP baku,

3. menerapkan model yang diusulkan untuk menduga rata-rata pengeluaran per kapita per kapita per bulan pada kecamatan nircontoh di Kota dan Kabupaten Bogor.

2

TINJAUAN PUSTAKA

Pendugaan Area Kecil (Small Area Estimation (SAE))

Menurut Rao (2003), suatu area dikatakan besar apabila ukuran contoh pada area tersebut mampu menghasilkan presisi pendugaan yang baik dengan penduga

langsung. Sebaliknya, suatu area dikatakan “kecil” apabila ukuran contoh pada

area tersebut tidak cukup untuk menunjang penduga langsung agar mampu menghasilkan presisi pendugaan yang baik. Pendekatan lain seringkali diperlukan untuk mengatasi permasalahan tersebut, salah satunya adalah penduga tak langsung. Penduga tak langsung “meminjam informasi” dengan menggunakan nilai peubah dari contoh pada area lain yang terkait dengan area yang diamati. Model pendugaan area kecil terdiri dari Model Level Area (Tipe-A) dan Model Level Satuan (Tipe-B).

a. Model Level Area (Tipe-A)

Model ini digunakan ketika informasi peubah penyerta pada level satuan tidak diketahui dengan mengasumsikan bahwa ̅ untuk tertentu berhubungan dengan peubah penyerta pada area, yaitu ,

melalui model linier berikut:

dengan merupakan pengaruh acak pada area ke-i. Penduga langsung ̅̂ diasumsikan diketahui untuk menarik kesimpulan tentang nilai tengah area kecil ̅, yaitu:

̂ ̅̂

dengan menganggap bahwa adalah galat penarikan contoh yang menyebar normal , dan diketahui.

Model deterministik pada diperoleh dengan menetapkan bahwa . Model tersebut mengarah pada model sintetik yang tidak memperhitungkan keragaman lokal selain dari keragaman yang bersumber pada peubah penyerta . Model berikut diperoleh dengan menggabungkan kedua model di atas:

(20)

3

b. Model Level Satuan(Tipe-B)

Model ini digunakan dengan asumsi bahwa data peubah penyerta untuk disurvei (contoh) dan satuan yang tidak disurvei (nircontoh) sehingga model di atas dapat diuraikan menjadi:

[ ] [ ]

dan penduga nilai tengah area kecil dapat dituliskan sebagai berikut: ̅ ̅ ̅ mixed model) dapat dituliskan dalam bentuk berikut:

(1)

dengan merupakan vektor berukuran yang berisi nilai pengamatan contoh, dan adalah matriks yang nilainya diketahui, serta dan merupakan pengaruh acak yang bersebaran saling bebas dengan nilai tengah nol dan matriks ragam koragam masing-masing adalah dan , yang bergantung pada suatu

Menurut Das et al. (2004), penduga EBLUP adalah suatu penduga dua tahap yang digunakan dalam menduga suatu parameter yang bergantung pada yang tidak diketahui. Pendekatan ini dilakukan dengan mengganti parameter dengan penduganya, yaitu ̂, sehingga pendugaan dilakukan terhadap parameter ̂ . Jika didefinisikan bahwa terdapat pendugaan untuk kombinasi linier dari dan yaitu:

dengan dan adalah suatu vektor konstanta, maka dapat diperoleh prediktor tak bias terbaik atau Best Linear Unbiased Predictor (BLUP) bagi adalah:

(21)

4 dengan

̃ ̃

adalah penduga kuadrat terkecil terampat (generalized least square), atau penduga takbias terbaik (Best Linear Unbiased Estimator (BLUE)) dari , dengan

Penduga EBLUP pada area contohke- dapat dituliskan sebagai:

̅ (∑ ̂ )

dengan adalah satuan contoh dan adalah satuan nircontoh, sehingga ̂ yang merupakannilai dugaan untuk satuan nircontohdapat dihitung dengan rumus:

̂ ̃ ̂

Penduga EBLUP pada areanircontoh ke- adalah sebagai berikut: ̅

(∑ ̂ )

dengan ̂ merupakan nilai dugaan yang dihitung dengan rumus berikut:

̂ ̃

Restricted Maximum Likelihood (REML)

Terdapat beberapa metode untuk memperoleh penduga komponen ragam. Salah satu pendekatannya adalah metode kemungkinan maksimum terbatas atau

Restricted Maximum Likelihood (REML) yang memaksimumkan kombinasi linier dari . Jika didefinisikan bahwa ∑ dengan , maka dapat dinyatakan bahwa:

.

Menurut McCullloch dan Searle (2001), fungsi kemungkinan maksimum dari dapat dituliskan dalam bentuk berikut: kenormalan karena persamaan tersebut diturunkan dari sebaran normal.

Analisis Gerombol (Clustering)

(22)

5 lainnya. Jarak euclid banyak digunakan karena perhitungannya yang sederhana, yaitu:

dengan anggapan bahwa semua peubah diukur dengan skala yang sama. Apabila terdapat perbedaan skala pengukuran diantara peubah maka harus dilakukan pembakuan peubah.

Johnson dan Wichern (2007) menjelaskan bahwa terdapat dua pendekatan dalam metode penggerombolan, yaitu metode berhirarkhi dan metode nirhirakhi. Metode penggerombolan berhirarkhi dapat dilakukan dengan pendekatan aglomeratif (penggabungan) maupun divisif (pemisahan). Penggabungan atau pemisahan antar objek dalam penggerombolan dapat disajikan dalam bentuk dendogram yang biasanya dijadikan sebagai dasar penentuan banyaknya gerombol. Metode penggerombolan nirhirarkhi digunakan apabila banyaknya gerombol yang ingin dibentuk telah ditentukan, yaitu sebanyak k gerombol.

Kendala yang mungkin ditemukan pada proses analisis gerombol di antaranya adalah pelanggaran asumsi multikolinieritas dan terdapatnya pencilan. Metode analisis gerombol berhirarkhi k-medoid dapat menjadi salah satu alternatif untuk mengatasi pencilan. Permasalahan lain yang mungkin ditemukan adalah apabila penggerombolan dilakukan berdasarkan peubah yang bersifat kategorik, atau campuran antara peubah kategorik dan numerik. Salah satu pendekatan yang dapat menangani permasalahan tersebut adalah metode penggerombolan dua tahap (two step cluster). Selain itu, metode penggerombolan dua tahap juga mampu menangani penggerombolan pada data yang besar.

3

METODE

Model dasar yang digunakan pada penelitian ini adalah model EBLUP baku, yang selanjutnya disebut sebagai Model-0. Pemodelan area kecil yang digunakan pada penelitian ini adalah model level satuan (tipe-B), dengan i dan j masing-masing menunjukkan area dan satuan pada area contoh, sedangkan dan masing-masing menunjukkan area dan satuanpada area nircontoh.

a) Model untuk populasi:

b) Model prediksi untuk area contoh:

̂ ̃ ̃ ̂

c) Model prediksi untuk area nircontoh:

̂ ̃ ̃

(23)

6

Pengembangan Model

Pengembangan model dilakukan dengan menambahkan informasi gerombol ke-k pada Model-0. Penambahan informasi gerombol sebagai bentuk modifikasi model dasar EBLUP menghasilkan lima model yang diusulkan pada penelitian ini. Kelima model tersebut memiliki model prediksi yang berbeda-beda, terutama untuk prediksi pada area nircontoh.

1. Model-1, yaitu modifikasi model EBLUP (Model-0) dengan menambahkan nilai tengah dari penduga pengaruh acak area masing-masing gerombol pada model prediksi area nircontoh. Penambahan tersebut dinyatakan sebagai ̂̅ ∑ ̂ , dengan merupakan banyaknya area contoh pada gerombol ke- .

a) Model untuk populasi:

b) Model prediksi untuk area contoh:

̂ ̃ ̃ ̂

c) Model prediksi untuk area nircontoh:

̂ ̃ ̃ ̂̅

2. Model-2, yaitu modifikasi model EBLUP (model-0) dengan menambah pengaruh tetap gerombol ke-k (model-1). Pengaruh tetap gerombol dinyatakan sebagai ̂ yang merupakan bentuk penyederhanaan notasi penduga koefisien peubah dummy untuk gerombol. Sehingga untuk sejumlah gerombol dapat diuraikan bahwa ̂ ̂ ̂ , dengan merupakan peubah dummy untuk gerombol dan ̂ ̂ merupakan penduga koefisien bagi peubah dummy.

a) Model untuk populasi:

b) Model prediksi untuk area contoh:

̂ ̃ ̃ ̂ ̂

c) Model prediksi untuk area nircontoh:

̂ ̃ ̃ ̂

3. Model-3, yaitu kombinasi dari Model-1 dan Model-2. a) Model untuk populasi:

b) Model prediksi untuk area contoh:

̂ ̃ ̃ ̂ ̂

c) Model prediksi untuk area nircontoh:

̂ ̃ ̃ ̂ ̂̅

(24)

7

b) Model prediksi untuk area contoh:

̂ ̃ ̂ ̃ ̂

c) Model prediksi untuk area nircontoh:

̂ ̃ ̅̂ ̃ ̅̂

5. Model-5, yaitu modifikasi dari Model-4 dengan menambahkan pengaruh tetap dari gerombol ke- .

a) Model untuk populasi:

b) Model prediksi untuk area contoh:

̂ ̃ ̂ ̃ ̂ ̂

c) Model prediksi untuk area nircontoh:

̂ ̃ ̅̂ ̃ ̅̂ ̂

Model-5 secara diharapkan mampu menghasilkan prediksi dengan akurasi yang lebih tinggi karena model ini memiliki penambahan komponen yang paling banyak dibandingkan model-model sebelumnya. Model ini memiliki tiga komponen tambahan yaitu pengaruh acak area, pengaruh acak peubah penyerta setiap area, dan pengaruh tetap gerombol sehingga model ini memiliki titik potong dan kemiringan yang berbeda, mirip seperti Model-4, namun model ini turut memperhitungkan pengaruh tetap dari setiap gerombol.

Kajian Simulasi

Simulasi dilakukan untuk mengevaluasi kebaikan model yang dikembangkan. Proses simulasi dilakukan dengan langkah-langkah berikut ini.

1. Membangun populasi yang terdiri dari 40 area, dengan ukuran populasi masing-masing area berkisar antara 100 hingga 1500 satuan. Populasi tersebut diasumsikan terdiri dari 5 gerombol. Simulasi ini menggunakan satu peubah respon dan satu peubah penyerta . Respon yang diamati ( ) merupakan kombinasi linier dari peubah penyerta ( ), pengaruh acak area ( ), dan galat penarikan contoh ( ), dengan menunjukkan area, menunjukkan satuan, dan menunjukkan gerombol. Hubungan tersebut dapat dinyatakan dalam model campuran linier berikut:

(25)

8

Parameter pada model (4) memiliki nilai yang berbeda untuk setiap gerombol ke- . Peubah penyerta dibangkitkan dari sebaran normal , sedangkan komponen acak dan berasal dari sebaran tertentu. Beberapa skenario dibangun untuk mengkaji kebaikan model yang diusulkan pada berbagai kondisi tertentu.

a) Skenario 1, populasi terdiri dari 5 gerombol yang saling terpisah dengan nilai masing-masing gerombol sebagai berikut:

Tabel 1 Titik potong dan kemiringan pada populasi skenario 1

Gerombol

Populasi ini memiliki heterogenitas antar gerombol yang tinggi. Seluruh komponen acak pada skenario ini berasal dari sebaran normal, yaitu dan sehingga model campuran linieryang dibangun pada skenario ini akan memenuhi asumsi kenormalan. Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi populasi yang ideal, yaitu karakteristik antar gerombol mampu dibedakan dengan baik dan tidak terdapat gangguan terhadap asumsi kenormalan.

b) Skenario 2, populasi terdiri dari 5 gerombol yang tidak terpisah sempurna dengan nilai masing-masing gerombol sebagai berikut:

Tabel 2 Titik potong dan kemiringan pada populasi skenario 2

Gerombol mengkaji kemampuan model pada kondisi penggerombolan yang beririsan, atau heterogenitas antar gerombol yang rendah dan tanpa ada gangguan terhadap asumsi kenormalan.

(26)

9 dengan mengasumsikan karakteristik antar gerombol mampu dibedakan dengan baik.

d) Skenario 4, populasi terdiri dari 5 gerombol yang terpisah sempurna, yaitu dengan nilai yang sama dengan skenario 1. Komponen pengaruh acak area pada skenario ini berasal dari sebaran normal , namun komponen acak galat penarikan contoh pada populasi ini tidak berasal dari sebaran normal. Galat penarikan contoh berasal dari sebaran khi-kuadrat . Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi dengan pelanggaran asumsi kenormalan pada komponen galat penarikan contoh, dengan mengasumsikan karakteristik antar gerombol mampu dibedakan dengan baik.

e) Skenario 5, populasi terdiri dari 5 gerombol yang terpisah sempurna, yaitu dengan nilai yang sama dengan skenario 1. Seluruh komponen acak pada skenario ini tidak berasal dari sebaran normal melainkan berasal dari sebaran khi-kuadrat, yaitu dan . Skenario ini dibangun untuk mengkaji kemampuan model pada kondisi dengan pelanggaran asumsi kenormalan pada seluruh komponen acak, dengan mengasumsikan karakteristik antar gerombol mampu dibedakan dengan baik.

Langkah-langkah yang dilakukan untuk membangun populasi pada setiap skenario adalah sebagai berikut:

(i) membangkitkan peubah penyerta sebanyak satuan, nilai yang diperoleh pada langkah ini digunakan untuk seluruh skenario pada proses simulasi,

(ii) membangkitkan pengaruh acak area dan galat penarikan contoh berdasarkan sebaran tertentu sesuai dengan skenario,

(iii) menghitung nilai peubah respon berdasarkan model (4) dengan nilai koefisien yang telah ditentukan untuk masing-masing gerombol sesuai dengan skenario.

2. Mengambil contoh acak dari populasi yang dibangkitkan pada langkah (1), yaitu sebanyak area contoh yang berasal dari kelima gerombol, sehingga terdapat area nircontoh(Tabel 3).

Tabel 3 Jumlah area contohdan nircontohpada gerombol

ke-Gerombol Jumlah Area Contoh Jumlah Area Nircontoh Total Area

1 4 1 5

2 6 2 8

3 8 2 10

4 4 2 6

5 8 3 11

Penarikan contoh acak pada level satuan untuk setiap area contoh dilakukan secara proporsional dengan ukuran contoh sebesar 3% dari ukuran populasi. 3. Melakukan pemodelan dan menduga nilai tengah area contoh ke-i dan nilai

(27)

10

(Model-0) dan kelima model yang diusulkan (Model-1, Model-2, Model-3, Model-4, dan Model-5).

4. Mengulangi proses pada langkah (2) dan (3) sebanyak B=1000 kali sehingga dapat dihitung nilai Relative Bias (RB) dan Relative Root Mean Squares Error (RRMSE) dari hasil pendugaan parameter pada setiap area dengan rumus sebagai berikut:

̂

√ ∑ ( ̂ ) .

5. Mengevaluasi model berdasarkan nilai RB dan RRMSE.

Studi Kasus

Studi kasus pada penelitian ini menggunakan data SUSENAS tahun 2010 dan PODES tahun 2011 yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah yang diamati pada penelitian ini adalah rata-rata pengeluaran per kapita per bulan untuk kecamatan di wilayah Kota dan Kabupaten Bogor. Data yang tersedia pada SUSENAS tidak mendukung pendugaan langsung pada tingkat kecamatan. Hal ini dikarenakan contoh pada tingkat kecamatan berukuran kecil, bahkan terdapat kecamatan yang tidak disurvei. Model yang dikembangkan pada penelitian ini digunakan sebagai alternatif untuk mengatasi permasalahan tersebut. Pemodelan dilakukan dengan memanfaatkan informasi dari peubah yang dipilih dari data PODES sebagai peubah penyerta.

Proses analisis data PODES dan SUSENAS adalah sebagai berikut: 1. melakukan eksplorasi data, yaitu dengan memeriksa distribusi data yang akan

digunakan, memeriksa peubah-peubah yang berkorelasi kuat terhadap peubah respon, serta melakukan pemilihan peubah yang mampu membedakan karakteristik setiap gerombol,

2. melakukan penggerombolan area berdasarkan peubah-peubah yang dipilih dari data PODES, dengan asumsi bahwa PODES memuat informasi seluruh anggota populasi hingga di tingkat desa,

3. mengelompokan area berdasarkan gerombol yang terbentuk,

4. melakukan pemodelan dengan model dasar EBLUP dan kelima model yang dikembangkan,

5. menduga nilai tengah pengeluaran per kapita per bulan setiap kecamatan, 6. mengevaluasi hasil pendugaan dengan membandingkan nilai root mean

(28)

11

4

HASIL DAN PEMBAHASAN

Kajian Simulasi

Data pada populasi dibagi menjadi dua, yaitu data contoh dan nircontoh. Data contoh digunakan untuk membangun enam model prediksi, model dasar (Model-0) dan model yang diusulkan (Model-1 hingga Model-5). Parameter yang diamati adalah nilai tengah seluruh area kecil dalam populasi, yaitu area contoh ke- dan area nircontoh ke- . Model EBLUP baku menghasilkan model prediksi area nircontoh yang bersifat global, sedangkan model yang diusulkan menghasilkan model prediksi area nircontoh yang bersifat lokal. Suatu model dikatakan bersifat global apabila model tersebut berlaku untuk seluruh pengamatan. Model yang bersifat lokal tidak berlaku untuk seluruh pengamatan, melainkan bersifat unik untuk level tertentu. Model lokal yang diusulkan pada penelitian ini bersifat unik untuk masing-masing gerombol.

Skenario 1 mengasumsikan bahwa karakteristik antar gerombol mampu dibedakan dengan baik, sehingga pola hubungan antara peubah penyerta dan peubah respon memiliki rentang nilai yang berbeda-beda untuk masing-masing gerombol pada area nircontoh (Gambar 1). Gerombol 1 memiliki rentang nilai terendah dan gerombol 5 memiliki rentang nilai tertinggi dengan jarak antar gerombol yang relatif renggang. Pendekatan garis prediksi Model-0 yang bersifat global tidak mampu menggambarkan keragaman yang dimiliki oleh masing-masing gerombol.

Gambar 1 Garis prediksi area nircontoh skenario 1 untuk hubungan peubah penyerta terhadap peubah respon yang dihasilkan oleh: (a) Model-0, (b) Model-1, (c) Model-2, (d) Model-3, (e) Model-4, dan (f) Model-5. Gerombol 1 (), gerombol 2 (), gerombol 3 (), gerombol 4 (), dan gerombol 5 ().

(a) (b) (c)

(29)

12

Model-0 hanya menghasilkan satu garis prediksi area nircontoh (perhatikan garis berwarna hitam), sedangkan kelima model yang diusulkan menghasilkan lima garis prediksi area nircontoh, sesuai dengan banyaknya gerombol pada area tersebut. Model prediksi yang dihasilkan oleh Model-0 mengabaikan pengaruh acak area sehingga prediksinya diperoleh dari model sintetik yang bersifat global. Prediksi area nircontoh yang dihasilkan oleh Model-0 akan terdistorsi pada satu garis prediksi yang bersifat global tersebut (Gambar 1a).

Garis prediksi yang dihasilkan oleh Model-1, Model-2, dan Model-3 memiliki titik potong yang berbeda-beda pada setiap gerombol, namun kemiringan garis yang dihasilkan tetap sama (Gambar 1b, Gambar 1c, Gambar 1d). Prediksi area nircontohdari ketiga model tersebut lebih mampu menghampiri nilai yang sebenarnya dibandingkan dengan Model-0, dengan asumsi bahwa penggerombolan yang dilakukan telah mampu membedakan karakteristik antar

-gerombol dengan sangat baik.

Model-4 dan Model-5 merupakan hasil modifikasi titik potong dan kemiringan dari model EBLUP baku. Kedua model ini mengasumsikan bahwa peubah penyerta bersifat acak. Garis prediksi area nircontoh yang dihasilkan kedua model tersebut memiliki titik potong dan kemiringan yang berbeda-beda pada setiap gerombol (Gambar 1e, Gambar 1f). Kondisi tersebut secara teoritis memungkinkan agar prediksi yang dihasilkan lebih baik dibandingkan model-model sebelumnya. Hal ini berlaku pada data dengan kondisi penggerombolan yang dicerminkan oleh data simulasi ini.

Lampiran 1 hingga Lampiran 4 menunjukkan garis prediksi area nircontoh skenario 2 hingga skenario 5. Skenario 2 mencerminkan kodisi karakteristik antar gerombol yang cukup sulit untuk dibedakan sehingga kondisi data menjadi beririsan antara suatu gerombol dan gerombol lainnya (Lampiran 1). Model-1 menghasilkan garis prediksi area nircontoh yang berhimpit, terutama untuk gerombol 1 dan gerombol 2, sementara garis prediksi Model-2 dan Model-3 sedikit lebih renggang. Model-4 menunjukkan garis prediksi yang cenderung lebih mendekati pengamatan area nircontoh yang sebenarnya, jika dibandingkan dengan Model-5. Selain itu, kuadrat tengah sisaan prediksi area nircontoh Model-4 lebih kecil dibandingkan dengan Model-5 (Tabel 4). Hal ini mengindikasikan bahwa penambahan pengaruh tetap gerombol pada model prediksi area nircontoh dengan asumsi peubah penyerta bersifat acak dapat dinilai kurang tepat pada kondisi penggerombolan yang beririsan.

Tabel 4 Kuadrat tengah sisaan prediksi area nircontoh

Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1 387.23 60.29 59.70 59.70 27.41 27.21

2 551.65 54.67 54.27 54.27 37.48 37.52

3 5595.57 177.91 179.73 179.73 26.46 26.69 4 5754.56 169.39 167.88 167.88 14.65 14.60

5 5556.56 154.76 155.67 155.67 2.67 2.67

(30)

13 penarikan contoh yang berasal dari sebaran khi-kuadrat mempengaruhi bentuk sebaran data yang diamati.

Simulasi dengan berbagai skenario secara umum menunjukkan model prediksi area nircontoh EBLUP baku bersifat global, sementara model yang diusulkan bersifat lokal. Garis prediksi model yang bersifat lokal lebih mampu menghampiri pengamatan area nircontoh yang sebenarnya. Hal ini dapat dilihat berdasarkan plot garis prediksi area nircontoh yang dihasilkan oleh masing-masing model. Selain itu, nilai kuadrat tengah sisaan dari prediksi area nircontoh yang diperoleh pada model lokal jauh lebih kecil dibandingkan dengan model EBLUP baku yang bersifat global (Tabel 4). Kuadrat tengah sisaan dari model dengan modifikasi titik potong dan kemiringan, yaitu Model-4 dan Model-5, memiliki nilai yang paling kecil dibandingkan model lain. Hal ini menunjukkan bahwa kedua model tersebut merupakan model lokal yang paling menghampiri pengamatan area nircontoh yang sebenarnya.

Tabel 5 Median dari Relative Bias (RB) pada area contoh (%) Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1 10.56 10.56 0.57 0.57 10.50 0.94

2 7.27 7.27 1.67 1.67 6.67 1.05

3 10.13 10.13 0.20 0.20 9.96 2.04

4 10.49 10.49 0.59 0.59 10.48 0.35

5 10.11 10.11 0.22 0.22 9.94 0.60

Tabel 6 Median dari RRMSE pada area contoh (%)

Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1 34.32 34.32 1.14 1.14 34.54 11.13 Model tersebut dipengaruhi oleh pengaruh acak area sehingga secara teoritis model ini sudah memiliki kemampuan prediksi yang cukup baik pada area contoh. Prediksi yang dihasilkan oleh Model-0 akan memiliki keragaman yang berbeda di setiap area contoh sehingga hasil yang diperoleh akan mendekati nilai sebenarnya. Namun demikian, hasil simulasi pada skenario 1 hingga skenario 4 memperlihatkan bahwa Model-0 bukan model terbaik pada prediksi area contoh.

Model-2, Model-3, dan Model-5 menghasilkan prediksi nilai tengah area contoh dengan kisaran nilai RB dan RRMSE yang jauh lebih kecil dibandingkan dengan model lain pada semua skenario (Tabel 5 dan Tabel 6). Ketiga model tersebut merupakan model dengan penambahan informasi gerombol sebagai pengaruh tetap, sehingga dapat dikatakan bahwa secara umum penambahan tersebut mampu memperbaiki prediksi area contoh.

(31)

14

mengindikasikan bahwa Model-2 dan Model-3 memiliki kemampuan yang paling baik untuk melakukan prediksi pada area contoh, prediksi yang dihasilkan memiliki ketepatan yang relatif lebih baik dibandingkan model lain.

Tabel 7 Median dari Relative Bias (RB) pada area nircontoh (%) Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1 -6.63 -1.11 -1.07 -1.07 -1.01 -0.97

2 0.60 -2.48 -2.66 -2.66 -2.67 -2.58

3 -6.55 0.24 0.35 0.35 0.37 0.40

4 -6.63 -1.02 -0.99 -0.99 -0.91 -0.91

5 -6.53 0.31 0.31 0.31 0.48 0.47

Tabel 8 Median dari RRMSE pada area nircontoh (%)

Skenario Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1 38.60 2.29 2.46 2.46 2.32 2.37

2 30.25 5.48 6.20 6.20 5.47 6.10

3 38.12 0.68 0.69 0.69 0.45 0.47

4 38.35 2.16 2.32 2.32 2.20 2.20

5 37.87 0.68 0.69 0.69 0.48 0.47

Prediksi nilai tengah area nircontoh skenario 1 yang dihasilkan oleh Model-5 memiliki nilai median RB yang paling mendekati nol dibandingkan model lain (Tabel 7). Nilai median RRMSE yang terkecil diperoleh pada prediksi yang dihasilkan oleh Model-1 (Tabel 8). Namun demikian, nilai median RB dan RRMSE yang diperoleh pada Model-1 hingga Model-5 memiliki perbedaan yang relatif kecil, yaitu berkisar antara 0.03% hingga 0.17%. Hal ini mengindikasikan bahwa secara umum penambahan informasi gerombol pada kelima model yang diusulkan mampu meningkatkan kemampuan prediksi parameter area nircontoh pada kondisi populasi yang paling ideal.

Hasil prediksi area nircontoh pada skenario 3, 4, dan 5 yang dihasilkan oleh Model-1 hingga Model-5 secara umum lebih baik dibandingkan dengan Model-0 berdasarkan nilai median RB dan RRMSE. Nilai median RB prediksi area nircontoh skenario 2 yang paling mendekati nol diperoleh pada Model-0 (Tabel 7), namun nilai RB pada prediksi area nircontoh Model-0 secara keseluruhan memiliki rentang nilai (range) yang jauh lebih lebar dibandingkan dengan kelima model yang diusulkan (Gambar 2). Selain itu, nilai median RRMSE terkecil diperoleh pada prediksi area nircontoh Model-4 (Tabel 8), sehingga Model-4 dapat dianggap sebagai model terbaik pada prediksi area nircontoh skenario ini.

(32)

15

Simulasi menunjukkan bahwa model yang diusulkan secara umum memiliki akurasi yang lebih baik daripada model EBLUP baku dalam memprediksi parameter area nircontoh, pada berbagai skenario populasi. Model-4 cenderung menghasilkan prediksi dengan nilai median RRMSE yang terkecil pada seluruh skenario (Gambar 3). Nilai RB prediksi area nircontoh yang dihasilkan kelima model yang diusulkan relatif sama (Gambar 4). Dengan demikian, dapat dikatakan bahwa Model-4 memiliki kemampuan yang relatif lebih baik dibandingkan model lain dalam memprediksi parameter area nircontoh.

Gambar 4 Nilai RB (%) prediksi area nircontoh model modifikasi Gambar 3 Nilai RRMSE (%) prediksi area nircontoh model modifikasi

(33)

16

Studi Kasus

Eksplorasi Data

Kota Bogor terdiri dari 6 kecamatan dan 64 kelurahan. Kabupaten Bogor terdiri dari 40 kecamatan dan 428 desa/kelurahan. Data PODES diasumsikan mencakup seluruh desa dan kecamatan di Kota dan Kabupaten Bogor sehingga penggerombolan pada tingkat kecamatan dilakukan berdasarkan peubah yang dipilih dari data tersebut. Peubah pada data PODES 2011 (Lampiran 25) yang dipilih sebagai peubah dasar penggerombolan mewakili empat bidang berikut:

1. keterangan umum desa/kelurahan, 2. kependudukan dan ketenagakerjaan, 3. pendidikan dan kesehatan,

4. ekonomi.

Peubah yang dipilih tersebut merupakan peubah yang memiliki ragam yang besar dan memiliki sedikit nilai nol (Lampiran 25).

Peubah pada data SUSENAS 2010 digunakan sebagai peubah respon , yaitu rata-rata pengeluaran per kapita per bulan. Data SUSENAS mencakup 44 kecamatan dan 111 desa/kelurahan di Kota dan Kabupaten Bogor. Rata-rata pengeluaran per kapita tidak berdistribusi normal. Hal ini dapat dilihat dari plot peubah yang menjulur ke kanan (Gambar 5).

Gambar 6 Plot kuantil-kuantil peubah

Gambar 5 Kepekatan peluang (a) peubah , yaitu rata-rata pengeluaran per kapita per bulan (Rupiah) dan (b) bentuk tranformasi logaritma peubah Y

(34)

17 Tabel 9 Uji Kenormalan Anderson-Darling

Peubah

AD 9.367 0.506

Nilai-p < 0.005 0.197

Uji kenormalan Anderson-Darling terhadap peubah menghasilkan nilai signifikansi < 0.005 sehingga pada taraf nyata 5% dapat dikatakan bahwa data tersebut tidak mengikuti sebaran normal (Tabel 9). Transformasi logaritma terhadap peubah dilakukan untuk mengatasi ketaknormalan data. Plot kuantil-kuantil peubah menunjukkan pola yang mengikuti garis kenormalan (Gambar 6). Uji kenormalan terhadap hasil transformasi peubah menghasilkan nilai signifikansi sebesar 0.197, artinya pada taraf nyata 5% hipotesis nol yang menyatakan bahwa data mengikuti sebaran normal dapat diterima.

Analisis Gerombol

Pembentukan gerombol dilakukan dengan pendekatan analisis gerombol berhirarki berdasarkan peubah yang dipilih pada tahap eksplorasi data. Jarak yang digunakan adalah jarak euclid yang mengasumsikan bahwa tidak terdapat multikolinieritas. Analisis Komponen Utama (AKU) digunakan untuk mengatasi multikolineritas pada data (Lampiran 26). Analisis gerombol dilakukan menggunakan seluruh Komponen Utama (KU) untuk mempertahankan seluruh keragaman data. Analisis gerombol dilakukan dengan metode Ward. Penentuan gerombol untuk tingkat kecamatan Kota dan Kabupaten Bogor dilakukan berdasarkan dendogram dengan nilai cutoff pada jarak ketakmiripan 8.20 (Lampiran 27). Penggerombolan tersebut menghasilkan 8 gerombol (Tabel 10).

Tabel 10 Penggerombolan kecamatan di Kota dan Kabupaten Bogor Gerombol Banyaknya

Anggota

Anggota Gerombol

1 11 Pamijahan, Cigombong, Megamendung, Babakan Madang, Jonggol, Kemang, Ciseeng, Gunung Sindur, Rumpin, Cigudeg

2 12 Nanggung, Leuwisadeng, Cibungbulang, Tenjolaya, Cijeruk, Sukamakmur, Cariu, Tanjungsari, Ranca Bungur, Sukajaya, Jasinga, Tenjo

3 2 Gunung Putri, Cibinong

4 1 Cisarua

5 6 Parung, Bogor Timur, Bogor Utara, Bogor Tengah, Bogor Barat, Tanah Sereal

6 6 Dramaga, Ciomas, Tamansari, Caringin, Kelapa Nunggal, Tajur Halang

7 4 Leuwiliang, Ciampea, Ciawi , Parung Panjang 8 5 Sukaraja, Cileungsi, Citeureup, Bojong Gede,

Bogor Selatan

(35)

18

pariwisata yang lebih banyak dibandingkan dengan gerombol 2. Gerombol 2 merupakan kawasan dengan jumlah penduduk yang paling sedikit dibanding gerombol lain. Gerombol 3 merupakan kawasan yang paling banyak penduduknya, sehingga kawasan ini juga memiliki sarana pendidikan dan kesehatan yang paling banyak pula. Sebagian besar mata pencaharian pada gerombol 3 berasal dari sektor industri. Gerombol 4 merupakan kawasan pariwisata dengan jumlah hotel dan penginapan yang jauh lebih banyak dibandingkan kawasan lain.

Sebagian besar kecamatan di wilayah kota Bogor termasuk ke dalam Gerombol 5. Gerombol ini merupakan kawasan dengan persentase keluarga pertanian paling sedikit. Proporsi jumlah desa/kelurahan dengan sumber mata pencaharian dari sektor jasa pada gerombol ini mencapai sekitar 50% , jauh lebih besar dibandingkan dengan gerombol lain. Gerombol 6 merupakan kawasan dengan rata-rata jumlah industri kecil terbanyak dibandingkan kawasan lain. Gerombol 7 merupakan kelompok kecamatan dengan proporsi jumlah desa mencapai 100%, sama halnya dengan gerombol 2, namun persentase keluarga pertanian pada gerombol 7 lebih sedikit dibandingkan gerombol 2. Jumlah sarana kesehatan dan pendidikan, serta sarana perekonomian pada gerombol ini juga lebih banyak daripada gerombol 2. Gerombol 8 merupakan kelompok kecamatan dengan jumlah koperasi terbanyak dibandingkan gerombol lain.

Pemodelan Small Area Estimation (SAE)

Model area kecil dibangun menggunakan transformasi logaritma dari rata-rata pengeluaran per kapita per bulan (rupiah) sebagai peubah respon dan peubah penyerta adalah: (1) jumlah minimarket (unit), (2) jumlah poliklinik (unit), dan (3) sumber mata pencaharian utama sebagian besar penduduk adalah pertanian atau bukan pertanian. Peubah penyerta dipilih berdasarkan seleksi dengan metode regresi bertatar atau stepwise (Lampiran 29). Model yang digunakan adalah model level satuan dengan desa/kelurahan sebagai level satuan dan kecamatan sebagai level area. Hubungan antara jumlah poliklinik dan minimarket terhadap peubah menunjukkan pola penggerombolan yang bercampur (Gambar 7). Kondisi ini relatif mirip dengan kondisi skenario 2 pada kajian simulasi apabila diasumsikan bahwa hasil penggerombolan sudah tepat.

Gambar 7 Hubungan antara peubah penyerta: (a) jumlah poliklinik (unit) dan (b) jumlah minimarket (unit) terhadap peubah respon . Gerombol 1 (), gerombol 2 (), gerombol 3 (), gerombol 4 (), gerombol 5 (), gerombol 6 (), gerombol 7 (), dan gerombol 8 ().

(36)

19 Pemodelan area kecil dilakukan dengan menggunakan model EBLUP baku (Model-0) dan Model-4 yang berdasarkan hasil simulasi dianggap sebagai model terbaik untuk memprediksi parameter kecamatan nircontoh. Prediksi rata-rata pengeluaran per kapita per bulan untuk kecamatan di Kota dan Kabupaten Bogor yang dihasilkan oleh kedua model berbeda-beda, namun masih memiliki kemiripan pola (Lampiran 31). Prediksi untuk kecamatan yang disurvei (contoh) adalah sebanyak 44 kecamatan. Seluruh model memprediksi bahwa kecamatan Gunung Putri memiliki rata-rata pengeluaran per kapita tertinggi dibandingkan kecamatan lain. Kecamatan yang diprediksi memiliki rata-rata pengeluaran per kapita terendah adalah kecamatan Nanggung.

Tabel 11 Prediksi rata-rata pengeluaran per kapita dan evaluasi pemodelan pada kecamatan nircontoh

Model-0 Model-4 Model-0 Model-4

Leuwisadeng 592.89 586.58 180.884 199.759

Tenjolaya 570.33 559.23 131.250 132.776

Kecamatan yang tidak disurvei (nircontoh) pada studi kasus ini adalah kecamatan Leuwisadeng dan Tenjolaya. Prediksi rata-rata pengeluaran per kapita yang dihasilkan kedua model tersebut tidak jauh berbeda (Tabel 11). Prediksi pada kecamatan nircontoh yang dihasilkan Model-0 memiliki nilai RMSE yang lebih kecil dibandingkan dengan Model-4. Hal ini menunjukkan bahwa pada studi kasus ini, Model-0 dapat dikatakan lebih baik dibandingkan dengan Model-4 pada prediksi kecamatan nircontoh.

Evaluasi model pada studi kasus menunjukkan hasil yang berbeda dengan simulasi. Perlu digarisbawahi bahwa data simulasi memiliki pola penggerombolan yang memiliki hubungan linier terhadap peubah respon (Lampiran 1). Data studi kasus memiliki pola penggerombolan yang cenderung tidak linier terhadap peubah respon (Gambar 7), jika dibandingkan dengan data simulasi. Hal ini mungkin disebabkan oleh keragaman di dalam gerombol pada studi kasus yang relatif besar jika dibandingkan dengan data simulasi. Fenomena ini menunjukkan kelemahan dari model yang diusulkan pada penelitian ini. Model ini memerlukan asumsi bahwa penggerombolan mampu membedakan karakteristik antar-area dengan baik dengan keragaman antar anggota gerombol yang minimum, dan pola penggerombolan memiliki hubungan yang linier terhadap peubah respon .

(37)

20

5

SIMPULAN DAN SARAN

Simpulan

Kajian simulasi menunjukkan bahwa secara umum model dengan penambahan informasi gerombol memiliki kemampuan prediksi yang lebih baik dibandingkan dengan model EBLUP baku, khususnya pada kasus prediksi area nircontoh. Model-4 dianggap sebagai model terbaik untuk memprediksi area nircontoh karena model ini cenderung menghasilkan prediksi dengan nilai RRMSE terkecil pada berbagai skenario. Studi kasus rata-rata pengeluaran per kapita tingkat kecamatan di Kota dan Kabupaten Bogor menunjukkan bahwa prediksi pada kecamatan nircontoh yang dihasilkan Model-0 memiliki nilai RMSE yang lebih kecil dibandingkan dengan Model-4. Hal ini mungkin disebabkan oleh keragaman di dalam gerombol pada studi kasus yang relatif besar sehingga pola penggerombolan cenderung tidak linier terhadap peubah respon, jika dibandingkan dengan data simulasi. Namun demikian, terdapat model yang menghasilkan prediksi rata-rata pengeluaran per kapita kecamatan nircontoh dengan nilai RMSE yang lebih kecil dibandingkan model EBLUP baku, yaitu Model-1 dan Model-5.

Saran

Mean Squares Error (MSE) yang digunakan pada evaluasi pemodelan pada penelitian ini masih mengadopsi dari rumus yang sudah ada. Oleh karenanya, diperlukan pengembangan dalam penguraian MSE bagi penduga yang dihasilkan oleh model modifikasi EBLUP yang dikembangkan pada penelitian ini. Selain itu, hasil penelitian ini menunjukkan bahwa penggerombolan memegang peranan penting dalam menerapkan model yang diusulkan pada studi kasus sehingga kajian mengenai penggerombolan yang sesuai dengan pemodelan area kecil akan sangat berguna bagi pengembangan metode yang diusulkan pada penelitian ini.

DAFTAR PUSTAKA

Anisa R, Kurnia A, Indahwati. 2014. Cluster Information of Non-Sampled Area in Small Area Estimation. IOSR Journal of Mathematics 10(1): 15-19. doi: 10.9790/5728-10121519

Das K, Jiang J, Rao JNK. 2004. Mean Square Error of Empirical Predictor. The Annals of Statistics 32(2): 818-840. doi: 10.1214/009053604000000201. Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis 6th

Edition. London : Prentice-Hall.

(38)

21 Mattjik AA, Sumertajaya IM. 2011. Sidik Peubah Ganda. Bogor: Departemen

Statistika FMIPA-IPB.

McCulloch CE, Searle SR. 2001. Generalized, Linear, and Mixed Models. New York: John Wiley & Sons.

Rao JNK. 2003. Small Area Estimation. New York: John Wiley & Sons.

(39)
(40)
(41)
(42)

23

(a) Model-0 (b) Model-1 (c) Model-2

(d) Model-3 (e) Model-4 (f) Model-5 Lampiran 1 Garis prediksi area nircontoh skenario 2 untuk hubungan peubah

(43)

24

(a) Model-0 (b) Model-1 (c) Model-2

(d) Model-3 (e) Model-4 (f) Model-5

(44)

25

(a) Model-0 (b) Model-1 (c) Model-2

(d) Model-3 (e) Model-4 (f) Model-5 Lampiran 3 Garis prediksi area nircontoh skenario 4 untuk hubungan peubah

(45)

26

(a) Model-0 (b) Model-1 (c) Model-2

(d) Model-3 (e) Model-4 (f) Model-5 Lampiran 4 Garis prediksi area nircontoh skenario 5 untuk hubungan peubah

(46)

27 Lampiran 5 Relative Bias (RB) prediksi nilai tengah area contohpada skenario 1

Area Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(47)

28

Lampiran 6 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contohpada skenario 1

Area

Relative Root Mean Squares Error (RRMSE)

(48)

29 Lampiran 7 Relative Bias (RB) prediksi nilai tengah area contohpada skenario 2

Area Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(49)

30

Lampiran 8 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contohpada skenario 2

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(50)

31 Lampiran 9 Relative Bias (RB) prediksi nilai tengah area contohpada skenario 3

Area Relative Bias (RB)

(51)

32

Lampiran 10 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contohpada skenario 3

Area Relative Root Mean Squares Error (RRMSE)

(52)

33 Lampiran 11 Relative Bias (RB) prediksi nilai tengah area contohpada skenario 4

Area Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(53)

34

Lampiran 12 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contohpada skenario 4

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(54)

35 Lampiran 13 Relative Bias (RB) prediksi nilai tengah area contohpada skenario 5

Area Relative Bias (RB)

(55)

36

Lampiran 14 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area contoh pada skenario 5

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(56)

37 Lampiran 15 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 1

Area Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1d 302.40 -2.97 -4.44 -4.44 -4.81 -5.52

Lampiran 16 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontohpada skenario 1

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(57)

38

Lampiran 17 Relative Bias (RB) prediksi nilai tengah area nircontoh pada skenario 2

Area Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1d 63.70 -4.10 -5.36 -5.36 -4.57 -5.55

Lampiran 18 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontohpada skenario 2

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(58)

39 Lampiran 19 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 3

Area Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1d 319.60 2.74 3.35 3.35 0.86 1.05

Lampiran 20 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontohpada skenario 3

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(59)

40

Lampiran 21 Relative Bias (RB) prediksi nilai tengah area nircontoh pada skenario 4

Area

Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1d 294.85 -2.71 -4.16 -4.16 -4.56 -4.63

Lampiran 22 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontohpada skenario 4

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(60)

41 Lampiran 23 Relative Bias (RB) prediksi nilai tengah area nircontoh pada

skenario 5

Area

Relative Bias (RB)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

1d 311.47 2.90 3.39 3.39 1.05 1.11

Lampiran 24 Relative Root Mean Squares Error (RRMSE) prediksi nilai tengah area nircontohpada skenario 5

Area Relative Root Mean Squares Error (RRMSE)

Model-0 Model-1 Model-2 Model-3 Model-4 Model-5

(61)

42

Lampiran 25 Peubah yang terpilih sebagai dasar penggerombolan kecamatan di Kota dan Kabupaten Bogor

Peubah Rataan Ragam Jumlah data

bernilai nol

X1 Proporsi jumlah desa 0.8383 0.1299 7

X2 Jumlah penduduk 120087 359699273 0

X3 Persentase keluarga pertanian 23.3187 306.2568 1

X4

X8 Jumlah SD Negeri/Swasta (unit) 56 325 0

X9 Jumlah SMP Negeri/Swasta (unit) 19 86 0

X10 Jumlah SMA Negeri/Swasta

(unit) 7 26 0

X11 Jumlah poliklinik (unit) 8 78 6

X12 Jumlah tempat praktek dokter

(unit) 14 219 1

X13 Jumlah posyandu (unit) 153 3962 0

X14 Jumlah minimarket (unit) 15 291 4

X15 Jumah toko/warung kelontong

(unit) 220 30645 0

X16 Jumlah restoran/rumah makan

(unit) 20 918 11

X17 Jumlah industri kecil dan mikro

(unit) 258 113905 3

X18 Jumlah koperasi yang beroperasi

(unit) 10 64 3

X19 Jumlah hotel dan penginapan

(62)

43 Lampiran 26 Korelasi antar peubah dasar penggerombolan kecamatan di Kota

dan Kabupaten Bogor

X10 -0.47 0.75 -0.41 -0.53 0.47 0.32 0.12 0.65 0.85 1.00

X11 -0.48 0.81 -0.62 -0.70 0.49 0.29 0.35 0.51 0.69 0.72

X12 -0.66 0.74 -0.62 -0.70 0.39 0.19 0.46 0.47 0.69 0.75

X13 -0.62 0.81 -0.55 -0.61 0.33 0.29 0.33 0.58 0.63 0.59

X14 -0.37 0.71 -0.61 -0.68 0.46 0.30 0.34 0.36 0.52 0.62

X15 -0.22 0.58 -0.40 -0.44 0.39 0.24 0.19 0.37 0.40 0.50

X16 -0.55 0.32 -0.42 -0.44 -0.06 0.11 0.40 0.17 0.21 0.29

X17 0.21 0.03 -0.12 -0.03 0.07 -0.10 0.09 -0.11 -0.14 -0.09

X18 0.13 0.12 0.01 0.06 0.16 0.02 -0.18 0.08 -0.04 -0.05

X19 0.04 -0.03 -0.02 -0.01 -0.15 0.03 0.05 -0.11 -0.16 -0.20

X11 X12 X13 X14 X15 X16 X17 X18 X19

X1 -0.48 -0.66 -0.62 -0.37 -0.22 -0.55 0.21 0.13 0.04

X10 0.72 0.75 0.59 0.62 0.50 0.29 -0.09 -0.05 -0.20

X11 1.00 0.84 0.65 0.82 0.60 0.47 -0.12 -0.01 -0.11

X12 0.84 1.00 0.67 0.69 0.59 0.59 -0.07 -0.07 -0.05

X13 0.65 0.67 1.00 0.52 0.48 0.53 -0.09 0.12 0.09

X14 0.82 0.69 0.52 1.00 0.66 0.37 -0.06 0.04 0.05

X15 0.60 0.59 0.48 0.66 1.00 0.38 0.14 0.08 -0.01

X16 0.47 0.59 0.53 0.37 0.38 1.00 -0.17 -0.21 0.36

X17 -0.12 -0.07 -0.09 -0.06 0.14 -0.17 1.00 0.13 -0.12

X18 -0.01 -0.07 0.12 0.04 0.08 -0.21 0.13 1.00 -0.11

X19 -0.11 -0.05 0.09 0.05 -0.01 0.36 -0.12 -0.11 1.00

(63)

44

(64)

45 Lampiran 28 Rataan setiap peubah pada masing-masing gerombol

Peubah Gerombol X3 = Persentase keluarga pertanian

X4 = Proporsi jumlah desa dengan sumber mata pencaharian utama bidang pertanian X5 = Proporsi jumlah desa dengan sumber mata pencaharian utama bidang industri

pengolahan (pabrik, kerajinan, dll)

X6 = Proporsi jumlah desa dengan sumber mata pencaharian utama bidang perdagangan besar/eceran dan rumah makan

X7 = Proporsi jumlah desa dengan sumber mata pencaharian utama bidang jasa X8 = Jumlah SD Negeri/Swasta (unit)

X9 = Jumlah SMP Negeri/Swasta (unit) X10 = Jumlah SMA Negeri/Swasta (unit) X11 = Jumlah poliklinik (unit)

X12 = Jumlah tempat praktek dokter (unit) X13 = Jumlah posyandu (unit)

X14 = Jumlah minimarket (unit)

(65)

46

Lampiran 29 Pemilihan peubah untuk pemodelan dengan seleksi model regresi

stepwise

log(Y) = Transformasi logaritma dari rata-rata pengeluaran per kapita per bulan X1 = Jumlah tempat praktek dokter

X2 = Jumlah minimarket

X3 = Jumlah poliklinik

X4 = Sumber penghasilan utama sebagian besar penduduk adalah bidang pertanian

X5 = Sumber penghasilan utama sebagian besar penduduk adalah bidang pertambangan dan penggalian

X6 = Sumber penghasilan utama sebagian besar penduduk adalah bidang industri pengolahan (pabrik, kerajinan, dll)

X7 = Sumber penghasilan utama sebagian besar penduduk adalah bidang perdagangan besar/eceran dan rumah makan

X8 = Sumber penghasilan utama sebagian besar penduduk adalah bidang angkutan, pergudangan, komunikasi

X9 = Sumber penghasilan utama sebagian besar penduduk adalah bidang jasa

X10 = Jumlah posyandu

X11 = Jumlah penduduk laki-laki

X12 = Jumlah penduduk perempuan

X13 = Jumlah keluarga

Gambar

Gambar 1 Garis prediksi area nircontoh skenario 1 untuk hubungan peubah penyerta   terhadap peubah respon   yang dihasilkan oleh: (a) Model-0, (b) Model-1, (c) Model-2, (d) Model-3, (e) Model-4, dan (f) Model-5
Tabel 7  Median dari Relative Bias (RB) pada area nircontoh (%)
Gambar 3   Nilai RRMSE (%) prediksi area nircontoh model modifikasi
Gambar 6  Plot kuantil-kuantil peubah
+3

Referensi

Dokumen terkait

Berdasarkan pada hasil penelitian dan kesimpulan, maka dapat diajukan rekomendasi yaitu penggunaan metode blended learning yang mampu meningkatkan pemahaman konsep

Tujuan dari Praktek Kerja Lapangan ini adalah untuk mendapatkan ilmu pengetahuan, pengalaman dan keterampilan dalam pemeliharaan ayam pebibit periode grower khususnya

PENERAPAN MODEL COLLABORATIVE TEAMWORK LEARNING UNTUK MENINGKATKAN KETERAMPILAN PROSES SAINS DALAM PEMBELAJARAN IPA MATERI ENERGI.. Universitas Pendidikan Indonesia

Asumsi makro ekonomi yang digunakan Kota Semarang membutuhkan biaya yang cukup besar dalam upaya memacu pembangunan, sehingga perlu menggali Pendapatan Daerah

REKAPITULASI DATA KEPENDUDUKAN MENURUT AGAMA DAN JENIS KELAMIN TAHUN 2016 SEMESTER I..

Penelitian ini bertujuan untuk mengetahui dan menganalisis pengaruh gaya kepemimpinan transformasional terhadap efektifitas kinerja pegawai di Puskesmas Sidomulyo

Kegiatan ini merupakan serangkaian kegiatan pengamatan proses pembelajaran yang dilakukan oleh mahasiswa praktikan terhadap guru pembimbing atau guru pengampu

Berdasarkan Surat Penetapan Pemenang Nomor : SPP/09-Kons.RM/VI/ 2014/Pan tanggal 13 Juni 2014 tentang Penetapan pemenang Konstruksi Pembangunan Dormitory III