APLIKASI ANALISIS REGRESI SPASIAL
ENSEMBLE
PADA
DATA KEMISKINAN DI PULAU JAWA
NURUL ROHMAWATI
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul Aplikasi Analisis Regresi Spasial Ensemble pada Data Kemiskinan di Pulau Jawa adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Maret 2015
Nurul Rohmawati
RINGKASAN
NURUL ROHMAWATI. Aplikasi Analisis Regresi Spasial Ensemble pada Data Kemiskinan di Pulau Jawa. Dibimbing oleh HARI WIJAYANTO dan AJI HAMIM WIGENA.
Kemiskinan di Indonesia hingga saat ini masih menjadi masalah yang belum sepenuhnya terselesaikan. Badan Pusat Statistik (BPS) tahun 2013 menunjukkan bahwa persentase penduduk miskin di Pulau Sumatera sebesar 11.53%, 10.98% di Pulau Jawa, 14.49% di Pulau Bali dan Nusa Tenggara, 6.66% di Pulau Kalimantan, 11.75% di Pulau Sulawesi serta 24.24% di Pulau Maluku dan Papua. Pulau Jawa merupakan pulau dengan persentase penduduk miskin terkecil kedua setelah Pulau Kalimantan, namun jumlah penduduk miskinnya terbesar di Indonesia.
Kemiskinan merupakan masalah yang kompleks yang dipengaruhi oleh faktor-faktor yang saling berkaitan satu dengan lainnya. Faktor tersebut antara lain tingkat pendapatan, pendidikan, kesehatan, akses barang dan jasa, lokasi geografis, serta kondisi lingkungan. Faktor-faktor ini juga dipengaruhi oleh kedekatan wilayah.
Pemodelan regresi untuk mengetahui faktor-faktor yang menjadi indikator kemiskinan yang dipengaruhi oleh aspek wilayah sangat penting. Pada kasus kemiskinan misalnya wilayah yang berdekatan dengan kota besar cenderung memiliki tingkat kemiskinan yang rendah, sebaliknya wilayah yang berjauhan dengan kota besar cenderung memiliki tingkat kemiskinan yang tinggi. Hal ini karena interaksi antar dua wilayah berupa keterkaitan spasial. Keterkaitan spasial atau otokorelasi spasial dapat berakibat pendugaan tidak tepat karena asumsi keacakan galat tidak dipenuhi.
Permasalahan ini dapat diatasi dengan model regresi spasial. Beberapa model regresi spasial yaitu model umum regresi spasial, model spasial otoregresif dan model galat spasial. Model regresi spasial dibentuk dengan cara melibatkan efek spasial dan pembobotan dalam bentuk matriks.
Data kemiskinan biasanya memiliki keragaman yang besar. Kondisi tersebut mengakibatkan asumsi pada model sulit terpenuhi. Oleh karena itu ada suatu metode yang bersifat kekar untuk mengatasi kondisi tersebut yaitu dengan teknik
ensemble. Teknik ensemble regresi spasial merupakan suatu teknik untuk menggabungkan � model regresi spasial. Penggabungan model regresi spasial dilakukan dengan merata-ratakan koefisien pada model. Penggunaan model regresi spasial ensemble mampu meningkatkan kemampuan pendugaan menjadi lebih stabil dari suatu model standar dan bersifat kekar. Penelitian ini bertujuan untuk mengkaji penerapan regresi spasial ensemble pada data kemiskinan di Pulau Jawa dan menelaah faktor-faktor yang dijadikan indikator kemiskinan di Pulau Jawa.
spasial dan model regresi linier klasik. Oleh karena itu, teknik ensemble
diterapkan untuk model spasial otoregresif.
Proses ensemble dilakukan dengan menambahkan noise (additive noise) pada data. Noise dibangkitkan dari �~� , σ . Simpangan baku yang dipilih untuk masing-masing noise adalah 1.55, 1.57, 1.59, 1.61, 1.63, 1.65, 1.67, 1.69, 1.71 dan 1.73. Setiap noise dilakukan pengulangan sebanyak 100 kali, sehingga didapatkan 100 model spasial otoregresif. Teknik ensemble dilakukan dengan merata-ratakan koefisien dari 100 model. Berdasarkan nilai RMSE, model spasial otoregresif ensemble lebih baik daripada model spasial otoregresif tanpa
ensemble.
Faktor-faktor yang dijadikan indikator kemiskinan di Pulau Jawa berdasarkan model spasial otoregresif ensemble adalah persentase angka melek huruf penduduk miskin usia 15-55 tahun, persentase penduduk miskin yang bekerja di sektor informal dan persentase rumah tangga penerima kartu Jamkesmas.
SUMMARY
NURUL ROHMAWATI. Application of Spatial Regression Analysis Ensemble on the Poverty Data in Java. Supervised by HARI WIJAYANTO and AJI HAMIM WIGENA.
Poverty in Indonesia is still an issue that has not been fully resolved. BPS_Statistics Indonesia (Badan Pusat Statistik) in 2013 showed that 11.53% of poor people in Sumatra, 10.98% in Java, 14.49% in of Bali and Nusa Tenggara, 6.66% in Kalimantan, 11.75% in Sulawesi, and 24.24% in Maluku and Papua. Java is an island with the second smallest percentage after Kalimantan, but the largest number of poor people in Indonesia.
Poverty is a complex problem that is influenced by factors that are related to each other. These factors include the level of income, education, health, access to goods and services, geographic location, and environmental conditions. These factors also influenced by the proximity of the area.
Regression modeling to determine the factors that serve as indicators of poverty that are influenced by aspects of the region is very important. In the case of poverty for example, an area adjacent to large cities tend to have lower poverty levels, otherwise distant regions with large cities tend to have high levels of poverty. This is because of interaction between the two regions, thus causing their spatial relationship. Spatial linkages will cause spatial autocorrelation result in the estimation becomes inaccurate because of the randomness assumption is not fulfilled.
These problems can be overcome by using spatial regression models. Some spatial regression models, namely spatial general model, spatial autoregressive model and spatial error model. Spatial regression model is established by means involving spatial effects and weighting in the form of a matrix.
Poverty data usually has a great heterogenity. These conditions lead to the assumption in the model difficult to fulfil. Therefore, there is a method that is robust to solve the condition and that is the ensemble technique. Ensemble technique is a technique to combine k spatial regression models. Combining spatial regression models is performed by averaging the coefficients of the models. The use of ensemble spatial regression technique is expected to improve the estimation that is more stable than the standard model and robust. This research aims to assess the application of spatial regression ensemble on poverty data in Java and examine the factors used as indicators of poverty in Java.
The data used in this study is the BPS poverty data in 2011. The area that is used in this study is the districts / city in the island of Java, which consists of 118 districts / cities. The results of the spatial effect test showed that of spatial autoregressive models and spatial error models can be used for spatial regression modeling. The model selection among classical regression model, spatial autoregressive model, and spatial error model is based on the values of the R . The larger R values, the better models. The spatial autoregressive model is better than spatial error model and linear regression. Furthermore, the ensemble technique is applied tospatial autoregressive models.
1.55, 1.57, 1.59, 1.61, 1.63, 1.65, 1.67, 1.69, 1.71 and 1.73. Each noise is simulated 100 times, and than we get 100 spatial autoregressive models. Ensemble technique is conducted by averaging the coefficients of 100 models. Based on the values of RMSE, ensemble spatial autoregressive model is better than spatial autoregressive model without ensemble technique.
The factors as indicators of poverty in Java are the literacy rate percentage of poor people aged 15-55 years, the percentage of poor people who work in the informal sector, and the percentage of households receiving public health insurance (Jamkesmas) card.
© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains
pada
Program Studi Statistika Terapan
APLIKASI ANALISIS REGRESI SPASIAL
ENSEMBLE
PADA
DATA KEMISKINAN DI PULAU JAWA
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2015
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala
atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Keberhasilan penulisan tesis ini tidak lepas dari bantuan, bimbingan, dan arahan dari berbagai pihak.
Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Hari Wijayanto, M.Si. dan Bapak Dr. Ir. Aji Hamim Wigena, M.Sc selaku pembimbing yang telah meluangkan waktu untuk memberikan bimbingan, arahan, dan saran kepada penulis dalam menyelesaikan tesis ini. Terimakasih untuk Bapak Dr. Ir. Budi Susetyo, MS selaku penguji tesis dan Ibu Dr. Ir. Indahwati, M.Si. selaku Ketua Program Studi Statistika Terapan S2. Disamping itu, penulis juga mengucapkan terimakasih kepada seluruh staf administrasi Rektorat dan staf Program Studi Statistika yang telah turut membantu kelancaran administrasi dalam penyelesaian tesis ini.
Ungkapkan terimakasih terkhusus penulis sampaikan kepada Bapak (Jamingan, S.Ag), Ibu (Bintari) dan adik (Ivana Hastuti, S.Pd), serta seluruh
keluarga atas do’a yang tulus, pengorbanan yang tak ternilai, dukungan dan
kasih sayangnya. Terimakasih juga untuk teman-teman Statistika (S1, S2, dan S3) dan Statistika Terapan (S2) atas bantuan, saran, dan ilmu yang positif.
Penulis menyadari sepenuhnya bahwa tesis ini masih banyak kekurangan dan jauh dari kesempurnaan. Oleh karena itu, penulis mengharapkan kritik dan saran yang bersifat membangun guna menyempurnakan tesis ini dan karya ilmiah secara utuh. Semoga tesis ini dapat menambah wawasan dan bermanfaat.
Bogor, Januari 2015
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
DAFTAR LAMPIRAN vi
PENDAHULUAN 1
Latar Belakang 1
Tujuan Penelitian 2
TINJAUAN PUSTAKA 3
Model Regresi Klasik 3
Matriks Pembobot Spasial 3
Indeks Moran 4
Model Regresi Spasial 5
Model Spasial Otoregresif 7
Model Galat Spasial 9
Teknik Ensemble 10
Kemiskinan 11
METODE PENELITIAN 11
Sumber Data 12
Metode Analisis 12
HASIL DAN PEMBAHASAN 16
Eksplorasi Data 16
Identifikasi Otokorelasi Spasial 17
Model Regresi Klasik 18
Uji Efek Spasial 20
Model Spasial Otoregresif 21
Model Galat Spasial 23
Model Regresi Spasial Ensemble 24
KESIMPULAN DAN SARAN 26
DAFTAR PUSTAKA 27
LAMPIRAN 28
DAFTAR TABEL
1. Nilai antar wilayah pada matriks pembobot spasial Queen 4
2. Standarisasi matriks pembobot spasial Queen 4
3. Peubah-peubah dalam penelitian 12
4. Pendugaan model regresi klasik 18
5. Hasil uji pengganda Lagrange pada model regresi spasial 20
6. Nilai dugaan model spasial otoregresif 21
7. Nilai dugaan model galat spasial 23
8. Model spasial otoregresif ensemble 25
9. Perbandingan nilai RMSE 26
DAFTAR GAMBAR
1. Ilustrasi gambar wilayah 3
2. Skema tahapan model regresi spasial 14
3. Skema tahapan model regresi spasial ensemble 15
4. Plot dataYdan data Y+noise 17
5. Plot pencaran Moran pada data persentase penduduk miskin. 18
6. Plot kenormalan sisaan model regresi linier 19
7. Plot kehomogenan sisaan model regresi linier 20 8. Plot kenormalan sisaan model spasial otoregresif 22 9. Plot kehomogenan sisaan model spasial otoregresif 22
10.Plot kenormalan sisaan model galat spasial 24
11.Plot kehomogenan sisaan model galat spasial 24
DAFTAR LAMPIRAN
1. Peta sebaran persentase penduduk miskin Pulau Jawa 28 2. Plot persentase kemiskinan berbagai ukuran σ dengan 100 ulangan
model spasial otoregresif 29
3. Sintaks pemograman model spasial otoregresif dan model galat
spasial 32
PENDAHULUAN
Latar Belakang
Kemiskinan di Indonesia hingga saat ini masih menjadi masalah yang belum sepenuhnya terselesaikan. Badan Pusat Statistik (BPS) tahun 2013 menunjukkan bahwa persentase penduduk miskin di Pulau Sumatera sebesar 11.53%, 10.98% di Pulau Jawa, 14.49% di Pulau Bali dan Nusa Tenggara, 6.66% di Pulau Kalimantan, 11.75% di Pulau Sulawesi serta 24.24% di Pulau Maluku dan Papua. Pulau Jawa merupakan pulau dengan persentase penduduk miskin terkecil kedua setelah Pulau Kalimantan, namun jumlah penduduk miskinnya terbesar di Indonesia. Jumlah penduduk miskin bulan September 2013 di Pulau Jawa mencapai 15.55 juta orang.
Kemiskinan didefinisikan sebagai kondisi dimana seseorang atau sekelompok orang, laki-laki dan perempuan, tidak terpenuhi hak-hak dasarnya untuk mempertahankan dan mengembangkan kehidupan yang bermartabat (BAPPENAS, 2004). Kemiskinan merupakan masalah kompleks yang dipengaruhi oleh faktor-faktor yang saling berkaitan satu dengan lainnya. Faktor tersebut antara lain tingkat pendapatan, pendidikan, kesehatan, akses barang dan jasa, lokasi geografis, serta kondisi lingkungan. Faktor-faktor ini juga dipengaruhi oleh kedekatan wilayah.
Pemodelan regresi untuk mengetahui faktor-faktor yang menjadi indikator kemiskinan yang dipengaruhi oleh aspek wilayah sangat penting. Berdasarkan hukum pertama tentang geografi yang dikemukakan oleh W Tobbler dalam Anselin (1988) yang berbunyi: “Segala sesuatu saling berhubungan satu dengan yang lainnya, tetapi sesuatu yang dekat lebih mempunyai pengaruh daripada sesuatu yang jauh”. Pada kasus kemiskinan misalnya wilayah yang berdekatan dengan kota besar cenderung memiliki tingkat kemiskinan yang rendah, sebaliknya wilayah yang berjauhan dengan kota besar cenderung memiliki tingkat kemiskinan yang tinggi. Hal ini karena interaksi antar dua wilayah berupa keterkaitan spasial. Keterkaitan spasial atau otokorelasi spasial dapat berakibat pendugaan yang tidak tepat karena asumsi keacakan galat tidak dipenuhi.
Permasalahan tersebut dapat diatasi dengan model regresi spasial. Model regresi spasial merupakan suatu analisis yang mengevaluasi hubungan antara satu peubah dengan beberapa peubah lain dengan memperhatikan pengaruh spasial. Model regresi spasial dibentuk dengan cara melibatkan efek spasial dan pembobotan dalam bentuk matriks. Beberapa model regresi spasial yaitu model umum regresi spasial, model spasial otoregresif dan model galat spasial. Model regresi spasial dapat diterapkan di berbagai bidang, antara lain kesehatan, sosial, klimatologi, hidrologi, dan lain-lain.
2
menambahkan noise. Regresi spasial ensemble merupakan suatu teknik untuk menggabungkan � model regresi spasial. Penggunaan model regresi spasial
ensemble diharapkan mampu meningkatkan kemampuan pendugaan menjadi lebih stabil dari suatu model standar serta model yang dihasilkan bersifat kekar.
Arisanti (2010) meneliti faktor-faktor yang berpengaruh terhadap kemiskinan di Jawa Timur dengan penelitian tersebut menggunakan model regresi spasial. Matriks pembobot yang digunakan adalah matriks pembobot spasial
Queen. Amelia (2012) mengidentifikasi peubah-peubah yang berpengaruh terhadap persentase kemiskinan kabupaten di Pulau Jawa dengan menggunakan pendekatan analisis regresi spasial yaitu model spasial otoregresif dan model galat spasial. Rohimah (2011) menganalisis faktor-faktor yang berpengaruh secara spasial dan non spasial terhadap jumlah penderita gizi buruk dengan menggunakan model SAR Poisson di Propinsi Jawa Timur.
Zhu (2008) menyatakan bahwa teknik ensemble menjadi salah satu teknik penting dalam peningkatan kemampuan prediksi dari berbagai model standar. Prinsip teknik ensemble adalah menggabungkan hasil estimasi dari banyak model menjadi satu buah estimasi akhir. Berbagai penelitian yang terkait dengan
ensemble diantaranya adalah Mevik et al. (2005) yang mencoba teknik ensemble
pada data dengan menambahkan noise sehingga dapat membuat partial least square regression (PLSR) menjadi kekar terhadap jenis noise yang ditambahkan. Friedmen dan Popescu (2008) melakukan studi simulasi dan mendapatkan bahwa teknik ensemble memberikan ketepatan dugaan yang umumnya lebih tinggi dibandingkan pohon tunggal. Berrocal et al. (2006) menyatakan bahwa ensemble Bayesian model averaging (EBMA) lebih unggul dan menunjukkan hasil yang lebih baik dibandingkan dengan Bayesian model averaging (BMA) dan
geostatistical output perturbation (GOP).
Metode yang akan digunakan dalam penelitian ini adalah regresi spasial
ensemble. Regresi spasial ensemble digunakan untuk mengkaji penerapan pada data kemiskinan di Pulau Jawa dan menelaah faktor-faktor yang dapat dijadikan indikator kemiskinan di Pulau Jawa. Data yang digunakan yaitu data kemiskinan BPS di Pulau Jawa tahun 2011. Teknik ensemble dilakukan dengan menambahkan
noise pada data persentase penduduk miskin. Data persentase penduduk miskin yang telah ditambahkan noise kemudian dimodelkan dengan menggunakan regresi spasial. Teknik penggabungan model dilakukan dengan merata-ratakan koefisien dari � model regresi spasial. Pada penelitian ini diharapkan mampu menghasilkan model bersifat kekar serta mampu menelaah faktor-faktor yang dijadikan indikator kemiskinan di Pulau Jawa.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Mengkaji penerapan regresi spasial ensemble pada data kemiskinan di Pulau Jawa
3
TINJAUAN PUSTAKA
Model Regresi Klasik
Model regresi klasik secara umum dapat dimodelkan dengan rumus sebagai berikut:
= � + � (2.1)
�~� , σ � (2.2)
Dengan merupakan vektor pengamatan peubah tak bebas berukuran n × 1, merupakan matriks peubah bebas berukuran n × (p+1) , � merupakan vektor koefisien regresi berukuran (p+1) × 1 dan � merupakan vektor galat berukuran n × 1.
Metode untuk menduga parameter � pada model regresi klasik menggunakan metode kuadrat terkecil adalah sebagai berikut:
�̂ = T − T
Asumsi yang harus dipenuhi model regresi klasik pada persamaan (2.1) adalah nilai harapan sisaan sama dengan nol atau E �� = dan ragam sisaan sama dengan konstanta ragam serta sisaan tidak berkorelasi satu dengan yang lainnya E(� , � ) = , i ≠ j atau cov(� , � ) = , i ≠ j, untuk i = , , … , n (Draper dan Smith 1992).
Matriks Pembobot Spasial
Matriks pembobot spasial merupakan matriks simetris dengan diagonal utama bernilai nol dan berisi hubungan ketetanggaan antar setiap pengamatan. Matriks pembobot spasial berukuran n × n , dengan n adalah jumlah pengamatan. Pada penelitian ini digunakan matriks pembobot spasial Queen yaitu wilayah yang berimpit ke arah kanan, kiri, atas, bawah serta diagonal didefinisikan sebagai wilayah yang berdekatan. Elemen-elemen dari matriks pembobot spasial Queen didasarkan pada hubungan ketetanggaan geografis w yaitu wilayah i dan j. Gambar 1 merupakan ilustrasi wilayah untuk membentuk matriks pembobot spasial Queen.
Gambar 1. Ilustrasi gambar wilayah
G
A B
F
D E
C
4
Berdasarkan aturan matriks pembobot spasial Queen, w = 1 jika antara dua wilayah bertetangga secara langsung dan w = 0 jika antara dua wilayah tidak saling bertetangga. Pemberian nilai pada wilayah yang berdekatan didasarkan pada kasus tertentu, misal pada kasus kemiskinan pemberian nilai antar wilayah memperhatikan adanya akses antar wilayah. Jika ada akses langsung antar wilayah yang berdekatan maka bernilai satu dan jika tidak ada akses langsung antar wilayah yang berdekatan maka bernilai nol. Selanjutnya, masing-masing baris pada matriks pembobot spasial Queen dijumlahkan. Baris dan kolom pada Tabel 1 menunjukkan hubungan antar wilayah pada matriks pembobot spasial Queen
sebagai berikut:
Tabel 1 Nilai antar wilayah pada matriks pembobot spasial Queen
A B C D E F G H I ∑ w
Proses standarisasi matriks pembobot spasial Queen dilakukan dengan cara membagi unit spasial dengan jumlah total dari masing-masing baris sehingga jika dijumlahkan untuk tiap baris sama dengan satu. Hasil standarisasi matriks pembobot spasial Queen ditunjukkan pada Tabel 2 sebagai berikut:
Tabel 2 Standarisasi matriks pembobot spasial Queen
A B C D E F G H I
5
I = n ∑ ∑≠ w −̅ ( −̅)
(∑ ∑≠ w ) ∑ −̅2
(2.3)
dengan n adalah banyak pengamatan, w adalah elemen matriks pembobot spasial, y adalah nilai pada lokasi ke i , y adalah nilai pada lokasi ke j dan y̅ adalah nilai rata-rata dari n lokasi.
Nilai pada indeks Moran sama dengan nilai pada korelasi yaitu antara -1 dan 1. Nilai indeks Moran bernilai nol mengindikasikan data tidak berkelompok, nilai indeks Moran yang positif mengindikasikan otokorelasi spasial yang positif dan nilai indeks Moran yang negatif mengindikasikan otokorelasi spasial yang negatif. Hipotesis pada uji indeks Moran sebagai berikut:
• H : I = ; Tidak terdapat otokorelasi spasial
• H : I > ; Terdapat otokorelasi spasial positif (wilayah yang berdekatan mirip dan cenderung bergerombol dalam suatu wilayah)
• H : I < ; Terdapat otokorelasi spasial negatif (wilayah yang berdekatan tidak mirip dan membentuk pola seperti papan catur)
Statistik uji indeks Moran merupakan hasil dari selisih antara nilai indeks Moran dengan nilai harapan indeks Moran terhadap akar nilai ragam indeks Moran
Z I =[I−E I ]√Va I (2.4) dengan Z I adalah nilai statistik uji indeks Moran, E I adalah nilai harapan indeks Moran dan V�r I adalah nilai ragam indeks Moran. Jika kondisi H benar statistik uji Z I pada persamaan 2.4 lebih besar dari Zα atau kurang dari −Zα maka keputusan menolak H pada taraf nyata α . Penolakan H pada α berarti terdapat otokorelasi spasial positif atau otokorelasi spasial negatif. Lee dan Wong (2001) menyebutkan bahwa plot pencaran Moran adalah salah satu cara untuk menginterpretasikan statistik indeks Moran. Plot pencaran Moran merupakan alat untuk melihat hubungan antara nilai pengamatan yang sudah distandarisasi dengan nilai rata-rata daerah tetangga yang telah distandarisasi.
Model Regresi Spasial
6
matriks pembobot spasial berukuran n × n, n merupakan banyaknya amatan atau lokasi dan k merupakan banyaknya peubah bebas.
Model yang dapat dibentuk dari persamaan (2.5) adalah sebagai berikut: 1. Jika ≠ dan λ = maka persamaan (2.5) menjadi model spasial
otoregresif.
2. Jika = 0 dan λ ≠ maka persamaan (2.5) menjadi model galat spasial. 3. Jika λ ≠ dan ≠ maka persamaan (2.5) menjadi model umum spasial. 4. Jika = 0 dan λ = 0 maka persamaan (2.5) menjadi model regresi linier
sederhana tanpa efek spasial.
Metode untuk menduga parameter model regresi spasial yaitu metode kemungkinan maksimum. Perhitungan dalam menduga parameter model regresi spasial menggunakan fungsi log kemungkinan dinotasikan dengan ℓ pada persamaan (2.6), dengan memisalkan A = � − dan B = � − λ fungsi log kemungkinan dapat dinyatakan sebagai berikut:
ℓ �, λ, , σ ; = −nln −nlnσ + ln|� − | + ln |� − λ | − ′ ′ ′ − �′ ′ ′σ2 + �′ ′ ′ � (2.6)
Persamaan (2.7) merupakan penduga � yang diperoleh dengan memaksimumkan fungsi log kemungkinan pada persamaan (2.6) yaitu
�̂ = ′ � − λ ′ � − λ − X′ � − λ ′ � − λ � − (2.7) Pemodelan regresi spasial membutuhkan identifikasi dengan melakukan uji efek spasial. Uji efek spasial dapat dibagi menjadi dua yaitu otokorelasi spasial dan keragaman spasial (Anselin 1988). Otokorelasi spasial terjadi akibat adanya ketergantungan pada data spasial. Keragaman spasial terjadi akibat adanya perbedaan antara satu wilayah dengan wilayah lain. Menguji adanya ketergantungan spasial dan keragaman spasial pada model regresi spasial sangat penting karena mengabaikan kedua uji tersebut akan menyebabkan penduga menjadi tidak efisien dan hasil yang diperoleh tidak tepat. Pada model spasial otoregresif dan model galat spasial uji ketergantungan yang digunakan adalah pengganda Lagrange.
Hipotesis yang diuji pada model spasial otoregresif adalah:
H : = dan H : ≠ (2.8)
dengan adalah parameter koefisien korelasi lag spasial. Hipotesis nol pada persamaan (2.8) menjelaskan tidak adanya ketergantungan lag spasial dan hipotesis satu menjelaskan adanya ketergantungan lag spasial. Statistik uji pengganda Lagrange dapat dinyatakan sebagai berikut:
L� = [�′ y �′� �⁄ ⁄ ] D⁄ (2.9) dengan
7
L� pada persamaan (2.10) akan mendekati sebaran χ dengan derajat bebas q. Dengan demikian keputusannya adalah menolak H pada α jika L� > χ . Penolakan H pada α berarti bahwa terdapat ketergantungan lag spasial.
Hipotesis yang diuji pada model galat spasial adalah:
H : λ = dan H : λ ≠ (2.11)
dengan λ adalah parameter koefisien korelasi galat spasial. Hipotesis nol pada persamaan (2.11) menjelaskan tidak adanya ketergantungan galat spasial dan hipotesis satu menjelaskan adanya ketergantungan galat spasial. Anselin (2009) menyatakan bahwa statistik uji pengganda Lagrange pada model galat spasial sebagai berikut:
L�λ =[�′ � (�⁄ ′� N⁄ )]2
t [ ′ + ]
(2.12)
dengan � adalah vektor galat dari model regresi klasik berukuran n × , tr adalah operasi teras matriks yang menyatakan jumlah elemen pada diagonal matriks, menyatakan matriks pembobot spasial berukuran n × n. Dibawah kondisi H benar, statistik uji L�λ pada persamaan (2.12) akan mendekati sebaran χ dengan derajat bebas q. Dengan demikian keputusannya adalah menolak H pada α, jika L�λ > χ . Penolakan H pada α berarti bahwa terdapat ketergantungan galat spasial.Uji efek spasial selanjutnya adalah uji keragaman spasial. Pada penelitian ini uji keragaman spasial menggunakan uji Breusch-Pagan (Anselin 1988). Hipotesis yang diuji adalah:
H : σ = σ = ⋯ = σn = σ dan H : minimal ada satu σ ≠ σ (2.13) dengan σ adalah ragam dari wilayah. Hipotesis nol pada persamaan 2.13 menjelaskan adanya keseragaman antar wilayah dan sebaliknya H menjelaskan adanya keragaman antar wilayah. Statistik uji keragaman spasial dapat ditulis dengan persamaan sebagai berikut:
Breusch-Pagan (BP) = � � − � ~χ (2.14) dengan elemen vektor h adalah:
= �σ −
ε adalah kuadrat galat untuk pengamatan ke-i dan z adalah vektor y berukuran n × yang sudah dinormal standarkan untuk setiap pengamatan. Dibawah kondisi H benar, statistik uji �P pada persamaan (2.14) akan mendekati sebaran χ dengan derajat bebas p. Dengan demikian keputusannya adalah menolak H pada α, jika �P> χ . Penolakan H pada α berarti bahwa terdapat keragaman antar wilayah.
Model Spasial Otoregresif
8
peubah bebas pada lokasi ke i. Bentuk persamaan model spasial otoregresif sebagai berikut (Anselin 1988):
= + � + � (2.15) �~� , σ �
dengan adalah vektor peubah tak bebas berukuran n × , adalah parameter koefisien korelasi spasial otoregresif, adalah matriks pembobot spasial berukuran n × n, � adalah vektor parameter koefisien regresi berukuran k +
× , adalah matriks peubah bebas berukuran n × k + dan � adalah vektor galat berukuran n × . Pada model spasial otoregresif galat pada lokasi i ε , diasumsikan nilai harapan sisaan sama dengan nol atau E ε = dan ragam sisaan sama dengan konstata ragam serta sisaan tidak berkorelasi satu dengan yang lainnya E(ε , ε ) = , i ≠ j atau cov(ε , ε ) = , i ≠ j. Pendugaan parameter � dilakukan dengan menggunakan pendekatan kemungkinan maksimum. Pada persamaan (2.15) � dapat dinyatakan sebagai berikut:
� = � − − � (2.16) Pada persamaan (2.16), ε diasumsikan menyebar normal, sehingga diperoleh fungsi kepekatan peluang bersama n peubah acak dari ε dengan i = 1, 2,…, n sebagai berikut:
f � = n⁄ σnexp − �σ′�
Hubungan � dan pada persamaan (2.16) diperoleh nilai Jacobian ∂ℇ
∂ = |� − |. Fungsi kepekatan peluang bersama dari n peubah tak bebas sebagai berikut: f = f � |∂ℇ
Selanjutnya, fungsi kemungkinan untuk peubah tak bebas adalah: L �, λ, , σ ; = n⁄
Penduga parameter diperoleh dengan memaksimalkan fungsi kemungkinan yang ekuivalen dengan memaksimumkan logaritma dari fungsi kemungkinan pada persamaan (2.17) sebagai berikut:
9
− ′ ′ − ′�σ′ + ′�′� . Pendugaan untuk β diperoleh dengan memaksimumkan fungsi log kemungkinan pada persamaan (2.18) sebagai berikut:
�̂ = ′ � − ′ −
Model Galat Spasial
Model galat spasial merupakan model regresi linier yang pada bentuk sisaannya terdapat korelasi spasial. Bentuk persamaan model galat spasial sebagai berikut:
= � + � (2.19) � = λ � + �
dengan, adalah vektor peubah tak bebas berukuran n × , λ adalah parameter koefisien korelasi spasial otoregresif, adalah matriks pembobot spasial berukuran n × n, � adalah vektor parameter koefisien regresi berukuran k +
× , adalah matriks peubah bebas berukuran n × k + , � adalah vektor galat yang diasumsikan mengandung otokorelasi berukuran n × dan � adalah vektor galat berukuran n × . Pendugaan parameter � dilakukan dengan menggunakan pendekatan kemungkinan maksimum.
� = � − λ �
= � + � − λ − �
� = − � � − λ (2.20) dengan memisalkan B = � − λ maka � = − � . Persamaan (2.20) ε diasumsikan menyebar normal, sehingga diperoleh fungsi kepekatan peluang bersama n peubah acak dari ε dengan i = 1, 2,…, n sebagai berikut:
f � = n⁄ σnexp − �σ′�
Hubungan � dan pada persamaan (2.20) diperoleh nilai Jacobian ∂ℇ
∂ = |� − λ |. Fungsi kepekatan peluang bersama dari n peubah tak bebas sebagai berikut:
f = f � | ∂�∂ |
f = n⁄
σnexp − �′�
σ |� − λ |
10
Penduga parameter diperoleh dengan memaksimalkan fungsi kemungkinan yang ekuivalen dengan memaksimalkan logaritma dari fungsi kemungkinan pada persamaan (2.21) sebagai berikut:
ℓ = L �, λ, , σ ; = −nln −nlnσ + ln|� − λ |
− �′ ′ � − �′ ′�σ′� + �′ ′�′� � . Pendugaan untuk β diperoleh dengan memaksimumkan fungsi log kemungkinan pada persamaan (2.22) sebagai berikut:
�̂ = ′ � − λ ′ � − λ ′ � − λ ′ � − λ −
Teknik Ensemble
Teknik ensemble adalah teknik untuk membangun sebuah model yang prediktif dengan cara menggabungkan beberapa model. Teknik ini tidak memilih satu model terbaik dari banyaknya kandidat model dan melakukan pendugaan dari model terbaik tersebut, namun menggabungkan hasil pendugaan dari berbagai model yang ada. Teknik ensemble dapat dilakukan dengan dua cara yaitu teknik
hybrid ensemble dan teknik non hybrid ensemble (De Bock et al. 2010). Teknik
hybrid ensemble bekerja dengan melibatkan berbagai algoritma pemodelan dan selanjutnya menggabungkan prediksi yang dihasilkan oleh masing-masing algoritma menjadi satu prediksi akhir. Sedangkan, teknik non hybrid ensemble
bekerja dengan satu algoritma dan digunakan berulang kali untuk mendapatkan banyak model yang berbeda dan selanjutnya dari prediksi model yang berbeda tersebut akan digabungkan menjadi satu. Penggunaan teknik ensemble diharapkan mampu untuk mendapatkan hasil prediksi yang lebih baik. Penelitian ini menggunakan teknik non hybrid ensemble dengan menggabungkan beberapa model regresi spasial. Model tunggal regresi spasial dihasilkan dengan cara menambahkan noise pada peubah tak bebas.
Noise adalah ganguan yang tidak beraturan pada data (Wu dan Huang 2005).
Additive noise dilakukan dengan membangkitkan �~� , σ . Simpangan baku yang digunakan adalah simpangan baku dengan nilai kecil dari nilai rentang data. Persamaan additive noise sebagai berikut:
� = + � (2.23) dengan � adalah vektor peubah tak bebas setelah ditambahkan noise, adalah vektor peubah tak bebas sebelum ditambahkan noise dan � ~� , σ .
Proses penggabungan dapat dilakukan dengan berbagai cara antara lain dengan rata-rata, rata-rata terboboti, voting dan lain-lain. Teknik penggabungan model regresi spasial dengan menggunakan rata-rata koefisien pada model. Teknik penggabungan dapat dimodelkan dengan persamaan sebagai berikut (Zhou 2012)
H x =
11
dengan H x adalah hasil gabungan dari rata-rata model, h x adalah model regresi spasial ke-i , f x adalah fungsi dari model regresi spasial, � adalah vektor galat dan T adalah banyaknya model.
Kemiskinan
BPS dalam mengukur kemiskinan menggunakan konsep kemampuan memenuhi kebutuhan dasar (basic needs approach). Menurut BPS kemiskinan didefinisikan sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan diukur dari sisi pengeluaran. Metode yang digunakan adalah menghitung garis kemiskinan (GK) yang terdiri dari dua komponen yaitu garis kemiskinan makanan (GKM) dan garis kemiskinan non makanan (GKNM). Jumlah penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran perkapita perbulan dibawah garis kemiskinan. GKM merupakan nilai pengeluaran kebutuhan minimum makanan yang disetarakan dengan 2100 kilokalori perkapita perhari. GKNM adalah kebutuhan minimum untuk perumahan, sandang, pendidikan, kesehatan dan kebutuhan dasar lainnya.
Berdasarkan tingkat konsumsi atau pengeluaran masyarakat, ukuran kemiskinan dibedakan menjadi (BPS,2013):
1. Head Count Indeks (P0): persentase penduduk miskin yang berada
dibawah garis kemiskinan.
2. Indeks kedalaman kemiskinan (P1) merupakan ukuran rata-rata
kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan.
3. Indeks keparahan kemiskinan (P2) memberikan gambaran mengenai
penyebaran pengeluaran diantara penduduk miskin.
P0, P1,dan P2 dapat dihitung menggunakan persamaan sebagai berikut:
Pα = n∑[z − y̅z ] α
=
dengan α = , ,
z = garis kemiskinan
y̅ = rata-rata pengeluaran perkapita penduduk yang berada dibawah garis kemiskinan (i = , ,3, … , q , y < q
12
METODE PENELITIAN
Sumber Data
Sumber data yang digunakan untuk menghitung kemiskinan di tingkat kabupaten/kota adalah survei sosial ekonomi nasional (Susenas) modul konsumsi triwulan I, II, III dan IV tahun 2011. Data diambil dari
http://www.bps.go.id/hasil_publikasi/kemiskinan_kabkot2011/indekx3.php.
Wilayah yang digunakan dalam penelitian ini adalah kabupaten/kota yang ada di Pulau Jawa yang terdiri dari 118 kabupaten/kota. Peubah tak bebas pada penelitian ini diperoleh dari Head Count Index (HCI-P0) yaitu persentase
penduduk yang berada di bawah garis kemiskinan (GK). Peubah bebas pada penelitian ini diperoleh dari informasi kemiskinan menurut BPS yang ditunjukkan pada Tabel 3.
Tabel 3 Peubah-peubah dalam penelitian
Peubah Definisi
Y Persentase penduduk miskin.
X1 Persentase kepala rumah tangga miskin usia 15 tahun ke atas dan
pendidikan yang ditamatkan SD/SLTP.
X2 Persentase angka melek huruf penduduk miskin usia 15-55 tahun.
X3 Persentase angka partisipasi sekolah penduduk miskin usia 7-12 tahun.
X4 Persentase angka partisipasi sekolah penduduk miskin usia 13-15 tahun.
X5 Persentase penduduk miskin usia 15 tahun keatas dan tidak bekerja.
X6 Persentase penduduk miskin yang bekerja di sektor informal.
X7 Persentase pengeluaran perkapita untuk makan.
X8 Persentase perempuan pengguna alat keluarga berencana (KB) di rumah
tangga miskin.
X9 Persentase perempuan yang persalinan pertamanya dibantu oleh tenaga
kesehatan di rumah tangga miskin.
X10 Persentase rumah yang memiliki luas lantai perkapita < 8m2.
X11 Persentase rumah tangga menggunakan air bersih.
X12 Persentase rumah tangga yang menggunakan jamban sendiri.
X13 Persentase rumah tangga penerima kartu jaminan kesehatan masyarakat
(Jamkesmas)
Metode Analisis
Langkah-langkah yang digunakan dalam penelitian ini adalah sebagai berikut dan secara garis besar diringkas pada Gambar 2 dan Gambar 3.
1. Melakukan eksplorasi data.
2. Menghitung matriks pembobot antar wilayah dengan menggunakan matriks spasial Queen.
3. Melakukan uji indeks Moran untuk mendeteksi awal adanya pengaruh spasial.
13
a. Membangkitkan �~� , σ .
b. Menambahkan noise pada data persentase penduduk miskin (Y) sehingga nilai data persentase penduduk miskin sesuai kisaran dari data persentase penduduk miskin yang sebenarnya, serta perubahan nilai data itu bersifat acak.
c. Mengganti nilai nol jika ada data persentase penduduk miskin yang sudah ditambahkan noise bernilai negatif.
5. Melakukan pemodelan regresi spasial sebagai berikut
a. Melakukan uji pengganda Lagrange untuk mengetahui adanya ketergantungan spasial.
b. Melakukan uji Breusch Pagan untuk mengetahui adanya keragaman spasial.
c. Melakukan pendugaan dan pengujian model regresi spasial. d. Mengukur kebaikan model regresi spasial dengan R-square.
6. Melakukan langkah ke-5 sebanyak k buah data persentase penduduk miskin.
7. Membuat model ensemble yang merupakan gabungan dari k buah model regresi spasial dengan menghitung rata-rata koefisien dari model tersebut. 8. Membandingkan model regresi spasial dan model regresi spasial ensemble
dengan mencari nilai RMSE terkecil.
9. Menginterpretasikan dan menyimpulkan hasil yang diperoleh.
14
Skema tahapan model regresi spasial
Gambar 2 Skema tahapan model regresi spasial
Pemilihan Model Terbaik (R2)
Model Regresi Klasik
Uji Indeks Moran
Uji Efek spasial
Uji ketergantungan spasial
Menambahkan noise pada data
Uji Keragaman spasial
H0: σ = σ
H1: minimal ada
σ ≠ σ
H0: =0, λ=0 H1: ≠0,λ≠0
Model Regresi Spasial
= + � + �
� = λ � + �
Terima H0
Tolak H0
Keragaman spasial
Terima H0 Keseragaman
spasial
Model = � + �
Menentukan Pembobot Spasial Queen
≠ 0,λ=0
SAR
= 0,λ≠0 SEM
≠0 ,λ≠ 0
15
Skema tahapan model regresi spasial ensemble
Gambar 3 Skema tahapan model regresi spasial ensemble
Melakukan prediksi model regresi spasial ensemble
Data peubah
Membangkitkan (�~� , σ ) dengan k ulangan
Additive noise ( � = + �)
� , � , … , �
Melakukan pemodelan regresi spasial
Model regresi spasial 1
Model regresi spasial 2
Model regresi spasial k
Teknik ensemble (merata-ratakan koefisien model regresi
16
HASIL DAN PEMBAHASAN
Eksplorasi Data
Eksplorasi data pada penelitian ini adalah eksplorasi penduduk miskin di Pulau Jawa dan eksplorasi pada peubah Y dengan noise. Eksplorasi penduduk miskin di Pulau Jawa digunakan untuk melihat jumlah dan persebaran penduduk miskin di Pulau Jawa. Eksplorasi pada peubah Y dengan noise digunakan untuk melihat karakteristik data peubah Y.
Eksplorasi penduduk miskin di Pulau Jawa
Pulau Jawa secara geografis terletak diantara selat Sunda dan Pulau Bali serta antara samudera Hindia dan laut Jawa, sedangkan secara astronomis Pulau
Jawa terletak antara 113°48 10 - 113°48 26 BT dan 7°50 10 - 7°56 41 LS.
Luas wilayah Pulau Jawa adalah 138.794 km2. Pulau Jawa terbagi menjadi enam
provinsi yaitu DKI Jakarta, provinsi Jawa Barat, provinsi Jawa Tengah, Daerah Istimewa Yogyakarta, provinsi Jawa Timur dan provinsi Banten. Jumlah penduduk miskin untuk masing-masing provinsi sebagai berikut: DKI Jakarta mencapai 375.700 jiwa, provinsi Jawa Barat mencapai 4.382.650 jiwa, provinsi Jawa Tengah mencapai 4.704.870 jiwa, Daerah Istimewa Yogyakarta mencapai 535.190 jiwa, provinsi Jawa Timur mencapai 4.865.820 jiwa dan provinsi Banten mencapai 682.710 jiwa (BPS 2013).
Berdasarkan jumlah penduduk miskin menunjukkan bahwa terdapat persebaran data yang berbeda. Kondisi ini dapat dilihat dari persebaran data persentase di setiap wilayah kabupaten/kota yang berbeda-beda. Penduduk miskin di Pulau Jawa memiliki keragaman tinggi. Keragaman persentase penduduk miskin yang terdapat di setiap provinsi sebagai berikut: DKI Jakarta 10.68%, Jawa Barat 15.23%, Jawa Tengah 23.78%, Daerah Istimewa Yogyakarta 43.86%, Jawa Timur 34.64% dan Banten 7.04%.
17
Eksplorasi pada peubah Y dengan noise
Pada data persentase penduduk miskin (peubah Y) akan ditambahkan dengan noise. Penambahan tersebut bertujuan agar keragaman pada peubah Y menjadi stabil. Data yang ditambahkan noise merupakan data simulasi, dan akan digunakan untuk teknik ensemble. Karakteristik data simulasi terhadap penambahan noise pada peubah Y dicobakan dengan berbagai simpangan baku σ . Penentuan simpangan baku dengan nilai kecil rentang data peubah Y dengan memperhatikan hasil uji efek spasial. Penggunaan additive noise bertujuan agar nilai peubah Y yang telah ditambahkan noise berada pada kisaran data peubah Y. Nilai σ yang dicobakan adalah 1.55, 1.57, 1.59, 1.61, 1.63, 1.65, 1.67, 1.69, 1.71 dan 1.73 menghasilkan pola data serupa dengan data peubah Y. Gambar 4 menunjukkan bahwa nilai σ menghasilkan fluktuasi yang serupa dengan data peubah Y.
18
Gambar 5 Plot pencaran Moran pada data persentase penduduk miskin Pada Gambar 5 terbagi menjadi 4 kuadran dan disetiap kuadran terdapat sebaran data dengan sumbu ZY adalah nilai rata-rata antar pengamatan yang sudah distandarisasi dan sumbu ZWY adalah nilai ZY yang dihitung menggunakan matriks W. Kuadran I dan III mengindikasikan adanya kesamaan karakteristik antar kabupaten/kota di Pulau Jawa kesamaan tersebut antara lain setiap kabupaten/kota yang memiliki persentase penduduk miskin tinggi akan membentuk satu kelompok kemudian kabupaten/kota yang memiliki persentase penduduk miskin rendah akan membentuk satu kelompok juga. Kuadran II dan IV mengindikasikan adanya keragaman karakteristik antar kabupaten/kota di Pulau Jawa.
Model Regresi Klasik OLS
Analisis model regresi digunakan untuk mengetahui hubungan antara peubah X dan peubah Y. Peubah X dan Y akan dimodelkan dengan regresi klasik OLS sebelum dimodelkan untuk regresi spasial. Pada model diperoleh hasil uji F sebesar 54.94 dengan p-value sebesar 0.00, hal ini menunjukkan bahwa peubah X berpengaruh secara simultan terhadap peubah Y dengan taraf nyata 0.05. Peubah X yang signifikan adalah X2 (persentase angka melek huruf penduduk miskin usia
15-55 tahun), X6 (persentase penduduk miskin yang bekerja disektor informal),
dan X13 (persentase rumah tangga penerima kartu Jamkesmas). Pendugaan model
regresi pada peubah Y terhadap peubah X ditunjukkan pada Tabel 4. Tabel 4 Pendugaan model regresi klasik
19
Persamaan model regresi klasik OLS peubah X2, X6 dan X13 dengan Y sebagai
berikut:
ŷ = 3 .3 − .3 X + . X + . X
Nilai koefisien determinasi sebesar 59.1% artinya dari keragaman persentase penduduk miskin dapat dijelaskan oleh model regresi OLS sebesar 59.1%. Interpretasi dari model regresi klasik menunjukkan bahwa setiap kenaikan 1 % angka melek huruf pada penduduk miskin usia 15-55 tahun (X2) akan
menurunkan persentase penduduk miskin sebesar 34.2%. Setiap kenaikan 1% penduduk miskin yang bekerja disektor informal (X6) akan meningkatkan
persentase penduduk miskin sebesar 18.25%. Selanjutnya, setiap kenaikan 1% rumah tangga penerima kartu Jamkesmas (X13) akan meningkatkan persentase
penduduk miskin sebesar 7.6%. Kemudian setalah mendapatkan model, diperiksa uji asumsi terhadap sisaan pada peubah Y. Uji asumsi pada model regresi klasik OLS adalah uji kenormalan, uji kehomogenan dan uji tidak terdapat korelasi pada sisaan.
a. Asumsi kenormalan
Asumsi kenormalan digunakan untuk menguji normalitas pada sisaan. Uji normalitas menggunakan uji Kolmogorov-Smirnov (KS) ditunjukkan pada Gambar 6. Statistik uji KS sebesar 0.05 dan nilai p-value lebih dari 0.15
Gambar 6 Plot kenormalan sisaan b. Asumsi tidak terdapat korelasi pada sisaan
20
c. Asumsi kehomogenan.
Uji kehomogenan dapat dilihat dari plot sisaannya. Asumsi kehomogenan terpenuhi jika plot sisaannya tidak membentuk suatu pola ditunjukkan pada Gambar 7.
Gambar 7 Plot kehomogenan sisaan Uji Efek Spasial
Uji efek spasial terdiri dari uji ketergantungan spasial dan uji keragaman spasial. Uji pengganda Lagrange (LM) digunakan untuk mendeteksi adanya ketergantungan lag spasial dan ketergantungan galat spasial. Uji Breusch Pagan
(BP) digunakan untuk mendeteksi adanya keragaman spasial. Hasil uji pengganda
Lagrange disajikan pada Tabel 5.
Tabel 5 Hasil uji pengganda Lagrange pada model regresi spasial Model Statistik Uji
Statistik uji LM akan mendekati χ dengan derajat bebas 1 dibawah kondisi H benar, sehingga keputusannya adalah menolak H pada α , jika L� > χ . Nilai statistik untuk model spasial otoregresif nilai dari LM sebesar 20.2051 dengan α = 0.05 dan nilai χ . , sebesar 3.84, sehingga keputusan dari hasil uji L� adalah tolak H . Penolakan H berarti bahwa terdapat ketergantungan lag spasial pada α = % . Selanjutnya, model galat spasial nilai dari LM sebesar 19.2339 dengan α = 0.05 dan nilai χ . , sebesar 3.84, sehingga keputusan dari hasil uji L� adalah tolak H . Penolakan H berarti bahwa terdapat ketergantungan galat spasial pada α = %.
21
benar, sehingga keputusannya adalah menolak H pada α , jika �P > χ . Nilai �P sebesar 8.3864 dengan α = 0.05 dan nilai χ . , sebesar 7.851 ,sehingga keputusan dari hasil uji �P adalah tolak H . Penolakan H berarti bahwa terdapat keragaman antar wilayah pada α = %. Hasil dari uji ketergantungan spasial dan uji keragaman spasial dapat mengidentifikasi adanya efek spasial dalam data sehingga model regresi yang digunakan adalah model regresi spasial.
Model Spasial Otoregresif
Uji pengganda Lagrange menunjukkan bahwa ada ketergantungan lag spasial sehingga perlu dilakukan pembentukan model spasial otoregresif yang melibatkan semua kabupaten/kota di Pulau Jawa. Pada model spasial otoregresif terdapat penduga rho sebesar 0.3789, artinya kabupaten/kota memiliki persentase penduduk miskin yang tinggi diduga dipengaruhi oleh kabupaten/kota yang ada disekelilingnya, yaitu sebesar 0.3789. Hasil dari nilai dugaan model spasial otoregresif ditunjukkan pada Tabel 6.
Tabel 6 Nilai dugaan model spasial otoregresif Peubah
penjelas
Penduga Galat baku Nilai Z Nilai peluang
Konstanta 21.8431 7.0828 3.0840 0.0020
X2 -0.2558 0.0687 3.7253 0.0001
X6 0.1431 0.0267 5.3556 0.0000
X13 0.0602 0.0170 3.5320 0.0004
Persamaan model spasial otoregresif pada peubah X2, X6, X13 dengan Y adalah:
ŷ = . 3 + .3 9Wy − . X + . 3 X + . X
Nilai koefisien determinasi pada model spasial otoregresif sebesar 64.1% menunjukkan keragaman persentase penduduk miskin di Pulau Jawa dapat dijelaskan dalam model sebesar 64.1%. Interpretasi dari model spasial otoregresif menunjukkan bahwa setiap kenaikan 1 % angka melek huruf pada penduduk miskin usia 15-55 tahun (X2) akan menurunkan persentase penduduk miskin
sebesar 25.6%. Setiap kenaikan 1 % penduduk miskin yang bekerja disektor informal (X6) akan meningkatkan persentase penduduk miskin sebesar 14.31%.
Selanjutnya, setiap kenaikan 1 % rumah tangga penerima kartu Jamkesmas (X13)
akan meningkatkan persentase penduduk miskin sebesar 6.02%. Nilai RMSE pada model spasial otoregresif sebesar 0.0005. Kemudian setalah mendapatkan model,
diperiksa uji asumsi terhadap sisaan pada peubah Y. Uji asumsi pada model spasial otoregresif adalah uji kenormalan, uji kehomogenan dan uji tidak terdapat korelasi pada sisaan.
a. Asumsi kenormalan
Asumsi kenormalan digunakan untuk menguji normalitas pada sisaan. Uji normalitas menggunakan uji Kolmogorov-Smirnov (KS) ditunjukkan pada Gambar 8. Statistik uji KS sebesar 0.05 dan nilai p-value lebih dari 0.15 sehingga keputusannya menolak H pada α =
22
Gambar 8 Plot kenormalan sisaan b. Asumsi tidak ada korelasi
Uji Durbin Watson digunakan untuk mengetahui tidak terdapatnya korelasi pada sisaan. Nilai uji statistik Durbin Watson sebesar 0.8427 dan α = . sehingga keputusannya menolak H pada α. Penolakan H berarti bahwa tidak ada korelasi pada sisaan.
c. Asumsi kehomogenan
Uji kehomogenan dapat dilihat dari plot sisaannya. Asumsi kehomogenan terpenuhi jika plot sisaannya tidak membentuk suatu pola ditunjukkan pada Gambar 9.
16
Gambar 9 Plot kehomogenan sisaan
23
Model Galat Spasial
Pada model galat spasial terdapat penduga lambda λ sebesar 0.4559 yang berarti terdapat pengaruh galat spasial antar satu kabupaten/kota dengan kabupaten/kota ada disekelilingnya, yaitu sebesar 0.4559. Hasil dari nilai dugaan model galat spasial ditunjukkan pada Tabel 7 sebagai berikut:
Tabel 7 Nilai dugaan model galat spasial Peubah
penjelas
Penduga Galat baku Nilai Z Nilai peluang
Konstanta 33.5524 7.8044 4.2992 0.0000
X2 -0.3329 0.0775 -4.2953 0.0000
X6 0.1653 0.0282 5.8585 0.0000
X13 0.0569 0.0192 2.9614 0.0031
Persamaan model galat spasial pada peubah X2, X6, X13 dengan Y adalah:
ŷ = 33. − .33 9X + . X + . 9X + . 9Wu
Nilai koefisien determinasi pada model galat spasial sebesar 59.7%, menunjukkan keragaman persentase penduduk miskin di Pulau Jawa dapat dijelaskan dalam model sebesar 59.7% . Interpretasi dari model galat spasial menunjukkan bahwa setiap kenaikan 1 % angka melek huruf penduduk miskin pada usia 15-55 tahun (X2) akan menurunkan persentase penduduk miskin sebesar
33.29%. Setiap kenaikan 1 % penduduk miskin yang bekerja disektor informal (X6) akan meningkatkan persentase penduduk miskin sebesar 16.54%.
Selanjutnya, setiap kenaikan 1 % rumah tangga penerima kartu Jamkesmas (X13)
akan meningkatkan persentase penduduk miskin sebesar 5.69%. Nilai RMSE pada model galat spasial sebesar 0.0036. Kemudian setalah mendapatkan model, diperiksa uji asumsi terhadap sisaan pada peubah Y. Pengujian asumsi pada model galat spasial adalah asumsi kenormalan sisan, asumsi kehomogenan sisaan dan asumsi tidak adanya korelasi sisaan sebagai berikut:
a. Asumsi tidak ada korelasi sisaan
Uji Durbin Watson digunakan untuk mengetahui tidak terdapatnya korelasi pada sisaan. Nilai uji statistik Durbin Watson sebesar 1.0343 dan α = . sehingga keputusannya menolak H pada α. Penolakan H berarti bahwa tidak ada korelasi pada sisaan.
b. Asumsi kenormalan
Asumsi kenormalan digunakan untuk menguji normalitas pada sisaan. Uji normalitas menggunakan uji Kolmogorov-Smirnov (KS) ditunjukkan pada Gambar 10. Statistik uji KS sebesar 0.05 dan nilai p-value lebih dari 0.15 sehingga keputusannya menolak H pada α =
24
Gambar 10 Plot kenormalan sisaan c. Asumsi kehomogenan
Uji kehomogenan dapat dilihat dari plot sisaannya. Asumsi kehomogenan terpenuhi jika plot sisaannya tidak membentuk suatu pola ditunjukkan pada Gambar 11.
25
Gambar 11 Plot kehomogenan sisaan
Model Regresi
S
pasial Ensemble25
yang dicobakan, mengindikasikan pola model sama. Plot peubah Y yang ditambahkan noise berada sekitar plot nilai data peubah Y. Masing-masing peubah Y yang ditambahkan noise dan peubah bebas X , X , X akan dilakukan uji efek spasial, selanjutnya dimodelkan dengan regresi spasial. Teknik ensemble
dilakukan pada model spasial otoregresif ditunjukkan pada Tabel 8. Tabel 8 Model spasial otoregresif ensemble Noise Model spasial otoregresif ensemble
ε~� , . ŷ = .9 + .3399Wy − . X + . 9X + . X
Model spasial otoregresif ensemble diperoleh dengan merata-ratakan koefisien parameter dari 100 model. Hasil dari model spasial otoregresif ensemble
untuk masing-masing noise mempunyai nilai koefisien parameter yang hampir sama. Kondisi ini menunjukkan bahwa penambahan noise dengan nilai simpangan baku kecil menyebabkan adanya perubahan yang tidak terlalu signifikan untuk nilai koefisien parameter dari masing-masing model spasial otoregresif ensemble. Berikut salah satu terapan dari model spasial otoregresif ensemble dengan noise
ε~� , . menghasilkan persamaan model spasial otoregresif ensemble
sebagai berikut:
ŷ = 3. 3 + .33 Wy − . X + . X + . X
Nilai penduga sebesar 0.3352 yang berarti kabupaten/kota yang memiliki persentase penduduk miskin yang tinggi diduga dipengaruhi oleh kabupaten/kota yang ada disekelilingnya sebesar 0.3352. Interpretasi dari model spasial otoregresif ensemble menunjukkan bahwa setiap kenaikan 1 % angka melek huruf penduduk miskin pada usia 15-55 tahun (X2) akan menurunkan persentase
penduduk miskin sebesar 26.51%. Kemudian, setiap kenaikan 1 % penduduk miskin yang bekerja di sektor informal (X6) akan meningkatkan persentase
penduduk miskin sebesar 14.84%. Selanjutnya, setiap kenaikan 1 % rumah tangga penerima kartu Jamkesmas (X13) akan meningkatkan persentase penduduk miskin
sebesar 6.06%.
Pemilihan model terbaik spasial otoregresif tanpa ensemble dan spasial otoregresif ensemble menggunakan kriteria nilai RMSE. Semakin kecil nilai RMSE semakin baik untuk suatu model. Berdasarkan Tabel 9 menunjukkan bahwa nilai RMSE model spasial otoregresif ensemble kurang dari nilai RMSE pada model spasial otoregresif tanpa ensemble, sehingga model spasial otoregresif
26
berdasarkan model spasial otoregresif ensemble adalah persentase angka melek huruf penduduk miskin usia 15-55 tahun, persentase penduduk miskin yang bekerja di sektor informal dan persentase rumah tangga penerima kartu Jamkesmas. Berdasarkan analisis model spasial otoregresif tanpa ensemble dan model spasial otoregresif ensemble diperoleh hasil pada Tabel 9.
Tabel 9 Perbandingan nilai RMSE
Model regresi Noise Nilai RMSE
Spasial otoregresif 0.0005
Spasial otoregresif ensemble ε~� , . 0.0004
ε~� , . 0.0003
ε~� , . 9 0.0002
ε~� , . 0.0001
ε~� , . 3 0.0000
ε~� , . 0.0000
ε~� , . 0.0001
ε~� , . 9 0.0002
ε~� , . 0.0003
ε~� , . 3 0.0004
KESIMPULAN DAN SARAN
Kesimpulan
Penambahan noise (additive noise) menunjukkan bahwa model regresi spasial otoregresif dengan teknik ensemble lebih baik daripada model regresi spasial otoregresif tanpa ensemble. Model spasial otoregresif ensemble dapat meningkatkan kemampuan pendugaan menjadi lebih stabil dan model yang dihasilkan bersifat kekar. Faktor-faktor yang yang dijadikan indikator kemiskinan di Pulau Jawa berdasarkan model spasial otoregresif ensemble adalah persentase angka melek huruf penduduk miskin usia 15-55 tahun, persentase penduduk miskin yang bekerja di sektor informal dan persentase rumah tangga penerima kartu Jamkesmas.
Saran
Penelitian ini menggunakan ensemble non hybrid dengan menambahkan
27
DAFTAR PUSTAKA
Anselin L. 1988. Spatial Econometrics: Method and Model. Dordrecht (NL): Kluwer Academic Publishers.
Anselin L. 2009. Spatial Regression. Fotheringham AS, PA Rogerson, editor, Handbook of Spatial Analysis. London (GB) : Sage Publications.
Amelia M. 2012. Penerapan Regresi Spasial untuk Data Kemiskinan Kabupaten di Pulau Jawa [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Arisanti R. 2010. Model Regresi Spasial untuk Deteksi Faktor-faktor Kemiskinan di Propinsi Jawa Timur [tesis]. Bogor: Program Pascasarjana. Institut Pertanian Bogor.
Bappenas. 2004. Strategi Penanggulangan Kemiskinan. Jakarta (ID) : Bappenas. Berrocal VJ, Raftery AE, Genaiting T. 2006. Combining spatial statistical and
ensemble information in probabilistic weather forecasts. Journal American
Meteorology society. (135).
[BPS] Badan Pusat Statistik. 2013. Jumlah Penduduk Miskin dan Persentase Penduduk Miskin di Indonesia. [Internet]. [diunduh 9 Januari 2014]. Tersedia pada : http://www.bps.go.id/getfile.php.
[BPS] Badan Pusat Statistik. 2013. Data dan Kemiskinan Kabupaten/Kota 2011. [Internet]. [diunduh 7 Januari 2014]. Tersedia pada :
http://www.bps.go.id/hasil_publikasi/kemiskinan_kabkot2011/indekx3.php. De Bock KW., Coussement K., Van den Poel D. 2010. Ensemble Classification
based on Generalized Additive Models. Computional Statistics & Data Analysis 54(6): 1535-1546.
Drapper N, Smith H. 1992. Analisis Regresi Terapan. Jakarta (ID): PT. Gramedia Pustaka Umum.
Friedman JH, Popescu BE. 2008. Predictive learning via rule ensemble. The Annals of Applied Statistics 2(3): 916-954.
Lee J , Wong SWD. 2001. Statistical Analysis with Arcview GIS. United Stated of America (US): John Wiley and Sons, Inc.
Mevik HB, Segtnan VH, Naes T. 2005. Ensemble methods and partial least squares regression. Journal of Chemometrics; 18(11).
Rohimah SR. 2011. Analisis Faktor-faktor yang Mempengaruhi Jumlah Penderita Gizi Buruk dengan Menggunakan model SAR Poisson [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor.
Ward MD, KS Gleditsch. 2008. Spatial Regression Model. California (US): Sage Publications.Inc.
Wu Z, Huang NE. 2005. Ensemble empirical mode decomposition: A noise assisted data analysis method. Advance in Adaptive Data Analysis. 1(1):1-41. Zhu M. 2008. Kernels and ensemble: Perspectives on statistical learning. The
28
29
Lampiran 2. Plot persentase kemiskinan dengan berbagai ukuran σ dengan 100 ulangan untuk model spasial otoregresif
32
(j) σ = . 3, n =
33
Lampiran 4 Sintaks pemograman model regresi spasial otoregresif ensemble
require(spdep)
bangkitan0<-rnorm(118, 0,1.55)
bangkitan<-cbind(bangkitan,bangkitan0) noise0<-kemiskinan+bangkitan0
noise0<-unclass(noise0)$Y
for(j in 1:length(noise0)){if(noise0[j] < 0) noise0[j] <-0} noise<-cbind(noise,noise0)
data<-data.frame(noise0,X) model0<-lm(noise0~.,data)
mod<-summary(model0)$coefficients model[i]<-list(mod)
#pvalue0<-summary(model0)$coefficients["X3","Pr(>|t|)"] #pvalue<-c(pvalue,pvalue0)
moran<-moran.test(data$noise0,mat2listw(bot))
LM<-lm.LMtests(model0,mat2listw(bot),test=c("LMerr", "LMlag")) pvaluelm[i]<-unclass(summary(LM))$results[2,3]
34
sar1<-lagsarlm(noise0~X2+X6+X13, data=data, mat2listw(bot)) sar[i]<-list(summary(sar1))
coef.sar[i,] <- t(coef(sar[[i]])) rho[i]<-unclass(summary(sar1))$rho
aic[i]<-unclass(summary(sar1))$AIC_lm.model p1<-predict(sar1,type="fitted")
p1[i]<-list(summary(p1)) print(p1<-predict(sar1)) }
35
RIWAYAT HIDUP
Penulis dilahirkan di Blora pada tanggal 18 Januari 1987 dari pasangan Bapak Jamingan, S. Ag dan Ibu Bintari. Penulis merupakan putri pertama dari dua bersaudara. Penulis menyelesaikan pendidikan Sekolah Lanjutan Tingkat Atas di
Madrasah Aliyah Mu’allimaat Yogyakarta pada tahun 2005 dan pada tahun yang