ENSEMBLE HYBRID
TERBOBOTI PADA MODEL
AUTOKORELASI SPASIAL UNTUK MEMPREDIKSI INDEKS
PEMBANGUNAN MANUSIA DI PULAU JAWA
SITTI MASYITAH MELIYANA R
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Ensemble Hybrid Terboboti pada Indeks Pembangunan Manusia di Pulau Jawa adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
RINGKASAN
SITTI MASYITAH MELIYANA R. Ensemble Hybrid Terboboti pada Model Autokorelasi Spasial untuk Memprediksi Indeks Pembangunan Manusia di Pulau Jawa. Dibimbing oleh HARI WIJAYANTO dan FARIT MOCHAMAD AFENDI. Analisis regresi adalah suatu metode stastistika yang menggambarkan hubungan antara peubah respon dan peubah penjelas. Pada saat hubungan yang terjadi tidak hanya pada peubah respon dan peubah penjelas namun terjadi hubungan antar observasi pada peubah respon. Salah satu penyebabnya dikarenakan observasi pada suatu lokasi memiliki pengaruh yang kuat dengan lokasi lain yang berdekatan. Kondisi tersebut dikenal dengan efek spasial yang dibagi kedalam dua bagian, yaitu auokorelasi spasial dan keragaman spasial (Anselin 1988). Model-model yang dapat mengatasi autokorelasi spasial yaitu Spatial Autoregressive Model (SAR), Spatial Error Model (SEM) dan General Spasial Model (GSM). SAR adalah model yang memuat informasi adanya ketergantungan observasi antar lokasi (autoregresi). SEM adalah model yang memuat informasi adanya autokorelasi error antar lokasi. Ketika informasi autoregresi dan autokorelasi error antar lokasi termuat dalam satu model, maka model ini disebut model GSM. Philip (2010) menyatakan bahwa GSM tidak banyak digunakan dalam praktek karena tidak terdapatnya panduan atau teori bila matriks pembobot yang digunakannya sama sehingga mengakibatkan masalah identifikasi.
Ensemble hadir sebagai teknik yang dapat menggabungkan satu atau beberapa model dan memberikan keakuratan prediksi yang lebih kuat. Ensemble non-hybrid dilakukan pada model SAR (ESAR). Ensemble non-hybrid juga dilakukan pada model SEM (ESEM). Ensemble hybrid pada SAR dan SEM atau pada model autokorelasi spasial (EAS). Melakukan Ensemble hybrid terboboti pada model autokorelasi spasial dengan pembobot proporsional (Wpro-EAS), pembobot regresi (Wreg-EAS) dan pembobot korelasi (Wcorr-EAS). Teknik ini diaplikasikan pada data Indeks Pembangunan Manusia (IPM) di 117 kabupaten/kota di Pulau Jawa sebagai observasinya.
Pendugaan terbaik dilakukan dengan memilih RMSEA yang terkecil dari beberapa metode pendugaan yang telah dilakukan. SAR memiliki nilai RMSEA sebesar 2.483, RMSEA dari SEM sebesar 1.978, RMSEA dari ESAR sebesar 2.482, RMSEA dari ESEM sebesar 1.975, RMSEA dari EAS sebesar 2.190, RMSEA dari Wpro-EAS sebesar 2.191, RMSEA Wreg-EAS sebesar 1.817, dan RMSEA dari Wcorr-EAS sebesar 15.539. Sehingga metode yang memiliki hasil prediksi terbaik adalah WregEAS dengan RMSEA sebesar 1.817.
SUMMARY
SITTI MASYITAH MELIYANA R. Weighted Ensemble Hybrid In Spatial
Autocorrelation Model’s for Predicting Human Development Index in Java. Supervised by HARI WIJAYANTO and FARIT MOCHAMAD AFENDI.
Regression analysis is a statistical method that describes the relationship between the response variable and the predictor variables. At the time of the relationship that occurs not only in the response variable and the explanatory variables, but there relationship between observations on the response variable. One of the reason is because observation at one location have a strong influence to other nearby locations. The condition known as spatial effects that divided into two parts, namely spatial autocorrelation and spatial diversity (Anselin 1988). The Models that can overcome spatial autocorrelation namely Spatial Autoregressive Model (SAR), Spatial Error Model (SEM) and General Spatial Model (GSM). SAR is a model that contains information existance of observation dependence between locations (autoregressive). SEM is a model that contains information exisance of error autocorrelation between locations. When information of autoregressive and error autocorrelation between locations contained in one model, then the model is called the GSM model. Philip (2010) states that GSM is not widely used in practice due to the absence of guidelines or theory if using similar weighting matrix with the result that affect identification problem.
Ensemble present as a technique that can combine one or several models and provide a stronger prediction accuracy. Non Hybryd Ensemble performed in SAR model (ESAR). Non-hybrid ensemble also performed in SEM model (ESEM). Ensemble hybrid in SAR and SEM or in spatial autocorrelation model (EAS). Do Weighed ensemble hybrid in spatial autocorrelation models with proportional weighted (WPRO-EAS), a regression weighted (Wreg-EAS) and the correlation weighted (Wcorr-EAS). This technique was applied to the data of Human Development Index (HDI) in 117 districts / cities in Java Island as the observation. The best estimation is done by selecting the smallest RMSEA of several estimation methods that has been done. SAR has a RMSEA value is 2.483, RMSEA of SEM as 1.978, RMSEA of ESAR is 2.482, RMSEA of ESEM is 1.975, RMSEA of EAS is 2.190, RMSEA of WPRO-EAS is 2.191, RMSEA Wreg-EAS is 1.817, and RMSEA of Wcorr -EAS is 15.539. Such that the method has the best predictive results is WregEAS with RMSEA of 1.817.
© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains
pada
Program Studi Statistika Terapan
ENSEMBLE HYBRID
TERBOBOTI PADA MODEL
AUTOKORELASI SPASIAL UNTUK MEMPREDIKSI INDEKS
PEMBANGUNAN MANUSIA DI PULAU JAWA
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2015
Judul Tesis : Ensemble Hybrid Terboboti pada Model Autokorelasi Spasial untuk Memprediksi Indeks Pembangunan Manusia di Pulau Jawa
Nama : Sitti Masyitah Meliyana R NIM : G152120071
Disetujui oleh Komisi Pembimbing
Dr Ir Hari Wijayanto, MSi Ketua
Dr Farit Mochamad Afendi, MSi Anggota
Diketahui oleh
Ketua Program Studi Statistika Terapan
Dr Ir Indahwati, MSi
Dekan Sekolah Pascasarjana
Dr Ir Dahrul Syah, MScAgr
PRAKATA
Bismillahirrohmanirrohim.
Puji dan syukur dipanjatkan kehadirat Allah subhanahu wa ta’ala atas limpahan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga tetap tercurah kepada junjungan kita Nabi
besar Muhammad Shalallahu ‘Alaihi Wassallam beserta keluarga Beliau, para
Shahabat, para tabi’in, tabi’ut tabi’in dan para penerus perjuangan Beliau hingga
akhir zaman. Karya ilmiah ini berjudul “Ensemble Hybrid Terboboti pada Model Autokorelasi Spasial untuk Memprediksi Indeks Pembangunan Manusia di Pulau
Jawa”.
Keberhasilan penulisan karya ilmiah ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai pihak. Oleh karena itu, penulis menyampaikan penghargaan dari ucapan terima kasih yang sebesar-besarnya khususnya kepada:
1. Bapak Dr Ir Hari Wijayanto, MSi selaku pembimbing I dan Bapak Dr Farit Mochamad Afendi, MSi selaku pembimbing II yang dengan penuh kesabaran telah memberikan bimbingan, arahan dan motivasi kepada penulis selama penyusunan karya ilmiah ini.
2. Bapak Dr Ir Muhammad Nur Aidi, MS selaku penguji luar komisi yang telah banyak memberikan kritikan, masukan, dan arahan yang sangat membangun dalam penyusunan karya ilmiah ini.
3. Seluruh staf pengajar pascasarjana Departemen Statistika IPB yang telah banyak memberikan ilmu dan arahan selama perkuliahan.
4. Kedua orangtua, Ayahanda Rustam Simanjuntak dan Ibunda Emmi, yang telah banyak memberikan dukungan moril, materi, doa dan kasih sayang yang tulus. 5. Adik-adikku tercinta Iqbal Muzaddaq R dan Sitti Nailah Rustam, dan seluruh keluarga besar atas dukungan semangatnya serta doa yang tak henti-hentinya. 6. Teman-teman seperjuangan, Wirnancy Juliasari, Sitti Sahriman, dan Ade Ayu
Putrigati terima kasih atas perhatian, bantuan, kerjasama, dan kekompakannya. 7. Tetangga kayak gini, Annisa Ristiana, Bunga Anggraeni, Nining Erlina Fitri, Fahrunnisa dan Yulia Puspita Sari yang telah memberikan semangat, nasehat
dan do’a, semoga kita tetap bertetangga di surga-Nya Allah kelak Aamiin. 8. Teman-teman Dubels yang selalu memberi keceriaan walaupun berada jauh
disana, terkhusus kepada Fahrul Basir yang telah memberikan banyak bantuan. 9. Seluruh pihak yang namanya tidak dapat disebutkan satu per satu, terima kasih. Atas segala bantuan yang diberikan, penulis hanya bisa berdoa dengan harapan semoga semua kebaikan yang penuh keikhlasan tersebut dicatat sebagai amal ibadah dan mendapatkan balasan berupa pahala di sisi Allah Subhanahu wa
ta’ala, Aamiin Ya Rabbal Alamin. Penulis menyadari bahwa masih banyak terdapat
kekurangan dalam penulisan karya ilmiah ini. Namun, penulis berharap karya ilmiah ini dapat bermanfaat bagi berbagai pihak yang membutuhkan.
Wassalam.
DAFTAR ISI
DAFTAR TABEL
1 Estimasi parameter regresi MKT 18
2 Komposisi posisi provinsi dalam plot pencaran Moran 20
3 Uji Lagrange Multiplier 20
4 Estimasi Parameter SAR 21
5 Estimasi Parameter SEM 22
6 RMSEA setiap metode pendugaan 26
DAFTAR GAMBAR
1 Boxplot Indeks Pembangunan Manusia 16
2 Peta Indeks Pembangunan Manusia di Pulau Jawa 16 3 Plot hubungan tiap peubah penjelas dengan IPM 17
4 Plot Residual untuk Y 18
5 Plot pencaran Moran Indeks Pembangunan Manusia 19
6 Plot data Y dan plot data Y+noise 23
DAFTAR LAMPIRAN
1 Kode Kabupaten 32
2 Pembagian kabupaten beradasakan kategori Quantile-nya 33 3 Pembagian kabupaten berdasakan kuadran pencaran Moran 34 4 Perbandingan Y dengan hasil prediksi SAR dan SEM 35 5 Perbandingan Y aktual dengan hasil prediksi ESAR dan ESEM 36 6 Perbandingan Y aktual dengan hasil prediksi dari EAS 37 7 Perbandingan nilai Y dengan hasil prediksi ensemble terboboti 38 8 Nilai pembobot yang digunakan untuk setiap jenis pembobotan. 39
1
PENDAHULUAN
Latar Belakang
Analisis regresi merupakan metode statistika yang digunakan untuk menggambarkan hubungan antara peubah respon dan peubah penjelas. Model yang dihasilkan disebut model regresi. Dengan model itu, kita berusaha memahami, menerangkan, mengendalikan dan kemudian memprediksi perilaku data. Model juga menolong peneliti dalam menentukan hubungan sebab akibat antara dua atau lebih peubah.
Permasalahan muncul ketika model yang terbentuk mengalami pelanggaran asumsi yang berkenaan dengan masalah error yang berkorelasi dan masalah heterogenitas pada error. Misalnya saja dikarenakan pengamatan pada suatu lokasi memiliki hubungan yang kuat dengan lokasi lain yang berdekatan. Kondisi tersebut dikenal dengan efek spasial, yang dapat dibagi kedalam 2 bagian, yaitu autokorelasi spasial dan keragaman spasial (Anselin 1988). Adanya efek spasial tidak bisa diabaikan dalam pendugaan model. Bila mengabaikan informasi adanya efek spasial pada data, maka pengamatan menghasilkan kesimpulan yang berbeda sehingga model yang terbentuk menjadi tidak layak (LeSage 1997). Griffith (2000) juga menunjukkan dalam penelitiannya bahwa pemodelan dengan cara klasik akan terganggu dengan adanya autokorelasi spasial sehingga pemodelannya tidak bisa digunakan. Oleh karena itu, diperlukan suatu model yang dapat memperhatikan efek dari autokorelasi spasial. Model ini disebut dengan model autokorelasi spasial yang dikembangkan dari analisis regresi spasial. Model-model yang terbentuk yakni Spatial Auto-Regressive Model (SAR), Spatial Error Model (SEM) dan General Spatial Model (GSM).
SAR adalah model yang memuat informasi adanya ketergantungan observasi (autoregresi) antar lokasi. SEM adalah model yang memuat informasi adanya autokorelasi error antar lokasi. McMillen (1992) menjelaskan bahwa metode SAR dan SEM lebih tepat digunakan dalam model yang mempunyai autokorelasi spasial. Ketika informasi autoregresi dan autokorelasi error antar lokasi termuat dalam satu model, maka model ini disebut model GSM. Oleh karena itu GSM dikenal sebagai penggabungan SAR dan SEM. Philip (2010) menyatakan bahwa GSM tidak banyak digunakan dalam praktek karena tidak terdapatnya panduan atau teori bila matriks pembobot yang digunakan sama (W = W1 = W2) yang mengakibatkan masalah identifikasi. Sehingga peneliti menyarankan menggunakan Teknik ensemble untuk menggabungkan informasi autoregresi dan autokorelasi error, yang akan disebut dengan ensemble autokorelasi spasial.
2
model, kemudian melakukan prediksi dari model terbaik yang terpilih tersebut. Terdapat dua jenis teknik ensemble yaitu hybrid dan non-hybrid (De Bock et al. 2010). Penggunaan teknik ensemble hybrid ialah menggunakan berbagai metode pemodelan dan selanjutnya menggabungkan prediksi yang dihasilkan oleh masing-masing metode menjadi satu prediksi akhir. Sedangkan teknik ensemble non-hybrid bekerja dengan satu jenis metode namun menggunakannya berkali-kali untuk menghasilkan banyak model yang berbeda, dan selanjutnya hasil prediksi dari model-model tersebut digabungkan menjadi satu prediksi akhir.
Salah satu kasus yang dipengaruhi oleh kedekatan wilayah adalah Indeks Pembangunan Manusia (IPM). Beberapa faktor yang mempengaruhi tinggi rendahnya IPM adalah tingkat pendapatan, pendidikan dan kesehatan. Dimana faktor-faktor ini juga dipengaruhi oleh kedekatan wilayah. Pada kasus IPM, suatu wilayah yang berdekatan dengan kota besar cenderung memiliki nilai IPM yang tinggi, sebaliknya wilayah yang berjauhan dengan kota besar cenderung memiliki nilai IPM yang rendah. Hal ini karena antar dua wilayah terjadi interaksi keterkaitan spasial. Sehingga data dalam penelitian ini menggunakan data IPM BPS di tahun 2012 di 117 kabupaten/kota di pulau jawa.
Beberapa penelitian tentang ensemble ialah Fransiska (2014) menggunakan teknik ensemble hybrid untuk metode dekomposisi ensemble dalam memprediksi harga beras DKI Jakarta untuk data time series. Rohmawati (2015) menggunakam teknik ensemble non-hybrid untuk aplikasi analisis regresi spasial pada data kemiskinan di pulau jawa. Penelitian sebelumnya belum menggunakan weighted averaging dalam ensemble guna mendapatkan hasil prediksi yang lebih baik. Oleh karena itu, penelitian ini akan menggunakan ensemble hybrid dengan pembobotan pada model-model autokorelasi spasial.
Tujuan Penelitian
3
2
TINJAUAN PUSTAKA
Indeks Pembangunan Manusia
Indeks Pembangunan Manusia (IPM) mengukur pencapaian pembangunan manusia berbasis sejumlah komponen dasar kualitas hidup. Menurut departemen dalam negeri, IPM digunakan sebagai alat untuk mengukur tingkat keberhasilan dalam pelaksanaan otonomi dan pembangunan daerah. IPM juga digunakan untuk mengukur tingkat keberhasilan pembangunan sehingga dapat mengklasifikasikan sebuah negara adalah negara maju, negara berkembang ataukah negara terbelakang. Selain itu, IPM juga dapat mengukur pengaruh kebijakan ekonomi terhadap kualitas hidup. IPM dibangun melalui pendekatan tiga dimensi dasar, yaitu dimensi umur panjang dan sehat, pengetahuan, dan kehidupan yang layak (BPS 2008). Informasi tentang IPM diperlukan untuk menetapkan prioritas pembangunan di setiap daerah-daerah di Indonesia.
Model Regresi Klasik
Persamaan regresi yang terdiri atas satu peubah respon dan satu peubah penjelas disebut regresi sederhana, sedangkan persamaan regresi dengan beberapa peubah penjelas dan satu peubah respon disebut regresi berganda (Walpole & Myers 1995). Hubungan antara peubah tersebut bila dimodelkan dalam bentuk matriks, maka bentuk persamaannya:
� = � + � � ~ , � �
Dimana y adalah vektor peubah respon, X adalah matriks peubah penjelas, � adalah vektor koefisien, dan � adalah vektor error. Pendugaan parameter � pada model regresi klasik menggunakan metode kuadrat terkecil (MKT). Penduga parameter � adalah:
�̂ = ′ − ′�
Asumsi-asumsi dalam regresi berganda yang harus dipenuhi adalah: 1. Error menyebar normal
4
Autokorelasi Spasial
Autokorelasi spasial adalah pembeda antara model regresi umum dan model regresi spasial. Hal ini terjadi akibat adanya ketergantungan dalam data lokasi. Indeks global Moran adalah suatu statistik yang sering digunakan dalam mendeteksi autokorelasi spasial. Statistik Moran’s I adalah ukuran korelasi antara pengamatan
pada suatu lokasi dengan lokasi lain yang berdekatan. Moran’s I dapat diperoleh
melalui persamaan berikut:
I = [∑ ∑n nn ] [∑ ∑ wn n ∑ x − x̅n x − x̅ (x − x̅)]
dengan n adalah banyaknya pengamatan, x̅ adalah nilai rata-rata dari x sebanyak n lokasi, x merupakan nilai pada lokasi ke-i, x adalah nilai pada lokasi ke-j, dan w adalah elemen matriks pembobot spasial. Nilai dari statistik I merupakan koefisien korelasi yang berkisar antara -1 sampai 1. Nilai mendekati 1 atau -1 berarti memiliki korelasi yang tinggi. Sedangkan mendekati nilai 0 berarti tidak ada korelasi.
Statistik lokal Moran berguna untuk pendeteksian hotspot/coldspot pada data area diskrit. Selain itu, jika ada pengelompokan dari beberapa hotspot/coldspot akan teridentifikasi sebagai gerombol lokal (local cluster). Local Moran dengan pembobot matriks contiguity didefinisikan sebagai berikut:
I = z ∑ w z
dengan, w = c
∑ c dan z = y − y̅ (y − y̅). z adalah nilai hasil
standarisasi dari peubah respon yang diamati pada lokasi ke-i, dan z adalah nilai hasil standarisasi dari peubah respon yang diamati pada lokasi ke-i dan lokasi ke-j. Sementara y merupakan nilai pengamatan pada lokasi ke-i ,y adalah nilai pengamatan pada lokasi lain ke-j, y̅ adalah nilai rataan dari peubah respon, dan w adalah ukuran pembobot antara wilayah ke-i dan wilayah ke-j, serta � merupakan nilai kolom ke-i dan ke-j .
Pengujian hipotesis Indeks Global Moran dan Local Moran dilakukan untuk menguji adanya autokorelasi spasial baik positif ataupun negatif dan merupakan suatu pengujian satu arah. Bentuk hipotesis awal (H0) adalah H0: I = 0 ,Tidak terdapat autokorelasi spasial. Sementara bentuk hipotesis alternatifnya (H1) ada dua jenis (positif atau negatif).
H1 : I > 0 ; Terdapat autokorelasi spasial positif. Artinya area yang berdekatan mirip dan cenderung bergerombol dalam suatu area.
H1 : I < 0 ; Terdapat autokorelasi spasial negatif. Artinya area yang berdekatan tidak mirip dan membentuk pola visual seperti papan catur.
Statistik uji dinyatakan pada persamaan (Lee & Wong 2001) : ℎ � = ��−��
√ �� ��
5 Model Regresi Spasial
Hukum pertama tentang geografi dikemukakan oleh W. Tobler dalam
Anselin (1988), yang berbunyi “Segala sesuatu saling berhubungan satu dengan
yang lainnya, tetapi sesuatu yang dekat lebih mempunyai pengaruh daripada
sesuatu yang jauh”. GSM merupakan Model regresi spasial dikembangkan oleh Anselin (1988), dengan formula sebagai berikut:
� = ρ � + � + (2) peubah respon, � adalah parameter koefisien spasial lag error, � dan � vektor error berukuran × , dan adalah matriks pembobot berukuran × ,
Asumsi pada regresi spasial sama halnya dengan asumsi pada model regresi klasik. Asumsi tersebut adalah asumsi kehomogenan, kenormalan, dan tidak ada autokorelasi dari galat. Pendugaan parameter pada model GSM diperoleh dengan metode penduga kemungkinan maksimum (Anselin 1988).
Dari persamaan (2) dapat dinyatakan dalam bentuk � − � = � + � atau
� − � = � + � (4)
Dan dari persamaan (3) dapat dinyatakan dalam bentuk � − � � = � atau
� = � − � − � (5)
Persamaan (4) disubstitusi ke persamaan (5) diperoleh � − � = � + � − � − �
6
Jika semua ruas dikalikan dengan � − � , maka
� = � − � [ � − � − �] (6) Nilai fungsi kemungkinan peubah � adalah
� ; � = � | |− / exp [− � − �] (7)
dengan V adalah matriks ragam koragam dari ε. Bila diasumsikan = � �, | | = � |�| = � . Kebalikan dari matriks ragam koragam dari − = �− �. Dengan mensubstitusikan nilai | | dan − pada persamaan (7) maka diperoleh
� ; � = � � − / exp [−
� � �] (8)
Dari hubungan ε dan y pada persamaan (6), didapatkan nilai Jacobian = |����| = |� − � ||� − |
Dengan mensubstitusikan persamaan (6) ke dalam persamaan (8) diperoleh fungsi kemungkinan untuk � yaitu:
, �, � , � ; � = � � − / |� − � ||� − | [−
� { � −
� [ � − � − �]} { � − � [ � − � − �]}] dan fungsi log kemungkinan (log-likelihood) yaitu:
, �, � , � ; � = � − � + |� − � | + |� − | − � { � − � [ � − � − �]} { � − � [ � − � − �]} (9)
Misalkan kuadrat matriks pembobot � − � − dinotasikan sebagai � dan penduga � diperoleh dengan memaksimalkan fungsi log kemungkinan pada persamaan (9). Penduga � adalah
� ̂ = � − � � − � �
Matriks Pembobot Spasial
7 adalah × . Tiga tipe dari matriks autokorelasi spasial menurut Dubin (2009) adalah sebagai berikut:
1. Benteng Catur
Konsep persinggungan ini memberikan nilai 1 untuk lokasi yang bersisian langsung di utara, selatan, barat, dan timur sedangkan 0 untuk lainnya.
2. Gajah Catur
Konsep persinggungan ini mendefinisikan nilai 1 untuk lokasi yang bersinggungan sudut dari lokasi yang sedang diamati sedangkan 0 untuk lainnya. 3. Ratu Catur
Konsep persinggungan ini mendefinisikan nilai 1 untuk daerah yang persinggungan sisi dan sudutnya bertemu dengan daerah yang sedang diamati sedangkan nilai 0 untuk lainnya.
Setelah menentukan matriks pembobot spasial yang akan digunakan, selanjutnya dilakukan normalisasi pada matriks pembobot spasial tersebut. Normalisasi pada matriks pembobot spasial yang biasa digunakan adalah normalisasi baris (row-normalize). Artinya bahwa matriks tersebut ditransformasi sehingga jumlah dari masing-masing baris matriks menjadi sama dengan satu (Dubin 2009).
Spatial Autoregressive Model
SAR merupakan model regresi linier yang pada peubah responnya terdapat korelasi spasial. Model ini dinamakan campuran autoregresi dengan regresi karena mengkombinasikan regresi biasa dengan model regresi spasial lag pada peubah respon (Anselin 1988). Model umum SAR dibentuk dari persamaan (2) dengan ρ
≠ 0 dan λ = 0, maka persamaannya menjadi:
� = � + � + � � ~ , � �
SAR digunakan apabila terdapat autokorelasi peubah respon antar lokasi.
Moran’s I tidak bisa membedakan jenis autokorelasi pada error ataupun dalam
8
H0 ditolak jika �� > � atau p-value < . Jika parameter signifikan, maka dilanjutkan pada pembentukan model SAR.
Pendugaan parameter pada model SAR menggunakan metode kemungkinan maksimum. Pada persamaan (2), � diasumsikan menyebar normal, bebas stokastik, identik, dengan nilai tengah nol dan ragam � , � adalah galat pada lokasi ke-i. Bila diasumsikan fungsi kepekatan peluang dari �
� =
�√exp [−
��]
; −∞ < � < ∞, = , , ,Fungsi kepekatan bersama peubah respon � diperoleh dengan metode transformasi peubah yang memetakan ruang ε berdimensi n ke sebuah ruang � berdimensi n. Dari persamaan (2) diperoleh
� = � − � − � � = � – � − �
Jacobian dari transformasi ini adalah ��
��= | � – |, yang menyatakan determinan
dari matriks � − yang berukuran . Sehingga diperoleh fungsi kepekatan peluang bersama dari peubah respon �
� = � | |
= �/
��
[−
�− �− � � �− �− �
�
] |� −
|
Fungsi kemungkinan bagi parameter �, , � �, , � ; � = � ; �, , � kemungkinan yang ekivalen dengan memaksimalkan logaritma dari fungsi kemungkinan pada persamaan (11)
= |�−�/ �|�
[−
�− �− � �� �− �− �]
9 Untuk mendapatkan penduga untuk � dan � , fungsi log kemungkinan akan bernilai maksimum ketika suku terakhir dari persamaan (12) bernilai minimum. Sehingga pendugaan untuk �,
�̂ = − � – − ̂ � (13)
Pendugaan untuk � sebagai berikut:
�̂ =
(�−̂ �− �̂)��(�−̂ �− �̂) (14)dengan �i adalah peubah respon pada lokasi , �̂� adalah nilai penduga peubah respon pada lokasi I dan n adalah banyak pengamatan. Sedangkan pendugaan untuk
sebagai berikut:
̂ = �′ ′ � − �′� (15)
Spasial Error Model
SEM adalah model regresi linier yang pada peubah errornya terdapat korelasi spasial. Hal ini disebabkan oleh adanya peubah penjelas yang tidak dilibatkan dalam model regresi linier sehingga akan dihitung sebagai error dan peubah tersebut berkorelasi spasial dengan galat pada lokasi lain. SEM dibentuk dari persamaan (2) dengan ρ = 0 dan λ ≠ 0, maka persamaannya:
� = � + � � + �
dengan � diasumsikan menyebar normal dengan � = , ��′ = � �
SEM terjadi akibat adanya autokorelasi antara nilai error pada suatu lokasi dengan nilai error di lokasi lain. Hipotesis statistik LM untuk menguji dilanjutkan pada pembentukan model SEM. Adapun penduga parameter model dilakukan dengan melakukan operasi matriks dari persamaan (16) sehingga diperoleh:
� = � � + � � − � � = �
10
Persamaan (16) disebut bentuk tereduksi dari model galat spasial. Fungsi kepekatan peluang dari εi transformasi peubah dari model galat spasial yang memetakan ruang � berdimensi n kesebuah ruang y berdimensi n. dari persamaan (16) diperoleh
� = �– � � = �– � �
sehingga
� = �– � �– �
Jacobian dari transformasi ini adalah |� − � | yang menyatakan determinan dari matrik yang berukuran nxn. Sehingga diperoleh fungsi kepekatan peluang bersama dari n peubah respon �
Fungsi kemungkinan bagi parameter �, �, � �, �, � ; � = |�−� |�/
�� [–
�−� �− � � �−� �− �
� ] (18)
Pendugaan parameter �, �, � diperoleh dengan memaksimalkan fungsi kemungkinan yang ekivalen. Dengan memaksimalkan logaritma dari fungsi kemungkinan persamaan (18).
= ln |�−� |�/
�� [−
�− �� �−� � �−� �− �
11 = − � + |� − � | − �− �� �−� �� �−� �− � (19) Pendugaan untuk � , � dan � diperoleh dengan memaksimumkan fungsi log kemungkinan (log-likelihood) pada persamaan (19). Untuk mendapatkan pendugaan untuk � dan � , fungsi log kemungkinan akan bernilai maksimum ketika suku terakhir dari persamaan (19) bernilai minimum. Pendugaan untuk :
�̂ = [( − �̂ ) ( − �̂ )]− ( − �̂ ) (� − �̂ �) (20)
Pendugaan untuk �2 adalah
�̂ = [ �−� (�− �̂)
� �−� (�− �̂)]
(21)
Untuk menduga parameter � diperlukan suatu iterasi numerik untuk mendapatkan penduga untuk � yang memaksimalkan fungsi log kemungkinan, yaitu:
�̂ = − − � |� − � | − − � ′ �−� � ′ �−� − � (22)
Teknik Ensemble
Ensemble adalah teknik dalam memprediksi dengan menggabungkan beberapa model yang dihasilkan dari suatu metode atau beberapa metode. Teknik ini tidak mengambil salah satu dari model terbaik dari banyaknya model-model yang dihasilkan dari suatu analisis serta tidak melakukan pendugaan dari model-model terbaik tersebut. Pendugaan dilakukan dengan menggabungkan hasil pendugaan dari berbagai model yang ada. Ada dua langkah utama untuk pembuatan sebuah ensemble. Langkah pertama adalah membuat keanggotan ensemble dan langkah kedua adalah untuk menentukan kombinasi yang tepat dari hasil-hasil dari anggota ensemble untuk menghasilkan hasil ensemble yang tunggal.
12
Simple Averaging
Proses ensemble dengan menggunakan metode simple averaging, yakni dengan menghitung rata-rata hasil dari keanggotaan ensemble. Misalkan Q adalah anggota dalam sebuah ensemble, fungsi kombinasinya adalah :
= ∑ ̂ , + =
dengan ̂ , adalah hasil dari model k untuk pengamatan ke t. Penggunaan pendekatan averaging itu mudah dan telah terbukti menjadi pendekatan yang efektif untuk meningkatkan kinerja model prediksi.
Weighted Averaging
Proses ensemble dengan menggunakan weighted averaging yakni dengan menggabungkan hasil rata-rata dari keanggotaan ensemble dengan bobot yang berbeda sesuai dengan jenis pembobotan. Secara rinci weighted averaging memberikan hasil gabungan sebagai berikut:
ℎ = ∑
=
13
3
METODE PENELITIAN
Data
Data yang digunakan adalah data sekunder yang diperoleh dari publikasi Badan Pusat Statistik Indonesia di tahun 2012 dan data potensi desa 2011. Secara keseluruhan data yang digunakan mencakup 117 kabupaten di pulau Jawa. Peubah yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Peubah respon (Y) yaitu Indek Pembangunan Manusia 2. Peubah penjelas (X) yaitu :
a. Banyaknya Perguruan Tinggi Negeri (X1)
b. Persentase Lembaga Keterampilan Perseribu penduduk (X2) c. Persentase Sarana Kesehatan Perseribu Penduduk (X3) d. Persentase Pasar Modern Perseribu Penduduk (X4) e. Persentase Koperasi Perseribu Penduduk (X5) f. Persentase Resto Perseribu Penduduk (X6) g. Persentase Hotel Perseribu Penduduk (X7)
h. Persentase Pasar Tradisional Perseribu Penduduk (X8) i. Angka Partisipasi Sekolah Umur 19-24 Tahun (X9)
Metode Analisis
Metode penelitian yang digunakan sebagai langkah-langkah pada penelitian ini adalah sebagai berikut :
1. Melakukan eksplorasi data 2. Melakukan analisis regresi klasik
a. Peubah penjelas yang digunakan adalah peubah-peubah penjelas yang memiliki nilai Variance Inflation Factor (VIF) < 10 dan nyata pada taraf ∝ = %.
b. Menyusun model regresi klasik � = � + � dan memenuhi asumsi-asumsi regresi klasik.
3. Mengecek efek spasial
14
dan disertai dengan pengecekan nilai Indeks Moran yang diperoleh dari =
∑ ∑ , − ̅ ( − ̅) adalah parameter koefisien spasial lag peubah respon.
b. Menyusun model SEM dengan persamaan � = � + �, � = � � + � dimana � adalah parameter koefisien spasial lag error.
c. Peubah penjelas yang digunakan adalah peubah-peubah penjelas yang nyata pada taraf ∝ = %.
5. Melakukan prediksi dengan teknik ensemble a. Menambahkan white noise pada data.
b. Menganalisis data yang telah diberi white noise dengan metode SAR atau SEM
c. Mengulangi langkah 1-2 sebanyak N kali, tetapi dengan white noise yang berbeda disetiap iterasinya.
d. Menghitung prediksi ensemble SAR (ESAR) dan prediksi ensemble SEM (ESEM) dengan menggunakan simple averaging berikut, ̂ = ∑ = ̂ ;
= , , … , (banyaknya observasi) dan = banyaknya iterasi (N) 6. Melakukan prediksi dengan teknik ensemble autocorrelation spatial (EAS)
a. Menyusun keanggotaan ensemble dari gabungan prediksi ESAR dan ESEM. b. Memrediksi EAS dengan menggunakan simple averaging yaitu ̂ �� =
̂ � + ̂ � dimana = , , … , .
7. Melakukan prediksi dengan teknik EAS dengan pembobotan proporsional (Wpro-EAS)
a. Menyusun keanggotaan ensemble dari gabungan prediksi ESAR dan ESEM dengan pemberian bobot secara proporsional.
b. Menentukan nilai bobot b1 dari hasil rata-rata rasio y dan ̂� � , dan nilai bobot b2 dari hasil rata-rata rasio y dan ̂� � .
c. Menghitung pendugaan dari Wpro-EAS dengan rumus ̂ � −�� = [ ̂ � � + ̂ � � + ̂ � � + ̂ � � ] dimana = , , … ,
15 a. Menyususn keanggotaan ensemble dari gabungan prediksi ESAR dan
ESEM dengan pemberian bobot secara regresi.
b. Meregresikan y, ̂� � , dan ̂� � untuk mendapatkan b0 dari intercept, b1 dari koefisien ̂� � dan b2 dari koefisien ̂� � .
c. Menghitung pendugaan dari Wreg-EAS dengan rumus ̂ ���−�� = + ̂ � � + ̂ � � .
9. Melakukan prediksi dengan teknik EAS dengan pembobotan korelasi (Wcorr-EAS)
a. Menyusun keanggotaan ensemble dari gabungan prediksi ESAR dan ESEM dengan pemberian bobot secara korelasi.
b. Menentukan nilai bobot b1 dari korelasi y dan ̂� � , dan nilai bobot b2 dari korelasi y dan ̂� � .
c. Menghitung pendugaan dari Wpro-EAS dengan rumus ̂ � ��−�� = [ ̂ � � + ̂ � � + ̂ � � + ̂ � � ] dimana = , , … ,
10.Membandingkan nilai RMSEA antara regresi klasik, SAR, SEM, SAR, E-SEM, EAS, Wreg-EAS, Wpro-EAS dan Wcorr-EAS dengan menggunakan statistik root mean square error aproctimation (RMSEA), nilai terkecil berarti prediksinya lebih baik. � = √∑�= �̂ −�
16
4
HASIL DAN PEMBAHASAN
Eksplorasi Data
Eksplorasi data berguna untuk mempelajari karakteristik data agar lebih mudah dalam menentukan model analisis statistik yang sesuai (perbaikan dari analisis statistik yang sudah direncanakan). Langkah pertama yang perlu dilakukan adalah pemeriksaan data. Berikut pada gambar 1 adalah boxplot dari peubah respon Y (IPM).
Gambar 1 Boxplot Indeks Pembangunan Manusia
Pada gambar 1 dapat dilihat bahwa data lebih banyak menyebar pada nilai-nilai tinggi yaitu sekitar median keatas. Nilai median adalah 73.43. Juga terlihat adanya 3 outlier yakni pada kabupaten bondowoso, probolinggo dan sampan dengan nilai IPM masing-masing 64.98, 64.35, dan 61.67. IPM terbesar berada pada DI Yogyakarta yaitu sebesar 80.24. Sedangkan nilai IPM terendah berada pada kabupaten Sampang yaitu sebesar 61.67. Nilai rata-rata IPM di pulau jawa adalah sebesar 73.22.
Berikut adalah gambaran nilai Indeks Pembangunan Manusia setiap kabupaten di Pulau Jawa berdasarkan sebaran IPM.
17
Gambar 3 Plot hubungan tiap peubah penjelas dengan IPM.
Pada Gambar 3 terlihat adanya hubungan positif antara nilai IPM dengan setiap peubah penjelasnya. Hal ini ditandai dengan semakin meningkatnya nilai IPM seiring dengan meningkatnya pengeluaran perkapita, angka melek huruf dan angka harapan hidup.
Pengujian Asumsi
18
Gambar 4 Plot Residual untuk Y
Analisis Regresi Klasik
Pemodelan dengan menggunakan analisis regresi klasik menghasilkan 4 peubah yang nyata pada taraf 5%. Peubah tersebut adalah jumlah perguruan tinggi (X1), persentase sarana kesehatan (X3), persentase pasar modern (X4) dan persentase pasar tradisional (X8). Untuk mengecek multikolinearitas dapat dilihat dari nilai VIF nya. Nilai VIF yang kurang dari 10 berarti tidak terdapat multiolinearitas. Nilai VIF yang disajikan oleh Tabel 2 untuk masing-masing peubah penjelas adalah 1.792, 2.731, 1.310 dan 1.232 menandakan tidak adanya masalah pada multikolinearitasnya. Sehingga dapat dilanjutkan dengan analisis regresi klasik dengan menggunakan metode kuadrat terkecil (MKT). Estimasi parameter dengan menggunakan metode kuadrat terkecil (MKT) disajikan pada Tabel 1.
Tabel 1 Estimasi parameter regresi MKT
Peubah Koefisien Galat Baku P-Value VIF
Konstanta 68.336 0.749 0.000 ***
X1 0.045 0.018 0.015 1.792*
X3 0.069 0.023 0.004 2.731**
X4 0.087 0.039 0.027 1.310*
X8 -0.258 0.128 0.046 1.232*
19
Persamaan regresi klasik yang terbentuk menggunakan metode kuadrat terkecil (MKT) adalah sebagai berikut :
̂ = 68.336 + 0.045X1 + 0.069X3 + 0.087X4 - 0.258X8
Persamaan regresi klasik yang terbentuk memiliki nilai R-Square 55.1% yang berarti model regresi klasik dapat menjelaskan keragaman indeks pembangunan manusia sebesar 55.1%. sedangkan sisanya dapat dijelaskan oleh peubah lain diluar model. Selanjutnya akan dilakukan pengujian untuk mengecek keberadaan autokorelasi spasial menggunakan Indeks Moran.
Indeks Moran
Pengujian Indeks Moran dilakukan dengan terlebih dahulu untuk membuat matriks pembobot sesuai konsep ratu catur. Matriks pembobot yang telah dibuat kemudian distandarisasi baris. Pengujian indeks moran dilakukan untuk mendeteksi adanya kemungkinan hubungan spasial antar lokasi yang bisa saja disebabkan karena adanya error correlation antar lokasi atau bisa saja adanya hubungan antar peubah respon (IPM) antar lokasi yang biasa disebut dengan spatial-lag correlation. Pengujian Indeks Moran diperlukan untuk mengecek ada tidaknya autokorelasi spasial pada data agar tidak terjadi kesalahan pendugaan yang menyebabkan model menjadi tidak layak.
Gambar 5 Plot pencaran Moran Indeks Pembangunan Manusia
Berdasarkan Gambar 5 hasil plot pencara Moran di atas, terlihat plotnya menyebar dibeberapa kuadran. Kuadran I terletak di kanan atas yang disebut kuadran High-High, artinya memiliki autokorelasi positif karena nilai pengamatan lokasi tersebut tinggi dan dikelilingi oleh area sekitar yang juga tinggi. Kuadran II terletak dikanan bawah yang disebut High-Low, artinya memiliki autokorelasi negatif karena nilai pengamatan lokasi tersebut tinggi dan dikelilingi oleh area sekitar yang memiliki
20
nilai rendah. Kuadran III terletak di kiri bawah yang disebut kuadran Low-Low, artinya memiliki autokorelasi positif, karena nilai pengamatan lokasi tersebut rendah dan dikelilingi oleh area sekitar yang juga rendah. Kuadran IV terletak di kiri atas yang disebut kuadran Low-High, artinya memiliki autokorelasi negatif, karena nilai pengamatan lokasi tersebut rendah dan dikelilingi oleh area yang tinggi. Detail persentase komposisi setiap kuadran dapat dilihat pada tabel 2. Terlihat bahwa plot banyak berada pada kuadran I dan III artinya memiliki autokorelasi yang positif.
Tabel 2 Komposisi posisi provinsi dalam plot pencaran Moran Kuadran Persentase Daerah bahwa adanya autokorelasi yang positif dimana pola yang mengelompok memiliki karakteristik sisaan yang sama dengan lokasi yang berdekatan. Hal ini didukung pula dengan nilai koefisien keragaman yang sangat kecil yakni hanya sebesar 0.0035. Hal ini menyimpulkan adanya autokorelasi spasial pada sisaan MKT. Pengecekan menggunakan Indeks Moran belum cukup membantu untuk menentukan model mana yang sebaiknya digunakan untuk prediksi. Ada dua kemungkinan model yang dapat dibentuk berdasarkan adanya autokorelasi spasial yaitu model autoregresi spasial (SAR) dan model error spasial (SEM), untuk itu perlu dilakukan uji pengganda (LM-Test) untuk mendeteksi letak masalah outokorelasinya sehingga dapat diketahui jenis regresi spasial yang lebih tepat.
Uji Lagrange Multiplier (LM-test)
Uji Lagrange Multiplier (LM-test) dilakukan untuk mengetahui ketergantungan spasial yang lebih spesifik, yaitu ketergantungan spasial pada observasi atau error. Pada Tabel 3 berikut, disajikan hasil dari uji LM-test.
Tabel 3 Uji Lagrange Multiplier
Model Parameter P-Value
SAR 6.656 0.009**
SEM 38.354 0.000***
Keterangan: ***) nyata pada taraf 0.001, **) nyata pada taraf 0.01, *) nyata pada taraf 0.05
21 Pada pengujian LM-test untuk Model Spasial Error (SEM) terlihat bahwa perlu juga dilakukan pembentuk model SEM karena nilai p-value nya signifikan atau lebih kecil dari pada =0.05 yang menunjukkan adanya autokorelasi pada spasial error nya. Sehingga akan digunakan kedua model tersebut yakni SAR dan SEM untuk melakukan pendugaan nilai IPM.
Analisis Autoregresi Spasial (SAR)
Analisis autokorelasi spasial merupakan suatu proses untuk mengatasi adanya autokorelasi spasial pada spasial lagnya. Pada analisis regresi klasik terpilih empat peubah yang nyata pada taraf ∝= % yaitu peubah banyaknya perguruan tinggi, sarana kesehatan, pasar modern dan pasar tradisional. Pada peubah pasar modern menunjukkan pengaruh yang positif terhadap peningkatan angka IPM, yang berarti semakin tinggi persentase pasar modern di suatu wilayah berarti semakin tinggi pula nilai IPMnya. Sedangkan pada peubah pasar tradisional menunjukan pengaruh yang negatif terhadap angka IPM, yang artinya semakin kecil persentase pasar tradisional di suatu wilayah maka meningkatkan nilai IPM di wilayah tersebut. Hal ini berarti angka IPM ditingkatkan dengan cara mengkonversikan pasar tradisional menjadi pasar modern. Sehingga kita hanya perlu mengukur seberapa banyak persentase pasar modern disuatu wilayah agar meningkatkan angka IPM diwilayah tersebut. Sehingga pada analisis spasial hanya ada 3 peubah yang digunakan yaitu, banyaknya perguruan tinggi (X1), persentase sarana kesehatan (X3) dan persentase pasar modern (X4). Pengujian signifikansi parameter model autokorelasi spasial secara parsial pada statistik uji z yang secara ringkas dapat dilihat pada Tabel 4.
Tabel 4 Estimasi Parameter SAR Peubah Koefisien Galat Baku P-Value
Konstanta 65.632 1.022 0.000***
X1 0.066 0.014 0.000***
X3 0.122 0.016 0.000***
X4 0.109 0.036 0.002**
Rho 0.004 0.01*
Keterangan: ***) nyata pada taraf 0.001, **) nyata pada taraf 0.01, *) nyata pada taraf 0.05
Tabel 4 menunjukkan bahwa koefisien rho ( ) nyata dengan nilai-p < 0.05
(α), artinya terdapat pengaruh lag spasial dari lokasi yang berdekatan. Begitu pula dengan jumlah perguruan tinggi (X1), persentase sarana kesehatan (X3), dan persentase pasar modern (X4) nyata secara statistik, artinya peubah-peubah tersebut memberikan pengaruh yang nyata terhadap besar perubahan Indeks Pembangunan Manusia di Pulau Jawa. Persamaan yang diperoleh dari hasil analisis SAR adalah sebagai berikut
22
Hasil ini masih belum cukup untuk memperoleh model prediksi terbaik, untuk itu akan dilakukan penyusunan model Ensemble SAR pada pembahasan selanjutnya.
Analisis Spasial Error Model (SEM)
Analisis spasial error model (SEM) merupakan suatu proses untuk mengatasi adanya autokorelasi spasial pada spasial errornya. Pengujian signifikansi parameter Model autokorelasi spasial secara parsial pada statistik uji z yang secara ringkas dapat dilihat pada Tabel 5.
Tabel 5 Estimasi Parameter SEM Peubah Koefisien Galat Baku P-Value
Konstanta 68.396 0.826 0.000***
X1 0.037 0.012 0.003**
X3 0.102 0.013 0.000***
X4 0.067 0.028 0.016*
Lambda 0.145 0.000***
Keterangan: ***) nyata pada taraf 0.001, **) nyata pada taraf 0.01, *) nyata pada taraf 0.05
Tabel 5 menunjukkan bahwa koefisien lambda (�) nyata dengan nilai-p < 0.05
(α), artinya terdapat pengaruh spasial error dari lokasi yang berdekatan Begitu pula dengan jumlah peguruan tinggi (X1), persentase sarana kesehatan (X3), dan persentase pasar moderen (X4) nyata secara statistik, artinya peubah-peubah tersebut memberikan pengaruh yang nyata terhadap besar perubahan Indeks Pembangunan Manusia di Pulau Jawa. Persamaan yang diperoleh dari hasil analisis SEM adalah sebagai berikut:
̂ = . + . + . + . + . �
23 Ensemble Prediksi
Pada ensemble prediksi pendugaan dilakukan dengan menggabungkan hasil pendugaan dari berbagai model yang ada. Ada dua langkah utama untuk pembuatan sebuah ensemble. Langkah pertama adalah membuat keanggotan ensemble dan langkah kedua adalah untuk menentukan kombinasi yang tepat dari hasil-hasil dari anggota ensemble untuk menghasilkan hasil ensemble yang tunggal.
Penambahan Noise
Pada penambahan noise pada data IPM (Y) akan memberikan skala yang beragam dengan frame yang serupa/seragam. Akibat dari penambahan noise yang berbeda di tiap-tiap iterasi maka akan menghasilkan noisy result atau hasil yang kotor. Namun dengan menghitug rataan seluruh hasil ensemble akan memberikan
pengaruh saling “membersihkan”. Zhang et al. 2008 melakukan percobaan noise dengan simpangan baku antara 0.1 atau 0.2 sebanyak 100 percobaan. Nilai � yang dicobakan adalah 0.11, 0.12, 0.13, 0.14, 0.15, 0.16, 0.17, 0.18, 0.19 dan 0.20 menghasilkan frame yang serupa dengan data pada peubah Y. Gambar 6 menunjukkan bahwa dengan penambahan noise dengan nilai � tertentu menghasilkan fluktuasi yang serupa dengan data peubah Y.
Gambar 6 Plot data Y dan Plot data Y+noise
24
Setelah membentuk keanggotaan ensemble selanjutnya dilakukan proses prediksi. Prediksi dilakukan dengan melakukan simple averaging yaitu dengan menjumlahkan masing-masing prediksi setiap keanggotan ensemble kemudian mencari nilai rata-rata dari n prediksi tersebut sehingga hanya ada 1 prediksi tunggal. Setelah didapatkan hasil prediksi untuk setiap ESAR dan ESEM selanjutnya dilihat seberapa jauh kebaikan dari hasil prediksinya yaitu dengan menentukan nilai RMSEA untuk setiap prediksi. Semakin kecil nilai RMSEA berarti hasil pendugaan semakin mendekati nilai yang sesungguhnya. RMSEA dari ESAR adalah 2.482 dan RMSEA dari ESEM adalah 1.975. Model prediksi dari ESAR yakni sebagai berikut:
� �
̂ = . . + . + . + . + .
Model prediksi untuk ESEM didapatkan sebagai berikut:
� �
̂ = . + . + . + . + . �
Agar mendapatkan hasil prediksi yang lebih baik dan dapat menggabukan informasi autoregressive dan autokorelasi error maka dilakukan teknik ensemble hybrid. Ensemble Autokorelasi Spasial (EAS)
Ensemble autokorelasi spasial (EAS) adalah ensemble hybrid yang menggabungkan hasil prediksi dari ESAR dan ESEM. Teknik EAS dilakukan dengan menyusun keanggotaan ensemble dari gabungan dari hasil prediksi ESAR dan ESEM. Hasil prediksi tunggal EAS didapatkan dengan menggunakan simple averaging yakni dengan formula berikut:
̂ � = ̂ � + ̂ dimana = , , … ,
Setelah didapatkan nilai prediksi dari ̂�� maka didapatkan nilai RMSEA dari EAS yaitu sebesar 2.190. Model prediksi dari EAS didapatkan sebagai berikut:
��
̂ = . + . + . + . + . + . �
Setelah didapatkan model prediksi dari EAS maka dilakukan ensemble hybrid dengan pembobotan guna mencari hasil prediksi yang lebih baik lagi.
EAS dengan Pembobotan Proporsional (Wpro-EAS)
EAS dengan pembobotan proporsional (Wpro-EAS) adalah teknik ensemble hybrid yang menggabungkan hasil prediksi dari ESAR dan ESEM dengan pemberian bobot secara proporsional. Sehingga didapatkan bobot = − . dimana adalah 1 dikurangi hasil rata-rata dari rasio Y dan ̂ESAR . Bobot untuk
= − . dimana adalah 1 dikurangi hasil rata-rata dari rasio Y dan ̂ESEM. Hasil prediksi Wpro-EAS didapatkan dengan rumus berikut:
25 Model prediksi dari Wpro-EAS yakni sebagai berikut:
� −��
̂ = . + . + . + . + .
+ . �
Setelah didapatkan hasil prediksi Wpro-EAS maka didapatkan nilai RMSEA nya sebesar 2.191.
EAS dengan Pembobotan Regresi (Wreg-EAS)
EAS dengan pembobotan regresi (Wreg-EAS) adalah teknik ensemble hybrid yang menggabungkan hasil prediksi dari ESAR dan ESEM dengan pemberian bobot secara regresi. Dengan meregresikan Y, ̂ ESAR, dan ̂ ESEM didapatkan bobot b0 = -10.727, dimana b0 adalah nilai dari konstanta. Bobot untuk b1 = -0.635, dimana b1 adalah nilai koefisien dari ̂ ESAR. Bobot untuk b2 = 1.782, dimana b2 adalah nilai koefisien dari ̂ ESEM. Maka hasil prediksi dari Wreg-EAS didapatkan dengan rumus berikut:
̂ � _ � = + ∗ ̂ � + ∗ ̂ Dimana = , , … ,
Model prediksi dari Wreg-EAS yakni sebagai berikut:
���−��̂ = . − . + . + . + . + . �
Setelah didapatkan hasil prediksi Wreg-EAS maka diketahui nilai RMSEA nya sebesar 1.817.
EAS dengan Pembobotan Korelasi (Wcorr-EAS)
EAS dengan pembobotan regresi (Wcorr-EAS) adalah teknik ensemble hybrid yang menggabungkan hasil prediksi dari ESAR dan ESEM dengan pemberian bobot dengan menggunakan korelasi. Nilai dari pembobot untuk Wcorr-EAS didapatkan dengan mengkorelasikan nilai Y, ̂ ESAR, dan ̂ ESEM. Didapatkan pembobot untuk b1 = 0.269, dimana b1 adalah besarnya korelasi antara Y dan ̂ ESAR. Pembobot untuk b2 = 0.150, dimana b2 adalah besarnya korelasi antara Y dan ̂ ESEM. Maka hasil prediksi dari Wcorr-EAS dapat didapatkan dengan rumus berikut:
̂ ��_ � = {[̂ � + ̂ � ∗ ] + [̂ + ̂ ∗ ]} Dimana = , , , … ,
Model prediksi dari Wcorr-EAS yakni sebagai berikut:
� ��−��̂ = . + . + . + . + .
+ . �
26
Pendugaan Terbaik
Hasil pendugaan yang digunakan untuk memprediksi nilai IPM adalah pendugaan terbaik. Pendugaan terbaik dilakukan dengan memilih RMSEA yang terkecil dari beberapa metode pendugaan yang telah dilakukan di atas. RMSEA dari masing-masing metode pendugaan yang telah dilakukan ditunjukkan pada Tabel 6 berikut.
Tabel 6 RMSEA setiap metode pendugaan Metode RMSEA autokorelasi spasial dengan pembobotan regresi (Wreg-EAS) dengan RMSEA sebesar 1.817. Sehingga Wreg-EAS digunakan untuk menggabungkan hasil prediksi dari model SAR dan SEM. Dimana model regresi yang terbentuk pada indeks pembangunan manusia yang menggunakan model SEM adalah:
̂ = . + . � + . + . + .
Dari model SEM yang terbentuk diperoleh R2 sebesar 70.44%, yang berarti model yang terbentuk dapat menjelaskan keragaman peubah IPM sebesar 70.44%, sedangkan 29.56% dijelaskan oleh peubah lain diluar model. Model yang terbentuk menghasilkan peubah-peubah yang nyata pada taraf ∝= . yaitu peubah jumlah perguruan tinggi (X1), peubah persentase sarana kesehatan (X3), dan peubah persentase pasar modern (X4). Koefisien � yang nyata menunjukkan bahwa jika suatu wilayah yang dikelilingi oleh wilayah lain sebanyak n, maka pengaruh dari masing-masing wilayah yang mengelilinginya dapat diukur sebesar 0.145 dikali rata-rata error sekitarnya. Koefisien peubah banyaknya perguruan tinggi 0.036 menunjukkan bahwa setiap peningkatan jumlah perguruan tinggi di pulau Jawa sebesar satu persen akan meningkatkan indeks pembangunan manusia di Indonesia sebesar 0.036 poin, dengan asumsi peubah yang lain dianggap konstan, demikian pula sebaliknnya. Ini menunjukkan bahwa untuk meningkatkan indeks pembangunan manusia sebesar satu poin, maka tiap kabupaten harus menambah jumlah perguruan tinggi sebesar 1/0.036 = 27.78%, dengan asumsi peubah yang lain dianggap konstan.
27 konstan, demikian pula sebaliknya. Ini menunjukkan bahwa untuk meningkatkan IPM sebesar satu poin, maka tiap kabupaten di pulau Jawa harus meningkatkan persentase sarana kesehatan sebesar 9.804%, dengan asumsi peubah yang lain dianggap konstan.
Indikator ekonomi dipulau Jawa dapat dijelaskan oleh peubah persentase pasar modern yang berpengaruh positif terhadap IPM. Peubah ini merupakan salah satu indikator yang bersifat positif dari kondisi kesejahteraan masyarakat. Oleh karena itu, jika nilai peubah ini semakin meningkat maka nilai IPM juga ikut meningkat. Berdasarkan model spasial yang didapatkan dapat didefinisikan bahwa, setiap peningkatan persentase pasar modern sebesar satu persen maka meningkatkan IPM di pulau jawa sebesar 0.067 poin.
Begitu pula untuk model regresi yang terbentuk dengan menggunakan model SAR yaitu:
̂ = . + . + . + . + .
Dimana koefisien yang nyata menunjukkan bahwa jika suatu wilayah yang dikelilingi oleh wilayah lain sebanyak n, maka pengaruh dari masing-masing wilayah yang mengelilinginya dapat diukur sebesar 0.004 dikali rata-rata peubah IPM di wilayah sekitarnya. Dimana peubah-peubah penjelas yang nyata pada taraf = . yaitu peubah banyaknya perguruan tinggi (X1), peubah persentase sarana kesehatan (X3), dan peubah persentase pasar modern (X4).
Kemudian digunakan teknik ensemble WregEAS untuk menggabungkan hasil pendugaan kedua model diatas dan diperoleh peningkatan R2 menjadi 75.05% dengan RMSEA sebesar 1.817. Berikut adalah model prediksi dari Wreg-EAS:
���−��̂ = . − . + . + . + . + . �
Terlihat pada model diatas ada tiga peubah penjelas yang menyusun model prediksinya yakni banyaknya perguruan tinggi, persentase sarana kesehatan dan persentase pasar modern.
28
lingkungan disekitar perguruan tinggi bermunculan pedagang-pedagang mulai dari toko buku, alat tulis kantor (ATK), foto copy, foto studio, warung makan dan kos-kosan untuk mahasiswa dan pegawai. Hal ini jelas akan mengurangi jumlah pengangguran dan meningkatkan pendapatan penduduk. Telah disadari bersama, pendidikan memiliki arti penting bagi upaya meningkatkan kualitas hidup individu, masyarakat dan bangsa.
Persentase sarana kesehatan berpengaruh positif terhadap IPM berarti semakin banyak sarana kesehatan yang dibangun maka meningkatkan IPM di daerah tersebut. Hal ini dikarenakan timbulnya kesadaran masyarakat akan kesehatan. Tujuan dari pembangunan manusia dibidang kesehatan adalah untuk mencapai umur panjang yang sehat. Pelayanan kesehatan merupakan faktor yang sangat penting dalam menunjang kesehatan masyarakat. Sehingga perlunya meningkatkan sarana kesehatan agar pelayanan kesehatan dapat dilakukan secara maksimal. Sarana kesehatan yang sebaiknya ditingkatkan jumlahnya adalah pusat kesehatan masyarakat (puskesmas) dan keberadaan rumah sakit rujukan. Tentu saja fasilitas Rumah Sakit Umum Daerah (RSUD) harus terus ditingkatkan, begitupun dengan jumlah tenaga kesehatan utamanya perawat dan dokter.
Peran pemerintah agar fasilitas kesehatan lebih terjangkau untuk masyarakat miskin memang sangat diperlukan. Dimana kemiskinan juga sering menghambat penduduk miskin untuk dapat mengakses berbagai fasilitas kesehatan. Akses yang rendah terhadap kesehatan merupakan masalah yang dihadapi masyarakat miskin. Masalah-masalah yang dihadapi oleh masyarakat miskin antara lain biaya pengobatan dan obat-obatan yang mahal, jarak yang jauh dari sarana kesehatan tersebut, serta kurangnya pengetahuan tentang pentingnya kesehatan. Selain perlunya pengadaan penyuluhan pola hidup sehat agar timbul kesadaran bahwa tubuh yang sehat akan mempengaruhi kualitas hidup seseorang. Upaya lain yang paling memungkinkan pada kondisi seperti ini adalah bagaimana meningkatkan keberpihakan yang nyata dari pemerintah melalui peningkatan alokasi belanja publik di bidang kesehatan pada APBD dan menggali potensi sektor swasta, seperti membujuk pihak swasta agar memperbesar alokasi dana corporate social responsibility (CSR) untuk bidang kesehatan, dengan harapan di masa mendatang biaya kesehatan murah dapat dinikmati masyarakat secara lebih luas.
29 kesehatan diharapkan mampu memberikan sanitasi tempat umum yang lebih baik dan bersih dibandingkan pasar tradisional.
30
5
SIMPULAN DAN SARAN
Data pada penelitian ini sudah memenuhi asumsi regresi klasik. Dari model autokorelasi spasial dapat dinyatakan bahwa SEM memprediksi lebih baik dibandingkan dengan SAR. Ini menandakan pada data IPM terdapat peubah penjelas yang tidak dilibatkan dalam model regresi linear sehingga dihitung sebagai galat dan peubah tersebut berkorelasi dengan galat pada lokasi lain. Agar informasi autoregressive dan autokorelasi error tergabung dalam satu model maka tidak dilakukan pemilihan model terbaik. Namun model-model yang terbentuk, digabungkan untuk mendapatkan hasil prediksi yang lebih baik. Maka model Autokorelasi spasial dikembangkan menggunakan ensemble hybrid dan nonhybrid, diperoleh bahwa metode ensemble hybrid dengan penggunaan konsep regresi pada pembentukan bobot (Wreg-EAS) yang menghasilkan prediksi lebih baik dari metode lainnya.
Saran
31
DAFTAR PUSTAKA
Anselin L. 1988. Spatial Econometrics: Methods and Models. Dordrecht: Academic Publishers.
[BPS] Badan Pusat Statistik. 2008. Indeks Pembangunan Manusia (IPM). Publikasi IPM Badan Pusat Statistik: Jakarta-Indonesia.
DeBock KW, Coussement K, Van den Poel D. 2010. Ensemble Classification based on General Additive Models. Computational Statistics & Data Analysis 54(6): 1535-1546)
Dubin R. 2009. Spatial Weight. Fotheringham AS, PA Rogerson, editor, Handbook of Spatial Analysis. London: Sage Publication.
Friedman JH, Popescu BE. 2008. Predictive learning vi rule ensemble. The Annals of Applied Statistics 2(3): 916-954.
Fransiska H. 2014. Metode Dekomposisi Ensemble untuk Memprediksi Harga Beras DKI Jakarta [tesis]. Bogor (ID): Institut Pertanian Bogor.
Griffith D. 2000. A linear regression solution to the spatial autocorrelation problem. Journal of Geographical System 2, 141-156.
LeSage JP. 1997. Bayesian estimation of spatial autoregressive models. International Regional Science Review, 20, nos 1 dan 2, pp 113-129.
McMillen DP. 1992. Probit with spatial autocorrelation. Journal of Regional Science, 32, No.3 , pp, 335-348.
Philip AP. 2010. Notes on Spatial Econometrics Model. National Oceanic and Atmospheric Administration, Washington, DC.
Rohmawati N. 2015. Aplikasi Analisis Regresi Spasial Ensemble Pada Data Kemiskinan Di Pulau Jawa [tesis]. Bogor (ID): Institut Pertanian Bogor. Walpole RE, Myers RH. 1995. Ilmu Peluang dan Statistika untuk Insinyur dan
Ilmuwan. Terjemahan Bambang Sumantri, Edisi ke-4. Bandung: Penerbit ITB. Zaier I, Shu C, Quarda TBMJ, Seidou O, Chebana F. 2010. Estimation of ice
thickness on lakes using artificial neural network ensembles. Journal of Hydrology, (383), pp. 330-340.
Zhang X, Lai KK, Wang SY. 2008. A New Approach for Crude Oil Price Analysis on Empirical Mode Decomposition. Energy Economics 30, 905-918.
Zhou ZH. 2012. Ensemble Methods Foundation and Algorithms. Cambridge (UK) : CRC Press.
32
Lampiran 1 Kode Kabupaten
KAB Kode KAB Kode KAB Kode KAB Kode
Kota Jakarta Selatan 1 Cilacap 32 Kota Salatiga 63 Tuban 94
Kota Jakarta Timur 2 Banyumas 33 Kota Semarang 64 Lamongan 95
Kota Jakarta Pusat 3 Purbalingga 34 Kota Pekalongan 65 Gresik 96
Kota Jakarta Barat 4 Banjarnegara 35 Kota Tegal 66 Bangkalan 97
Kota Jakarta Utara 5 Kebumen 36 Kulon Progo 67 Sampang 98
Bogor 6 Purworejo 37 Bantul 68 Pamekasan 99
Sukabumi 7 Wonosobo 38 Gunung Kidul 69 Sumenep 100
Cianjur 8 Magelang 39 Sleman 70 Kota Kediri 101
Bandung 9 Boyolali 40 Kota Yogyakarta 71 Kota Blitar 102
Garut 10 Klaten 41 Pacitan 72 Kota Malang 103
Tasikmalaya 11 Sukoharjo 42 Ponorogo 73 Kota Probolinggo 104
Ciamis 12 Wonogiri 43 Trenggalek 74 Kota Pasuruan 105
Kuningan 13 Karanganyar 44 Tulungagung 75 Kota Mojokerto 106
Cirebon 14 Sragen 45 Blitar 76 Kota Madiun 107
Majalengka 15 Grobogan 46 Kediri 77 Kota Surabaya 108
Sumedang 16 Blora 47 Malang 78 Kota Batu 109
Indramayu 17 Rembang 48 Lumajang 79 Pandeglang 110
Subang 18 Pati 49 Jember 80 Lebak 111
Purwakarta 19 Kudus 50 Banyuwangi 81 Tangerang 112
Karawang 20 Jepara 51 Bondowoso 82 Serang 113
Bekasi 21 Demak 52 Situbondo 83 Kota Tangerang 114
Kab Bandung Barat 22 Semarang 53 Probolinggo 84 Kota Cilegon 115
Kota Bogor 23 Temanggung 54 Pasuruan 85 Kota Serang 116
Kota Sukabumis 24 Kendal 55 Sidoarjo 86 Kota Tangerang Selatan 117
Kota Bandung 25 Batang 56 Mojokerto 87
Kota Cirebon 26 Pekalongan 57 Jombang 88
Kota Bekasi 27 Pemalang 58 Nganjuk 89
Kota Depok 28 Tegal 59 Madiun 90
Kota Cimahi 29 Brebes 60 Magetan 91
Kota Tasikmalaya 30 Kota Magelang 61 Ngawi 92
33 Lampiran 2 Pembagian kabupaten beradasakan kategori Quantile-nya
IPM ≤ Q1 Q1 < IPM ≤Q2 Q2 < IPM ≤ Q3 IPM > Q3
Bogor Garut Kota Jakarta Timur Kota Jakarta Selatan
Sukabumi Majalengka Kota Jakarta Barat Kota Jakarta Pusat
Cianjur Sumedang Kota Jakarta Utara Kota Bogor
Tasikmalaya Purwakarta Bandung Kota Cirebon
Ciamis Bekasi Indramayu Kota Bekasi
Kuningan Kota Sukabumi Kab Bandung Barat Kota Depok
Cirebon Kota Cimahi Kota Bandung Sukoharjo
Subang Cilacap Banyumas Wonogiri
Karawang Purbalingga Kebumen Karanganyar
Kota Tasikmalaya Banjarnegara Klaten Pati
Kota Banjar Purworejo Blora Kota Magelang
Wonosobo Magelang Rembang Kota Surakarta
Boyolali Grobogan Kudus Kota Salatiga
Sragen Jepara Kendal Kota Semarang
Demak Semarang Pekalongan Kota Tegal
Batang Temanggung Tegal Bantul
Kulon Progo Pemalang Kota Pekalongan Sleman
Gunung Kidul Brebes Trenggalek Kota Yogyakarta
Kediri Pacitan Malang Blitar
Lumajang Ponorogo Pasuruan Sidoarjo
Jember Tulungagung Mojokerto Sumenep
Bondowoso Banyuwangi Jombang Kota Kediri
Madiun Situbondo Magetan Kota Blitar
Ngawi Probolinggo Gresik Kota Malang
Bojonegoro Nganjuk Kota Madiun Kota Probolinggo
Tuban Lamongan Kota Batu Kota Pasuruan
Pamekasan Bangkalan Kota Tangerang Kota Mojokerto
Pandeglang Sampang Kota Serang Kota Surabaya
Lebak Tangerang Kota Tangerang Selatan Kota Cilegon
34
Lampiran 3 Pembagian kabupaten berdasakan kuadran pencaran Moran
Tabel Keterangan Kab/kota Moran
Scatterplot Kabupaten/Kota
High-High Kota Jakarta Selatan, Kota Jakarta Timur, Kota Jakarta Pusat, Kota Jakarta Barat, Kota Jakarta Utara, Bandung, Bekasi, Kab Bandung Barat, Kota Bandung, Kota Bekasi, Kota Depok, Kota Cimahi, Purworejo, Klaten, Sukoharjo, Karanganyar, Pati, Kudus, Jepara, Demak, Semarang, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kulon Progo, Bantul, Sleman, Kota Yogyakarta, Trenggalek, Tulungagung, Blitar, Sidoarjo, Mojokerto, Jombang, Magetan, Gresik, Kota Kediri, Kota Blitar, Kota Malang, Kota Mojokerto, Kota Surabaya, Kota Batu, Kota Tangerang, Kota Tangerang Selatan
Low-High Kota Bogor, Kota Sukabumi, Kota Cirebon, Kota Tasikmalaya, Banyumas, Temanggung, Kota Pekalongan, Kota Tegal, Kota Probolinggo, Kota Pasuruan, Kota Madiun, Kota Cilegon
Low-Low Sukabumi, Garut, Tasikmalaya, Kuningan, Cirebon, Majalengka, Sumedang, Indramayu, Subang, Karawang, Kota Banjar, Cilacap, Purbalingga, Banjarnegara, Kebumen, Wonosobo, Sragen, Blora, Rembang, Pekalongan, Pemalang, Tegal, Malang, Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo, Pasuruan, Nganjuk, Madiun, Ngawi, Bojonegoro, Tuban, Lamongan, Bangkalan, Sampang, Pamekasan, Sumenep, Pandeglang, Lebak, Serang
35 Lampiran 4 Perbandingan Y aktual dengan hasil prediksi SAR dan SEM tanpa
Ensemble.
(a) Trend antara Y aktual dengan hasil prediksi SAR
36
Lampiran 5 Perbandingan Y aktual dengan hasil prediksi ensemble non-hybrid SAR dan SEM (E-SAR dan E-SEM)
(a) Trend antara Y aktual dengan hasil prediksi E-SAR
(b) Trend antara Y aktual dengan hasil prediksi E-SEM
37 Lampiran 6 Perbandingan Y aktual dengan hasil prediksi dari EAS
Trend antara Y aktual dengan Y duga EAS
55 60 65 70 75 80 85
1 5 9
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
1
0
1
1
0
5
1
0
9
1
1
3
1
1
7
IP
M
Kode Wilayah
39
Lampiran 8 Nilai pembobot yang digunakan untuk masing-masing jenis pembobotan.
PEMBOBOT
REGRESI KORELASI PROPORSIONAL
b0 b1 b2 b1 b2 b1 b2