KAJIAN PENENTUAN KLASIFIKASI DESA DI INDONESIA
SHAFA ROSEA SURBAKTI
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul “Kajian Penentuan Klasifikasi Desa di Indonesia” adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Juni 2015
Shafa Rosea Surbakti
G152130434
RINGKASAN
SHAFA ROSEA SURBAKTI. Kajian Penentuan Klasifikasi Desa di Indonesia. Dibimbing oleh ERFIANI dan BAGUS SARTONO.
Penggolongan wilayah kelurahan/desa ke dalam status perkotaan/perdesaan pada dasarnya dimaksudkan untuk membentuk suatu lapisan (strata) yang digunakan dalam teknik pengambilan contoh dalam survei. Dengan adanya status perkotaan dan perdesaan, diharapkan contoh yang terambil dapat mewakili keseluruhan populasi dengan baik.
Regresi logistik merupakan salah satu metode regresi dimana peubah responnya merupakan data kategorik. Regresi logistik biner digunakan jika peubah respon terdiri dari dua kategori. Metode ini juga dapat digunakan untuk klasifikasi data. Bootstrap, dikenal sebagai salah satu metode simulasi data, dimaksudkan untuk menyederhanakan analisis statistik inferensia namun menghasilkan analisis yang lebih robust.
Tujuan dari penelitian ini untuk melakukan kajian pemilihan peubah yang paling berpengaruh dalam penentuan klasifikasi desa di Indonesia dengan metode perpaduan bootstrap dan regresi logistik biner. Data yang digunakan kasus ini adalah data pendataan Potensi Desa (PODES) 2011 yang dilakukan oleh Badan Pusat Statistik dengan jumlah peubah prediktor sebanyak 15 buah.
Hasil penelitian menunjukkan bahwa pengurangan sebelas peubah (X1-X11) dalam penentuan klasifikasi desa di Indonesia menjadi lima peubah mampu menghasilkan model yang sama baiknya. Model dengan penambahan empat peubah prediktor baru mampu menaikkan tingkat ketepatan klasifikasi. Penggunaan metode bootstrap dalam seleksi peubah terbukti lebih baik dibandingkan seleksi peubah yang hanya melihat hasil uji parsial saja.
SUMMARY
SHAFA ROSEA. INDEPTH STUDIES OF DETERMINANTS VILLAGE CLASSIFICATION IN INDONESIA. Supervised by ERFIANI and BAGUS SARTONO.
Classification of “kelurahan” and rural area into urban/rural class basically meant to form a layer (stratum) were used in the survey sampling techniques. With the status of urban and rural areas, the sample can represent the entire population correctly. Proper selection of variables could distinguish village into urban and rural class.
Logistik regression is one of regressions method where the response variable is categorical data. Binary logistik regression was used when the response variable consists of two categories. This method can also be used for data classification. Bootstrap, is known as one of the data simulation method, intended to simplify the inferential statistikal analysis but produces a more robust analysis.
The purpose of this study was to do some studies in selection of the most influential variables in determining the classification of villages in Indonesia with a mix method of bootstrap and binary logistik regression. The data used in this case is data Potensi Desa (PODES) 2011 which conducted by Badan Pusat Statistik with consist of 15 predictor variable.
The results showed that reduction of eleven variables (X1-X11) in determining the classification of villages in Indonesia into five variables able to produce models that are just as good as previous model. The model with the addition of four new predictor variables were able to raise the level of accuracy of the classification. The use of bootstrap method in variables selection was proved better than variables selection that only see partial test results alone.
© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan IPB
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Statistika Terapan
KAJIAN PENENTUAN KLASIFIKASI DESA DI INDONESIA
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
BOGOR 2015
Judul Tesis : Kajian Penentuan Klasifikasi Desa di Indonesia Nama : Shafa Rosea Surbakti
NIM : G152130434
Disetujui oleh Komisi Pembimbing
Dr Ir Erfiani, MSi Ketua
Dr Bagus Sartono Anggota
Diketahui oleh
Ketua Program Studi Statistika Terapan
Dr Ir Indahwati, MSi
Dekan Sekolah Pascasarjana
Dr Ir Dahrul Syah, MScAgr
PRAKATA
Puji dan syukur penulis ucapkan kehadirat Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga penulis dapat menyelesaikan tesis yang berjudul “Kajian Penentuan Klasifikasi Desa di Indonesia”. Keberhasilan penulisan tesis ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai pihak.
Terima kasih penulis ucapkan kepada Ibu Dr. Ir. Erfiani, M.Si. sebagai ketua komisi pembimbing dan Bapak Dr. Bagus Sartono sebagai anggota komisi pembimbing yang telah memberikan bimbingan, arahan serta saran kepada penulis. Penulis juga mengucapkan terima kasih kepada Pimpinan Badan Pusat Statistik (BPS) atas kesempatan yang diberikan kepada penulis untuk menempuh jenjang Magister Statistika Terapan. Ungkapan terima kasih terkhusus penulis sampaikan kepada orang tua, suami dan ananda tercinta serta seluruh keluarga besar atas do’a, dukungan dan pengertiannya. Terima kasih pula kepada seluruh staf Program Studi Statistika Terapan, teman-teman Statistika (S2 dan S3) dan Statistika Terapan (S2) khususnya Kelas BPS atas bantuan dan kebersamaannya. Terima kasih tak lupa penulis sampaikan kepada semua pihak yang tidak dapat penulis sebutkan satu per satu yang telah membantu dalam penyusunan tesis ini.
Penulis menyadari bahwa tesis ini masih banyak kekurangan. Semoga penelitian selanjutnya dapat lebih baik dari penelitian ini. Semoga penelitian ini bermanfaat bagi yang membutuhkan.
Bogor, Juni 2015
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
1 PENDAHULUAN 1
Latar Belakang 1
Identifikasi Masalah 3
Tujuan Penelitian 3
Kegunaan Penelitian 3
2 TINJAUAN PUSTAKA 3
Perkotaan dan Perdesaan 4
Perbedaan Perkotaan dan Perdesaan 5
Regresi Logistik Biner 6
Bootstrap 8
Seleksi Peubah dengan Bootstrap Regresi Logistik 9
3 METODE PENELITIAN 10
Data 10
Metode Analisis 11
4 HASIL DAN PEMBAHASAN 12
Eksplorasi Data 12
Seleksi Peubah X1 hingga X11 19
Penambahan Peubah X12-X15 22
Penentuan Titik Potong Peluang 24
Aplikasi Model pada Data Propinsi Jawa Barat 25
5 SIMPULAN DAN SARAN 26
DAFTAR PUSTAKA 27
DAFTAR TABEL
1.1 Kriteria dan keberadaan akses pada fasilitas perkotaan dengan skor 2 2.1 Jenis Infrastruktur dan Indikator Pemenuhan Infrastruktur 5
2.2 Tabel Klasifikasi Dua Arah 7
3.1 Peubah Prediktor Penyusun Model 10
4.1 Nilai Korelasi Antar Peubah Penyusun Model 17
4.2 Nilai koefisien, galat baku dan VIF peubah penyusun model 18 4.3 Rata-rata Persentase Rumah Tangga Pertanian Menurut Klasifikasi
Desa 19
4.4 Persentase Desa Yang Memiliki Sarana Pendidikan (TK, SMP, dan
SMU) Menurut Klasifikasi Desa (%) 19
4.5 Nilai Parameter β, Galat Baku, Nilai-Z dan Nilai-p dari Uji Parsial
Parameter 20
4.6 Persentase Signifikansi Tiap Peubah dalam Ukuran Contoh n 21 4.7 Simulasi Pengurangan Peubah Penyusun Model Beserta Dugaan Galat
Prediksi dan Dugaan Keakuratan 22
4.8. Persentase Signifikansi Peubah pada 10.000 replikasi dan Peringkat
Peubah 23
4.9. Simulasi Pengurangan Peubah Penyusun Model Beserta Dugaan Galat
Prediksi dan Dugaan Keakuratan 24
4.10. Nilai AIC, AER, Sensitivitas, dan 1-Spesifisitas Berdasarkan Titik
Potong 25
4.11 Aplikasi Penerapan Model di Propinsi Jawa Barat 25
DAFTAR GAMBAR
2.1 Diagram Alir Regresi Logistik Biner 8
2.2 Ilustrasi Penarikan Contoh dengan Bootstrap 9
3.1 Diagram Alir Penelitian 12 berdasarkan Pembagian Wilayah atau Pulau Besar 14 4.4 Persebaran Desa Perkotaan dan Desa Perdesaan di Propinsi Jawa
Timur 14
4.5 Persebaran Desa Perkotaan dan Desa Perdesaan di Propinsi Papua 15 4.6 Persebaran Desa Perkotaan dan Desa Perdesaan di Kab. Sidoarjo 15 4.7 Persebaran Desa Perkotaan dan Desa Perdesaan di Kab. Jayapura 16
4.8 Tingkat Kekuatan Peubah X1-X11 21
4.9 Tingkat Kekuatan Peubah Penyusun Model Akhir dengan mengikut
1 PENDAHULUAN
Latar Belakang
Hakikat dari pembangunan yang dilakukan Pemerintah Indonesia pada intinya bertujuan untuk meningkatkan taraf hidup masyarakat, baik peningkatan secara material maupun spiritual. Perencanaan pembangunan yang matang dapat menciptakan pembangunan yang tepat sasaran. Salah satu aspek penunjang dalam perencanaan pembangunan adalah ketersediaan data yang rinci pada tingkat wilayah terkecil. Informasi hingga wilayah terkecil dapat dipergunakan sebagai panduan dalam membuat kebijakan yang lebih tepat sasaran.
Pembagian wilayah administratif menurut Kementerian Dalam Negeri Republik Indonesia terdiri dari Rukun Tetangga (RT), Rukun Warga (RW), Kelurahan/Desa, Kecamatan, Kota/Kabupaten, Propinsi hingga pemerintahan pada tingkat nasional. Pembagian wilayah ini bertujuan untuk pengelolaan oleh pemerintah daerah di dalam batas-batas wilayahnya masing-masing menurut prinsip otonomi, dekonsentrasi, desentralisasi, dan tugas pembantuan. Badan Pusat Statistik berupaya untuk menyediakan informasi sampai level wilayah terkecil dalam hal ini pada tingkat kelurahan/desa. Karena penggunaan istilah kelurahan/desa lebih tepat jika ditujukan untuk kepentingan administrasi, maka Badan Pusat Statistik (BPS) melakukan penggolongan kelurahan/desa tersebut ke dalam status perkotaan atau perdesaan. Penggolongan berdasarkan perkotaan dan perdesaan dianggap lebih menggambarkan karakteristik dari desa tersebut. Penggolongan wilayah kelurahan/desa ke dalam status perkotaan/perdesaan pada dasarnya dimaksudkan untuk membentuk suatu lapisan (strata) yang digunakan dalam teknik pengambilan contoh dalam survei. Dengan adanya status perkotaan dan perdesaan, diharapkan contoh yang terambil dapat mewakili keseluruhan populasi dengan baik. Dalam analisis, penggolongan desa menjadi desa perkotaaan/perdesaan akan memberikan hasil yang lebih menggambarkan keadaan sebenarnya jika dibandingkan dengan penggolongan kelurahan/desa (Imawan 1986).
2
Tabel 1.1. Kriteria dan keberadaan akses pada fasilitas perkotaan dengan skor
Penentuan nilai/skor untuk menetapkan wilayah perkotaan apabila dari kepadatan penduduk, persentase rumah tangga pertanian, dan keberadaan/akses pada fasilitas perkotaan yang dimiliki mempunyai total nilai/skor 10 (sepuluh) atau lebih dan wilayah perdesaan apabila dari kepadatan penduduk, persentase rumah tangga pertanian, dan keberadaan/akses pada fasilitas perkotaan yang dimiliki mempunyai total nilai/skor di bawah 10 (sepuluh).
Seiring dengan perubahan kondisi wilayah, peubah lama yang digunakan oleh BPS sebagai pembeda perkotaan/perdesaan dirasa perlu diperbaharui. Dari segi ekonomi, pembaharuan peubah diharapkan dapat menekan biaya pengumpulan data jika pembaharuan menghasilkan peubah yang terpilih lebih sedikit. Akan tetapi kemunculan peubah baru dianggap mampu mengklasifikasikan desa dengan lebih baik. Oleh karenanya, seleksi peubah harus dilakukan dengan baik.
Ada banyak metode yang digunakan dalam seleksi peubah. Ilmu pengetahuan yang terus berkembang juga turut memperkaya khasanah metode seleksi peubah. Metode yang satu dianggap lebih tepat dalam menggolongkan wilayah perkotaan/perdesaan dibandingkan metode yang lain. Imawan (1986) telah menggunakan Analisis Komponen Utama (AKU) dalam pemilihan peubah pembeda perkotaan/perdesaan. Perkembangan dalam ilmu simulasi data juga memberikan kontribusi yang cukup besar dalam metode seleksi peubah. Metode
3
metode bootstrap yang dikombinasikan dengan regresi logistik ordinal maupun dengan MARS. Hasilnya adalah untuk masalah ketepatan klasifikasi pendekatan
bootstrap pada masing-masing metode memberikan kesalahan yang kecil baik pada matriks varians kovarians yang tidak sama maupun matriks varians kovarians yang sama. Berdasarkan penelitian-penelitian tersebut, pengembangan metode kombinasi bootstrap dan regresi logistik biner kiranya dapat diterapkan pada seleksi peubah dalam klasifikasi perkotaan/perdesaan.
Identifikasi Masalah
Berdasarkan latar belakang yang telah dijelaskan sebelumnya, maka masalah yang dibahas dalam penelitian ini adalah peubah apa saja yang saat ini paling berpengaruh dalam penentuan klasifikasi desa di Indonesia sehingga dapat dijadikan pembeda secara nyata antara desa perkotaan dan perdesaan?
Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk melakukan kajian pemilihan peubah yang paling berpengaruh dalam penentuan klasifikasi desa di Indonesia.
Kegunaan Penelitian
Manfaat yang didapat dari penelitian ini adalah memperkaya khasanah pengetahuan ilmu statistik dengan penerapan metode bootstrap dan regresi logistik biner untuk memberikan alternatif pemilihan peubah yang paling berpengaruh dalam penentuan klasifikasi desa di Indonesia. Di masa yang akan datang, penelitian ini diharapkan bisa dijadikan bahan rintisan untuk mengembangkan metode ini pada permasalahan lain.
2 TINJAUAN PUSTAKA
4
Perkotaan dan Perdesaan
Pemerintah Inggris Raya mengklasifikasikan suatu wilayah sebagai perkotaan jika populasi penduduk yang tinggal di wilayah tesebut sudah lebih dari 10.000 orang. Sensus India (2011) mendefinisikan wilayah perkotaan jika wilayah tersebut memiliki pemerintahan kota dan memenuhi syarat-syarat antara lain memiliki populasi penduduk yang bermukim di wilayah tersebut minimal 5.000 orang, sedikitnya 75% angkatan kerja laki-laki berkerja di sektor non pertanian, serta memiliki kepadatan penduduk sedikitnya 400 orang per km2.
Di Indonesia, definisi perkotaan menurut UU No 22/ 1999 tentang Otonomi Daerah, kawasan perkotaan adalah kawasan yang mempunyai kegiatan utama bukan pertanian dengan susunan fungsi kawasan sebagai tempat pelayanan jasa pemerintahan, pelayanan social dan kegiatan ekonomi. Perkotaan adalah status suatu wilayah administrasi setingkat desa/kelurahan yang memenuhi kriteria klasifikasi wilayah perkotaan.
Sementara itu, World Bank (2008) mengatakan bahwa wilayah perdesaan dapat didefinisikan berdasarkan banyaknya permukiman, kepadatan penduduk, jarak ke area metropolitan, pemisahan administratif dan peranan sektor pertanian.
The Organization for Economic Co-operation and Development menggunakan kepadatan penduduk 150 orang per km2 untuk mendefinisikan wilayah perdesaan. Menurut Landis (1948) desa adalah suatu wilayah yang penduduknya kurang dari 2.500 jiwa. Dengan ciri ciri sebagai berikut:
a) Mempunyai pergaulan hidup yang saling kenal mengenal antara ribuan jiwa.
b) Ada pertalian perasaan yang sama tentang kesukaan terhadap kebiasaan
c) Cara berusaha (ekonomi) adalah agraris yang paling umum yang sangat dipengaruhi alam seperti: iklim, keadaan alam, kekayaan alam, sedangkan pekerjaan yang bukan agraris adalah bersifat sambilan. Kawasan perdesaan menurut UU No. 26 Tahun 2007 tentang Rencana Tata Ruang Wilayah Nasional adalah suatu wilayah yang mempunyai kegiatan utama pertanian, termasuk pengelolaan sumber daya alam dengan susunan fungsi kawasan sebagai tempat permukiman perdesaan, pelayanan jasa pemerintahan, pelayanan sosial dan kegiatan ekonomi. Menurut Tim Penyusun Pusat Kamus (2005), pedesaan adalah daerah pemukiman penduduk yang sangat dipengaruhi oleh kondisi tanah, iklim, dan air sebagai syarat penting bagi terwujudnya pola kehidupan agraris penduduk ditempat itu.
5
Perbedaan Perkotaan dan Perdesaan
Perbedaan yang paling sederhana antara perkotaan dan perdesaan di suatu negara biasanya didasarkan pada anggapan bahwa masyarakat perkotaan memiliki cara hidup dan biasanya memiliki standar hidup yang berbeda dibandingkan masyarakat perdesaan. Pada negara yang sektor industrinya sedang berkembang, perbedaan tersebut menjadi tidak terlalu terlihat lagi dan muncul perbedaan mencolok lainnya seperti tingkat kepadatan penduduk di wilayah tersebut. Beberapa negara merasa perlu menambahkan kriteria tambahan yang diyakini dapat membedakan perkotaan dan perdesaan seperti persentase penduduk yang bekerja di sektor pertanian, ketersediaan listrik dan atau ketersediaan air ledeng, dan kemudahan akses ke sarana kesehatan, sekolah, dan tempat rekreasi. Bahkan pada beberapa negara juga ditambahkan kriteria pembeda seperti kawasan pertanian, pusat perdagangan, pusat industri, pusat pelayanan masyarakat dan lain sebagainya yang dinilai mampu membedakan perkotaan dan perdesaan (UN 2008).
Menurut Arsyad et al.(2011), daerah perdesaan pada umumnya memiliki ketidakberuntungan komparatif, yang biasanya muncul karena: (1) ketertinggalan pembangunan berbagai infrastruktur yang mengakibatkan keterbatasan masyarakat perdesaan dalam hal akses untuk berkomunikasi, produk, uang dan informasi dan (2) keterbatasan kemampuan (ability) dan sumber daya (resource-type disadvantages) untuk menghasilkan barang dan jasa yang bisa dijual di pasar yang lebih luas. Infrastruktur yang dimaksud antara lain yaitu infrastruktur transportasi, infrastruktur komunikasi, infrastruktur listrik, infrastruktur ekonomi, infrastruktur kesehatan, dan infrastruktur pendidikan. Beberapa indikator yang digunakan untuk melihat terpenuhinya infrastruktur tersebut dapat dilihat pada tabel berikut:
Tabel 2.1 Jenis Infrastruktur dan Indikator Pemenuhan Infrastruktur
Jenis Infrastruktur Indikator
Infrastruktur Transportasi • Ketersediaan jalan • Akses kendaraan roda 4 Infrastruktur Komunikasi • Keberadaan kantor pos
• Ketersediaan jaringan telepon (telepon kabel atau seluler) • Keberadaan internet
Infrastruktur Listrik • Rumah tangga pengguna listrik
Infrastruktur Ekonomi • Keberadaan pasar
• Keberadaan pertokoan
• Keberadaan lembaga keuangan Infrastruktur Kesehatan • Jumlah tenaga kesehatan
• Ketersediaan fasilitas kesehatan
• Sumber air minum utama Infrastruktur Pendidikan • Ketersediaan fasilitas
6
Dari semua indikator ketercapaian infrastruktur tersebut, dapat dibuat batasan yang dijadikan acuan pembeda desa perkotaan dan desa perdesaan.
Regresi Logistik Biner
Regresi logistik merupakan salah satu metode regresi dimana peubah responnya merupakan data kategorik. Regresi logistik biner digunakan jika peubah respon terdiri dari dua kategori (Agresti 2002). Pada Metode Regresi Logistik Biner dapat digunakan untuk klasifikasi data. Peubah respon Y = 1 menyatakan kejadian yang “sukses” (masuk dalam kategori), sedangkan untuk Y = 0 menyatakan kejadian yang “gagal” (tidak masuk kategori). Peubah Y ini akan mengikuti sebaran Binomial.
Bentuk umum model peluang regresi logistik dengan k peubah bebas diformulasikan sebagai berikut:
=1 + exp +exp + + ⋯ ++ ⋯ + … . 1
Jika model pada persamaan di atas ditransformasi dengan menggunakan transformasi logit dari π(x), maka model logistik dapat ditulis sebagai persamaan (Azen dan Walker 2011):
g x =ln π xi
1-π xi = β0+β1x1+…+βkxk ….(2)
Pendugaan parameter pada regresi logistik menggunakan Maximum Likelihood Estimation. Metode ini menduga nilai parameter β dengan memaksimumkan fungsi Likelihood (Hosmer dan Lemeshow 2000). Nilai dugaan parameter kemudian diuji untuk mengetahui peubah bebas mana yang berpengaruh nyata terhadap model. Pengujian peubah bebas dapat dilakukan secara simultan atau parsial.
Adapun hipotesis yang pada uji parsial sebagai berikut: H0: βj = 0
H1: βj≠0, j = 1, 2, … , k
Pengujian parameter secara parsial menggunakan statistik uji Wald dengan sebagai berikut (Azen dan Walker 2011):
X2= β-β Sβ
2
~ χ2 dengan df =1 …(3)
7
G2= -2 ln L0
Lk ~χ(k)
2 …(4)
Salah satu metode yang digunakan untuk memilih model terbaik dengan menyeimbangkan prinsip kebaikan (goodness-of-fit) dan prisip keserhanaan (parsimony) dari model tersebut adalah metode Akaike’s Information Criterion (Akaike 1974 dalam Perlich et al. 2003)):
AIC = -2(maximized log-likelihood) +2 (jumlah parameter) … (5) Model terbaik adalah model dengan AIC terkecil.
Salah satu alat untuk mengukur kemampuan suatu metode klasifikasi dalam meramalkan kelompok data baru digunakan peluang dari kesalahan klasifikasi yang disebut dengan Apparent Error Rate (Rencher and Chistensen 2012). Misalkan terdapat tabel dua arah yang merupakan hasil klasifikasi sebagai berikut:
Tabel 2.2 Tabel Klasifikasi Dua Arah
Klasifikasi Klasifikasi Aktual Total
Baris Perdesaan Perkotaan
Klasifikasi Prediksi
Perdesaan .
Perkotaan .
Total Kolom . . ..
AER= n12+n21
n11+n12+n21+n22 … 6
8
Gambar 2.1. Diagram Alir Regresi Logistik Biner Bootstrap
Bootstrap, dikenal sebagai salah satu metode simulasi data, saat ini menjadi semakin populer sebagai metode statistik. Bootstrap dimaksudkan untuk menyederhanakan analisis statistik inferensia, yang kadangkala dalam situasi tertentu sulit diperoleh hasil analisisnya. Seiring dengan berkembangnya teknologi komputer yang semakin cepat dan handal, waktu dan upaya yang diperlukan dalam proses bootstrap semakin menurun ke tingkat dimana bootstrap menjadi alternatif yang tersedia untuk teknik parametrik standar.
Metode bootstrap diperkenalkan pada 1979 oleh Efron untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstrap merupakan teknik modifikasi dari Jackknife yang diperkenalkan oleh Quenouille pada tahun 1948. Bootstrap pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, sehingga bootstrap dikenal sebagai data driven approach. Pada
9
kali agar dapat mewakili data populasinya. Bootstrap memungkinkan seseorang untuk melakukan inferensi statistik tanpa membuat asumsi sebaran terlebih dahulu.
Gambar 2.2. Ilustrasi Penarikan Contoh dengan Bootstrap (Barker 2005) Seleksi Peubah dengan Bootstrap Regresi Logistik
Seperti yang telah dijelaskan pada bab terdahulu, seleksi peubah merupakan tahapan yang amat penting dalam pemodelan. Kenkel dan Signorino (2013) telah mengkombinasikan regresi basis dan bootstrap dengan pemilihan peubah untuk menghasilkan bentuk pendugaan yang lebih fleksibel. Fokus penelitian mereka adalah untuk mengeluarkan peubah yang tidak memiliki efek sesungguhnya dari model dugaan pada contoh yang cukup besar. Kemudian mereka menggunakan
bootstrap untuk menghitung galat bakunya. Austin dan Tu (2004) melakukan simulasi bootstrap regresi logistik dengan metode backward elimination, forward selection dan stepwise selection. Seleksi peubah ini menghasilkan model yang tidak stabil dan peubah yang dihasilkan dari seleksi ini cenderung terlalu sensitif terhadap fluktuasi data.
10
3 METODE PENELITIAN
Data
Data yang digunakan dalam penelitian ini merupakan data hasil pendataan Potensi Desa (PODES) tahun 2011. Peubah respon (Y) dalam penelitian ini adalah kode klasifikasi desa dengan desa perkotaan (1) dan desa perdesaan (0). Ada 15 peubah prediktor yang digunakan dalam penelitian ini. Kelimabelas peubah prediktor dibagi menjadi dua kelompok. Kelompok pertama terdiri dari 11 peubah yang saat ini digunakan BPS dalam penentuan klasifikasi desa dan kelompok kedua terdiri dari empat peubah yang diharapkan dapat memperbaiki hasil klasifikasi desa. Pemilihan empat peubah baru ini merujuk pada Tabel 2.1 yang dikembangkan oleh Arsyad et al. (2011). Pemilihan peubah baru juga merujuk pada program-program yang dikembangkan oleh Pemerintah Indonesia, seperti Internet Masuk Desa dan masuknya lembaga keuangan hingga tingkat kecamatan.
Tabel 3.1 Peubah Prediktor Penyusun Model
Peubah Nama Peubah Skala Kriteria
11
Metode Analisis
Langkah-langkah analisis data yang akan dilakukan dalam penelitian ini sebagai berikut:
1. Melakukan eksplorasi data PODES 2011. Eksplorasi dilakukan dengan melihat sebaran X1, X2,…, X11, melihat korelasi antar peubah dan frekuensi desa menurut klasifikasi.
2. Memilih di antara X1, X2,…, X11 yang memiliki kontribusi paling kecil terhadap model. Pemilihan peubah dilakukan dengan cara:
a. Melakukan penarikan contoh bootstrap dengan ukuran contoh sebanyak n dan ulangan bootstrap (replikasi) sebanyak B.
b. Membuat model regresi logistik biner pada tiap ulangan bootstrap
sehingga akan dihasilkan sebanyak B model regresi logistik.
c. Dari masing-masing peubah akan dihitung berapa kali peubah tersebut signifikan dari B model yang terbentuk lalu kemudian dihitung persentasenya.
d. Membuat peringkat peubah yang akan dikeluarkan paling awal dari dalam model berdasarkan persentase signifikansi yang paling kecil. 3. Membuat model baru dengan mengurangi peubah satu per satu secara bertahap
hingga didapat model optimum yang memiliki peubah sedikit dan error yang kecil pula.
a. Pemilihan model ini dilakukan dengan metode k-fold cross-validation method. K-fold cross-validation method adalah metode validasi silang dimana set data dibagi menjadi k kelompok data (fold) yang berukuran sama dan kemudian diberi nomor. Selanjutnya lipatan pertama dijadikan set validasi (testing) dan sisanya dijadikan set percobaan (training). Hal yang sama dilakukan pada set kedua dan seterusnya hingga set ke k. Hasil akhir berupa nilai dugaanrata-rata dari k set tersebut.
b. Pemilihan model terbaik dilakukan dengan membandingkan cross-validation error dan cross-validation accuracy model yang satu dengan model yang lain. Apabila nilai error dan akurasi yang didapat tidak berbeda jauh, maka pemilihan model terbaik dilakukan dengan membandingkan selisih error antar model yang paling besar.
4. Menambahkan peubah baru ke dalam model optimum yang dihasilkan pada poin 3 dan melakukan pemilihan peubah yang memiliki kontribusi paling kecil terhadap model. Pemilihan peubah dilakukan dengan cara yang sama pada poin 2 dan 3. Hasil akhir berupa model baru yang lebih kekar dan mampu menaikkan ketepatan klasifikasi.
5. Menghitung titip potong peluang yang mampu mengurangi tingkat kesalahan klasifikasi pada model yang dihasilkan pada poin 4, dengan melihat error rate,
sensitivitas dan spesifisitas.
12
Gambar 3.1. Diagram Alir Penelitian
4 HASIL DAN PEMBAHASAN
Eksplorasi Data
13
Gambar 4.1 Persentase Desa Perkotaan dan Desa Perdesaan di Indonesia Tahun 2011
Pada penyajian gambar 4.1 dapat kita lihat bahwa persentase desa perdesaan lebih besar dibandingkan desa perkotaan. Persentase desa perkotaan dan perdesaan ini dapat dilihat lebih rinci berdasarkan propinsi.
Gambar 4.2. Persentase Desa Perkotaan dan Perdesaan di Indonesia Tahun 2011 Menurut Propinsi
Pada gambar 4.2 dapat dilihat gambaran persentase desa perkotaan dan desa perdesaan menurut propinsi di Indonesia. Pada gambar terlihat bahwa Propinsi DKI Jakarta tidak memiliki desa perdesaan. Hal ini disebabkan fungsi DKI Jakarta sebagai pusat pemerintahan dengan sarana prasarana yang serba ada. Dalam gambar juga terlihat bahwa Propinsi Papua memiliki persentase desa perkotaan paling sedikit di Indonesia.
Perkotaan 17%
14
(a) (b)
Gambar 4.3 Persentase Desa Perkotaan (a) dan Desa Perdesaan (b) di Indonesia Tahun 2011 berdasarkan Pembagian Wilayah atau Pulau Besar
Persentase desa perkotaan dan desa perdesaan di Indonesia juga dapat dilihat berdasarkan pembagian wilayah atau pulau besar yang disajikan dalam gambar 4.3. Berdasarkan gambar tersebut terlihat bahwa dari total jumlah desa perkotaan di Indonesia, mayoritas desa perkotaan berada di Pulau Jawa. Pada gambar juga terlihat bahwa mayoritas desa perdesaan berada di Pulau Sumatera.
15
Gambar 4.5. Persebaran Desa Perkotaan dan Desa Perdesaan di Propinsi Papua Jika kita perhatikan peta tematik yang disajikan pada gambar 4.4 dan gambar 4.5, terlihat bahwa sebaran desa perkotaan dan desa perdesaan di Propinsi Jawa Timur dan Papua amat berbeda. Propinsi Jawa Timur sebagai propinsi terbesar kedua di Indonesia memiliki desa perkotaan yang cukup banyak. Lain halnya dengan Propinsi Papua. Pada gambar 4.5 terlihat jelas bahwa terdapat sedikit sekali desa yang bisa di kategorikan sebagai desa perkotaan. Bahkan ada kabupaten yang tidak memiliki desa perkotaan.
Kabupaten/kota yang dekat dengan ibukota propinsi biasanya merasakan imbas atau dampak dari pembangunan yang terjadi di ibukota. Dampak tersebut dapat berupa kemajuan infrastruktur atau fasilitas dari kabupaten/kota tersebut. Akibatnya akan ditemukan lebih banyak desa perkotaan di daerah tersebut. Contoh kabupaten yang terkena dampak pembangunan dari kota tetangganya adalah Kabupaten Sidoarjo yang bertetangga dengan Kota Surabaya.
16
Pada gambar 4.6, terlihat bahwa Kabupaten Sidoarjo didominasi oleh desa perkotaan. Meskipun didominasi oleh kawasan perkotaan, kabupaten ini juga menampakkan kondisi yang unik. Kondisi unik yang dimaksud adalah adanya desa perdesaan yang dikelilingi desa perkotaan, contohnya adalah Desa Janti. Akan tetapi hal yang berbeda terjadi di Kabupaten Jayapura. Meskipun bertetangga dengan Kota Jayapura, sepertinya dampak pembangunan ibukota tidak terlalu nyata menyentuh kabupaten ini. Pada gambar 4.7, terlihat bahwa jumlah desa perkotaan di kabupaten ini amat sedikit.
Gambar 4.7. Persebaran Desa Perkotaan dan Desa Perdesaan di Kab. Jayapura
17
Tabel 4.1. Nilai Korelasi antar peubah penyusun model
Peubah Y X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14
X1 -0,529
X2 0,254 -0,398
X3 0,246 -0,307 0,396
X4 0,396 -0,360 0,336 0,452
X5 0,330 -0,289 0,326 0,328 0,375
X6 0,385 -0,279 0,111 0,116 0,204 0,163
X7 0,506 -0,418 0,317 0,304 0,435 0,568 0,261
X8 0,555 -0,428 0,233 0,204 0,325 0,237 0,369 0,395
X9 0,219 -0,166 0,075 0,078 0,129 0,099 0,161 0,160 0,192
X10 0,545 -0,380 0,168 0,171 0,290 0,243 0,446 0,372 0,447 0,229
X11 0,189 -0,267 0,284 0,161 0,166 0,150 0,092 0,204 0,178 0,055 0,136
X12 0,304 -0,325 0,221 0,224 0,251 0,217 0,154 0,269 0,203 0,123 0,239 0,150
X13 0,149 -0,287 0,386 0,244 0,192 0,183 0,063 0,194 0,151 0,046 0,096 0,264 0,210
18
Pada tabel korelasi antar peubah yang disajikan oleh tabel 4.1, terlihat korelasi antar peubah Y dengan tiap peubah X tidak ada yang bernilai nol. Artinya antar peubah Y dan X memiliki hubungan linier. Tabel 4.1 menunjukkan bahwa korelasi antar peubah X juga tidak ada yang bernilai nol yang berarti terdapat hubungan linier antar peubah X.
Korelasi antar peubah X biasanya mengindikasikan bahwa adanya kemungkinan terjadi masalah multikolinieritas. Masalah multikolinieritas akan menyebabkan model regresi yang dihasilkan tidak tepat. Pengecekan keberadaan masalah multikolinieritas dilakukan dengan membuat model regresi yang melibatkan seluruh peubah X dan kemudian dilihat nilai VIF yang muncul. Jika ada peubah yang memiliki nilai VIF di atas 5 maka dapat disimpulkan bahwa terjadi masalah multikolinieritas.
Tabel 4.2 Nilai Koefisien, Galat Baku, dan Variance Inflation Factors (VIF) Peubah Penyusun Model
Peubah Koefisien Galat Baku Koef. VIF
Konstanta -4,5210 0,2790 bahwa tidak terjadi masalah multikolinieritas dalam model sehingga dapat disimpulkan semua peubah X layak untuk dimasukkan ke dalam model. Berdasarkan kesimpulan yang diambil, kita dapat melanjutkan ke tahapan eksplorasi selanjutnya yakni analisis deskriptif pada data.
19
Tabel 4.3 Rata-rata Persentase Rumah Tangga Pertanian Menurut Klasifikasi Desa Klasifikasi Desa Rata-rata Persentase Rumah Tangga
Pertanian (%)
Perkotaan 23,35
Perdesaan 75,07
Sarana pendidikan antar desa perkotaan dan desa perdesaan juga cenderung berbeda. Desa perkotaan diyakini memiliki sarana pendidikan yang lebih lengkap dibandingkan desa perdesaan. Program Pendidikan Dasar 9 Tahun yang dicanangkan oleh pemerintah mendorong pembangunan sarana pendidikan hingga ke pelosok desa.
Tabel 4.4 Persentase Desa Yang Memiliki Sarana Pendidikan (TK, SMP, dan SMU) Menurut Klasifikasi Desa (%)
Klasifikasi Desa TK SMP SMU
Perkotaan 98,35 92,67 78,71
Perdesaan 68,27 61,63 27,77
Pada tabel 4.3 dapat kita lihat desa perkotaan memiliki fasilitas pendidikan yang lebih lengkap dibandingkan desa perdesaan. Hal ini ditunjukkan dengan persentase yang cukup tinggi dari desa perkotaan yang sudah dilengkapi sarana pendidikan tersebut. Pada tabel 4.4 dapat dilihat bahwa 98,35% dari seluruh desa perkotaan di Indonesia sudah memiliki Taman Kanak-Kanak. Tabel 4.4 juga menunjukkan hanya 27,77% desa perdesaan yang memiliki Sekolah Menengah Umum/sederajat.
Seleksi Peubah X1 hingga X11
20
Tabel 4.5 Nilai Parameter β, Galat Baku, Nilai-Z dan Nilai-p dari Uji Parsial Parameter
Tabel 4.5 menunjukkan nilai-p dari semua peubah prediktor berbeda nyata pada α = 0,05, sehingga semua peubah diikutsertakan dalam model awal. Model awal memiliki AIC = 30034 dengan AER = 7,635%.
Langkah analisis selanjutnya adalah memilih peubah yang tidak diikutsertakan dari model awal. Pemilihan peubah yang dikeluarkan dari model menggunakan simulasi bootstrap. Penarikan contoh bootstrap dilakukan dengan penarikan contoh acak sederhana dengan memperhatikan proporsi desa perkotaan dan desa perdesaan secara keseluruhan dan keterwakilan contoh berdasarkan pulau-pulau besar yang ada di Indonesia. Adapun rumus penentuan jumlah contoh sebagai berikut:
n= Np(1-p)
N-1 D+p(1-p) dengan D= B2
4 …(7)
Penentuan jumlah contoh bootstrap harus berdasarkan batas kesalahan (Margin of Error) yang digunakan oleh peneliti. Pada penelitian ini dilakukan simulasi penentuan jumlah contoh berdasarkan beberapa batas kesalahan yang dapat digunakan oleh peneliti. Setelah dilakukan penentuan jumlah contoh bootstrap (n), proses selanjutnya adalah penarikan contoh bootstrap sebanyak n untuk 1 set contoh bootstrap. Penarikan contoh tersebut kemudian diulang hingga terbentuk sejumlah set contoh bootstrap yang dinamakan replikasi bootstrap (B).
Pada tiap replikasi bootstrap kita terapkan model regresi logistik biner. Hasil pemodelan akan terlihat peubah yang signifikan. Replikasi tersebut diulang sebanyak 10.000 kali. Berdasarkan keseluruhan replikasi, selanjutnya dibuat persentase signifikansi tiap peubah dengan rumus:
% Signifikansi Xi=jumlah Xi yang sig. dari B rep.
21
Tabel 4.6 Persentase Signifikansi Tiap Peubah dalam Ukuran Contoh n
Peubah Persentase Signifikansi Peubah Menurut Ukuran Contoh (%) Batas Galat = 0,025 Batas Galat = 0,010 Batas Galat = 0,000
bootstrap sama dengan ukuran contoh sesungguhnya maka sensitivitas signifikansi akan semakin tinggi. Akan tetapi, jika ukuran contoh bootstrap diperkecil maka akan terlihat peubah-peubah yang dianggap tidak signifikan. Tanpa melihat besar persentase kekuatan peubah, ukuran contoh 893 dan 5266 menghasilkan gambaran kekuatan peubah yang serupa. Berdasarkan simulasi pada tabel tersebut, dapat dibuat tingkat kekuatan peubah yang disajikan pada gambar berikut.
Gambar 4.8. Tingkat Kekuatan Peubah X1-X11 pada n = 5266
22
sebanyak k kali, lalu di hitung rata-rata kesalahan dan keakuratan dari tiap model. Nilai k yang umum digunakan adalah 10.
Tahapan selanjutnya adalah membandingkan nilai dugaan galat prediksi dan nilai dugaan akurasi dari model tersebut. Hasilnya adalah sebagai berikut:
Tabel 4.7 Simulasi Pengurangan Peubah Penyusun Model Beserta Dugaan Galat Prediksi dan Dugaan Keakuratan
No. Peubah yang Tidak
Pada tabel 4.7 terlihat bahwa ada dua model yang patut dipertimbangkan sebagai model sederhana, yakni model ke-7 dan ke-8. Kedua model tersebut memiliki selisih galat yang tidak terlalu jauh dengan model sebelumnya (selisih galat model 7 ke 6 dan model 8 ke 7). Hal yang membedakan kedua model tersebut adalah keberadaan peubah X4 di dalam model. Untuk mendapatkan hasil penelitian yang meyakinkan, dilakukan simulasi penambahan peubah X12-X15 ke dalam ke dua model tersebut.
Penambahan Peubah X12-X15
23
Tabel 4.8 Persentase Signifikansi Peubah pada 10.000 replikasi dan Peringkat Peubah
Peubah Persentase Signifikansi Peubah
Model 7 Model 8
X1 100,0 100,0
X4 99,9 -
X7 100,0 100,0
X8 100,0 100,0
X10 100,0 100,0
X12 29,3 37,4
X13 38,8 50,4
X14 100,0 100,0
X15 96,9 98,8
Gambar 4.9. Tingkat Kekuatan Peubah Penyusun Model Akhir dengan mengikutsertakan X4
24
Tabel 4.9 Simulasi Pengurangan Peubah Penyusun Model Beserta Dugaan Galat Prediksi dan Dugaan Keakuratan
No. Peubah yang Tidak Simulasi dengan Model ke-7 (X1, X4, X7, X8, X10, X12, X13, X14, X15)
1 - 0,053 - 0,928 -
2 X12 0,053 0,000 0,928 0,000
3 X12, X13 0,053 0,000 0,928 0,000
4 X12, X13, X15 0,054 0,001 0,927 -0,001
5 X12, X13, X15, X4 0,055 0,001 0,926 -0,001 Simulasi dengan Model ke-8 (X1, X7, X8, X10, X12, X13, X14, X15)
6 - 0,054 - 0,927 -
7 X12 0,054 0,000 0,927 0,000
8 X12, X13 0,054 0,000 0,926 -0,001
9 X12, X13, X15 0,055 0,001 0,926 0,000
Pada tabel 4.9 terlihat bahwa penambahan peubah baru meningkatkan tingkat ketepatan model, sehingga dapat disimpulkan bahwa penambahan peubah baru berdampak positif terhadap model. Jika kita bandingkan kedua simulasi di atas, terlihat bahwa simulasi dengan model ke-7 memiliki nilai error yang lebih kecil dan tingkat akurasi yang lebih tinggi. Hal ini mempertegas bahwa peubah X4 sebaiknya diikutsertakan ke dalam model. Jika kita perhatikan model ke-12 terlihat bahwa model tersebut memiliki tingkat akurasi yang paling baik dikarenakan memiliki selisih error yang tidak terlalu besar dan tingkat akurasi yang cukup tinggi yakni sebesar 92,8%. dapat disimpulkan model ke-12 dengan peubah X1, X4, X7, X8, X10, X14, X15 merupakan model yang lebih baik untuk digunakan dalam penentuan klasifikasi perkotaan dan perdesaan. Model regresi logistik yang dihasilkan ke-7 peubah tersebut adalah sebagai berikut:
=
25
Tabel 4.10 Nilai AIC, AER, Sensitivitas, dan 1-Spesifisitas Berdasarkan Titik Potong
Titik
Potong AIC AER Sensitivitas Spesifisitas 1- Spes. 0,15 28789,0202 11,0433 0,8821 0,8911 0,1089
Pada tabel 4.10 dapat dilihat bahwa titik potong untuk menghasilkan nilai sensitivitas dan spesifisitas yang seimbang terletak pada titik 0,15. Akan tetapi titik potong 0,495 mampu menghasilkan nilai AER yang minimum dan nilai sensitivitas yang tinggi. Artinya ketepatan memprediksi desa perkotaan tepat menjadi desa perkotaan (True Positive) titik 0,495 sudah di atas titik potong awal (0,500).
Aplikasi Model pada Data Propinsi Jawa Barat
Untuk melihat kemampuan model dalam memprediksi klasifikasi akan dilakukan perbandingan model dengan 11 peubah, 5 peubah dan 7 peubah denga titik potong 0,495 terhadap klasifikasi aktual desa di propinsi Jawa Barat. Hasil perbandingan model yang dihasilkan disajikan pada tabel berikut:
26
5 SIMPULAN DAN SARAN
Kesimpulan yang dihasilkan dari penelitian ini adalah pengurangan sebelas peubah (X1-X11) yang saat ini digunakan oleh BPS dalam penentuan klasifikasi desa di Indonesia menjadi lima peubah mampu menghasilkan model yang sama baiknya. Model dengan penambahan empat peubah prediktor baru mampu menaikkan tingkat ketepatan klasifikasi. Penggunaan metode bootstrap dalam seleksi peubah terbukti lebih baik dibandingkan seleksi peubah yang hanya melihat hasil uji parsial saja. Hal ini dibuktikan dengan terpilihnya peubah yang sedikit yang memiliki kekuatan memprediksi yang nyaris sama baiknya dengan peubah yang banyak.
27
DAFTAR PUSTAKA
Agresti A. 2002. Categorical Data Analysis. New York (US): John Wiley & Sons, Inc.
Arsyad L, Satriawan E, Mulyo JH, Fitrady A. 2011. Strategi Pembangunan Perdesaan Berbasis Lokal. Yogyakarta (ID): STIM YKPN.
Austin PC, Tu JV. 2004. Automated Variable Selection Methods For Logistic Regression Produced Unstable Models For Predicting Acute Myocardial Infarction Mortality. Journal of Clinical Epidemiology 57 (2004) 1138– 1146. Canada (CA): Elsevier.
Azen R, Walker CM. 2011. Categorical Data Analysis for Behavioral and Social Science. New York (US): Routledge.
Badan Pusat Statistik. 2010. Peraturan Kepala Badan Pusat Statistik No.37 tahun 2010 Tentang Klasifikasi Perkotaan dan Perdesaan di Indonesia. Jakarta (ID): BPS.
Barker N. 2005. A Practical Introduction to the Bootstrap Using the SAS System. Di dalam Katherine Hutchinson, editor. Proceedings of the Pharmaceutical Users Software Exchange Conference. Wallingford (UK): Oxford Pharmaceutical Sciences: Paper PK02.
Department of Economic and Social Affairs Statistics Division. 2008. Principles and Recommendations for Population and Housing Censuses. New York (US): United Nation.
. 2014. Principles and Recommendations for a Vital Statistics System. New York (US): United Nation.
Efron B, Tibshirani R. 1993. An Introduction to Bootstrap. New York (US): Chapman &Hall.
Office for National Statistics. 2013. Rural Urban Classification 2011. London (UK): Government Statistical Service.
Otok BW, Akbar MS, Guritno S, Subanar. 2007. Pendekatan Bootstrap pada Klasifikasi Pemodelan Respon Ordinal. Jurnal Ilmu Dasar, 8(1):54-67. Yogyakarta (ID): Universitas Gajah Mada.
Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. Ed Ke-2. Toronto (CA): John Wiley & Sons, Inc.
Imawan W. 1986. Penerapan Fungsi Diskriminan Dalam Penggolongan Desa di Jawa Timur [Skripsi]. Jakarta (ID): Universitas Indonesia.
Kenkel B, Signorino CS. 2013. Bootstrapped Basis Regression with Variable Selection: A New Method for Flexible Functional Form Estimation. Paper Work. [Diunduh 2015 April 8]. Tersedia pada: http://bkenkel.com/data/basics.pdf
Landis PH. 1948. Pengantar Sosiologi Pedesaan dan Pertanian. Jakarta (ID): PT. Gramedia Pustaka Utama.
Mailvaganam H. 2007. Data Modeling and Mining: Modeling for Data Mining.
[Diakses 2014 Oktober 25]. Tersedia pada:
http://www.dwreview.com/Data_mining/DM_models.html
28
Perlich C, Provost F, Simanoff JS. 2003. Tree Induction vs. Logistic Regression: A Learning-Curve Analysis. Journal of Machine Learning Research, 4, 211-255.
Rencher AC, Christensen WF. 2012. Methods of Multivariate Analysis Third Edition. New Jersey (US): John Wiley & Sons, Inc.
Shtatland ES, Kleinman K, Cain EM. 2004. A New Strategy of Model Building in Proc Logistic with Automatic Variable Selection, Validation, Shrinkage and Model Averaging. Proceedings SAS SUGI 29 Duke Owen, Conference
Chair [Internet]. [Montréal, Canada May 9-12]. Tersedia pada:
http://www2.sas.com/proceedings/sugi29/191-29.pdf
Surbakti SR. 2014. Optimizing Classification Urban/Rural Areas in Indonesia with Bagging Methods in Binary Logistic Regression. Proceedings 13th Islamic Countries Conference on Statistical Sciences. Di dalam: Munir Ahmad dan Shahjahan Khan, editor. Proceedings ICCS-13. 13th Islamic Countries
Conference on Statistical Sciences; 2014 December 18-21; Bogor, Indonesia. Lahore: ISOSS, pp 327-336.
. 2015. Alternative Determinant Variables in Urban/Rural Village Classification in Indonesia. Proceeding of 2nd ICRIEMS. 2nd International
Conference on Research, Implementation and Education of Mathematics and Science; 2015 Mei 17-19; Yogyakarta, Indonesia. Yogyakarta (ID): UNY, pp 261-270.
Tim Penyusun Pusat Kamus. 2005. Kamus Besar Bahasa Indonesia. Jakarta (ID): Balai Pustaka.
29
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 2 Mei 1984, sebagai anak kedua dari 3 bersaudara. Pendidikan sekolah menengah ditempuh di SMA Negeri 68 Jakarta Program IPA, lulus pada tahun 2002. Pada tahun yang sama penulis diterima di Sekolah Tinggi Ilmu Statistik, Jakarta dan menyelesaikannya pada tahun 2006. Saat ini penulis bekerja sebagai Pegawai Negeri Sipil di Badan Pusat Statistik RI, Direktorat Pengembangan Metodologi Sensus dan Survei.