• Tidak ada hasil yang ditemukan

Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial"

Copied!
25
0
0

Teks penuh

(1)

PENERAPAN ANALISIS POHON REGRESI PADA DATA

PERLINDUNGAN SOSIAL

PUTRI DWI ANDINI

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

ABSTRAK

PUTRI DWI ANDINI. Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial. Dibimbing oleh KUSMAN SADIK dan DIAN KUSUMANINGRUM

.

Kemiskinan merupakan suatu permasalahan yang dihadapi oleh negara -negara berkembang. Kemiskinan menyangkut suatu kondisi kekurangan dari sebuah tuntutan kehidupan yang paling mendasar, khususnya dari aspek konsumsi, pendapatan, dan kebutuhan sosial. Salah satu upaya yang dilakukan pemerintah dalam menanggulangi masalah kemiskinan adalah dengan mengadakan program perlindungan sosial. Namun, program perlindungan sosial yang ada tidaklah mencukupi dalam menurunkan tingkat resiko bagi keluarga miskin. Oleh karena itu, pemerintah perlu melakukan evaluasi untuk melakukan klasifikasi terhadap keluarga penerima bantuan perlindungan sosial agar program perlindungan sosial yang dilakukan tepat sasaran. CART merupakan metodologi statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi, baik untuk peubah respon kategorik maupun kontinu. Tujuan utama CART adalah untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian. Dalam penelitian ini digunakan algoritma CART dengan menggunakan pendekatan analisis pohon regresi untuk menganalisis faktor-faktor penciri yang mempengaruhi pemberian bantuan Program Perlindungan Sosial (PLS) di Kabupaten Bogor. Hasil analisis pohon regresi menghasilkan pohon maksimal dengan jumlah simpul sebanyak 20 simpul yang terdiri dari 9 simpul dalam dan 11 simpul terminal. Setelah dilakukan pemangkasan dengan menggunakan 10-fold cross validation diperoleh pohon optimal dengan jumlah simpul sebanyak 8 simpul yang terdiri dari 3 simpul dalam dan 5 simpul terminal. Pada pohon optimal diperoleh tiga peubah penjelas yang efektif dalam memprediksi persentase keluarga yang menerima bantuan perlindungan sosial. Persentase keluarga yang anggotanya menjadi buruh tani muncul sebagai peubah yang paling efektif, diikuti oleh bahan bakar untuk memasak dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir. Hasil pengelompokan pohon regresi dapat digunakan sebagai referensi pemerintah dalam menentukan segmentasi penerima bantuan program perlindungan sosial bagi kelompok-kelompok desa yang berada di Kabupaten Bogor berdasarkan kombinasi peubah -peubah penjelas yang dihasilkan.

(3)

PENERAPAN ANALISIS POHON REGRESI PADA DATA

PERLINDUNGAN SOSIAL

PUTRI DWI ANDINI

Skripsi

sebagai salah satu syarat untuk memperoleh gelar

Sarjana Statistika pada

Departemen Statistika

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(4)

Judul : Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial

Nama : Putri Dwi Andini

NRP : G14070067

Disetujui :

Pembimbing I

Pembimbing II

Dr. Ir. Kusman Sadik, M.Si.

Dian Kusumaningrum, M. Si.

NIP. 19690912 199702 1 001

Diketahui :

Ketua Departemen Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M. Si.

NIP. 196504211990021001

(5)

PRAKATA

Alhamdulillahi rabbil’alamin,

Puji syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia -Nya sehingga penulis dapat menyelesaikan karya ilmiah dengan judul “Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial”. Karya ilmiah ini merupakan hasil penelitian dalan rangka memenuhi tugas akhir yang merupakan salah satu syarat untuk memperoleh gelar Sarjana Statistika di Fakultas Matematika dan Ilmu pengetahuan Alam Institut Pertanian Bogor.

Terima kasih penulis ucapkan kepada berbagai pihak yang telah membantu penyelesaian karya ilmiah ini :

1. Bapak Dr. Ir. Kusman Sadik, M. Si. dan Ibu Dian Kusumaningrum, M. Si. selaku pembimbing yang telah meluangkan waktu, serta memberikan arahan dan masukan yang bermanfaat bagi penulis.

2. Ibu Dra. Itasia Dina Sulvianti M. Si. selaku dosen penguji.

3. Seluruh dosen Departemen Statistika IPB atas nasehat dan ilmu yang bermanfaat.

4. Bapak, Ibu, Mas Danis, dan Virgia yang telah memberikan cinta dan kasih sayang sepenuhnya, semangat, dan do’a yang tulus setiap waktu.

5. Seluruh staf Departemen Statistika yang telah banyak membantu penulis selama perkuliahan di Statistika.

6. Teman-teman Statistika 44 atas kebersamaan dan keceriaannya selama ini.

Semoga tulisan ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Februari 2012

(6)

RIWAYAT HIDUP

Penulis dilahirkan di Gisting, Lampung pada tangal 11 Agustus 1989 sebagai anak kedua dari tiga bersaudara dari pasangan Bapak Fathulloh, S.P. dan Ibu Sunarsih. Penulis telah berhasil menyelesaikan pendidikannya di Sekolah Dasar Negeri (SDN) 4 Gisting Bawah pada tahun 2001. Jenjang pendidikan selanjutnya penulis tempuh di Sekolah Menengah Pertama Negeri (SMPN) 2 Talang Padang dan lulus pada tahun 2004. Penulis menamatkan pendidikannya di Sekolah Menengah Atas (SMA) AL-Kautsar Bandar Lampung pada tahun 2007 dan pada tahun yang sama penulis diterima sebagai mahasiswa Departemen Statistika, Institut Pertanian Bogor (IPB) melalui jalur Seleksi Penerimaan Mahasiswa Baru (SPMB).

(7)

DAFTAR ISI

Halaman

DAFTAR TABEL ... vii

DAFTAR GAMBAR... vii

DAFTAR LAMPIRAN ... vii

PENDAHULUAN Latar Belakang ... 1

Tujuan ... 1

TINJAUAN PUSTAKA Metode Pohon Regresi ... 1

Aturan Penyekatan ... 2

Proses Penyekatan... 2

Aturan Penghentian ... 2

Aturan Pemangkasan ... 3

Validasi ... 3

Pemilihan Pohon Regresi Terbaik... 3

Aturan Penentuan Dugaan Respon ... 3

METODOLOGI Data... 4

Metode ... 4

HASIL DAN PEMBAHASAN Deskripsi Data... 4

Pohon Regresi Program Perlindungan Sosial Kabupaten Bogor ... 6

Pemangkasan (Prunning) Pohon Regresi Maksimal untuk Menghasilkan Pohon Regresi Optimal... 6

SIMPULAN DAN SARAN Simpulan ... 8

Saran ... 8

DAFTAR PUSTAKA ... 8

(8)

DAFTAR TABEL

Halaman

1 Matriks korelasi antara peubah Y dan peubah X2, X8, dan X5 ... 6

DAFTAR GAMBAR Halaman 1 Struktur pohon regresi ... 2

2 Persentase pengguna bahan bakar untuk memasak ... 4

3 Persentase tempat pembuangan sampah sebagian besar penduduk... 5

4 Persentase sumber air yang digunakan untuk memasak atau minum... 5

5 Persentase sertifikasi lahan tempat tinggal penduduk ... 5

6 Boxplot sebaran data peubah X2, X8, dan X9 ... 5

7 Grafik banyaknya simpul terhadap kuadrat tengah galat ... 7

8 Struktur pohon optimal hasil pemangkasan ... 7

DAFTAR LAMPIRAN Halaman 1 Diagram alir pembentukan pohon regresi ... .10

2 Diagram alir pembentukan pohon regresi maksimal ... .11

3 Diagram alir pembentukan pohon regresi optimal ... .12

4 Tabel peubah bebas yang digunakan beserta kategorinya ... .13

5 Deskripsi peubah-peubah numerik ... .14

6 Deskripsi peubah-peubah kategorik ... .14

7 Struktur pohon maksimal persentase keluarga penerima bantuan PLS... .15

8 Struktur pohon optimal persentase keluarga penerima bantuan PLS ... .16

(9)

1

PENDAHULUAN

Latar Belakang

Kemiskinan merupakan suatu permasalahan yang dihadapi oleh negara-negara berkembang. Kemiskinan menyangkut suatu kondisi kekurangan dari sebuah tuntutan kehidupan yang paling mendasar, khususnya dari aspek konsumsi, pendapatan, dan kebutuhan sosial (iridsindonesia.com).

Mayoritas penduduk Indonesia rentan terhadap kemiskinan. Hampir 40% dari penduduk, hidup hanya sedikit di atas garis kemiskinan nasional dan mempunyai pendapatan kurang dari US$ 2 per hari. Perubahan sedikit saja dalam tingkat harga, pendapatan, dan kondisi kesehatan dapat menyebabkan mereka berada dalam kemiskinan, walaupun hanya untuk sementara waktu. Salah satu upaya yang dilakukan pemerintah dalam menanggulangi masalah kemiskinan adalah dengan mengadakan program perlindungan sosial. Namun, program perlindungan sosial yang ada tidaklah mencukupi dalam menurunkan tingkat resiko bagi keluarga miskin. Kondisi ini dapat diperbaiki dengan menyediakan program perlindungan sosial yang lebih bermanfaat bagi penduduk miskin serta masyarakat yang rentan terhadap kemiskinan (siteresources.worldbank.org). Oleh karena itu, pemerintah perlu melakukan evaluasi dalam melakukan klasifikasi terhadap keluarga penerima bantuan perlindungan sosial agar program perlindungan sosial yang dilakukan tepat sasaran.

Penelitian ini menggunakan analisis pohon regresi untuk memprediksi faktor-faktor yang mempengaruhi pemberian bantuan perlindungan sosial. Pohon regresi bertujuan untuk menghasilkan segmentasi atau pengelompokan pengamatan menjadi beberapa kelompok, dimana pengamatan yang berada pada satu kelompok umumnya lebih homogen dibandingkan kelompok yang lain. Metode pohon regresi mampu mengeksplorasi struktur data yang kompleks baik dimensinya maupun jenis peubahnya, mampu mengidentifikasi peubah yang kontribusinya dominan terhadap peubah respon, serta hasil analisisnya relatif lebih mudah untuk diinterpretasikan terutama bagi pengguna yang bukan statistisi (Lewis 2000). Hasil penelitin ini diharapkan mampu memberian segmnentasi desa-desa penerima bantuan perlindungan sosial di Kabupaten Bogor.

Tujuan

Menentukan peubah-peubah paling penting dalam memprediksi pemberian bantuan Program Perlindungan Sosial (PLS) di Kabupaten Bogor dengan menggunakan pendekatan pohon regresi.

TINJAUAN PUSTAKA

Metode Pohon Regresi

Classification And Regression Tree (CART) merupakan metodologi statistik nonparametrik yang dikembangkan untuk topik analisis klasifikasi, baik untuk peubah respon kategorik maupun kontinu (Breiman et al. 1993). CART menghasilkan suatu pohon klasifikasi jika peubah responnya kategorik, dan menghasilkan pohon regresi jika peubah responnya kontinu. Tujuan utama CART adalah untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian.

Pohon regresi adalah salah satu metode atau algoritma dari salah satu teknik pohon keputusan (decision tree) yang dibentuk melalui suatu algoritma penyekatan (if-then logical) secara rekursif. Seperti halnya regresi biasa, metode ini juga digunakan untuk mengetehui pengaruh peubah penjelas terhadap peubah respon. Perbedaannya adalah pada pohon regresi, pendugaan respon dilakukan pada kelompok-kelompok pengamatan yang dibentuk berdasarkan peubah-peubah penjelasnya, bukan untuk keseluruhan data sehingga interpretasi hasil mudah dilakukan. Metode pohon regresi menghasilkan kelompok-kelompok pengamatan yang dicirikan oleh peubah-peubah yang memisahkan simpul. Peubah-peubah penjelas yang dianggap berpengaruh terhadap respon adalah peubah-peubah yang muncul sebagai pemisah (Breiman et al., 1993). Beberapa sifat yang dimiliki metode pohon ragresi antara lain:

1. Tidak memerlukan spesifikasi bentuk fungsional modelnya.

2. Kekar terhadap pengaruh pencilan. 3. Dapat menangani peubah bebas kategorik

dan kontinu secara lebih baik.

(10)

2

(1993), aturan utama dari algoritma CART secara umum adalah:

1. Penyekatan setiap simpul 2. Penetapan simpul akhir

3. Penentuan nilai dugaan respon bagi setiap simpul akhir.

Struktur pohon regresi memiliki satu simpul akar yang dinyatakan dengan t1 yang mengandung semua gugus data (Gambar 1). Simpul dalam adalah simpul yang masih bisa disekat menjadi simpul anak atau simpul dalam. Simpul dalam dilambangkan dengan lingkaran (t2, t3, t7), sedangkan simpul akhir atau simpul terminal adalah simpul yang tidak bisa disekat lagi. Simpul akhir dilambangkan dengan kotak (t4, t5, t6, t8, t9).

Gambar 1 Struktur pohon regresi

Aturan Penyekatan

Pohon regresi dibentuk melalui penyekatan gugus data dengan sederetan penyekatan biner sampai dihasilkan simpul akhir (Breimann et al. 1993). Untuk menyekat suatu simpul menjadi dua simpul anak dilakukan dengan aturan sebagai berikut:

1. Setiap penyekatan tergantung dari nilai yang berasal dari satu peubah penjelas. 2. Untuk peubah kontinu Xj, penyekatan

yang diperbolehkan adalah Xj≤ c, dimana c adalah nilai tengah antara dua nilai amatan peubah Xj secara berurutan. Jadi jika Xj memiliki nilai n yang berbeda maka akan ada n-1 penyekatan.

3. Untuk peubah penjelas kategorik, penyekatan yang terjadi berasal dari semua kemungkinan penyekatan berdasarkan terbentuknya dua anak gugus yang saling lepas (disjoint). Jika Xj adalah peubah kategorik nominal dengan L kategori, maka akan ada 2L-1-1 penyekatan.

Sedangkan jika berupa kategorik ordinal maka aka nada L-1 penyekatan.

Proses Penyekatan

Menurut Breimann et al. (1993) proses penyekatan pada tiap simpul adalah dengan cara sebagai berikut:

1. Tentukan semua kemungkinan penyekatan pada tiap peubah penjelas.

2. Pilih penyekatan terbaik dari masing-masing peubah penjelas dan pilih penyekatan terbaik dari kumpulan penyakatan terbaik tersebut. Penyekatan terbaik dihitung berdasarkan selisih jumlah kuadrat deviasi dari masing-masing simpul anak dengan simpul induknya. Selisih terbesar akan dijadikan penyekat terbaik. Jumlah kuadrat galat (JKG) pada simpul ke-t dijadikan sebagai kriteria kehomogenan di dalam masing-masing simpul. Misalkan simpul t berisi anak contoh {(Xn, Yn)}, N(t) adalah banyaknya amatan dalam simpul t, dan rataan respon dalam simpul t diduga oleh rataan respon dalam simpul t tersebut, yang dihitung sebagai berikut:

̅(t) =

∑ �

Sedangkan jumlah kuadrat galat pada simpul t dinyatakan sebagai:

JKG(t) = ̅(t)]2

Misalkan ada penyekatan s yang menyekat t menjadi simpul anak kiri dan simpul anak kanan , fungsi penyekat yang digunakan adalah:

(s,t) = JKG(t) – {JKG( ) + JKG( )}

dimana (s,t) adalah fungsi penyekat pada pohon regresi, JKG(t ) adalah jumlah kuadrat galat simpul induk, dan JKG( ) adalah jumlah kuadrat galat simpul anak kiri, dan JKG( )} adalah jumlah kuadrat galat simpul anak kanan. Penyekatan terbaik s* adalah:

(s*,t) = �� ��� (s,t)

dengan S adalah gugus yang berisi semua kemungkinan penyekatan.

Aturan Penghentian

(11)

3

kehomogenan ragam pada tiap simpul, serta dipengaruhi juga oleh peubah-peubah yang berpengaruh terhadap respon. Simpul yang tak bisa disekat lagi disebut simpul akhir.

Aturan Pemangkasan

Pohon yang dibentuk pada proses penyekatan berukuran sangat besar. Hal ini karena aturan pemberhentian berdasarkan banyaknya amatan pada simpul akhir atau besarnya peningkatan kehomogenan. Cara untuk mengatasi masalah ini adalah mencari pohon dengan ukuran yang layak. Pencarian pohon dengan ukuran yang layak dilakukan dengan kriteria sebagai berikut:

1. Penentuan pohon awal yang besar

2. Secara iteratif pohon tersebut di pangkas (pruning) menjadi deretan pohon yang makin kecil dan tersarang

3. Dipilih pohon yang terbaik dari deretan ini dengan menggunakan sample uji (test sample) atau sampel validasi silang (cross validation sample)

Langkah awal pemangkasan dilakukan T1, yaitu subpohon yang memenuhi kriteria R(T1) = R(Tmax). Untuk mendapatkan T1 dan Tmax ambil tL dan tR yang merupakan simpul anak kiri dan simpul anak kanan dari Tmax yang dihasilkan dari pemilihan pada setiap simpul induk t. Karena R(t) = R(tL) + R(tR), maka pangkas simpul anak tL dan tR tersebut. Ulangi proses ini sampai tidak ada lagi pemangkasan yang mungkin (Breiman et al. 1993).

Inti dari pemangkasan cost complexity minimum adalah pemotongan hubungan terlemah (weak est link) pada pohon regresi.

Validasi silang pada pohon regresi dilakukan sebelum proses pemangkasan. Aspek terpenting adalah kestabilan dari pendugaan pohon regresi yang diperoleh. Kestabilan pohon regresi dapat bernilai rendah jika pohon regresi mengandung terlalu banyak peubah penjelas atau jika dua atau lebih peubah penjelas memiliki korelasi tinggi (multikolinieritas). Cara terbaik untuk melakukan proses validasi dan pemangkasan yaitu dengan menggunakan kelompok data peubah bebas (penjelas) untuk proses

validasi. Data dibagi menjadi 10 kelompok. Sembilan kelompok data digunakan untuk membangun pohon regresi dan 10 kelompok data digunakan untuk proses validasi (Breiman et al. 1993). Proses ini diulang dalam 10 cara yang berbeda, sehingga setiap kelompok data digunakan untuk validasi silang.

Menurut Dietterich (1998) dan Kuhnerta et al. (2000) dalam Mendes dan Akkartal (2009) proses validasi silang lipat 10 (10- fold cross validation) akan menghasilkan sebuah pohon akhir. Penduga kuadrat tengah galat validasi silang lipat 10 dirumuskan dengan

Rcv (Tk) = adalah rataan dari simpul k.

Pohon terbaik adalah Tk0 yaitu :

Rcv (Tk0) = min Rcv (Tk)

dengan Rcv (Tk0) merupakan kuadrat tengah

galat pohon regresi optimal terbaik (Breiman et al. 1993)

Pemilihan Pohon Regresi Terbaik

Keragaman yang dapat dijelaskan dalam CART adalah sebagai berikut :

�� = [ galat dari peubah respon (kuadrat tengah galat dari simpul akar).

� =

�∑ �� � ̅

dengan adalah nilai dari peubah respon dan

̅ adalah nilai rataan dari peubah respon (Breiman et al. 1993).

Aturan Penentuan Nilai Dugaan Respon

(12)

4

METODOLOGI

Data

Data yang digunakan untuk analisis ini adalah data Potensi Desa/Kelurahan (PODES) dan data Pendataan Program Perlindungan Sosial (PPLS) tahun 2010 di Kabupaten Bogor, di mana kriteria keterangan rumah tangga yang digunakan adalah status penguasaan bangunan, luas dan jenis lantai, jenis dinding dan atap, sumber air minum, sumber penerangan, bahan bakar untuk memasak, fasilitas buang air besar, kepemilikan asset, dan kepesertaan dalam program perlindungan sosial.

Peubah respon yang diamati berasal dari data PPLS dari setiap desa di Kabupaten Bogor, di mana peubah responnya berupa persentase keluarga yang menerima bantuan perlindungan sosial. Sedangkan peubah penjelas yang digunakan sebagai berikut: X1 = Bahan bakar untuk memasak

X2 = Persentase keluarga yang menerima kartu ASKESKIN setahun terakhir X3 = Persentase surat miskin yang

dikeluarkan desa setahun terakhir X4 = Tempat sebagian penduduk

X9 = Persentase keluarga yang anggotanya menjadi buruh tani

X10= Sumber air untuk memasak atau minum pada umumnya

X11= Sertifikasi sebagian besar lahan tempat tinggal penduduk

X12= Jumlah TKI

Metode

Tahapan-tahapan yang dilakukan dalam penelitian ini adalah:

1. Tahap awal adalah proses persiapan data. 2. Pemilihan peubah-peubah penjelas yang

akan dianalisis dari data podes.

3. Membangun pohon regresi dengan algoritma CART.

a. Penyekatan pada setiap peubah penjelas.

b. Pemilihan penyekat terbaik dengan kriteria jumlah kuadrat galat terkecil. c. Menentukan nilai dugaan respon pada

setiap simpul.

4. Pemangkasan (pruning) pohon regresi untuk menghasilkan pohon regresi optimal.

5. Melakukan interpretasi hasil analisis.

HASIL DAN PEMBAHASAN

Deskripsi Data

Jumlah desa yang digunakan sebanyak 428 desa yang terletak di Kabupaten Bogor. Peubah penjelas yang digunakan berjumlah 12 buah. Deskripsi untuk peubah penjelas numerik dapat dilihat pada Lampiran 5, sedangkan deskripsi peubah penjelas kategorik dapat dilihat pada Lampiran 6.

Berdasarkan Lampiran 5 terlihat bahwa rata-rata persentase keluarga yang menerima kartu ASKESKIN setahun terakhir sebesar 24.03%, rata-rata persentase surat keterangan tidak mampu (SKTM) yang dikeluarkan desa setahun terakhir sebesar 4.554%, dan rata-rata persentase keluarga yang anggotanya menjadi buruh tani sebesar 22.57%. Rata-rata persentase ketiga peubah tersebut menunjukkan bahwa angka kemiskinan di Kabupaten Bogor cukup rendah. Mayoritas penduduk desa di Kabupaten Bogor sudah menggunakan listrik yang dikelola oleh PLN. Hal tersebut dapat dilihat dari tingginya rata-rata persentase pengguna PLN yaitu sebesar 90.70%. Rata-rata jumlah TKI di desa yang berada di Kabupaten Bogor sebanyak 4 orang, dengan desa dengan jumlah TKI terbanyak yaitu Desa Tengah, Kecamatan Cibinong dengan jumlah TKI sebanyak 244 orang.

Gambar 2 Persentase pengguna bahan bakar untuk memasak

Berdasarkan Gambar 2 terlihat bahwa sebagian besar masyarakat di Kabupaten Bogor masih menggunakan minyak tanah sebagai bahan bakar untuk memasak dengan persentase 75%, 23.83% menggunakan kayu bakar, dan sisanya sebesar 1.17% menggunakan gas LPG sebagai bahan bakar untuk memasak. Hal tersebut mengindikasikan bahwa minyak tanah dan kayu bakar masih diminati oleh sebagian besar penduduk di Kabupaten Bogor.

(13)

5

Gambar 3 Persentase tempat pembuangan sampah sebagian besar penduduk

Berdasarkan Gambar 3 dapat terlihat bahwa sebagian besar masyarakat di Kabupaten Bogor membuang sampah di dalam lubang kemudian dibakar dengan persentase sebesar 65.98%, tempat sampah sebesar 5.61%, serta sungai dan lainnya masing-masing sebesar 6.77% dan 21.73%. Namun, sebagian besar desa yang berada di Kabupaten bogor belum memiliki tempat penampungan sampah sementara. Hal ini dapat dilihat pada Lampiran 6 dimana hanya 78 desa yang sudah memiliki tempat penampungan sampah sementara. Mayoritas penduduk di desa-desa yang berada di Kabupaten Bogor sudah mempunyai tempat buang air besar sendiri, terlihat dari besarnya persentase penduduk yang mempunyai jamban sendiri. Hal ini menunjukkan bahwa mayoritas penduduk di Kabupaten Bogor sudah memiliki sanitasi yang baik.

Gambar 4 Persentase sumber air yang digunakan untuk memasak atau minum pada umumnya

Sebagian besar masyarakat di Kabupaten Bogor menggunakan air sumur untuk keperluan memasak dan minum. Hal tersebut terlihat pada Gambar 4 dimana pesentase pengguna air sumur yaitu sebesar 67.76%, persentase pengguna mata air sebesar 17.52%, persentase pengguna pompa listrik sebesar 12.38%, serta persentase pengguna PAM/air kemasan dan sungai/danau untuk keperluan

memasak dan minum masing-masing sebesar 1.87% dan 0.47%.

Gambar 5 Persentase sertifikasi lahan tempat tinggal penduduk

Pada Gambar 5 terlihat bahwa sebagian besar penduduk menggunakan girik/letter C sebagai bukti kepemilikan lahan tempat tinggal dengan persentase sebesar 88%, dan hanya 7% penduduk di Kabupaten Bogor yang sudah memiliki sertifikat hak milik sebagai bukti kepemilikan lahan tempat tinggal. Sisanya, persentase sertifikat hak guna bangunan dan akta jual beli

(14)

6

pengguna PLN dimana lebih dari 75% desa-desa di Kabupaten Bogor memiliki persentase pengguna PLN (X9) diatas 80%. Namun, ada satu desa di Kabupaten Bogor dengan persentase pengguna PLN masih dibawah 20% yaitu Desa Cisarua, Kecamatan Sukajaya. Gambar 6 juga menunjukkan bahwa sebagian besar desa di Kabupaten Bogor memiliki persentase keluarga yang anggotanya menjadi buruh tani (X9) dibawah 40%. Hal tersebut menunjukkan bahwa masih banyak masyarakat di desa-desa yang ada di

Berdasarkan Tabel 1 terlihat korelasi antara beberapa peubah penjelas cukup rendah. Hal tersebut menunjukkan tidak adanya multikolinieritas sehingga tidak mempengaruhi kestabilan dari pohon regresi yang akan dihasilkan.

Pohon Regresi Program Perlindungan Sosial Kabupaten Bogor

Pohon regresi Program Perlindungan Sosial (PLS) Kabupaten Bogor menghasilkan 20 simpul yang terdiri dari 9 simpul dalam (internal node) dan 11 simpul terminal (terminal node) dengan keragaman pada peubah respon yang dapat dijelaskan oleh model sebesar 46.77%. Hal ini menunjukkan bahwa sebesar 46.77% keragaman persentase penerima bantuan PLS dapat dijelaskan oleh peubah penjelas yang memberikan pengaruh signifikan dalam pembentukan pohon maksimal. Dari 11 simpul yang terbentuk pada pohon maksimal maka persentase keluarga penerima bantuan PLS dapat dikelompokkam menjadi 11 kelompok dengan berbagai karakteristik peubah penjelasnya. Simpul akhir merupakan kelompok desa dengan persentase perolehan bantuan PLS yang relatif homogen. Struktur pohon maksimal dapat dilihat pada Lampiran 7.

Berdasarkan pohon regresi maksimal yang terbentuk, ternyata tidak semua peubah penjelas yang digunakan untuk menduga persentese pemerima bantuan PLS masuk ke dalam model. Peubah X4, X5, X6, X7, dan X12 tidak muncul dalam pembentukan pohon maksimal artinya peubah-peubah tersebut bukan merupakan peubah yang efektif dalam memprediksi persentase keluarga penerima bantuan PLS. Peubah yang paling efektif dalam memprediksi persentase keluarga pemerima bantuan PLS adalah persentase keluarga yang anggotanya menjadi buruh tani (X9). Jadi, peubah persentase keluarga yang anggotanya menjadi buruh tani merupakan peubah yang mempunyai kontribusi utama dalam pembentukan pohon regresi maksimal. Peubah lain yang berpengaruh adalah X1, X2, X3, X8, X10, dan X11. Setelah diperoleh pohon maksimal, dilakukan proses pemangkasan untuk mendapatkan pohon optimal. Hal ini bertujuan untuk mendapatkan pohon regresi yang lebih sederhana dengan prediksi kesalahan yang cukup kecil.

Berdasarkan penelitian sebelumnya yang dilakukan oleh Mendes dan Akkartal (2009), pohon regresi yang digunakan adalah pohon regresi optimal. Hal tersebut dikarenakan pohon optimal lebih efektif dalam memprediksi persentase penerima bantuan PLS dan memudahkan dalam interpretasi pohon regresi.

Pemangkasan (Pruning) Pohon Regresi Maksimal untuk Menghasilkan Pohon

Regresi Optimal

Pohon regresi yang terbentuk melalui proses pemilahan secara rekursif akan berukuran sangat besar. Hal ini dikarenakan aturan penghentian (stopping rule) yang digunakan hanya berdasarkan banyaknya jumlah amatan pada simpul terminal minimal lima atau penurunan tingkat keragaman nilai persentase keluarga penerima bantuan perlindungan sosial dalam simpul anakan hasil pemilahan. Oleh kerena itu, perlu dilakukan pemangkasan untuk memperoleh pohon regresi optimal yang berukuan sederhana tetapi memberikan kesalahan prediksi yang cukup kecil. Pemangkasan dilakukan dengan proses validasi silang yaitu dengan menggunakan validasi silang lipat 10 (10- fold cross validation) untuk menghasilkan pohon regresi terbaik. Hasil proses validasi silang terlihat pada Gambar 7.

(15)

7

sehingga pohon regresi dengan lima buah simpul akhir dari total 8 simpul dipilih sebagai pohon regresi optimal terbaik hasil dari proses validasi silang lipat 10.

Gambar 7 Grafik kuadrat tengah galat terhadap banyaknya simpul akhir

Pohon regresi optimal persentase keluarga penerima bantuan PLS memiliki keragaman pada peubah respon yang dapat dijelaskan oleh model sebesar 38.31%. Hal ini menunjukkan bahwa sebesar 38.31% keragaman persentase keluarga penerima bantuan PLS dapat dijelaskan oleh peubah -peubah penjelas yang memberikan pengaruh signifikan dalam pembentukan pohon optimal. Dari lima simpul yang terbentuk maka persentase keluarga penerima bantuan PLS dapat dikelompokkan menjadi lima kelompok pendugaan dengan berbagai karakteristik peubah penjelasnya. Gambar 8 merupakan struktur pohon optimal persentase keluarga penerima PLS. Deskripsi struktur pohon optimal dapat dilihat pada Lampiran 8.

Gambar 8 Struktur pohon optimal hasil pemangkasan

Berdasarkan deskripsi pohon optimal pada Lampiran 8, persentase penerima bantuan PLS pada Node 0 atau simpul akar dibagi menjadi dua simpul berdasarkan persentase keluarga yang anggotanya menjadi buruh tani sebagai Simpul 1 (X9 ≤ 3.4%) dan Simpul 2 (X9 > 3.4%). Jadi, persentase keluarga yang anggotanya menjadi buruh tani adalah peubah yang paling efektif dalam memprediksi persentase keluarga penerima bantuan PLS. Nilai dugaan bagi persentase keluarga penerima bantuan PLS pada Simpul 1 dan Simpul 2 masing-masing adalah 14.15% dan 29.28%. Proporsi dari persentase keluarga penerima bantuan PLS pada Simpul 1 dan Simpul 2 adalah 17.52% dan 82.48% dari total keseluruhan data amatan.

Simpul 2 yang dihasilkan oleh persentase keluarga yang anggotanya menjadi buruh tani dibagi menjadi simpul baru berdasarkan jenis bahan bakar yang digunakan untuk memasak. Namun, pada persentase keluarga yang anggotanya menjadi buruh tani ≤ 3.4% (Simpul 1) tidak terbentuk simpul baru. Hal ini dikarenakan pada Simpul 1 menunjukkan kehomogenan kelompok yang disebut simpul terminal. Oleh karena itu, Simpul 1 lebih efisien dibandingkan Simpul 2 dalam memprediksi persentase keluarga penerima bantuan PLS.

Bahan bakar yang digunakan untuk memasak adalah peubah kedua yang memiliki pengaruh paling signifikan untuk memprediksi presentase keluarga penerima bantuan PLS. Berdasarkan jenis bahan bakar yang digunakan untuk memasak, sebanyak 353 amatan pada Simpul 2 dibagi menjadi dua simpul baru, yaitu Simpul 3 dengan jenis bahan bakar yang digunakan untuk memasak berupa gas LPG dan minyak tanah dan Simpul 4 dengan bahan bakar yang digunakan untuk memasak berupa kayu bakar. Persentase keluarga yang anggotanya menjadi buruh tani > 3.4% dan jenis bahan bakar yang digunakan untuk memasak berupa LPG dan minyak tanah memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 27.32%. Persentase keluarga yang anggotanya menjadi buruh tani > 3.4% dan kayu bakar sebagai bahan bakar untuk memasak memberikan nilai prediksi sebesar 34.32% bagi persentase keluarga penerima bantuan PLS.

(16)

8 disamping persentase keluarga yang anggotanya menjadi buruh tani dan bahan bakar yang digunakan untuk memasak, persentase keluarga yang menerima kartu ASKESKIN setahun terakhir juga dapat digunakan untuk memprediksi persentase keluarga penerima bantuan PLS.

Persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa LPG dan minyak tanah, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir ≤ 15.2% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 22.50%, sedangkan persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa LPG dan minyak tanah, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir > 15.2% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 29.96%.

Persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa kayu bakar, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir ≤ 62.08% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 33%, sedangkan persentase keluarga yang anggotanya menjadi buruh tani > 3.4%, jenis bahan bakar yang digunakan untuk memasak berupa kayu bakar, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir > 62.08% memberikan nilai prediksi bagi persentase keluarga penerima bantuan PLS sebesar 47.50%.

SIMPULAN DAN SARAN

Simpulan

Pohon regresi persentase keluarga penerima bantuan PLS menghasilkan pohon optimal dengan 5 simpul terminal dari total 8 simpul yang dihasilkan. Berdasarkan pohon regresi optimal, dapat disimpulkan bahwa persentase keluarga yang anggotanya menjadi buruh tani, bahan bakar untuk memasak, dan persentase keluarga yang menerima kartu ASKESKIN setahun terakhir merupakan

peubah penting dalam memprediksi presentase keluarga penerima bantuan PLS. Ketiga peubah tersebut merupakan peubah yang paling efisien didandingkan sembilan peubah lainnya dalam memprediksi pres entase keluarga penerima bantuan PLS. Hasil pengelompokan pohon regresi dapat digunakan sebagai referensi pemerintah dalam menentukan segmentasi penerima bantuan program perlindungan sosial bagi kelompok-kelompok desa yang berada di Kabupaten Bogor berdasarkan kombinasi peubah-peubah penjelas yang dihasilkan.

Saran

Perlu dilakukan penelitian lebih lanjut untuk mengetahui jumlah minimum simpul akhir pada pohon maksimal yang layak untuk pemangkasan.

DAFTAR PUSTAKA

Anonim. 2012. Jumlah Penduduk Misk in Kabupaten Bogor Tertinggi di Jawa Barat. http://iridsindonesia.com/ page/5. [15 Januari 2012].

Anonim. 2012. Mengurangi Kemisk inan. https:// worldbank.org/INTINDONESIA. [15 Januari 2012].

Breiman et al. 1993.Classification and Regression Trees. Chapman and Hall: New York.

Komalasari WB. 2005. Penentuan Faktor-Faktor yang Mempengaruhi Pendapatan Usahatani dengan Menggunakan Metode Pohon Regresi CART dan CHAID. [Tesis]. Sekolah Pascasarjana IPB. Bogor.

Lewis RJ. 2000. An Introduction to Classification and Regression Tree (CART) Analysis. California: Department of Emergency Medicine, Harbor-UCLA Medical Centre.

Mendez M, Akkartal E. 2009. Regression Tree Analysis for Predicting Slaugther Weight in Broilers. Italia, Journal Animal Science 8 : 615-624.

(17)

9

(18)

10

Lampiran 1. Diagram alir pembentukan pohon regresi

Mulai

Memilih peubah-peubah penjelas yang bersesuaian antara

data Podes dan data PPLS

Membangun pohon maksimal dengan menggunakan algoritma

CART

Pemangkasan untuk memperoleh pohon optimal

Pohon regresi optimal

(19)

11

Kontinu

Cari penyekatan terbaik dari tiap peubah penjelas

ϕ (s,t)

Nominal

Banyaknya peyekatan = 2L-1-1 Ordinal

Banyaknya penyekatan = L-1 Jumlah penyekatan = n-1

Pilih penyekatan terbaik dari kumpulan

penyekatan terbaik tersebut ϕ (s*,t) = �� ���ϕ (s,t)

Kategorik

Penghentian jika amatan pada simpul

akhir ≤ 5 (Breimann et al. 1993)

Ya

Tentukan jumlah kemungkinan penyekatan pada tiap peubah

penjelas

Lampiran 2. Diagram alir pembentukan pohon regresi maksimal

Cari penyekatan terbaik dari tiap peubah penjelas

ϕ (s,t)

selesai

Tidak

(20)

12

Pohon regresi maksimal

10-fold cross validation

Cari pohon optimal terbaik dengan kriteria kuadrat tengah

galat (KTG) terkecil

���

�0 = min ���(��

Pohon regresi optimal Kuadrat tengah galat (KTG)

��� �� =

�∑ �� � ̅ �

Lampiran 3. Diagram alir pembentukan pohon regresi optimal

(21)

13

Lampiran 4. Tabel peubah bebas yang digunakan beserta kategorinya

Kode Peubah Jenis Kategori

X1 Bahan bakar untuk memasak Kategorik 1 = Kayu Bakar 2 = Minyak Tanah 3 = LPG

X2 Persentase keluarga yang menerima kartu ASKESKIN setahun terakhir

Kontinu -

X3 Jumlah surat miskin yang dikeluarkan desa setahun terakhir

Kontinu -

X4 Tempat sebagian penduduk membuang sampah

Kategorik 1 = Sungai 2 = Lubang 3 = Tempat Sampah 4 = Lainnya

X5 Tempat buang air besar Kategorik 1 = Bukan Jamban 2 = Jamban Bersama 3 = Jamban Umum 4 = Jamban Pribadi X6 Tempat penampungan sampah

sementara

Kategorik 1 = Tidak ada 2 = Ada

X7 Jenis permukaan jalan yang terluas Kategorik 1 = Tanah 2 = Diperkeras 3 = Aspal

X8 Persentase pengguna PLN Kontinu -

X9 Persentase keluarga yang anggotanya menjadi buruh tani

Kontinu -

X10 Sumber air untuk memasak atau minum pada umumnya

Kategorik 1 = Mata Air 2 = Sungai/ Danau 3 = Sumur 4 = Pompa Listrik 5 = PAM/ Air Kemasan X11 Sertifikasi sebagian besar lahan

tempat tinggal penduduk

Kategorik 1 = Girik/ Letter C 2 = Akta Jual Beli 3 = Sertifikat Hak Guna

Bangunan

4 = Sertifikat Hak Milik

(22)

14

Lampiran 5. Deskripsi peubah-peubah numerik

Peubah Mean Simp.

Baku

Median Min Max

Persentase keluarga yang menerima kartu ASKESKIN setahun terakhir

24.031 19.206 20.15 0 98.36

Persentase SKTM yang dikeluarkan desa setahun terakhir

4.554 4.738 3.015 0 33.33

Persentase pengguna PLN 90.702 19.95 97.94 18.52 100

Persentase keluarga yang anggotanya menjadi buruh tani

22.575 20.157 17.265 0 84.35

Jumlah TKI 3.825 12.652 2 0 244

Lampiran 6. Deskripsi peubah-peubah kategorik

Peubah Kategori Jumlah Persentase

Bahan bakar untuk memasak Kayu Bakar 102 23.83

Minyak Tanah 321 75

LPG 5 1.17

Tempat sebagian penduduk membuang sampah

Sungai 29 6.77

Lubang 282 65.89

Tempat Sampah 24 5.61

Lainnya 93 21.73

Tempat buang air besar Bukan Jamban 98 22.9

Jamban Bersama 8 1.87

Jamban Umum 21 4.90

Jamban Pribadi 301 70.33 Tempat penampungan sampah sementara Tidak ada 350 81.78

Ada 78 18.22

Jenis permukaan jalan yang terluas Tanah 8 1.87

Diperkeras 117 27.34

Aspal 303 70.79

Sumber air untuk memasak atau minum pada umumnya

Mata Air 75 17.52

Sungai/ Danau 2 0.47

Sumur 290 67.76

Pompa Listrik 53 12.38

PAM/Air Kemasan 8 1.87

Sertifikasi sebagian besar lahan tempat tinggal penduduk

Girik/ Letter C 376 87.85

Akta Jual Beli 21 4.90

Sertifikat Hak Guna Bangunan

2 0.47

Sertifikat Hak Milik

(23)

15

Lampiran 7. Struktur pohon maksimal persentase keluarga penerima bantuan program perlindungan sosial

Y

X9

X9≤ 3.4%

X9 > 3.4%

X1: LPG, Gasoline

29.28%

X1

X1: kayu bakar

27.32% 34,32%

X2 X2

X2≤ 15.2% X2 > 15.2%

29.96%

X2≤ 62.08% X2 > 62.08%

33.00%

X11

X11: SHGB, SHM X11: AJB, Girik

30.66%

X10

X9

X9≤ 13.225% X9 > 13.225%

32.17%

X8

X8≤ 96.25% X2 > 96.25%

X10: Pompa, PAM X10: MA, Sungai, Sumur

30.91%

X3

X3≤ 2.385% X3 > 2.385%

33.87%

X8

X8≤ 75.965% X8 > 75.965%

22.5% 47.50%

19.23% 36.61%

26.75% 27.13%

29.51%

34.69% 22.67% 35.94%

(24)

16

Lampiran 8. Struktur pohon optimal persentase keluarga penerima bantuan program perlindungan sosial

Node 0

Mean 26.63%

N 428

% 100

Predicted 26.63%

X9

Node 1

Mean 14.15%

N 75

% 17.52

Predicted 14.15%

Node 2

Mean 29.28%

N 353

% 82.48

Predicted 29.28%

X9≤ 3.4% X9 > 3.4%

Node 3

Mean 27.32%

N 254

% 59.35

Predicted 27.32%

Node 4

Mean 34.32%

N 99

% 23.13

Predicted 34.32% X1 : Kayu Bakar X1 : LPG, Gasoline

X1

Node 8

Mean 47.5%

N 9

% 2.1

Predicted 47.5% Node 7

Mean 33%

N 90

% 21.03

Predicted 33% Node 6

Mean 29.96%

N 164

% 38.32

Predicted 29.96% Node 5

Mean 22.50%

N 90

% 21.03

Predicted 22.50%

X2 X2

(25)

17

Lampiran 9. Program R

a. Program R untuk membangun pohon maksimal

> tmp <-read.table("PUTRI.csv", header=T, sep=",")

> tmp.tr <- tree(Y~ X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, tmp) > tmp.tr

> plot(tmp.tr); text(tmp.tr, cex=0.3) > summary(tmp.tr)

b. Program R pemangkasan pohon maksimal dengan menggunakan kriteria kuadrat tengah galat

> tmp.tr.cv<-cv.tree(tmp.tr,,prune.tree) > for(i in 2:5)tmp.tr.cv$dev<-tmp.tr.cv$dev+ + cv.tree(tmp.tr,,prune.tree)$dev

> tmp.tr.cv$dev<-tmp.tr.cv$dev/5 > plot(tmp.tr.cv)

c. Program R untuk penentuan pohon optimal hasil pemangkasan

> opt.trees=which(tmp.tr.cv$dev==min(tmp.t r.cv$dev)) > best.leave=min(tmp.tr.cv$size[opt.trees])

> tmp.tr.pruned=prune.tree(tmp.tr, best=best.leave) > plot(tmp.tr.pruned)

Gambar

Gambar 2  Persentase pengguna bahan bakar  untuk memasak
Gambar 6  Boxplot sebaran data peubah X2, X3, X8, dan X9
Gambar 8  Struktur pohon optimal hasil

Referensi

Dokumen terkait

Judul Penelitian : Penerapan Metode Regresi Berstruktur Pohon Pada Pendugaan Masa Rawat Kelahiran Bayi (Studi Kasus di Rumah Sakit Hasan Sadikin Bandung)..

Tujuan penelitian ini adalah menentukan faktor apa saja yang berpengaruh dan menerapkan model regresi spasial ensem- ble non-hybrid pada data kemiskinan di Provinsi Jawa Tengah

Berdasarkan hasil penelitian dan pembahasan diatas mengenai pengeluaran pemerintah sektor pendidikan, kesehatan dan perlindungan sosial terhadap kemiskinan pada Kabupaten/Kota di Jawa

Selain itu, penelitian ini menemukan bahwa KRT pada rumah tangga miskin yang menerima tiga jenis program bantuan perlindungan sosial sekaligus, yaitu Raskin, BLT, dan

- Mengetahui jumlah penyandang masalah kesejahteraan sosial (PMKS) penerima bantuan dan jaminan sosial dari informasi dan.. laporan data dari TKSK tiap kecamatan.

Oleh karena itu, penelitian ini menerapkan Model Regresi Data Panel dengan pendekatan Fixed Effect Model menggunakan Metode Least Square Dummy Variable untuk menentukan

Analisis regresi sirkular linier berganda yang digunakan pada penelitian ini untuk melihat peubah-peubah yang memengaruhi curah hujan, namun terdapat peubah bebas sirkular

Analisis regresi pada dasarnya adalah studi mengenai ketergantungan satu peubah dependen (respon/tak bebas) dengan satu atau lebih peubah independen