• Tidak ada hasil yang ditemukan

PEMODELAN PENGARUH RATA-RATA LAMA SEKOLAH TERHADAP INDEKS KEDALAMAN KEMISKINAN DI INDONESIA MENGGUNAKAN SUPPORT VECTOR REGRESSION

N/A
N/A
Protected

Academic year: 2022

Membagikan "PEMODELAN PENGARUH RATA-RATA LAMA SEKOLAH TERHADAP INDEKS KEDALAMAN KEMISKINAN DI INDONESIA MENGGUNAKAN SUPPORT VECTOR REGRESSION"

Copied!
6
0
0

Teks penuh

(1)

Seminar Nasional Riset Kuantitatif Terapan 2017 Kendari, 8 April 2017

 100

Received June 1st,2012; Revised June 25th, 2012; Accepted July 10th, 2012

PEMODELAN PENGARUH RATA-RATA LAMA SEKOLAH TERHADAP INDEKS KEDALAMAN KEMISKINAN DI INDONESIA MENGGUNAKAN

SUPPORT VECTOR REGRESSION

Ita Fitriati1, Muhammad Ghazali2

1Pendidikan Teknologi Informasi, STKIP Taman Siswa Bima

2Pendidikan Teknologi Informasi, STKIP Taman Siswa Bima e-mail :1itafitriati88@gmail.com, 2m.ghazali11@gmail.com

Abstrak

Indeks Kedalaman Kemiskinan merupakan ukuran rata-rata kesenjangan penyebaran pengeluaran masing-masing penduduk terhadap garis kemiskinan. Banyak faktor yang mempengaruhi indeks kedalaman kemiskinan, baik dari indikator kesehatan, SDM maupun ekonomi. Oleh karena itu diperlukan sebuah pemodelan statistika untuk menganalisa faktor-faktor yang mempengaruhi indeks kedalaman kemiskinan di Indonesia. Dalam beberapa penelitian sebelumnya, salah satu variabel yang mempengaruhi Indeks Kedalaman Kemiskinan adalah variabel rata-rata lama sekolah di setiap kabupaten/kota di seluruh Indonesia. Data yang digunakan dalam penelitian ini bersumber dari data SUSENAS dengan individu pengamatan adalah seluruh kabupaten/kota di Indonesia tahun 2012. Pada penelitian ini digunakan metode Support Vector Regression (SVR) untuk menaksir Indeks Kedalaman Kemiskinan (Y) dengan menggunakan variabel prediktor Rata-rata lama sekolah (X). Model Support Vector Regression (SVR) pada penelitian ini menggunakan beberapa kernel berbeda yaitu kernel linear, polynomial dan RBF. Kriteria model terbaik adalah model yang menghasilkan MSE yang terkecil dan R2 terbesar. Model terbaik yang dihasilkan adalah model dengan menggunakan kernel RBF. Penelitian ini penting untuk menganalisa dengan lebih akurat terhadap faktor kemiskinan di Indonesia.

Kata Kunci– Data Kemiskinan, SVR, Regresi, kernel.

Abstract

The poverty gap index is a measure of the intensity of poverty. It is defined as the average poverty gap in the population as a proportion of the poverty line. There are many factors affecting the poverty gap index, including health factors, human resources and economics.Therefore we need a statistical model to analyze the factors that affect the poverty gap index in Indonesia. In some previous studies, one of the variables that affect the poverty gap index is the average length of schools in Indonesia. The data used in this study comes from SUSENAS observeall of districts or cities in Indonesia throughout 2012. In this study used a method Support Vector Regression (SVR) to analyze the Poverty Depth Index (Y) using the predictor variables average length of school (X). SVR’s Model in this study using several different kernels such as linear kernel, polynomial and RBF. The best model is the model that produces the smallest MSE and the largest R2. The best model is the model generated using RBF kernel.This research is important for more accurate analysis of poverty in Indonesia.

Keyword– Poverty Data, SVR, Regression, kernel.

1. PENDAHULUAN

emiskinan di Indonesia adalah permasalahan berat yang masih dihadapi oleh pemerintah. Kemiskinan selain

dipengaruhi oleh dimensi ekonomi, juga berkaitan dengan berbagai dimensi antara lain dimensi sosial, budaya, sosial politik, lingkungan, kesehatan, pendidikan, agama, dan

K

(2)

budi pekerti. Menelaah kemiskinan secara multidimensional sangat diperlukan untuk perumusan kebijakan pengentasan kemiskinan [1]. Selama ini kemiskinan lebih cenderung dikaitkan dengan dimensi ekonomi karena dimensi ini paling mudah diamati, diukur dan diperbandingkan. Padahal kemiskinan berkaitan juga dengan berbagai dimensi antara lain dimensi sosial, budaya, sosial politik, lingkungan, kesehatan, pendidikan, agama, dan budi pekerti [2] .

Penelitian sebelumnya yang melakukan pemodelan terhadap kemiskinan di Indonesia diantaranya adalah Damayanti dan Ratnasari [3]

yang memodelkan kemiskinan di Jawa Timur menggunakan metode Geographically Weighted Regression (GWR), Anuraga melakukan pemodelan kemiskinan di Jawa Timur dengan menggunakan Structural Equation Modeling- Partial Least Square [2]. Kemudian Ngafiyah menggunakan Meta-Analityc Structural Equation Modeling (MASEM) untuk memodelkan kemiskinan di pulau Jawa [4],

Penelitian sebelumnya yang menggunakan data ini adalah Sita dan Otok dengan pendekatan Multivariate Adaptive Regression SPLINES (MARS) pada pemodelan penduduk miskin di Indonesia yang memperoleh nilai R2 sebesar 79,7 % pada data SUSESNAS tahun 2012 [5], kemudian dilanjutkan oleh Ghazali dengan menggunakan pendekatan Generalized Methods of Moments (GMM) dengan Regresi Data Panel model Fixed Effect dan memperoleh nilai R2 sebesar 63.38 % untuk data tahun 2008-2012.

Salah satu variabel yang berpengaruh signifikan terhadap indeks kedalaman kemiskinan adalah faktor pendidikan masyarakat yang diukur melalui variabel rata-rata lama pendidikan [6].

Penggunaan metode SVR untuk memodelkan kemiskinan di Indonesia dilakukan oleh Ghazali dan Fitriati yang menghasilkan kesimpulan bahwa kernel RBF merupakan kernel terbaik dalam model SVR untuk menaksir indeks kedalaman kemiskinan dengan variabel respon terdiri dari beberapa faktor sosial [7].

Berdasarkan penelitian sebelumnya, faktor yang paling berpengaruh signifikan untuk menaksir indeks kedalaman kemiskinan adalah faktor pendidikan masyarakat yang diukur dengan menggunakan variabel rata-rata lama sekolah masyarakat di setiap kabupaten/kota di Indonesia [2][4][6].Sehingga penelitian ini berusaha memodelkan secara lebih akurat pengaruh rata-rata lama sekolah terhadap indeks kedalam kemiskinan di Indonesia.

Menurut data Badan Pusat Statistik [8], pada bulan Maret 2015, jumlah penduduk miskin (penduduk dengan pengeluaran per kapita per bulan di bawah Garis Kemiskinan) di Indonesia mencapai 28,59 juta orang (11,22 %), bertambah sebesar 0,86 juta orang dibandingkan dengan kondisi September 2014 yang sebesar 27,73 juta orang (10,96 %).

Persentase penduduk miskin di daerah perkotaan pada September 2014 sebesar 8,16 persen, naik menjadi 8,29 persen pada Maret 2015. Sementara persentase penduduk miskin di daerah perdesaan naik dari 13,76 % pada September 2014 menjadi 14,21 % pada Maret 2015 [8].

Penelitian ini mencoba menggunakan metode berbasis algoritma yaitu Support Vector Machine (SVM). Support Vector Machine (SVM) pertama kali diperkenalkan oleh Vapnik tahun 1992 sebagai rangkaian harmonis konsep- konsep unggulan dalam bidang pattern recognition [9]. Pengembangan metode Support Vector Machine (SVM) yang awalnya digunakan untuk klasifikasi juga dikembangkan menjadi metode regresi yang dikenal dengan nama Support Vector Regression (SVR).

Model SVR memiliki keunggulan dibandingkan model regresi Ordinary Least Square (OLS) dalam hal pemanfaatan model nonlinear secara implisit melalui penerapan fungsi kernel yang memetakan vektor titik data fitur x ke ruang dimensi yang lebih tinggi sehingga memungkinkan penggunaan model seperti pada kasus linearly separable [10].

Pada penelitian ini digunakan metode Support Vector Regression (SVR) untuk memodelkan dan menaksir tingkat kedalaman kemiskinan di Indonesia sebagai variabel respon faktor pendidikan yang diukur dengan rata-rata lama sekolah sebagai prediktor. Penelitian ini untuk mencari model yang paling terbaik dari beberapa model Support Vector Regression (SVR) yang menggunakan kernel berbeda untuk menganalisis tingkat kedalaman kemiskinan kabupaten/kota di Indonesia .

2. METODE PENELITIAN 2.1 Support Vector Regression

Algoritma Support Vector Machine (SVM) pertama kali diusulkan oleh Vapnik (1995) untuk klasifikasi dua kategori atau binomial. Pada bentuk yang paling sederhana, SVM memisahkan titik-titik dari kelas yang berbeda, misalkan kelas {+1} dan {-1},

(3)

dengan hyperplane tunggal pada ruang berdimensi banyak yang pada akhirnya partisi-partisi tersebut diselesaikan secara nonlinear. Hyperplane yang optimum diperoleh melalui program nonlinear, tepatnya quadratic programming [9].

Support Vector Regression (SVR) adalah penerapan Support Vector Machine (SVM) pada kasus regresi. SVM yang merupakan metode klasifikasi dengan variabel respon adalah variabel ordinal dikembangkan menjadi metode regresi dimana variabel bebasnya adalah variabel numerik berupa bilangan rill dan kontinu.

Misalkan terdapat sekumpulan data

= {( , ), ( , ), … , ( , )}, ∈ , ∈ (1) dengan fungsi linear

( ) = 〈 , 〉 + (2) Fungi optimal regresi dari Persamaan (2) adalah sebagai berikut :

Φ( , ) = ‖ ‖ + ∑ ( + ) (3) dimana adalah nilai yang ditentukan sebelumnya, dan ( , ) adalah variabel slack yang menunjukkan batas atas dan batas bawah pada output dalam sistem [11].

Faktor ‖ ‖ dinamakan faktor regularisasi.

Meminimalkan ‖ ‖ akan membuat fungsi setipis (flat) mungkin, sehingga dapat mengontrol kapasitas fungsi (functioncapacity).

Menggunakan ide -insensitive loss functionyang diperkenalkan Vapnik (1995) kita meminimalkan norm dari agar mendapatkan generalisasi yang baik untuk fungsi regresi [12].

Persamaan -insensitive loss function, untuk menyelesaikan optimasi Persamaan (3) adalah

( ) = 0

| ( ) − | −

| ( ) − | <

(4) sehingga solusinya adalah sebagai berikut :

max, ( , ) = max

, 1

2 ( )

) ,

( − )

( + )

(5)

dengan batasan

0 ≤ , ≤ , = 1, … . ,

∑ ( − ) = 0 (6)

Selesaikan Persamaan (5) dengan batasan (6) dengan menggunakan lagrange multiplier maka kondisi optimal dari fungsi regresi dituliskan sebagai berikut :

= ∑ ( − ) ( , ) (7)

= − 〈 , 〈 ( , ) + ( , )〉〉 (8) Jika = 0 maka kita peroleh optimisasi loss function dalam bentuk persamaan yang lebih sederhana sebagai berikut

min ∑ ∑ ( ) ( , ) − ∑ (9)

dengan batasan

− ≤ ≤ , = 1, … ,

= 0

dimana ( , ) adalah fungsi kernel dari ( , )

Fungsi regresi optimal dari persamaan (2) dituliskan sebagai berikut [6]

〈 , 〉 = ∑ ( , ) (10)

= − 〈 , 〈 ( , ) + ( , )〉〉 (11) Pada penelitian ini, optimasi dibantu dengan fungsi kernel diantaranya kernel polynomial dan Gaussian Radial Basis Function (RBF).

Persamaan fungsi kernel polynomial adalah

, = , + 1 (12)

Persamaan fungsi kernel RBF adalah

, = − ′‖ (13)

Sedangkan persamaan fungsi kernel Exponetial RBF adalah

, = − ′‖ (14)

dimana adalah derajat kernel [13].

2.2 Ukuran Kebaikan Model

Untuk memilih model yang terbaik digunakan prosedur validasi model menggunakan Mean Square Error (MSE) dan R2. Koefisien determinasi R2 merupakan persentase pengaruh dari variabel prediktor terhadap variabel respon. Persamaannya ditulis sebagai berikut [14] :

= ∑ ( − ) (15) dan

= (( )) (16) menyatakan objek pengamatan ke-i dan adalah prediksi data ke-i. Maka model terbaik

(4)

adalah model yang memiliki nilai MSE paling kecil dan nilai R2 yang paling maksimal.

3. HASIL DAN PEMBAHASAN

Data penelitian ini merupakan data sekunder yang diambil dari hasil pendataan Survei Sosial Ekonomi Nasional (SUSENAS) untuk tahun 2012 oleh Badan Pusat Statistik (BPS). Data yang dikumpulkan antara lain menyangkut semua indikator yang termasuk ke dalam indikator kesehatan, SDM, dan ekonomi.

Dengan data observasi terdiri dari 497 Kabupaten/Kota di Indonesia.

Variabel responnya adalah Indeks kedalaman kemiskinan (Y), sedangkan variabel prediktor adalah Rata-rata lama sekolah (X) di setiap kabupaten/kota di Indonesia pada tahun 2012.

Software yang digunakan adalah toolbox Matlab oleh Steve R. Gunn [11]. Deskripsi data ditampilkan oleh Tabel 1.

Tabel 1.Deskripsi Variabel

Variabel Respon (Y) Prediktor (X)

Satuan index Tahun

Min 0.14 2.30

Mean 2.273 8.007

Max 17.94 12.25

Std Deviasi 2.13897 1.56370 Korelasi X dan Y -0.4528

Korelasi antara variabel bebas dan respon yaitu sebesar -0.45 artinya terdapat hubungan terbalik (tanda negatif) antara variabel rata-rata lama sekolah dan indeks kedalaman kemiskinan.

Hal ini berarti semakin baik faktor pendidikan masyarakat yang ditandai dengan tingginya rata- rata lama sekolah maka tingkat kemiskinan di Indonesia juga semakin menurun yang ditandai dengan semakin menurunnya indeks kedalaman kemiskinan.

Kernel SVR yang digunakan adalah kernel Linear, Polynomial, Gaussian Radial Basis Function (RBF) dan ExponentialGaussian Radial Basis Function (ERBF). Masing-masing kernel, Polynomial dan RBF digunakan 3 derajat yang berbeda.

Setelah memperoleh prediksi dari variabel respon ( ) akan dibandingkan akurasinya dengan variabel respon ( ). Jika nilai semakin mendekati nilai , maka tingkat akurasinya semakin besar yang ditunjukkan oleh nilai MSE yang kecil dan nilai R2 yang besar.

Ringkasan output dari percobaan ini ditunjukkan oleh Tabel 2.

Tabel 2.Ringkasan output percobaan model SVR Kernel derajat MSE R2

Linear 3.6234 20.65 %

Polynomial 1 3.6307 20.49 % Polynomial 2 2.9146× 104 0 % Polynomial 3 2.3425× 104 0 %

RBF 1 2.6229 42.56 %

RBF 2 2.8223 38.19 %

RBF 3 2.9207 36.03 %

ERBF 1 0.9000 80.29 % ERBF 2 0.9000 80.29 % ERBF 3 0.9000 80.29 %

Dari Tabel 2 terlihat bahwa SVR kernel linearmemberikan nilai R2 yang menunjukkan bahwa pengaruh variabel rata-rata lama sekolah dalam menaksir indeks kedalaman kemiskinan di Indonesia sebesar 20.65 %. Kemudian jika dibandingkan dengan SVR kernel polynomial derajat 1, R2 yang diperoleh tidak terlalu jauh berbeda dengan kernel linear yaitu 20.65 %.

Sedangkan jika jika kernel polynomial menggunakan derajat yang lebih tinggi menghasilkan estimasi yang tidak akurat yang ditandai dengan MSE yang sangat besar dan R2 yang sangat kecil. Jika menggunakan kernel RBF menghasilkan tingkat akurasi yang lebih baik yang ditunjukkan dengan nilai R2sebesar 42.56% untuk kernel RBF derajat 1. Jika kernel RBF menggunakan derajat yang lebih tinggi terlihat bahwa tren nilai R2 semakin berkurang, sehingga diambil kesimpulan bahwa model SVR kernel RBF menghasilkan tingkat akurasi estimasi jika menggunakan derajat 1.

Estimasi yang lebih baik diperoleh dengan menggunakan model SVR kernel ERBF dimana untuk semua derajat kernel menghasilkan nilai MSE yang paling kecil yaitu 0.900 dan R2sebesar 80.29 %. Jika menggunakan derajat yang lebih tinggi maka tingkat akurasi estimasi yang dihasilkan tidak terlalu berbeda dengan kernel ERBF derajat 1. Sehingga bisa disimpulkan bahwa estimasi terbaik diperoleh dengan menggunakan kernel ERBF

Berikut ini adalah plot variabel respon terhadap masing-masing variabel bebas dengan menggunakan kernel RBF derajat 2.

(5)

Gambar 1 Plot X vs Y dengan metode SVR Kernel linear

Gambar 2 Plot X vs Y dengan metode SVR Kernel polynomial derajat 1

Berdasarkan Gambar 1 dan Gambar 2 beserta output pada Tabel 2, output yang dihasilkan dengan menggunakan kernel linear dan kernel polynomial derajat 1 tidak terlalu berbeda. Jika menggunakan kernel polynomial derajat yang lebih tinggi dari 1 maka akan menghasilkan akurasi estimasi yang tidak bagus, sehingga diambil kesimpulan bahwa kernel polynomial derajat yang lebih tinggi dari 1 tidak bisa digunakan dalam model.

Gambar 3 Plot X vs Y dengan metode SVR Kernel RBF derajat 1

Gambar 3 memperlihatkan bahwa plot kernel RBF derajat 1 membentuk pola sesuai dengan data. Jika menggunakan kernel RBF dengan derajat lebih dari 2 terlihat bahwa nilai R2 akan semakin menurun, sehingga diambil kesimpulan bahwa derajat terbaik untuk kernel RBF pada data ini adalah 1.

Gambar 4 Plot X vs Y dengan metode SVR Kernel ERBF derajat 1

Gambar 4 menunjukkan bahwa kernel ERBF membentuk pola garis yang mendekati data, yang berarti kernel ERBF bisa memodelkan dengan lebih baik. Kesimpulan ini ditunjang dengan nilai MSE dan R2 yang paling optimal seperti yang ditampilkan pada Tabel 2.

4. KESIMPULAN

Model terbaik untuk mengestimasi pengaruh faktor pendidikan masyarakat yang diukur melalui rata-rata lama sekolahterhadap indeks kedalaman kemiskinan di Indonesia dengan metode Support Vector Regression (SVR) diperoleh dengan menggunakan kernel EksponetialGaussian Radial Basis Function (ERBF), yang ditunjukkan dengan nilai MSE yang paling rendah dan R2 yang sangat besar.

5. SARAN

Saran untuk penelitian selanjutnya adalah membandingkan data dengan beberapa kernel SVM yang berbeda diantaranya kernel Splines, B-Splines, Fouries Series, dll. Selain itu, karena data yang digunakan pada penelitian ini hanya data satu tahun (cross section), maka penelitian selanjutnya disarankan untuk menggunakan data panel yang menganalisis data beberapa tahun secara bersamaan

DAFTAR PUSTAKA

[1] Suryawati, C., “Memahami Kemiskinan Secara Multidimensional”,2005 Jurnal Manajemen Pelayanan Kesehatan (JMPK), 8(3). p.121-129.

[2] Anuraga, G.,2013, “Pemodelan Kemiskinan di Jawa Timur Dengan Structural Equation Modeling-Partial

(6)

Least Square”, Tesis, Institut Teknologi Sepuluh Nopember.

[3] Damayanti dan Ratnasari., “Pemodelan Penduduk Miskin di Jawa Timur Menggunakan Metode Geographically Weighted Regression (GWR)”, JURNAL SAINS DAN SENI POMITS Vol. 2, No.2, Institut Teknologi Sepuluh Nopember, 2013, Surabaya.

[4] Ngafiyah, A. N.,2014“Meta-Analityc Structural Equation Modeling (MASEM) Pada Faktor-Faktor Yang Mempengaruhi Kemiskinan Di Pulau Jawa”. Tesis, Institut Teknologi Sepuluh Nopember, [5] Sita, Eta D.A.A. Otok, B. W.2014

“Pendekatan Multivariate Adaptive Regression SPLINES (MARS) pada Pemodelan Penduduk Miskin di Indonesia Tahun 2008-2012”. Prosiding Seminar Nasional Matematika, Universitas Jember, Jember.

[6] Ghazali, M.,2016. “Regresi Data Longitudinal Dengan Estimasi Generalized Method of Moments Pada Pemodelan Penduduk Miskin di indonesia tahun 2008-2012”, Tesis, Institut Teknologi Sepuluh Nopember.

[7] Ghazali,M.,Fitriati, I.,.2016. Aplikasi Support Vector Regression pada Pemodelan Kemiskinan di Indonesia.

Proceeding Seminar Nasional Riset Ilmu Komputer. Makassar. ISSN: 2443-048X, hal 129-133

[8] Badan Pusat Statistik, 2015. “Persentase Penduduk Miskin Maret 2015 Mencapai 11,22

Persen”.http://bps.go.id/brs/view/1158dia kses tgl 23 Maret 2017

[9] Nugroho, A.S, Witarto, A.B, Handoko, D.

2003.“Support Vector Machine Teori dan Aplikasinya dalam Bioinformatika”

Kuliah Umum IlmuKomputer.com.

[10] Maharesi, R. “Penggunaan Support Vector Regression (SVR) pada prediksi Return Saham Syariah BEI”. 2013. Proceeding PESAT (Psikologi, Ekonomi, Sastra, Arsitektur & Teknik Sipil), Bandung, Indonesia.

[11] Gunn, S.R. 1998 “Support Vector Machines For Classification and Regression”, Faculty of Engineering, Science and Mathematics School of Electronics and Computer Science, University of Southampton.

[12] Santoso, B., 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis, Teori dan Aplikasi”, Graha Ilmu, Yogyakarta.

[13] Vapnik., V. 1995 “The Nature of Statistical Learning Theory”. Springer, N.Y., ISBN 0-387-94559-8.

[14] Walpole, R.E. 1995 “Pengantar Statistika Edisi 3” Gramedia Utama, Jakarta

Referensi

Dokumen terkait

d. Idea-finding, upaya yang dilakukan siswa untuk menemukan beberapa ide yang memungkinkan dapat memecahkan masalah yang dihadapi, semua ide atau gagasan-gagasan

Simpulan dalam penelitian ini adalah faktor-faktor yang mempengaruhi motivasi belajar siswa kelas IV SDN Se-Gugus IV Kecamatan Limapuluh Kota Pekanbaru terbagi

Lanjut Kasubbag Humas, kemudian ibu RR menanyakan kebenaran kepada RR tentang perbuatan bejat yang dilakukan MM, RR kemudian menceritakan apa yang telah dilakukan

Analisis komponensial adalah penguraian unsur-unsur yang membentuk makna kosakata tertentu.. dalam analisis komponensional adalah penemuan kandungan makna kata atau

Hanya saja encoder memiliki kelemahan yakni suatu encoder tidak dapt digunakan untuk motor dengan jumlah pole yang berbeda dan letak suatu kode komutasi pada

Membiasakan anak untuk mengkonsumsi sayur dan buah sejak dini sangat penting karena pola diet yang diterapkan pada usia anak- sejak dini sangat penting karena pola diet yang

Maka dapat dikatakan latihan ini sangat baik sekali digunakan dalam latihan dalam permainan bola voli guna untuk meningkatkan lompat yaitu daya ledak otot tungkai dari

Namun proses dari metode latihan yang dapat memberikan stimulus lebih baik pada sistem saraf pusat, saraf sensorik hingga respon saraf motorik yang akan mengaktifkan