DESCRIPTIVE MODELLING MENGGUNAKAN K-MEANS UNTUK
PENGCLUSTERAN TINGKAT KEMISKINAN DI PROPINSI RIAU
Warnia Nengsih1)
1)Sistem Informasi/Komputer,Politeknik Caltex Riau-Pekanbaru
Abstrak - Secara statistik dari tahun ke tahun statistik tingkat kemiskinan terkadang mengalami peningkatan dan penurunan pada sebuah wilayah. Peningkatan tersebut bisa terlihat dengan semakin tingginya indeks keparahan kemiskinan. Kenaikan indeks bisa saja disebabkan oleh banyak hal diataranya kesenjangan antar penduduk miskin dan semakin rendahnya daya beli masyarakat.Jika dibandingkan wilayah kota dengan pedesaan, maka pedesaan mengalami kondisi kemiskinan yang parah dibandingkan dengan daerah perkotaan. Salah satu penyebabnya disebabkan tingginya tingkat inflasi di wilayah pedesaan. Riau merupakan propinsi dengan dominasi sumber daya alam terutama minyak bumi, gas alam, karet dan perkebunan kelapa sawit. Propinsi ini memiliki 12 kecamatan dan kota Namun bukan berarti kondisi ini menyebabkan Riau terbebas dari masalah kemiskinan.Data pesentase kemiskinan dan garis kemiskinan serta jumlah penduduk miskin pada setiap wilayah menjadi acuan pemetaan. Kesulitan dalam menentukan wilayah mana yang mengalami tingkat kemiskinan yang paling tinggi dan normal serta wilayah dengan tingkat kemiskinan rendah menjadi sebuah alasan untuk melakukan pengclusteran ini. Metode cluster yang digunakan adalah clustering k-means
sebagai salah satu permodelan deskriptif. Hasil cluster yang diperoleh dimana record 3 dan record 9 berada pada cluster 2. Record 1,2,4,5,6,7,8,10,11,12 berada pada cluster 3. Tidak ada kota atau kabupaten yang berada pada cluster 1. Metode ini memberikan pengetahuan pengclusteran wilayah yang tersebar di Propinsi Riau, sehingga gambaran yang diperoleh dapat menjadi acuan bagi Pemerintah dalam pelaksanaan dan pengaturan sebuah kebijakan
Kata Kunci – Clustering,K-Means, Riau , Kemiskinan , descriptive model
.
1. PENDAHULUAN
Peningkatan kemiskinan bisa terlihat dengan semakin meningkatnya indeks keparahanan kemiskinan . Kenaikan indeks bisa saja disebabkan oleh banyak hal diantaranya kesenjangan antar penduduk miskin dan semakin rendahnya daya beli masyarakat. Pertumbuban jumlah penduduk dan dampak goncangan ekonomi global, melemahnya beberapa harga komoditas unggulan dan pemutusan hubungan kerja mempengaruhi perekenomian masyarakat Riau. Hal ini mengakibaatkan pengaruh besar terhadap pendapatan per kapita penduduk dan bertambahnya jumlah penduduk miskin.Tingkat kemiskinan di Riau mengalami peningkatan hal itu ditunjukkan dengan indeks keparahan kemiskinan, Dari 0,243 pada bulan September 2013 lalu menjadi 0,288 pada bulan September 2014. Indeks keparahan kemiskinan di Riau juga terjadi peningkatan Dari 0,243 pada bulan September 2013 lalu menjadi 0,288 pada bulan September (BPS 2014). Namun kondisi ini belum tentu mendefinisikan seluruh wilayah-wilayah yang ada di Propinsi Riau. Ada bebebara wilayah yang terkena dampak sangat signifikan dan ada wilayah yang masih bertahan pada garis standar untuk kategori perekonomian yang normal.
Pemerintah tentunya dalam hal ini segera dan sedini mungkin harus mengeluarkan tindakan, program dan kebijakan untuk meminimalisir agar
indeks keparahan kemiskinan serta pertumbuhan jumlah penduduk miskin tidak mengalami kenaikan yang tinggi. Agar program berjalan dengan baik, cepat dan merata maka azas prioritas lebih ditekankan. Pemerintah mestinya mempunyai gambaran wilayah mana yang perlu penanganan cepat dan serius . Sehingga nilai tepat guna untuk kebijakan, program dan strategi yang dibuat bisa terimplemetasikan dengan baik.
Kesulitan dalam menentukan wilayah mana yang mengalami tingkat kemiskinan yang paling tinggi sehingga bisa menjadi prioritas dari pemerintah provinsi menjadi dasar perlu adanya pengclusteran setiap wilayah. Mana wilayah yang termasuk pada cluster wilayah normal dan wilayah yang termasuk tingkat kemiskinannya tinggi atau rendah.
Metode cluster yang digunakan adalah
clustering k-means. Metode ini merupakan bagian dari teknik clustering data mining. Dimana metode ini akan mengelompokkan nilai yang mempunyai kemiripan yang sama pada satu cluster. Metode ini juga merupakan bagian dari model deskriptif yang menggambarkan pola dari sebuah nilai. Data yang diolah adalah data kemiskinan 12 kota atau kabupaten yang tersebar di Propinsi Riau. Dengan Variabel yang digunakan sebanyak 3 variabel dengan rincian Data pesentase kemiskinan(x1) dan garis kemiskinan(x2)
serta jumlah penduduk miskin (x3) untuk menentukan
cluster wilayah dengan tingkat kemiskinan tinggi (c3) dan cluster dengan wilayah dengan tingkat kemiskinan normal(c2) serta wilayah dengan tingkat kemiskinan rendah (c1)
II.METODE
1. Kemiskinan dan Masalah Perekonomian
Pad
a
dasarnya kemiskinan sebuah wilayah dalam jangka panjang akan berdampak pada terhambatnya pembangunan nasional. Jika masyarakat sebuah wilayah masih berfokus untuk perbaikan ekonomi, bagaimana pemerintah fokus untuk program-program lain yang lebih luas.Secara definitif kemiskinan adalah ketidakmampuan dan kesulitan dalam memenuhi kebutuhan dasar seperti sandang, pangan, papan serta kelayakan pendidikan, kesehatan dan keamanan atau hal-hal yang bersifat pelayanan dasar. Kemiskinan dapat dikategorikan menjadi dua jenis yaitu Kemiskinan klasik yaitu kategori kemiskinan dalam hal kekurangan sandang, pangan dan papan atau kebutuhan dasar. Kemiskinan Modern merupakan kategori kemiskinan dalam hak kesulitan dan ketidakmampuan memenuhi layanan - layanan dasar. Layanan dasar ini dapat dikategorikan dalam bentuk kelayakan pendidikan, kelayakan fasilitas kesehatan atau kelayakan mendapatkan fasilitas-fasilitas umum. Berikut merupakan penyebab kemiskinan secara umum Penyebaran pembangun yang belum merata. Selanjutnya kondisi penciptaan pendapatan bagi masyarakat yang sangat minim, tingginya tingkat pengangguran.
Berikut program yang digalakkan pemerintah dalam menanggulangi kemiskinan antara lain
a. Menjaga stabilitas harga bahan kebutuhan pokok;
b. Mendorong pertumbuhan yang berpihak pada rakyat miskin;
c. Menyempurnakan dan memperluas cakupan program pembangunan berbasis masyarakat; d. Meningkatkan akses masyarakat miskin
kepada pelayanan dasar;
e. Membangun dan menyempurnakan sistem perlindungan sosial bagi masyarakat miskin..
2. Tingkat Kemiskinan Propinsi Riau
Propinsi Riau merupakan propinsi dengan dominasi sumber daya alam terutama minyak bumi, gas alam, karet dan perkebunan kelapa sawit. Propinsi ini memiliki 12 kecamatan dan kota Namun bukan berarti kondisi ini menyebabkan Riau terbebas dari
ke tahun diantaranya tingkat pengangguran.Tingkat pengangguran disebabkan oleh menurunnya harga komoditas unggulan Propinsi Riau di Sektor Migas , CPO dan Karet, Berikutnya tingginya pertumbuhan penduduk akibat migrasi dan tingkat pendidikan tenaga kerja relatif rendah juga turut menyumbang kenaikan angka tersebut .
Beberapa program atau kebijakan pemerintah untuk menanggulangi kemiskinan adalah menggerakkan sektor real dengan berbagai program unggulan seperti program nasional pemberdayaan masyarakat, pemberdayaan UKM dan regulasi kemudahan dan perlindungan usaha, menciptakan lapangan kerja, menggalakkan program-progam yang berhubungan dengan kesejahteraan masyarakat, menjaga stabilitas harga bahan dan kebutuhan pokok, meningkatkan dan mempermudah akses masyarakat miskin untuk pelayanan dasar, menyempurnakan dan memperluas cakupan program pembangunan berbasis masyarakat.
3.K-Means Clustering
K-Means clusutering merupakan salah satu metode clustering data mining menggunakan konsep
descriptive model. Konsep ini secara umum menggambarkan sebuah pola dari nilai yang sudah dijabarkan.
Metode ini masuk ke dalam kategori jenis
non hirarki clustering, dimana penentuan jumlah cluster ditentukan terlebih dahulu. Metode ini juga mengenal nilai euclidean dan iterasi untuk menemukan nilai cluster akhir dari sebuah nilai. Berikut merupakan algoritma dasar dari clustering k- means:
1. Tentukan jumlah cluster.
2. Menentukan pusat cluster secara acak.
3. Menentukan jarak setiap data terhadap pusat
cluster dan pengclusteran data dari nilai cluster
terdekat.
4. Menentukan pusat cluster baru.
5. Ulangi langkah 3 sampai nilai pusat cluster baru tidak berubah.
Penentuan pusat cluster baru menggunakan formula sebagai berikut :
C= ∑xn/cn ... (1) Persamaan 1 didefnisikan sebagai jumlah seluruh nilai atribut terhadap cluster tertentu dimana :
C= Cluster baru Xn=nilai atribut Cn =cluster tertentu
Sedangkan rumus menentukan jarak terdekat sebagai berikut :
...(2) dimana:
p : Dimensi data | . | : Nilai absolut x1,x2: nilai variabel.
III. HASIL DAN PEMBAHASAN
Berikut merupakan sistematika sistem secara umum descriptive model yang dibangun:
Gambar 1 alur sistem secara umum
Gambar 1 menjelaskan tentang descriptive model dimana data yang diolah adalah data kemiskinan pada 12 Kota atau Kabupaten di Propinsi Riau.Variabel yang digunakan adalah Data pesentase kemiskinan(x1) dan garis kemiskinan(x2) serta jumlah penduduk miskin (x3) untuk menentukan
cluster wilayah dengan tingkat kemiskinan tinggi (c3)
dan cluster dengan wilayah dengan tingkat kemiskinan normal(c2) serta wilayah dengan tingkat kemiskinan rendah(c1). Data tersebut diolah dengan menggunakan
k-means clustering untuk menemukan pola yang memberikan gambaran tentang cluster setiap wilayah. Berikut merupakan proses clustering k-means
Gambar 2 Proses clustering k-means
Dimulai dengan penentuan jumlah cluster, dalam hal ini cluster yang digunakan tiga cluster,
cluster wilayah dengan tingkat kemiskinan normal dan cluster dengan tingkat kemiskinan tinggi serta wilayah dengan tingkat kemiskinan rendah. Penentuan pusat
cluster acak dari nilai yang terdapat pada variabel yang diolah. Selanjutnya mencari nilai euclidean dan penentuan cluster baru. Sampai sebuah iterasi selesai dikerjakan.
Berikut merupakan analisa dan hasil dari
descriptive model yang dilakukan . Data Kemiskinan Penentuan atribut terdefinisi n(x)=3 dan n(c)=2 Clustering k-means Hasil Cluster Penentuan jumlah cluster Penentuan pusat cluster Penentuan jarak cluster Penentuan pusat cluster baru Hasil cluster penilaian unit spesialis
Tabel 1 Data Kemiskinan 12 Kota Kabupaten/Kota Kabupaten/Kot a Jumlah Pendudu k Miskin (000) Data Persentase Kemiskinan(% ) Garis Kemiskina n (Rp) Kuantan Singingi 34.7 11.28 400.655 Indragiri Hulu 29.6 7.5 369,21 Indragiri Hilir 54.2 7.88 282.361 Pelalawan 43.6 12 429.452 Siak 23.2 5.54 336.671 Kampar 68.6 9.04 336,681 Rokan Hulu 59.9 10.86 358.295 Bengkalis 40.1 7.57 388,671 Rokan Hilir 47.5 7.73 296.77 Kepulauan Meranti 64 35.74 386.745 Pekanbaru 32.5 3.27 381.287 Dumai 13.7 4.98 328.158
Nilai acak diambil dari nilai masing-masing variabel yang digunakan.Pengambilan nilai acak berpengaruh pada jumlah iterasi pada k-means clustering.
Tabel 2 Pusat Cluster Acak
X1 X2 X3
C1 13.7 3.27 282.361
C2 23.2 4.98 296.77
C3 29.6 5.54 328.158
Tabel 3 menjelaskan cluster sementara dari pengelompokan tingkat kemiskinan pada 12 kota atau kabupaten. Pada tabel terlihat 12 kota atau kabupaten yang ada di Propinsi Riau hanya masuk ke dalam kategori C2 dan C3. Tabel 3 Iterasi 1 X1 X2 X3 C1 C2 C3 120.41 104.71 72.90 * 88.39 72.77 41.10 * 40.76 34.31 52.04 * 150.35 134.42 102.46 * 55.18 39.90 10.65 * 77.45 60.58 40.07 * 89.21 71.88 43.07 * 109.62 93.48 61.45 * 37.01 24.46 36.20 * 45.83 32.79 15.91 *
Berikutnya menentukan pusat cluster baru.Pada tabel 4 terlihat bahwa pusat cluster hanya fokus pada c2 dan c3.
Tabel 4 Pusat Cluster baru
X1 X2 X3
C1 - - -
C2 50.85 7.81 289.57
C3 40.99 10.78 371.58
Tabel 4 tingkat kemiskinan di Kabupaten/Kota
X2 X3 C2 C3 112.31 29.75 * 82.43 12.09 * 7.95 90.24 * 140.14 57.94 * 54.67 39.53 * 50.36 44.54 * 69.39 23.11 * 99.69 17.41 * 7.95 75.16 * 101.97 37.18 * 93.65 14.92 * 53.64 51.61 *
Pada tabel 4 menjelaskan hasil cluster yang diperoleh dimana record 3 dan record 9 berada pada
cluster 2. Record 1,2,4,5,6,7,8,10,11,12 berada pada
cluster 3. Tidak ada kota atau kabupaten yang berada pada cluster 1.
IV.KESIMPULAN
Descriptive model dimana data yang diolah adalah data kemiskinan pada 12 Kota atau Kabupaten di Propinsi Riau dimana variabel yang digunakan adalah : Data pesentase kemiskinan(x1) dan garis kemiskinan(x2) serta jumlah penduduk miskin (x3) untuk menentukan cluster wilayah dengan tingkat kemiskinan normal dan cluster dengan wilayah dengan tingkat kemiskinan tinggi dan wilayah dengan tingkat kemiskinan rendah. Data tersebut diolah dengan menggunakan k-means clustering untuk menemukan pola yang memberikan gambaran tentang
cluster setiap wilayah. hasil cluster yang diperoleh dimana record3 dan record 9 berada pada cluster
2(wilayah dengan tingkat kemiskinan normal). Record 1,2,4,5,6,7,8,10,11,12 berada pada cluster 3( Wilayah dengan tingkat kemiskinan tinggi). Tidak ada kota atau kabupaten yang berada pada cluster 1(Wilayah dengan tingkat kemiskinan rendah).
Berdasarkan Nilai Body Mass index (BMI) & Ukuran Kerangka” . Yogyakarta. 2008
[2] Agusta, Y. Minimum Message Length Mixture Modelling for Uncorrelated and Correlated Continuous Data Applied to Mutual Funds Classification, Ph.D. Thesis, School of Computer Science and Software Engineering, Monash University, Clayton, 3800 Australia, 2004
[3]Agusta,Y, K-means-penerapan, permasalahand an metode terkait, STMIK, Bali, Indonesia. 2007 [4] Harun, Analisis Kepuasan Pasien Rawat Inap
terhadap Mutu Pelayanan Rumah Sakit Nirmala Suri Sukohardjo dengan Methode Servqual, Tesis, Kajian Administrasi Rumah Sakit, FKM, UI, Depok.2001.)
[5] Nengsih,Warnia.Clustering K-Means Analysis SNTIKI6, UIN, Pekanbaru,Indonesia. 2014. [6] Nengsih, Warnia, Juni Nurma Sari. K-Means
Analysis in Mapping Concept Based On Geographic Information System.IC-Star, Universitas Lampung, Lampung.Indonesia.2015.