Penyandang Disabilitas Menurut Kecamatan
Kabupaten Simalungun
Ade Indah Sari
1, Heru Satria Tambunan
2, Widodo Saputra
3, Irfan Sudahri
Damanik
4, Ilham Syahputra Saragih
5STIKOM Tunas Bangsa Pematangsiantar
Jl. Jenderal Sudirman Blok A No 1-3 Pematangsiantar, Indonesia
[email protected]
Abstract
A person with a disability is someone who has physical or mental limitations that can interfere and is an obstacle for him to carry out normal daily activities. People with special needs (disabilities) are people who live with special characteristics and have differences with people in general. This study aims to classify areas of people with disabilities based on districts. In this study using data mining techniques with the k-Means clustering method. The k-means method is a clustering method that functions to break the dataset into groups. The data source of this research was obtained from the Central Statistics Agency (BPS) of Simalungun Regency. Data entered is data on the number of persons with disabilities in 2008-2017 consisting of 31 sub-districts divided into 3 clusters: high, medium and low clusters. From the k-means calculation results, 8 sub-districts as high clusters were obtained, 15 sub-districts as medium clusters and 8 sub-districts as low clusters. The implementation process using the RapidMiner 5.3 application is used to help find accurate values.
Keywords: Data Mining, Clustering, K-Means, Person with Disabilities, RapidMiner
5.3
1. Pendahuluan
Penyandang disabilitas adalah seseorang yang memiliki keterbatasan fisik atau mental yang dapat mengganggu dan merupakan hambatan baginya untuk melakukan kegiatan sehari-hari secara normal. Tidak semua manusia diciptakan dengan kondisi fisik ataupun mental yang sempurna. Hal ini yang menyebabkan sebagian pada diri mereka merasa minder atau rendah diri dalam pergaulan. Permasalahan penyandang disabilitas merupakan masalah yang sangat kompleks dengan adanya keterbatasan tentu saja menimbulkan masalah sosial karena adanya keterbatasan pada fungsi tubuh yang tidak sempurna. Ketidakmampuan ini dapat menghambat penyandang disabilitas dalam menjalankan kegiatan sehari-hari. Orang yang berkebutuhan khusus (disabilitas) merupakan orang yang hidup dengan karakteristik khusus dan memiliki perbedaan dengan orang pada umumnya. Karena karakteristik yang berbeda inilah yang memerlukan pelayanan khusus agar mendapatkan hak u ntuk kehidupan yang lebih baik. Oleh karena itu, dalam upaya pemberdayaan penyandang disabilitas perlu dilakukannya penelitian berdasarkan kecamatan kabupaten simalungun sehingga dapat diketahui kelompok-kelompok wilayah yang memiliki
cluster tinggi, cluster sedang, cluster rendah terhadap jumlah penyandang
disabilitas.
Ada banyak cabang ilmu komputer yang dapat memecahkan masalah yang kompleks, salah satunya data mining. Data Mining adalah suatu proses mencari pola atau informasi menarik yang tersembunyi pada data tersebut [1]. Salah satu algoritma clustering adalah k-means yang merupakan salah satu metode pengelompokan dalam data mining. algoritma k-means yaitu salah satu dari metode
pengelompokan data nonhierarki yang dapat mempartisi data kedalam bentuk dua kelompok atau lebih [2]. Algoritma ini mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama akan dikelompokan ke dalam satu
cluster yang sama dan apabila data yang memiliki karakteristik yang berbeda akan
di kelompokan ke dalam cluster yang lain [3]. Algoritma k-means sangat terkenal karena kemudahan dan kemampuannya untuk meng-cluster data yang besar dan data
outlier dengan sangat cepat [4]. Algoritma k-means clustering dapat diterapkan pada
data jumlah penyandang disabilitas berdasarkan kabupaten simalungun, sehingga dapat diketahui pengelompokan kecamatan berdasarkan data tersebut. Dari data pengelompokan tersebut dapat dilihat karakteristiknya sehingga diketahui cluster tinggi, cluster sedang, cluster rendah pada jumlah penyandang disabilitas setiap kecamatan. Berdasarkan permasalahan diatas, maka penulis mengambil judul skripsi “Implementasi Algoritma K-Means Dalam Pengelompokan Penyandang Disabilitas Menurut Kecamatan Kabupaten Simalungun”. Diharapkan penelitian ini dapat dijadikan masukkan kepada pemerintah sebagai bahan pertimbangan dalam upaya meningkatkan pemberdayaan penyandang disabilitas pada tahun -tahun berikutnya.
2. Metodologi Penelitian
Penelitian ini dilakukan untuk mengimplementasikan data mining dengan algoritma
k-means clustering dalam menentukan cluster tinggi, cluster sedang, dan cluster rendah
terhadap data jumlah penyandang disabilitas di kecamatan kabupaten simalungun. 2.1. Analisa Data
Proses analisis data dilakukan setelah adanya pengumpulan data dan bukti yang mendukung penelitian. Data yang digunakan penulis untuk mendukung terlaksananya penelitian ini yaitu data sekunder yang bersumber dari Badan Pusat Statistik (BPS) Kabupaten Simalungun. Data sekunder merupakan data yang tidak diperoleh dari sumbernya langsung, melainkan sudah dikumpulkan oleh pihak lain dan sudah diolah serta memiliki keterkaitan dengan permasalahan yang akan diteliti. Sumber data penelitian diperoleh dari Badan Pusat Statistik Kabupat en Simalungun dengan situs resmi simalungunkab.bps.go.id dan buku publikasi BPS Kabupaten Simalungun. Data yang digunakan dalam penelitian ini adalah data penyandang disabilitas menurut kabupaten simalungun dari tahun 2008-2017 yang terdiri dari 31 kecamatan.
2.2. Data Mining
Data Mining merupakan rangkaian kegiatan untuk menemukan pola yang
menarik dari data dalam jumlah besar, kemudian data tersebut dapat disimpan dalam database, data werehaouse atau penyimpanan informasi [5]. Data yang diolah dengan teknik data mining dapat menghasilkan suatu pengetahuan baru yang bersumber dari data lama, hasil dari pengolahan data tersebut dapat digunakan untuk menentukan keputusan di masa yang akan datang.
2.3. Algoritma K-Means
Algoritma K-Means merupakan metode yang digunakan untuk mengelompokkan suatu data yang dilakukan berdasarkan pencarian pusat cluster secara iterative dimana letak cluster masing-masing data ditemukan jarak minimum setiap data pada pusat cluster [6]. Langkah-langkah dalam algoritma k-means yaitu : a. Tentukan jumlah cluster (k) pada data set
Penentuan nilai centroid pada tahap awal dilakukan secara acak, sedangkan pada tahap iterasi digunakan rumus seperti berikut ini :
(1)
Keterangan :
Vij = centroid rata-rata cluster ke-i untuk variabel ke-j Ni = jumlah anggota cluster ke-i
i, k = indeks dari cluster j = indeks dari variabel
Xkj = nilai data ke-k variabel ke-j dalam cluster tersebut
c. Pada masing-masing record, hitung jarak terdekat dengan centroid. Jarak centroid yang digunakan adalah Euclidean Distance, dengan rumus seperti berikut ini :
(2) Keterangan :
De = Euclidean Distance
i = banyaknya objek (x,y) = koordinat objek (s,t) = koordinat centroid
d. Kelompokkan objek berdasarkan jarak ke centroid terdekat
e. Ulangi langkah ke-2, lakukan iterasi hingga centroid bernilai optimal
3. Hasil dan Pembahasan
Pada penelitian ini kumpulan data yang diperoleh digunakan sebagai data masukan dalam membuat model aturan menggunakan algoritma k-means clustering dengan menggunakan aplikasi rapidminer 5.3 untuk mengetahui kabupaten mana yang masuk ke dalam cluster tinggi, cluster sedang dan cluster rendah. Berikut adalah langkah penyelesaian dalam mengelompokkan penyandang disabilitas menggunakan algoritma k-means clustering :
a. Menentukan jumlah data yang akan di cluster
Table 1. Rata-rata penyandang disabilitas No Kecamatan Rata-rata 1 Silimakuta 60,400 2 Pamatang Silimahuta 55,400 3 Purba 86,200 4 Haranggaol Horison 47,200 5 Dolok Pardamean 117,200 6 Sidamanik 121,300 7 Pamatang Sidamanik 108,400 8 Girsang Sipangan Bolon 41,100
9 Tanah Jawa 193,700 10 Hatonduhan 62,600 11 Dolok Panribuan 108,900 12 Jorlang Hataran 146,600 13 Panei 100,800 14 Panombeian Panei 84,900 15 Raya 117,700 16 Dolok Silou 72,800 17 Silou Kahean 112,300
No Kecamatan Rata-rata 18 Raya Kahean 115,300 19 Tapian Dolok 199,300 20 Dolok Batu Nanggar 149,900
21 Siantar 206,200
22 Gunung Malela 219,100 23 Gunung Maligas 96,100 24 Hutabayu Raja 207,900
25 Jawa Maraja Bah Jambi 158,100
26 Pamatang Bandar
126,300
27 Bandar Huluan
100,400
28 Bandar
229,800
29 Bandar Masilam
173,000
30 Bosar Maligas
151,000
31 Ujung Padang
209,700
b. Menetapkan Jumlah Cluster
Pada tahap ini penulis menetapkan nilai k jumlah cluster penyandang disabilitas sebanyak 3 cluster (k-3). Cluster yang dibentuk yaitu cluster tinggi, cluster sedang dan
cluster rendah.
c. Menentukan nilai Centroid
Menentukan nilai Centroid awal yang telah ditentukan secara random berdasarkan nilai variabel data yang di cluster sebanyak yang ditentukan sebelumnya. Adapun cluster tertinggi (C1) diperoleh dari nilai tertinggi , cluster sedang (C2) diperoleh dari nilai rata-rata, dan cluster rendah (C3) diperoleh dari nilai terkecil. Berikut adalah nilai
centroid data awal untuk iterasi 1 :
Table 2. Centroid Data Awal (Iterasi 1) C1 Maximum 229,800
C2 Average 128,374 C3 Minimum 41,100 d. Menghitung Jarak Centroid
Menghitung jarak setiap data terhadap pusat cluster. Setelah data nilai pusat cluster ditentukan, maka langkah selanjutnya adalah menghitung jarak masing-masing data terhadap pusat cluster dengan menggunakan Euclidean Distance sebagai berikut : Dilakukan perhitungan jarak dengan titik pusat (centroid) pada C1,C2, dan C3 :
D (1.1) = = 169,400
D (2.1) = = 67,974
D (3.1) = = 19,300
Dan seterusnya sampai dengan D (1.31), D (2,31), dan D (3.31) sehingga menghasilkan jarak terpendek dari centroid. Berikut tabel hasil dari perhitungan centroid 1 (C1), centroid 2 (C2) dan centroid 3 (C3) serta jarak terpendeknya :
Table 3. Jarak Centroid Iterasi 1
No Kecamatan C1 C2 C3 Jarak Terpendek
1 Silimakuta 169,400 67,974 19,300 19,300 2 Pamatang Silimahuta 174,400 72,974 14,300 14,300
No Kecamatan C1 C2 C3 Jarak Terpendek 3 Purba 143,600 42,174 45,100 42,174 4 Haranggaol Horison 182,600 81,174 6,100 6,100 5 Dolok Pardamean 112,600 11,174 76,100 11,174 6 Sidamanik 108,500 7,074 80,200 7,074 7 Pamatang Sidamanik 121,400 19,974 67,300 19,974 8 Girsang Sipangan Bolon 188,700 87,274 0,000 0,000 9 Tanah Jawa 36,100 65,326 152,600 36,100 10 Hatonduhan 167,200 65,774 21,500 21,500 11 Dolok Panribuan 120,900 19,474 67,800 19,474 12 Jorlang Hataran 83,200 18,226 105,500 18,226 13 Panei 129,000 27,574 59,700 27,574 14 Panombeian Panei 144,900 43,474 43,800 43,474 15 Raya 112,100 10,674 76,600 10,674 16 Dolok Silou 157,000 55,574 31,700 31,700 17 Silou Kahean 117,500 16,074 71,200 16,074 18 Raya Kahean 114,500 13,074 74,200 13,074 19 Tapian Dolok 30,500 70,926 158,200 30,500 20 Dolok Batu Nanggar 79,900 21,526 108,800 21,526 21 Siantar 23,600 77,826 165,100 23,600 22 Gunung Malela 10,700 90,726 178,000 10,700 23 Gunung Maligas 133,700 32,274 55,000 32,274 24 Hutabayu Raja 21,900 79,526 166,800 21,900 25 Jawa Maraja Bah Jambi 71,700 29,726 117,000 29,726 26 Pamatang Bandar 103,500 2,074 85,200 2,074 27 Bandar Huluan 129,400 27,974 59,300 27,974 28 Bandar 0,000 101,426 188,700 0,000 29 Bandar Masilam 56,800 44,626 131,900 44,626 30 Bosar Maligas 78,800 22,626 109,900 22,626 31 Ujung Padang 20,100 81,326 168,600 20,100 e. Pengelompokkan posisi cluster
Dalam mengelompokkan posisi cluster dari tabel diatas, dapat dilakukan dengan melihat pernyataan berikut. “jika nilai terpendek berada di kolom C1 maka pada tabel posisi cluster, kolom C1 diberi nilai 1”, jika nilai terpendek berada di kolom C2 maka pada tabel posisi cluster, kolom C2 diberi nilai 1” dan “jika nilai terpendek berada di kolom C1 maka pada tabel posisi cluster, kolom C3 diberi nilai 1”. Nilai 1 hanya untuk simbolis atau pertanda bahwa pada kolom tersebut terdapat nilai jarak terpendek mewakili kolom tersebut. Berikut tabel pengelompokan posisi cluster
Table 4. Pengelompokkan Posisi Cluster No C1 C2 C3 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 1 10 1
11
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
1Table 5. Hasil Cluster Iterasi 1
C1 7
C2 18
C3 6
Setelah mendapatkan hasil
perhitungan iterasi 1, maka langkah Selanjutnya
menghitung iterasi kedua dengan melakukan kembali langkah 3-5. Jika nilai
centroid hasil iterasi dengan nilai centroid sebelumnya bernilai sama atau nilainya
sudah optimal serta posisi cluster tidak mengalami perubahan maka proses iterasi
berhenti. Namun jika nilai centroid tidak sama atau nilainya belum optimal maka
proses iterasi berlanjut pada iterasi selanjutnya. Berikut menghitung titik pusat
baru menggunakan hasil dari setiap anggota pada masing-masing cluster
:C1x = = 209,386 C2x = = 120,800 C3x = = 56,583
Table 6. Hasil Cluster Iterasi 2
C1 8
C2 15
C3 8
Setelah mendapatkan hasil perhitungan iterasi 2, maka langkah Selanjutnya menghitung iterasi ketiga dengan melakukan kembali langkah 3-5. Jika nilai centroid hasil iterasi dengan nilai centroid sebelumnya bernilai sama atau nilainya sudah optimal serta posisi cluster tidak mengalami perubahan maka proses iterasi berhenti. Namun jika nilai centroid tidak sama atau nilainya belum optimal maka proses iterasi berlanjut pada iterasi selanjutnya. Berikut hasil dari Cluster iterasi 3 :
Table 7. Hasil Cluster Iterasi 3
C1 8
C3 8
Dilihat dari tabel posisi cluster 1, cluster 2 dan cluster 3 memiliki nilai yang sama dan tidak ada perubahan. Pada penelitian ini, proses perhitungan k-means berhenti pada iterasi ke-3, karena iterasi ke-3 sama hasilnya dengan iterasi sebelumnya. Berdasarkan hasil posisi cluster, diperoleh C1 berjumlah 8 data, C2 berjumlah 15 data dan C3 berjumlah 8 data, sehingga diperoleh kesimpulan sebagai berikut :
1. Cluster Tertinggi (C1) dengan jumlah data penyandang disabilitas sebanyak 8 kecamatan, yaitu Tanah Jawa, Tapian Dolok, Siantar, Gunung Malela, Hutabayu Raja, Bandar, Bandar Masilam, Ujung Padang.
2. Cluster Sedang (C2) dengan jumlah data penyandang disabilitas sebanyak 15 kecamatan, yaitu Dolok Pardamean, Sidamanik, Pematang Sidamanik, Dolok Panribuan, Jorlang Hataran, Panei, Raya, Silau Kahean, Raya Kahean, Dolok Batu Nanggar, Gunung Maligas, Jawa Maraja Bah Jambi, Pematang Bandar, Bandar Huluan, Bosar Maligas.
3. Cluster Rendah (C3) dengan jumlah data penyandang disabilitas sebanyak 8 kecamatan, yaitu Silimakuta, Pematang Silimahuta, Purba, Haranggaol Horison, Girsang Sipangan Bolon, Hatonduhan, Panombeian Panei, Dolok Silou.
Berdasarkan dari penjelasan diatas pada data yang telah dianalisa dapat disimpulkan bahwa data tersebut valid. Dibuktikan dengan hasil akhir perhitungan manual dengan hasil akhir dari aplikasi RapidMiner 5.3. dapat menampilkan hasil akhir yang sama. Berikut adalah tampilan cluster model berupa teks yang ada didalam aplikasi
RapidMiner 5.3. dari cluster yang terbentuk :
Gambar 1. Cluster Model Penyandang Disabilitas Keterangan :
1. Jumlah Cluster 0 (Sedang) berjumlah 15 Items 2. Jumlah Cluster 1 (Rendah) berjumlah 8 Items 3. Jumlah Cluster 2 (Tinggi) berjumlah 8 Items
4. Kesimpulan
Berdasarkan hasil penelitian yang dilakukan tentang pengelompokkan penyandang disabilitas dengan algoritma k-means clustering dapat disimpulkan bahwa Cluster Tertinggi (C1) dengan jumlah data penyandang disabilitas sebanyak 8 kecamatan, Cluster Sedang (C2) dengan jumlah data penyandang disabilitas sebanyak 15 kecamata, dan Cluster Rendah (C3) dengan jumlah data penyandang disabilitas sebanyak 8 kecamatan. Berdasarkan Pengujian data yang dilakukan dalam penelitian ini, cluster data berhenti pada data yang terjadi di iterasi 3. Nilai
hasil akurasi dari perhitungan manual excel dan aplikasi RapidMiner 5.3 bernilai sama.
Daftar Pustaka
[1] R. R. Putra and C. Wadisman, “Implementasi Data Mining Pemilihan Pelanggan Potensial Menggunakan Algoritma K-Means,” vol. 1, no. 1, pp. 72–77, 2018.
[2] Gustientiedina, M. H. Adiya, and Y. Desnelita, “Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada RSUD Pekanbaru,” vol. 01, pp. 17–24, 2019.
[3] A. E. Wicaksono, “Implementasi data mining dalam pengelompokan data peserta didik di sekolah untuk memprediksi calon penerima beasiswa dengan menggunakan algoritma k- means (studi kasus sman 16 bekasi),” vol. 21, no. 3, 2016.
[4] Y. Darmi and A. Setiawan, “Penerapan Metode Clustering K-Means Dalam Pengelompokan Penjualan Produk,” vol. 12, no. 2, pp. 148–157, 2016.
[5] A. Eryzha, D. Hartama, A. Wanto, and Sumarno, “Data Mining Algoritma K-Means Dalam Mengelompokkan Jumlah Desa yang Memiliki Fasilitas Sekolah Menurut Provinsi Berdasarkan Tingkat Pendidikan,” vol. 2018, no. April, 2018.
[6] E. Satria, H. S. Tambunan, I. S. Saragih, I. S. Damanik, and F. T. E. Sitanggang, “Penerapan Clustering dalam Mengelompokkan Jumlah Kunjungan Wisatawan Mancanegara Dengan Metode K-Means,” no. September, pp. 462–471, 2019.