Klasterisasi Desa dengan Menggunakan Algoritma K-Means pada Data Potensi Desa
Anggi Syahadat Harahap*, Pepi Zulvia
Program Studi Administrasi Bisnis Sektor Publik, Politeknik STIA LAN Bandung, Kota Bandung, Indonesia Email: 1,*[email protected], 2[email protected]
Email Penulis Korespondensi: [email protected] Submitted 29-11-2021; Accepted 20-12-2021; Published 30-12-2021
Abstrak
Indeks Desa Membangun merupakan indeks gabungan yang disusun berdasarkan tiga indeks, yakni Indeks Ketahanan Sosial, Indeks Ketahanan Ekonomi dan Indeks Ekologi Desa. Berdasarkan Indeks Desa Membangun menunjukkan 5 klasifikasi Desa, yaitu Desa Mandiri, Desa Maju, Desa Berkembang, Desa Tertinggal, serta Desa Sangat Tertinggal. Sejalan dengan itu, Badan Pusat Statistik juga mengeluarkan Indeks Pembangunan Desa untuk menunjukkan klasifikasi desa tersebut. Penelitian ini bertujuan untuk menentukan klasterisasi desa dengan menggunakan Algoritma K-Means pada data Potensi Desa (Podes) tahun 2020 khususnya pada dimensi ekonomi. K-Means merupakan metode klasterisasi data non hierarki yang dapat mempartisi data ke dalam bentuk dua kelompok atau lebih. Jumlah klaster ditentukan berdasarkan jumlah status Indeks Desa Membangun yaitu sebanyak 5 klaster. Hasil dari 6 iterasi perhitungan menggunakan algoritma K-Means didapatkan bahwa klaster 1 dikelompokkan ke dalam status Desa Sangat Tertinggal sebanyak 8 Desa/Kelurahan.
Kemudian pada klaster 2 dikelompokkan sebagai Desa Tertinggal sebanyak 3 Desa/Kelurahan. Selanjutnya pada klaster 3 dikelompokkan sebagai Desa Berkembang sebanyak 83.987 Desa/Kelurahan. Pada klaster 4 dikelompokkan sebagai Desa Maju sebanyak 24 Desa/Kelurahan. Kemudian pada klaster 5 dikelompokkan sebagai Desa Mandiri sebanyak 16 Desa/Kelurahan.
Kata Kunci: Klasterisasi; Indeks Membangun Desa; K-Means; Data Potensi Desa Abstract
The Developing Village Index (Indeks Desa Membangun) is a composite index compiled based on three indices, namely the Social Resilience Index, the Economic Resilience Index and the Village Ecological Index. Based on the Developing Village Index, there are 5 classifications of villages, namely Independent Villages, Developed Villages, Developing Villages, Underdeveloped Villages, and Very Underdeveloped Villages. In line with that, the Central Statistics Agency also issued a Village Development Index (Indeks Pembangunan Desa) to show the classification of the village. This study aims to determine village clustering using the K-Means Algorithm on the 2020 Village Potential (Podes) data, especially on the economic dimension. K-Means is a non-hierarchical data clustering method that can partition data into two or more groups. The number of clusters is determined based on the number of The Developing Village Index statuses, which are 5 clusters. The results of 6 iterations of calculations using the K-Means algorithm show that cluster 1 is grouped into the status of Very Underdeveloped Villages as many as 8 Villages. Then in cluster 2 it is grouped as Underdeveloped Villages as many as 3 Villages. Furthermore, in cluster 3, it is grouped as Developing Villages as many as 83,987 Villages. In cluster 4, they are grouped as Developed Villages as many as 24 Villages. Then in cluster 5 it is grouped as Independent Villages as many as 16 Villages.
Keywords: Clustering; The Developing Village Index; K-Means; Village Potential Data
1. PENDAHULUAN
Negara Republik Indonesia merupakan salah satu negara kepulauan terbesar di dunia. Data Badan Pusat Statistik (BPS) 2020 mencatat bahwa Indonesia memiliki 34 Provinsi, 515 Kabupaten/Kota, 7.263 Kecamatan, dan 84.038 Desa/Kelurahan [1].
Dari banyaknya jumlah desa, ketidakmerataan pembangunan pun masih menjadi salah satu masalah utama yang dihadapi oleh Indonesia. Pembangunan infrastuktur merupakan upaya pemerintah untuk mengurangi kesenjangan antara desa dan kota [2]. Salah satunya dengan digulirkannya Dana Desa yang bersumber dari Anggaran Pendapatan dan Belanja Daerah (APBD).
Dana tersebut dihitung berdasarkan jumlah desa dan dialokasikan dengan memperhatikan jumlah penduduk, angka kemiskinan, luas wilayah, dan tingkat kesulitan geografis. Selain itu Pemerintah pun masih kesulitan dalam menentukan desa mana saja yang akan diberikan bantuan Dana Desa [3].
Kementerian Desa, Pembangunan Daerah Tertinggal dan Transmigrasi (KEMENDESPDTT) melalui Direktorat Jendral Pembangunan dan Pemberdayaan Masyarakat Desa membuat suatu konsep dalam menetapkan kemajuan dan kemandirian desa melalui Indeks Desa Membangun (IDM) [4]. IDM merupakan indeks gabungan yang disusun berdasarkan tiga indeks, yakni Indeks Ketahanan Sosial, Indeks Ketahanan Ekonomi dan Indeks Ekologi Desa. Ketiga Indeks tersebut menjadi kekuatan yang saling mengisi dan menjaga potensi serta kemampuan Desa untuk mensejahterakan kehidupan Desa.
Berdasarkan hasil IDM, KEMENDESPDTT membagi atas 5 klasifikasi Desa, yaitu Desa Mandiri, Desa Maju, Desa Berkembang, Desa Tertinggal, serta Desa Sangat Tertinggal [4]. Teknik perhitungan indeks dalam menentukan status IDM, yaitu berawal dari menetapkan nilai skor 0 sampai 5 berdasarkan hasil Analitycal Hierarchy Process (AHP) sehingga muncul nilai indeks dari setiap indikator. Selanjutnya skor akhir dari Indeks Desa Membangun dihasilkan dari rata-rata Indeks Ketahanan Sosial, Indeks Ketahanan Ekonomi dan Indeks Ketahanan Lingkungan. Dalam pengumpulan data, KEMENDESPDTT melakukan survey dengan memberikan kuesioner IDM kepada seluruh perangkat desa yang selanjutnya diverifikasi dari tingkat Kecamatan, Kabupaten/Kota, serta Provinsi. Badan Pusat Statistik (BPS) Indonesia juga melalukan survey terhadap Potensi Desa di Indonesia. Sama halnya seperti KEMENDESPDTT, BPS juga memberikan kuesioner kepada seluruh perangkat desa serta narasumber lain yang berwenang dan relevan. BPS mengumpulkan data dengan dimensi yang lebih banyak, antara lain Perumahan dan Lingkungan, Pendidikan dan Kesehatan, Olahraga dan Hiburan, Angkutan dan Komunikasi, Ekonomi, Sosial dan Keamanan, serta Bencana Alam dan Mitigasi Bencana Alam. Hal tersebut dilakukan
agar mendapatkan informasi yang lebih detail terkait pengembangan potensi desa. Sehingga nantinya data tersebut bisa dijadikan untuk penentuan ataupun klasterisasi dalam pemberikan Dana Desa [5].
Klasterisasi merupakan salah satu metode analisis data mining yang digunakan untuk berbagai bidang salah satunya adalah penggalian pengetahuan baru dalam penyebaran dokumen [6]. Banyak penelitian-penelitian terdahulu yang membahas tentang metode klasterisasi. Salah satunya metodenya dengan menggunakan algoritma K-Means. K-Means merupakan metode klasterisasi data non hierarki yang dapat mempartisi data ke dalam bentuk dua kelompok atau lebih[7].
Contohnya pada penelitian yang dilakukan oleh Sandra Regina dkk dalam mengelompokkan kinerja karyawan menggunakan algoritma K-Means, dari 38 karyawan dapat dihasilkan 16 karyawan untuk klaster 1 kategori sangat produktif, 18 karyawan untuk klaster 2 kategori cukup produktif, serta 4 karyawan untuk klaster 3 kategori kurang produktif [5]. Selanjutnya penelitian yang dilakukan oleh Agil dkk dalam mengelompokkan Ujian Nasional Sekolah Menengah Pertama tahun ajaran 2018/2019, dari 34 provinsi di Indoensia dihasilkan terdapat klaster 1 terdapat 14 provinsi dengan nilai ujian nasional Tinggi, klaster 2 terdapat 5 provinsi dengan nilai ujian nasional Rendah, dan klaster 3 terdapat 15 provinsi engan nilai ujian nasional [9]. Kemudian pada penelitian yang dilakukan oleh Shelladita dkk dalam pengelompokan desa menggunakan K-Means untuk penyelenggaraan penanggulangan bencana banjir, menghasilkan jumlah klaster paling optimal sebanyak 7 dari hasil penentuan nilai k dari metode Elbow. Sehingga didapatkan klaster 1 sebanyak 1 desa, klaster 2 sebanyak 2 desa, klaster 3 sebanyak 19 desa, klaster 4 sebanyak 4 desa, klaster 5 sebanyak 5 desa, klaster 6 sebanyak 1 desa, klaster 7 sebanyak 1 desa [7]. Pada penelitian yang dilakukan oleh Mhd Gading Sadewo dkk, hasil yang diperoleh dari proses penilaian berdasarkan indeks Desa berdasarkan Keberadaan Keluarga Pengguna Listrik dan Sumber Penerangan Jalan Utama yaitu 5 Provinsi tingkat penerangan tinggi, 13 Provinsi tingkat penerangan sedang, dan 16 Provinsi lainnya termasuk tingkat penerangan rendah [10]. Selanjutnya penelitian yang dilakukan oleh Gustientiedina dkk untu klastering data obat-obatan pada RSUD Pekanbaru, menghasilkan kelompok obat yang pemakaiannya sedikit terdapat rata-rata permintaan obat setiap tahunnya kurang dari 18000 buah. Obat yang pemakaian sedang memiliki rata rata permintaan obat setiap tahunnya diantara 18000- 70000 buah. Sedangkan obat yang masuk kedalam kelompok obat yang pemakaian tinggi menghasilkan rata-rata permintaan obat setiap tahunnya diatas 70000 buah [11]. Penelitian lainnya yang menjelaskan penggunaan dari Algoritma K-Means yaitu pada penelitian Kusnadi menjelaskan, Algoritma K-Means dapat dipergunakan sebagai salah satu metode pengklasteran yang membantu keputusan dalam menentukan kelompok penduduk prioritas yang mendapatkan bedah rumah [12].
Tujuan dari penelitian ini yaitu mengelompokkan masing-masing karakteristik desa berdasarkan status IDM menggunakan Algoritma K-Means pada data Potensi Desa (Podes) tahun 2020 khususnya pada bidang ekonomi. Selain itu juga memberikan masukan kepada pemerintah pemangku kebijkan untuk memperhatikan Desa yang masih berstatus Tertinggal dan Sangat Tertinggal.
2. METODOLOGI PENELITIAN
2.1 Tahapan Penelitian
Adapun tahapan penelitian ini ditunjukkan pada Gambar 1 di bawah ini:
Gambar 1. Tahapan Penelitian 2.2 Pengumpulan Data
Pada penelitian ini menggunakan data sekunder yang didapatkan dari BPS terkait Potensi Desa tahun 2020. Data tersebut terdiri dari identitas seluruh wilayah yang ada di Indonesia, baik dari Provinsi, Kabupaten/Kota, Kecamatan, serta Desa/Kelurahan/Nagari. Data tersebut didapatkan dari hasil kuesioner yang dilakukan oleh BPS kepada 84.038 perangkat desa pada setiap Desa yang terdiri atas dimensi Perumahan dan Lingkungan, Pendidikan dan Kesehatan, Olahraga dan Hiburan, Angkutan dan Komunikasi, Ekonomi, Sosial dan Keamanan, serta Bencana Alam dan Mitigasi Bencana Alam.
Akan tetapi pada penilitian ini terfokus pada dimensi Ekonomi dimana terdiri atas 54 variable seperti yang ditunjukkan pada Tabel 1.
Tabel 1. Variabel Dimensi Ekonomi No. Nama
Variabel
Keterangan
1 R901a Jumlah Industri mikro dan kecil menurut bahan baku utama: Industri barang dari kulit (tas, sepatu, sandal, dll.)
2 R901b Jumlah Industri mikro dan kecil menurut bahan baku utama: Industri barang dari kayu (meja, kursi, lemari, dll.)
3 R901c Jumlah Industri mikro dan kecil menurut bahan baku utama: Industri barang dari logam mulia atau bahan logam (perabot dan perhiasan dari logam, dll.)
4 R901d Jumlah Industri mikro dan kecil menurut bahan baku utama: Industri barang dari kain/tenun (kerajinan tenun, konveksi, dll.)
5 R901e Jumlah Industri mikro dan kecil menurut bahan baku utama: Industri gerabah/keramik/batu (genteng, batu bata, porselin, tegel, keramik, dll.) 6 R901f Jumlah Industri mikro dan kecil menurut bahan baku utama: Industri anyaman yang
terbuat dari rotan/bambu, rumput, pandan, dll. (tikar, tas, hiasan dinding, dan produk lainnya).
7 R901g Jumlah Industri mikro dan kecil menurut bahan baku utama: Industri makanan dan minuman (pengolahan dan pengawetan daging, ikan, buah– buahan, sayuran, minyak
dan lemak, susu dan makanan dari susu, makanan dan minuman lain, dll.) 8 R901h Jumlah industri mikro dan kecil menurut bahan baku utama: Industri lainnya.
9 R902a Keberadaan pangkalan/agen/penjual minyak tanah (termasuk penjual minyak tanah keliling)
10 R902b Keberadaan pangkalan/agen/penjual LPG (warung, toko, supermarket, penjual gas keliling)
11 R903ak2 Jumlah Bank Umum Pemerintah (misalnya: BRI, BNI, MANDIRI, BPD, BTN, dll.)
12 R903ak3 Jarak terdekat ke Bank Umum Pemerintah
13 R903ak4 Kemudahan untuk mencapai Bank Umum Pemerintah
14 R903bk2 Jumlah Bank Umum Swasta (misalnya: BCA, Permata, Sinarmas, CIMB, dll.)
15 R903bk3 Jarak terdekat ke Bank Umum Swasta
16 R903bk4 Kemudahan untuk mencapai Bank Umum Swasta
17 R903ck2 Jumlah Bank Perkreditan Rakyat (BPR)
18 R903ck3 Jarak terdekat ke Bank Perkreditan Rakyat (BPR) 19 R903ck4 Kemudahan untuk mencapai Bank Perkreditan Rakyat (BPR) 20 R904a Jumlah Koperasi Unit Desa (KUD) yang beroperasi
21 R904b Jumlah Koperasi Industri Kecil dan Kerajinan Rakyat (Kopinkra)/Usaha mikro
22 R904c Jumlah Koperasi Simpan Pinjam (Kospin)
23 R904d Jumlah Koperasi lainnya
24 R905 Keberadaan salon kecantikan
25 R906ak2 Jumlah kelompok pertokoan
26 R906ak3 Jika tidak ada [kolom (2) terisi 0], jarak ke kelompok pertokoan terdekat (km) 27 R906ak4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai kelompok pertokoan 28 R906bk2 Jumlah pasar dengan bangunan permanen (memiliki atap, lantai, dan dinding) 29 R906bk3 Jika tidak ada [kolom (2) terisi 0], jarak ke pasar dengan bangunan permanen terdekat
(km)
30 R906bk4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai pasar dengan bangunan permanen terdekat
No. Nama Variabel
Keterangan
31 R906ck2 Jumlah pasar dengan bangunan semi permanen (memiliki atap dan lantai, tanpa dinding)
32 R906ck3 Jika tidak ada [kolom (2) terisi 0], jarak ke pasar dengan bangunan semi permanen terdekat (km)
33 R906ck4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai pasar dengan bangunan semi permanen terdekat
34 R906dk2 Jumlah pasar tanpa bangunan (misalnya: pasar kaget, pasar subuh, pasar terapung, dll.) 35 R906dk3 Jika tidak ada [kolom (2) terisi 0], jarak ke pasar tanpa bangunan terdekat (km) 36 R906dk4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai pasar tanpa bangunan
terdekat
37 R906ek2 Jumlah minimarket/swalayan (tempat usaha di bangunan tetap untuk menjual berbagai jenis barang secara eceran dengan label harga, sistem pelayanan mandiri, luas lantai <
400 m2)
38 R906ek3 Jika tidak ada [kolom (2) terisi 0], jarak ke minimarket/swalayan terdekat (km) 39 R906ek4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai minimarket/swalayan
terdekat
40 R906fk2 Jumlah restoran/rumah makan (usaha pangan siap saji di bangunan tetap, pembeli biasanya dikenai pajak)
41 R906fk3 Jika tidak ada [kolom (2) terisi 0], jarak ke restoran/rumah makan terdekat (km) 42 R906fk4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai restoran/rumah makan
terdekat
43 R906gk2 Jumlah warung/kedai makanan minuman (usaha pangan siap saji di bangunan tetap, pembeli biasanya tidak dikenai pajak)
44 R906gk3 Jika tidak ada [kolom (2) terisi 0], jarak ke warung/kedai makanan minuman terdekat (km)
45 R906gk4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai warung/kedai makanan minuman terdekat
46 R906hk2 Jumlah hotel (menyediakan jasa akomodasi dan ada restoran, penginapan dengan izin usaha sebagai hotel)
47 R906hk3 Jika tidak ada [kolom (2) terisi 0], jarak ke hotel terdekat (km) 48 R906hk4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai hotel terdekat 49 R906ik2 Jumlah penginapan: hostel/motel/losmen/wisma (menyediakan akomodasi, penginapan
dengan izin usaha sebagai bukan hotel)
50 R906ik3 Jika tidak ada [kolom (2) terisi 0], jarak ke penginapan: hostel/motel/losmen/wisma terdekat (km)
51 R906ik4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai penginapan:
hostel/motel/losmen/wisma terdekat
52 R906jk2 Jumlah toko/warung kelontong (tempat usaha di bangunan tetap untuk menjual berbagai jenis barang keperluan sehari-hari secara eceran tanpa ada sistem pelayanan
mandiri)
53 R906jk3 Jika tidak ada [kolom (2) terisi 0], jarak ke toko/warung kelontong terdekat (km) 54 R906jk4 Jika tidak ada [kolom (2) terisi 0], kemudahan untuk mencapai toko/warung kelontong
terdekat 2.3 Standarisasi Data
Data Potensi Desa 2020 yang diperoleh dari BPS memiliki perbedaan ukuran satuan yang besar pada setiap variabelnya. Hal tersebut akan berdampak kepada ketimpangan data dari masing-masing variabel [13]. Oleh karena itu perlu dilakukan proses standarisasi data dengan trasnformasi pada data awal sebelum dilakukan analisa pengelempokkan menggunakan alogritma K-Means. Standarisasi dilakukan terhadap data variabel yang relevan ke dalam bentuk Z-score[14]. Z-core merupakan angka yang digunakan untuk membandingkan antara nilai data dan rata-rata, lalu dibagi dalam kelompok berdasarkan standar deviasinya [15]. Rumusnya diperlihatkan sebagai berikut [16]:
𝑍 𝑠𝑐𝑜𝑟𝑒 =
𝑋−𝑋𝑆 (1)
dimana: 𝑋 : skor mentah dari data,
𝑋 : Mean awal, dan 𝑆 : deviasi standar awal.
2.4 Clustering menggunakan Algoritma K-Means
Clustering merupakan suatu proses dimana mengelompokan dan membagi pola data menjadi beberapa jumlah data set sehingga membentuk pola yang serupa dan dikelompokkan pada klaster yang sama dan memisahkan diri dengan membentuk pola yang berbeda di klaster yang berbeda [17]. Ada beberapa algoritma dalam klasterisasi, salah satunya adalah alogirtma K-Means. K-Means menggunakan proses secara berulang-ulang untuk mendapatkan basis data klaster. Secara umum algoritma K-Means menggunakan algoritma sebagai berikut [18]:
1. Penentuan k sebagai jumlah klaster yang ingin dibentuk.
Dalam penelitian ini, jumlah klaster ditentukan berdasarkan jumlah status IDM, yakni sebanyak 5 klaster.
2. Pembangkitan titik pusat klaster (k centroid) awal secara random.
Penentuan titik pusat klaster awal dilakukan secara acak dari objek-objek yang tersedia sebanyak k klaster, kemudian untuk menghitung centroid klaster ke-i berikutnya, digunakan rumus sebagai berikut: [Ediyanto]
𝑣 =
∑ 𝑥𝑖𝑛 𝑖=1
𝑛
; 𝑖 = 1, 2, 3, … , 𝑛
(2)dimana: 𝑣
: centroid pada klaster 𝑥𝑖 : objek ke-i
𝑛
: banyaknya objek/jumlah objek yang menjadi anggota klaster 3. Perhitungan jarak setiap objek ke masing-masing centroid dari masing-masing klaster.
Untuk menghitung jarak antara objek dengan centroid menggunakan Euclidian Distance.
𝑑(𝑥, 𝑦) = ‖𝑥 − 𝑦‖ = √∑
𝑛𝑖=1(𝑥
𝑖− 𝑦
𝑖)
2; 𝑖 = 1, 2, 3, … , 𝑛
(3) dimana: 𝑥𝑖 : objek x ke-i𝑦𝑖 : daya y ke-i 𝑛 : banyaknya objek
4. Alokasikan masing-masing objek ke dalam centroid yang paling terdekat.
5. Lakukan iterasi, kemudian tentukan posisi centroid baru dengan menggunakan persamaan.
6. Ulangi langkah 3 jika posisi centroid baru tidak sama.
2.5 Penentuan Status IDM
Setelah mendapatkan klasterisasi dari klaster 1 sampai dengan klaster 5 menggunakan algoritma K-Means, selanjutnya penentuan status desa didapatkan dengan perbandingan nilai survei jika dihitung secara manual. Jika nilai survei desa pada klaster 1 memiliki nilai yang rendah dibandingkan dengan nilai desa pada klaster 5, maka dapat disimpulkan bahwa klaster 1 masuk ke dalam status desa sangat tertinggal dan klaster 5 ditetapkan sebagai desa mandiri. Namun jika nilai survei desa pada klister 1 memiliki nilai yang lebih tinggi dibandingkan dengan nilai desa pada klister 5, maka dapat disimpulkan bahwa klister 1 masuk ke dalam status desa mandiri dan klister 5 ditetapkan sebagai desa tertinggal.
3. HASIL DAN PEMBAHASAN
3.1 Dataset
Dataset yang digunakan merupakan data hasil survey sebanyak 84.038 baris data dari 54 variabel telah didapatkan dari BPS yakni data Potensi Desa 2020, seperti ditampilkan pada Gambar 2 berikut ini:
Tabel 2. Dataset Potensi Desa 2020
No. Desa/
Kelurahan
R901 a
R901 b
R901 c
R901 d
R901 e
R901 f
R901 g
R901 h
R902 a
R902 b
R903ak
2 . . R906jk 4
1 LATIUNG 0 0 0 0 0 0 0 0 2 4 0 . . 3
2 LABUHAN
BAJAU 0 0 0 0 0 0 0 0 1 4 0 . . 1
3 SUAK
LAMATAN 0 1 0 0 0 0 0 0 2 4 0 . . 0
4 ANA AO 0 0 0 0 0 0 0 0 1 4 0 . . 2
5 LATALING 0 0 0 0 0 0 0 0 2 4 0 . . 2
6
PULAU BENGKALA
K
0 0 0 0 0 0 0 0 1 4 0 . . 2
7 BADEGONG 0 0 1 0 0 0 0 0 2 4 0 . . 0
8 KEBUN
BARU 0 0 0 0 0 0 0 0 1 4 0 . . 0
9 ULUL
MAYANG 0 0 0 0 0 0 0 0 2 4 0 . . 0
No. Desa/
Kelurahan
R901 a
R901 b
R901 c
R901 d
R901 e
R901 f
R901 g
R901 h
R902 a
R902 b
R903ak
2 . . R906jk 4
10 PASIR
TINGGI 0 0 0 0 0 0 0 0 2 4 0 . . 3
11 LABUHAN
JAYA 0 0 0 0 0 0 0 0 2 4 0 . . 2
12 LABUHAN
BAKTI 0 0 0 0 0 0 0 0 1 4 0 . . 3
13 BATU
RALANG 0 0 0 0 0 0 0 0 1 4 0 . . 0
14 ALUS ALUS 0 5 0 0 0 0 0 0 1 4 0 . . 0
15 SEUNEUBO
K 0 0 0 0 0 0 0 0 2 4 0 . . 0
16 BLANG
SEBEL 0 0 0 0 0 0 0 0 2 4 0 . . 2
17 TRANS
BARU 0 0 0 0 0 0 0 0 2 4 0 . . 0
18 TRANS
MERANTI 0 1 0 0 0 0 0 0 1 4 0 . . 0
19 TRANS
JERNGE 0 2 0 0 0 1 0 0 2 4 0 . . 0
20 AIR PINANG 0 0 0 0 0 0 0 0 1 4 0 . . 0
: : : : : : : : : : : : : . . :
84038 GAYA JAYA 0 0 0 0 0 0 0 0 1 3 0 . . 0
3.2 Hasil Z-Score
Sebelum dilakukan proses klasterisasi menggunakan algoritma K-Means, proses awal yang dilakukan adalah standarisasi data Potensi Desa 2020 menggunakan metode Z-score. Hal tersebut dilakukan agar tidak ada ketimpangan data dari setiap variable data. Dan berikut ini hasil dari standarisasi yang telah dilakukan:
Tabel 3. Hasil Standarisasi Z-score
No. Desa/ Kelurahan R901a R901b R901c R901d R901e R901f R901g R901h R902a R902b R903ak2 . . R906jk4
1 LATIUNG -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . 393233
2 LABUHAN
BAJAU -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . 114012
3 SUAK
LAMATAN -
.04180 -.12365 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . -.25599
4 ANA AO -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . 253622
5 LATALING -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . 253622
6 PULAU
BENGKALAK -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . 253622
7 BADEGONG -
.04180 -.20940 .06584 - .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . -.25599
8 KEBUN BARU -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . -.25599
9 ULUL
MAYANG -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . -.25599
10 PASIR TINGGI -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . 393233
11 LABUHAN
JAYA -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . 253622
12 LABUHAN
BAKTI -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . 393233
13 BATU
RALANG -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . -.25599
14 ALUS ALUS -
.04180 .21938 -
.09400 - .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . -.25599
15 SEUNEUBOK -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . -.25599
16 BLANG
SEBEL -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . 253622
17 TRANS BARU -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
-
.09247 .53430 172577 -.25847 . . -.25599
18 TRANS
MERANTI -
.04180 -.12365 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . -.25599
19 TRANS
JERNGE -
.04180 -.03789 - .09400
- .15998
- .10978
- .08847
- .28094
-
.09247 .53430 172577 -.25847 . . -.25599
20 AIR PINANG -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 172577 -.25847 . . -.25599
: : : : : : : : : : : : : . . :
84037 GAYA JAYA -
.04180 -.20940 - .09400
- .15998
- .10978
- .11663
- .28094
- .09247
-
2E+05 -.57944 -.25847 . . -.25599
3.3 Hasil Klasterisasi dari Algoritma K-Means
Setelah mendapatkan nilai Z-score untuk masing-masing data pada setiap variabel, maka dilakukan klasterisasi menggunakan Algorita K-Means. Hal pertama yang dilakukan adalah menentukan jumlah nilai k (jumlah klaster yang diinginkan), yakni sebanyak 5. Nilai 5 didapatkan dari jumlah status IDM. Hal tersebut dilakukan karena setiap Desa akan dikelompkan berdasarkan status IDM.
Proses selanjutnya adalah membangkitan titik pusat klaster (k centroid) awal secara random. Kemudian memperhitungkan jarak setiap objek ke masing-masing centroid dari masing-masing klaster. Dan terakhir mengalokasikan masing-masing objek ke dalam centroid yang paling terdekat. Proses tersebut dilakukan kembali sehingga muncul iterasi yang kedua. Dari hasil iterasi pertama dan kedua didapatkan bahwa posisi centroid menghasilkan nilai yang berbeda. Maka dari itu dilakukan iterasi yang selanjutnya sehingga mendapatkan posisi centroid yang sama dari posisi yang sebelumnya.
Dari 7 iterasi yang telah dilakukan, posisi centroid pada iterasi ke-6 dan ke-7 menghasilkan nilai yang sama. Maka 6 iterasi cukup untuk mendapatkan hasil klasterisasi menggunakan algoritma K-Means. Sehingga hasil final klaster centers, didapatkan seperti pada Tabel 4:
Tabel 4. Hasil Final Cluster Centers
Variabel Klaster
1 2 3 4 5
Zscore(r901a) -0,04180 -0,04180 -0,01390 47,95300 1,07446 Zscore(r901b) 0,79825 -0,20940 -0,00028 0,50167 0,33730 Zscore(r901c) 1,00489 -0,09400 -0,00060 1,32456 0,65524 Zscore(r901d) 0,22007 -0,15998 -0,00090 2,68629 0,59518 Zscore(r901e) 0,31219 -0,10978 -0,00003 0,01546 -0,00284 Zscore(r901f) 0,09804 -0,11663 -0,00004 -0,02630 0,21066 Zscore(r901g) 1,18977 -0,25997 -0,00044 0,61302 0,86535 Zscore(r901h) -0,08656 -0,09247 -0,00063 0,68770 2,34558 Zscore(r902a) 0,53430 0,53430 -0,00021 0,43405 0,08319 Zscore(r902b) -0,29129 0,95737 0,00024 -0,48339 -0,57944 Zscore(r903ak2) -0,09470 -0,25847 -0,00151 0,72416 6,94752 Zscore(r903ak3) 0,06297 0,20074 0,00027 -0,56911 -0,65248 Zscore(r903ak4) -0,56046 0,77172 0,00058 -0,68939 -1,84968 Zscore(r903bk2) -0,11001 -0,11001 -0,00113 0,22612 5,65224 Zscore(r903bk3) -0,47189 -0,20658 0,00052 -0,93630 -1,03175 Zscore(r903bk4) -0,77857 0,61760 0,00071 -0,90550 -2,11129 Zscore(r903ck2) 0,05024 93,08961 -0,00470 0,24890 6,80470 Zscore(r903ck3) -0,50011 -0,92760 0,00050 -0,83860 -0,91667 Zscore(r903ck4) -0,89113 -2,21816 0,00075 -0,64985 -2,09752 Zscore(r904a) 0,67763 -0,21784 -0,00021 0,22989 0,45376 Zscore(r904b) 79,17484 -0,05298 -0,00757 0,01097 0,13886 Zscore(r904c) 0,37587 -0,22790 -0,00063 1,04673 1,58342 Zscore(r904d) -0,17775 -0,17775 -0,00156 -0,02512 8,36924 Zscore(r905) -0,64472 -0,02121 0,00060 -0,91194 -1,44637 Zscore(r906ak2) -0,07878 -0,03900 -0,00134 1,55214 4,75430 Zscore(r906ak3) -0,18922 0,00266 0,00034 -0,65787 -0,70719 Zscore(r906ak4) -0,53602 0,04224 0,00069 -1,07573 -1,75038 Zscore(r906bk2) 0,02139 -0,25375 -0,00089 0,47996 4,01094 Zscore(r906bk3) -0,02893 0,53266 0,00026 -0,55713 -0,63540 Zscore(r906bk4) -0,33399 1,01649 0,00041 -0,33399 -1,68447 Zscore(r906ck2) 0,22437 0,40384 -0,00022 -0,13456 1,16658 Zscore(r906ck3) 0,13401 0,32736 0,00015 -0,36141 -0,36543 Zscore(r906ck4) -0,44615 0,17413 0,00021 -0,11533 -0,75629 Zscore(r906dk2) 0,09448 -0,25602 -0,00021 0,67865 0,09448 Zscore(r906dk3) -0,30196 1,01004 0,00022 -0,38181 -0,62341 Zscore(r906dk4) -0,53103 0,76637 0,00025 -0,37377 -0,64898 Zscore(r906ek2) 0,35635 -0,29972 -0,00499 2,22517 22,75230 Zscore(r906ek3) -0,18702 0,82433 0,00029 -0,63314 -0,65350 Zscore(r906ek4) -0,88030 1,00002 0,00064 -1,05441 -1,50708 Zscore(r906fk2) -0,01309 -0,19707 -0,00456 0,99879 22,47830 Zscore(r906fk3) -0,30593 0,48150 0,00037 -0,74540 -0,78569 Zscore(r906fk4) -0,23284 0,84655 0,00070 -1,31223 -1,74399 Zscore(r906gk2) 0,81372 -0,31466 -0,00278 2,11388 11,05804 Zscore(r906gk3) -0,31196 0,46980 0,00018 -0,35217 -0,35217 Zscore(r906gk4) -0,37920 0,23559 0,00031 -0,58413 -0,58413 Zscore(r906hk2) -0,01616 -0,09885 -0,00700 0,09408 36,61297 Zscore(r906hk3) -0,31304 0,39850 0,00042 -0,77088 -0,97327 Zscore(r906hk4) -0,64247 0,45176 0,00065 -0,55493 -2,34947 Zscore(r906ik2) -0,06903 -0,06903 -0,00875 0,52199 45,19566 Zscore(r906ik3) 0,10135 0,95635 0,00033 -0,71050 -0,87902
Variabel Klaster
1 2 3 4 5
Zscore(r906ik4) -0,32797 1,01454 0,00061 -0,68597 -2,20747 Zscore(r906jk2) 0,26347 -0,36962 -0,00135 1,70200 4,48162 Zscore(r906jk3) -0,16303 -0,16303 0,00010 -0,16303 -0,16303 Zscore(r906jk4) -0,25599 -0,25599 0,00016 -0,25599 -0,25599
Dari hasil final klaster centroid didapatkan bahwa nilai yang mendekati 0 merupakan nilai yang mendekati pusat centroid.
Selanjutnya variabel yang bernilai negatif (di bawah nol) merupakan nilai yang memiliki di bawah rata-rata sampel secara keseluruhan. Sebaliknya variabel yang bernilai positif (di atas nol) merupakan nilai yang memiliki di atas rata-rata sampel secara keseluruhan. Sehingga dari 6 iterasi yang dilakukan mendapatkan hasil klasterisasi berdasarkan Tabel 5. berikut ini:
Tabel 5. Hasil Clustering K-Means Cluster
Valid Missing
1 2 3 4 5
8 3 83.987 24 16 84.038 0
3.4 Pembahasan
Dari hasil klasterisasi menggunakan K-Means yang diperoleh, terdapat 8 Desa yang masuk pada klaster 1 antara lain ditunjukkan pada Tabel 6 di bawah ini:
Tabel 6. Daftar Desa pada Klaster 1
No. Provinsi Desa/ Kelurahan Distance
1 Jawa Tengah Bengking 4,29656
2 Jawa Tengah Bandungan 4,69987
3 Sumatera Barat Manggopoh 16,18469
4 Jawa Tengah Golantepus 24,28623
5 Sulawesi Utara Langagon I 37,65605
6 Jawa Timur Kalianget 38,18400
7 Jawa Tengah Kayumas 38,20681
8 Kalimantan Barat Sumber Agung 73,99071
Dari Tabel 6 didapatkan bahwa Desa/Kelurahan Bengking pada Provinsi Jawa Tengah memiliki jarak paling dekat dari pusat cetroid yaitu 4,29656 sehingga Desa/Kelurahan Bengking tersebut paling sesuai dengan klaster 1. Sehingga bisa disimpulkan bahwa Desa/Kelurahan Bengking memiliki nilai yang mewakili klaster 1. Sedangkan Desa/Kelurahan Sumber Agung pada Provinsi Kalimantan Barat memilki jarak yang sangat jauh dari pusat klaster 1 yaitu 73,99071. Sehingga bisa disimpulkan Desa/Kelurahan Sumber Agung juga memiliki klasterisasi yang hampir dekat dengan klaster 2. Kemudian terdapat 16 Desa yang masuk pada klaster 5 antara lain ditunjukkan pada Tabel 7 di bawah ini:
Tabel 7. Daftar Desa pada Klaster 5
No. Provinsi Desa/ Kelurahan Distance
1 Bali Jimbaran 30,40154
2 Bali Sanur 30,96405
3 Bali Seminyak 32,41777
4 Bali Ubud 34,33433
5 Bali Legian 34,38258
6 Bali Ungasan 36,34732
7 Bali Benoa 39,77445
8 Kepulauan Riau Lubuk Baja Kota 47,34882
9 Di Yogyakarta Condong Catur 47,94802
10 Jawa Barat Tugu Selatan 49,19115
11 Di Yogyakarta Catur Tunggal 62,02505
12 Jawa Timur Songgokerto 68,73951
13 Bali Tibubeneng 78,39087
14 Bali Jungutbatu 82,48858
15 Bali Kerobokan Kelod 91,64648
16 Bali Kuta 127,27723
Dari Tabel 7 didapatkan bahwa Desa/Kelurahan Jimbaran pada Provinsi Bali memiliki jarak paling dekat dari pusat cetroid yaitu 30,40154 sehingga Desa tersebut paling sesuai dengan klaster 5. Sehingga dapat disimpulkan bahwa Desa/Kelurahan Jimbaran memiliki nilai yang mewakili klaster 5. Sedangkan Desa/Kelurahan Kuta pada Provinsi Bali memilki jarak yang sangat jauh dari pusat klaster 5. Sehingga bisa disimpulkan bahwa Desa/Kelurahan Sumber Agung juga memiliki klasterisasi yang hampir dekat dengan klaster 2.
Berdasarkan hasil perhitungan survei secara manual, Desa Bengking memiliki hasil suvei yang rendah dibandingkan dengan nilai Desa Kuta. Sehingga dapat disimpulkan bahwa klaster 1 dikelompokkan ke status Desa Sangat Tertinggal dan klaster 5 dikelompokkan ke status Desa Mandiri.
4. KESIMPULAN
Dari hasil klasterisasi menggunakan Algoritma K-Means pada Data Potensi Desa 2020 berdasarkan dimensi Ekonomi didapatkan bahwa klaster 1 dikelompokkan ke dalam status Desa Sangat Tertinggal sebanyak 8 Desa/Kelurahan. Kemudian pada klaster 2 dikelompokkan sebagai Desa Tertinggal sebanyak 3 Desa/Kelurahan. Selanjutnya pada klaster 3 dikelompokkan sebagai Desa Berkembang sebanyak 83.987 Desa/Kelurahan. Pada klaster 4 dikelompokkan sebagai Desa Maju sebanyak 24 Desa/Kelurahan. Kemudian pada klaster 5 dikelompokkan sebagai Desa Mandiri sebanyak 16 Desa/Kelurahan. Jika hasil klasterisasi ini dibandingkan dengan Peringkat Status IDM tahun 2020 memiliki perbedaan yang cukup signifikan. Hal tersebut dikarenakan pada penelitian ini data yang diperhitungkan hanya data dimensi Ekonomi pada Data Potensi Desa 2020 sedangkan hasil Peringkat Status IDM menggunakan data yang lengkap dengan penggabungan 3 indeks yaitu indeks ketahanan sosial, indeks ketahanan ekonomi, dan indeks ketahanan ekologi/lingkungan. Oleh karena itu, diharapkan untuk penelitian selanjutnya dapat dilakukan perhitungan juga untuk dimensi lain seperti Perumahan dan Lingkungan, Pendidikan dan Kesehatan, Olahraga dan Hiburan, Angkutan dan Komunikasi, Sosial dan Keamanan, serta Bencana Alam dan Mitigasi Bencana Alam. Hal tersebut dilakukan agar klasterisasi status IDM sesuai dengan data KEMENDESPDTT.
UCAPAN TERIMAKASIH
Terima kasih penulis sampaikan kepada Politeknik STIA LAN Bandung yang telah memberikan dana untuk penilitian mandiri bagi Dosen Politeknik STIA LAN Bandung, khususnya dalam membeli data dari Badan Pusat Statistik serta dalam melakukan perjalanan dinas. Selanjutnya terima kasih juga kepada Ketua Unit Peneletian dan Pengabdian yang telah memafasilitasi kegiatan penelitian mandiri bagi Dosen Politeknik STIA LAN Bandung.
REFERENCES
[1] A. Mahmud, A. Pangestika, A. P. Ramadhanty, G. M. Putra, G. S. N. D. S. Putri, and R. Nooraeni, “Klasifikasi Status Desa/Kelurahan DIY (Yogyakarta) Menggunakan Model Decision Tree (Studi Kasus Data Praktik Kerja Lapangan Politeknik Statistika STIS Tahun 2020),” Engineering, MAthematics and Computer Science (EMACS) Journal, vol. 3, no. 1, pp. 33–41, Feb.
2021, doi: 10.21512/emacsjournal.v3i1.6787.
[2] N. S. Ratnadila, “Perencanaan Skenario untuk Pembangunan Desa Tertinggal: Sebuah Telaah Kritis,” Jurnal Penyuluhan Perikanan dan Kelautan, vol. 12, no. 2, pp. 111–128, Aug. 2018, doi: 10.33378/jppik.v12i2.104.
[3] M. Sukarno, Prosiding Seminar Edusainstech Analisis Pengembangan Potensi Desa Berbasis Indeks Membangun Desa (IDM) (Studi Kasus: Desa Ponggok, Kecamatan Palohharjo, Kabupaten Klaten).
[4] Suroso, “Kebijakan Pembangunan Desa Tertinggal Berbasis Indeks Desa Membangun (IDM) dan Potensi Lokal The Development Policy for Under-Developed Villages Based on IDM and Local Potential,” 2020. [Online]. Available: http://
[5] F. Xaverius, “PERKEMBANGAN DESA BERDASARKAN INDEKS DESA MEMBANGUN DI KABUPATEN MEMPAWAH VILLAGE PROGRESS BY VILLAGE DEVELOPING INDEX IN MEMPAWAH REGENCY,” vol. 7, no. 1, pp. 10–20, 2021.
[6] S. Setiawan, “ANALISIS CLUSTER MENGGUNAKAN ALGORITMA K-MEANS UNTUK MENGETAHUI KEMAMPUAN PEGAWAI DIBIDANG IT PADA CV. ROXED LTD,” Jurnal Pelita Informatika, vol. 7, no. 3, 2019.
[7] S. F. Susilo, A. Jamaludin, and I. Purnamasari, “Pengelompokan Desa Menggunakan K-Means Untuk Penyelenggaraan Penanggulangan Bencana Banjir,” JOINS (Journal of Information System), vol. 5, no. 2, pp. 156–167, Nov. 2020, doi:
10.33633/joins.v5i2.3709.
[8] S. Regina, E. Sutinah, and N. Agustina, “Clustering Kualitas Kinerja Karyawan Pada Perusahaan Bahan Kimia Menggunakan Algoritma K-Means,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 5, no. 2, p. 573, Apr. 2021, doi:
10.30865/mib.v5i2.2909.
[9] A. Aditya, I. Jovian, and B. N. Sari, “Implementasi K-Means Clustering Ujian Nasional Sekolah Menengah Pertama di Indonesia Tahun 2018/2019,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 4, no. 1, p. 51, Jan. 2020, doi: 10.30865/mib.v4i1.1784.
[10] M. Gading Sadewo, A. Eriza, A. Perdana Windarto, and D. Hartama, Seminar Nasional Teknologi Komputer & Sains (SAINTEKS) Algoritma K-Means Dalam Mengelompokkan Desa/Kelurahan Menurut Keberadaan Keluarga Pengguna Listrik dan Sumber Penerangan Jalan Utama Berdasarkan Provinsi. [Online]. Available: https://www.bps.go.id.
[11] G. Gustientiedina, M. H. Adiya, and Y. Desnelita, “Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan,” Jurnal Nasional Teknologi dan Sistem Informasi, vol. 5, no. 1, pp. 17–24, Apr. 2019, doi: 10.25077/teknosi.v5i1.2019.17-24.
[12] Y. Kusnadi and M. S. Putri, “Clustering Menggunakan Metode K-Means Untuk Menentukan Prioritas Penerima Bantuan Bedah Rumah (Studi Kasus : Desa Ciomas Bogor),” Jurnal Teknologi Informatika dan Komputer, vol. 7, no. 1, pp. 17–24, Mar. 2021, doi:
10.37012/jtik.v7i1.498.
[13] N. Anissa, “PENGGUNAAN METODE Z SCORE UNTUK MEMPREDIKSI KEMUNGKINAN KEBANGKRUTAN PADA PT MITRA ADIPERKASA Tbk.”
[14] A. Claudio et al., “ANALISIS MODEL ALTMAN (Z-SCORE) DALAM MENGUKUR KINERJA KEUANGAN UNTUK MEMPREDIKSI KEBANGKRUTAN PADA PERUSAHAAN MANUFAKTUR SEKTOR INDUSTRI BARANG KONSUMSI DI BURSA EFEK INDONESIA (BEI) PERIODE 2010-2014,” 2017.
[15] Basri and Syarli, “AHP-STANDAR SCORE: PENDEKATAN BARU DALAM SISTEM PEMERINGKATAN,” Jurnal Keteknikan dan Sains (JUTEKS) – LPPM UNHAS, vol. 1, no. 1, 2018.
[16] T. Muflifah, J. Akuntansi, and F. Ekonomi, “PENGGUNAAN METODE ALTMAN Z-SCORE UNTUK MEMPREDIKSI KEBANGKRUTAN PADA PERUSAHAAN FOOD AND BEVERAGES YANG TERDAFTAR DI BURSA EFEK INIDONESIA.”
[17] N. Putu, E. Merliana, and A. J. Santoso, PROSIDING SEMINAR NASIONAL MULTI DISIPLIN ILMU & CALL FOR PAPERS UNISBANK (SENDI_U) Kajian Multi Disiplin Ilmu untuk Mewujudkan Poros Maritim dalam Pembangunan Ekonomi Berbasis Kesejahteraan Rakyat ANALISA PENENTUAN JUMLAH CLUSTER TERBAIK PADA METODE K-MEANS CLUSTERING.
[18] N. Mara and N. S. Intisari, “PENGKLASIFIKASIAN KARAKTERISTIK DENGAN METODE K-MEANS CLUSTER ANALYSIS,” 2013.