Penerapan Metode K-Means Untuk Clustering Desa Rawan Bencana Berdasarkan Data Kejadian Terjadinya Bencana Alam
Devy Isya Ramadhani, Oki Damayanti, Osa Thaushiyah*, Abdul Rahman Kadafi4 Fakultas Teknologi Informasi, Program Studi Sistem Informasi, Universitas Nusa Mandiri, Depok, Indonesia Email: 1[email protected], 2[email protected], 3,*[email protected], 4[email protected]
Email Penulis Korespondensi: [email protected] Submitted 20-06-2022; Accepted 30-06-2022; Published 30-06-2022
Abstrak
Terletak pada kawasan Asia Tenggara, negara Indonesia menjadi salah satu wilayah yang rawan terhadap bencana terkait kondisi demografis, geologis dan geografis yang memicu terjadinya bencana baik yang disebabkan oleh faktor alam, faktor non alam maupun faktor manusia. Purbalingga termasuk wilayah Provinsi Jawa Tengah yang cukup berpotensi terjadi bencana ketika kondisi cuaca tidak menentu. Metode K-Means clustering digunakan agar mempermudah dalam menganalisis serta mengelompokan data untuk mengetahui beberapa daerah rawan bencana di wilayah Purbalingga. Dalam penelitian ini pengolahan data menggunakan tools rapidminer. Berdasarkan pengolahan data diperoleh sejumlah 5 Cluster pembagian daerah rawan bencana di Kabupaten Purbalingga dengan tingkat rawan sangat tinggi, tingkat rawan tinggi, tingkat rawan sedang, tingkat rawan rendah dan tingkat rawan sangat rendah.
Terdapat 146 desa dengan potensi rawan sangat rendah, 7 desa dengan tingkat rawan rendah, 1 desa dengan tingkat rawan sedang, 3 desa dengan tingkat rawan tinggi dan 1 desa dengan tingkat rawan sangat tinggi. Hasil pengelompokan daerah tersebut diharapkan dapat menjadi antisipasi yang dilakukan terhadap adanya bencana yang mungkin timbul dapat terus dilakukan secara tepat sehingga dapat meminimalisir efek bencana bagi masyarakat.
Kata Kunci: K-Means Clustering; Bencana; Rapidminer;
Abstract
Located in the Southeast Asian region, the country of Indonesia is one of the areas prone to disasters related to demographic, geological and geographical conditions that trigger disasters both caused by natural factors, non-natural factors and human factors. Purbalingga is an area of Central Java Province which has the potential for disasters to occur when weather conditions are uncertain. The K-Means clustering method is used to make it easier to analyze and group data to identify several disaster-prone areas in the Purbalingga area.
In this research, data processing uses rapidminer tools. Based on data processing, there were 5 clusters of disaster-prone areas in Purbalingga Regency with a very high level of vulnerability, a high level of vulnerability, a medium level of vulnerability, a low level of vulnerability and a very low level of vulnerability. There are 146 villages with very low vulnerability potential, 7 villages with low vulnerability level, 1 village with medium vulnerability level, 3 villages with high vulnerability level and 1 village with very high vulnerability level. The results of the regional grouping are expected to be used as anticipations for disasters that may arise which can continue to be carried out appropriately so as to minimize the effects of disasters for the community.
Keywords: K-Means Clustering; Disaster; Rapidminer;
1. PENDAHULUAN
Indonesia termasuk wilayah yang rawan bencana pada daerah Asia Tenggara. Hal ini berkaitan kondisi geologis, demografis dan geografis yang memicu kemungkinan terjadi suatu bencana baik yang ditimbulkan dari faktor-faktor alam seperti tanah longsor, gempa, tsunami, gunung meletus, banjir, tsunami, dan faktor non alam maupun faktor insan[1].
Indonesia termasuk kedalam negara yg memiliki 2 musim yaitu penghujan dan kemarau. Hal tersebut menjadi faktor yg dapat memicu terjadinya bencana di Indonesia. Saat kemarau tiba terjadi peningkatan ancaman seperti kebakaran hutan serta lahan, kekeringan sumber air, namun ketika musim penghujan datang ancaman bencana banjir, tanah longsor serta puting beliung juga kian meningkat [2].
Purbalingga adalah suatu wilayah yg berada di Provinsi Jawa Tengah bagian barat daya, tepatnya pada 1010 11’- 1090 35’ Bujur Timur dan 7o 10’- 7o 29’ Lintang Selatan, yang relatif berpotensi terjadi bencana akibat dari cuaca tidak menentu. Berdasarkan data yang berasal dari situs resmi Badan Penanggulangan bencana daerah (BPBD) Kabupaten Purbalingga tahun 2021 dengan total masalah sebanyak 92 kali yang terdiri berasal tanah longsor sebanyak 19 kali, angin sebanyak 28 kali, kebakaran 38 kali, banjir 7 kali.
Identifikasi area prioritas untuk taraf bencana alam terendah serta tertinggi di Purbalingga perlu dibenahi dengan memakai metode data mining. Data mining atau pattern recognition artinya prosedur pemecahan yg dipergunakan dalam proses pengolahan data guna mencari pola yang tersembunyi pada data yg diolah. Data yg diolah menggunakan teknik data mining membentuk suatu pengetahuan baru yg bersumber berasal data lama yg nantinya dapat dipergunakan untuk menentukan keputusan di masa depan.
Analisis cluster adalah suatu teknik multivariate dengan tujuan utamanya buat menggabungkan objek berdasarkan karakteristik yg dimiliki. Konsep primer prosedur pemecahan clustering yaitu mencari pusat cluster secara iteratif, dimana ditentukan pusat cluster pada jarak minimum tiap data di sentra cluster [3]. K-Means Clustering termasuk pada metode penganalisaan data atau metode data mining yang proses nya tanpa pengawasan (unsupervised) serta menjadi suatu metode pengelompokan yang datanya dilakukan dengan sistem partisi [4].
pada hal ini penulis menggunakan data yg bersumber dari Badan Penanggulangan bencana wilayah Purbalingga.
Topik yg diangkat pada penelitian ini yaitu pengelompokkan pada daerah Purbalingga menggunakan potensi rawan bencana alam memakai K-Means clustering. Metode ini digunakan agar mempermudah pada proses analisis dan
pengelompokkan data untuk mengetahui beberapa daerah rawan bencana di daerah Purbalingga. Hasilnya dapat dipergunakan menjadi masukan bagi pemerintah guna menyampaikan fokus yg lebih pada daerah-daerah dengan potensi rawan bencana yang tinggi .
2. METODOLOGI PENELITIAN
2.1 Metode Penelitian
Pada tahap ini proses pengolahan data dilakukan memakai metode CRISP- DM (Cross-Industry Standard Process for Data Mining). Berikut adalah tahapan CRISP-DM[15]:
Gambar 1 Tahapan pada CRISP-DM Sumber: [15]
Proses yang dilakukan pada tahap ini yaitu mengumpulkan dataset, menentukan atribut yang relevan serta membangun contoh clustering memakai metode clustering K-Means untuk penggolongan data serta penilaian model.
2.2 Dataset
Dataset yang dipakai merupakan data banyaknya desa ataupun kelurahan yang mengalami kejadian bencana alam dalam kurun waktu 6 tahun, terhitung sejak tahun 2016 hingga tahun 2021 yang berasal dari Badan Penanggulangan Bencana Daerah Kabupaten Purbalingga. Total dataset yang diperoleh sejumlah 2.457 rows dengan total desa terdampak sebanyak 166 desa atau kelurahan. Berikut adalah data banyaknya desa dan bencana alam yang digunakan dalam penelitian ini:
Tabel 1. Tabel Dataset
Nama Desa Data Jenis Bencana
Kejobong, Kedungjati, Krenceng, Bokol, Kedungwuluh, Kembangan, Langgar, Gambarsari, Nangkasawit, Penaruban, Nangkod, Jetis, Pandansari, Tidu, Sokanegara, Kedungbenda, Kalikajar, Kedunglegok, Arenan, Karangmanyar, Pagerandong, Muntang, Penaruban, Panican, Selakambang, Pelumutan, Selanegara, Sumilir, Sempor Lor, Toyareka, Sidanegara, Bojong, Sinduraja, Bukateja, Slinga, Karangcengis, Bancar, Karangnangka, Kembaran Kulon, Kembangan, Kalimanah Kulon, Kutawis, Wirasaba, Purbalingga Lor, Karangreja, Purbalingga Wetan, Tlahab Kidul, Jatisaba, Tlahab Lor, Toyareja, Banjarkerta, Babakan, Grecol, Karanganyar, Kutabawa, Kramat, Sanguwatang, Pepedan, Kalimanah Wetan, Rajawana, Karangsari, Sirau, Kedung Menjangan, Selabaya, Kalikabong, Mewek, Candinata, Candiwulan, Karangcegak, Meri, Binangun, Campakoah, Karang Nangka, Karangturi, Mangunegara, Pengalusan, Sangkanayu, Condong, Sindang, Pagedangan, Tangkisan, Banjarsari, Bobotsari, Dagan, Karangmalang, Limbasari, Majapura, Palumbungan, Tlagayasa, Tunjungmuli, Karanggedang, Losari, Makam, Panusupan, Sumampir, Wlahar, Banjaran, Kajongan, Karangbanjar, Metenggeng, Pekalongan, Bojongsari, Bojanegara, Dawuhan, Brobot, Sokawera, Bedagas, Bumisari, Karangjoho, Patemon, Pengadegan, Gondang, Tegalpingen, Serang, Tetel, Siwarak, Tumanggal, Bungkanel, Sumingkir, Kabunderan, Danasari, Kalijaran, Serayu Larangan, Jambudesa, Jingkang, Baleraksa, Karangjambu, Kaliori, Purbasari, Lumpang, Sirandu, Maribaya, Karangasem, Ponjen, Karangpucung, Karangbawang, Kasih, Brakas, Krangean, Tamansari, Mergasana, Karangsari, Bantarbarang, Pekiringan, Grantung, Gunungwuled, Penolih, Karangkemiri, Cilapar, Kaligondang, Kandanggampang, Kutasari, Munjul, Kertanegara, Karangreja, Karangklesem, Tajug, Tanalum.
Tanah Longsor, Geser Tanah, Angin Kencang, Angin Ribut, Banjir, Angin Puting Beliung, Gempa
2.3 Preprocessing Data
Proses seleksi data yang sesuai dan memiliki keterkaitan tentang bencana alam dilakukan pada tahap ini. Penulis melakukan pembersihan data outlier dengan ketentuan minimal 3 atribut terisi dan penulis juga melakukan pembersihan data pada nilai data yang terlalu besar. Dari total 166 row menjadi 159 row. Selain itu juga dilakukan pengubahan nama atribut desa menjadi kode desa id_01.01 hingga id_18.11. Berikut adalah tabel kode desa :
Tabel 2. Tabel Kode Desa
Kecamatan Desa/Kelurahan
Kode Nama Kode Desa
01 Kemangkon Id_01.01 Bakulan.
Id_01.02 Bokol.
Id_01.03 Gambarsari.
Id_01.04 Jetis.
Id_01.05 Kalialang.
Id_01.06 Karangkemiri.
Id_01.07 Karangtengah.
Id_01.08 Kedungbenda.
Id_01.09 Kedunglegok.
Id_01.10 Kemangkon.
Id_01.11 Majasem.
Id_01.12 Majatengah.
Id_01.13 Muntang.
Id_01.14 Panican.
Id_01.15 Pegandekan.
Id_01.16 Pelumutan.
Id_A.17 Senon.
Id_01.18 Sumilir.
Id_01.19 Toyareka.
……. ……….. ………… ……….
18 Kertanegara Id_18.01 Adiarsa Id_18.02 Condong Id_18.03 Darma
Id_18.04 Karang Tengah Id_18.05 Karangasem Id_18.06 Karangpucung Id_18.07 Kasih
Id_18.08 Kertanegara Id_18.09 Krangean Id_18.10 Langkap Id_18.11 Margasana 2.4 Modelling dan Evaluasi
Tahap modelling dilakukan dengan tools yang ada pada rapidminer dengan metode yang digunakan yaitu K-Means Clusturing. Untuk mengevaluasi penulis menggunakan model performance untuk menghitung nilai Index Davies Bouldin (IDB) untuk mengetahui jumlah cluster paling optimal.
3. HASIL DAN PEMBAHASAN
3.1 Hasil dan Pembahasan
Mencari nilai Index Davies Bouldin (DBI) terkecil guna mencari optimasi jumlah clusternya. Berikut adalah jumlah cluster yang diperoleh berdasarkan hasil DBI:
Tabel 3. Tabel Cluster Hasil DBI Cluster Hasil DBI
2 0.654
3 0.864
4 0.818
5 0.619
Dari hasil pengolahan tersebut dapat diketahu bahwa untuk jumlah cluster dioptimalkan adalah 5 hasil DBI 0,619. Jumlah masing masing cluster akan ditampilkan dibawah ini:
Gambar 2. Hasil Cluster Model
Pada cluster 0 terdapat 146 desa, cluster 1 terdapat 1 desa, cluster 2 terdapat 7 desa, cluster 3 terdapat 1 desa dan pada cluster 4 terdapat 3 desa sehingga jumlahnya keseluruhan adalah 158 desa. Maka diperoleh sejumlah 5 cluster sebagai nilai optimal yaitu daerah dengan tingkat rawan sangat rendah, tingkat rawan rendah, tingkat rawan sedang, tingkat rawan tinggi, serta tingkat rawan sangat tinggi. Berikut adalah data tiap cluster:
Tabel 4. Tabel Hasil Cluster Tiap Desa Cluster Jumlah
Anggota Desa/Kelurahan
0 146 Kejobong, Kedungjati, Krenceng, Bokol, Kedungwuluh, Kembangan, Langgar, Gambarsari, Nangkasawit, Penaruban, Nangkod, Jetis, Pandansari, Tidu, Sokanegara, Kedungbenda, Kalikajar, Kedunglegok, Arenan, Karangmanyar, Pagerandong, Muntang, Penaruban, Panican, Selakambang, Pelumutan, Selanegara, Sumilir, Sempor Lor, Toyareka, Sidanegara, Bojong, Sinduraja, Bukateja, Slinga, Karangcengis, Bancar, Karangnangka, , Kembaran Kulon, Kembangan, Kalimanah Kulon, Kutawis, Wirasaba, Purbalingga Lor, Karangreja, Purbalingga Wetan, Tlahab Kidul, Jatisaba, Tlahab Lor, Toyareja, Banjarkerta, Babakan, Grecol, Karanganyar, Kutabawa, Kramat, Sanguwatang, Pepedan, Kalimanah Wetan, Rajawana, Karangsari, Sirau, Kedung Menjangan, Selabaya, Kalikabong, Mewek, Candinata, Candiwulan, Karangcegak, Meri, Binangun, Campakoah, Karang Nangka, Karangturi, Mangunegara, Pengalusan, Sangkanayu, Condong, Sindang, Pagedangan, Tangkisan, Banjarsari, Bobotsari, Dagan, Karangmalang, Limbasari, Majapura, Palumbungan, Tlagayasa, Tunjungmuli, Karanggedang, Losari, Makam, Panusupan, Sumampir, Wlahar, Banjaran, Kajongan, Karangbanjar, Metenggeng, Pekalongan, Bojongsari, Bojanegara, Dawuhan, Brobot, Sokawera, Bedagas, Bumisari, Karangjoho, Patemon, Pengadegan, Gondang, Tegalpingen, Serang, Tetel, Siwarak, Tumanggal, Bungkanel, Sumingkir, Kabunderan, Danasari, Kalijaran, Serayu Larangan, Jambudesa, Jingkang, Baleraksa, Karangjambu, Kaliori, Purbasari, Lumpang, Sirandu, Maribaya, Karangasem, Ponjen, Karangpucung, Karangbawang, Kasih, Brakas, Krangean, Tamansari, Mergasana, Karangsari, Bantarbarang, Pekiringan, Grantung, Gunungwuled,
1 1 Penolih
2 7 Karangkemiri, Cilapar, Kaligondang, Kandanggampang, Kutasari, Munjul, Kertanegara
3 1 Karangreja
4 3 Karangklesem, Tajug, Tanalum
Dari hasil clustering tersebut dapat ditampilkan penyebaran anggota cluster dalam bentuk grafik scatter pada gambar 2 yaitu:
Gambar 3. Hasil Penyebaran Cluster dalam Grafik Scatter
3.2 Potensi Hasil
Penelitian ini dilakukan untuk mengetahui daerah dengan potensi rawan bencana yang ada pada wilayah Kabupaten Purbalingga. Dengan adanya penelitian ini diharapkan pemerintah lebih memperhatikan daerah-daerah dengan tingkat potensi tinggi sebagai upaya pencegahan ataupun penanggulangan bencana alam. Selain itu penulis berharap penelitian ini dapat dipublikasikan dalam bentuk jurnal sebagai sumber referensi bagi para pembaca.
4. KESIMPULAN
Setelah melakukan penelitian tentang “Penerapan Metode K- means Clustering Untuk Pengelompokan Daerah Rawan Bencana di Kabupaten Purbalingga”, maka dapat disimpulkan bahwa upaya melakukan pengelompokan desa desa rawan bencana di kabupaten purbalingga sangat penting untuk dilakukan agar dapat memproleh data yang akurat tentang desa desa dengan tingkat rawan sangat tinggi dan yang sangat rendah. Terdapat 146 desa dengan potensi rawan sangat rendah, 7 desa dengan tingkat rawan rendah, 1 desa dengan tingkat rawan sedang, 3 desa dengan tingkat rawan tinggi dan 1 desa dengan tingkat rawan sangat tinggi. Data yang diperoleh bisa dimanfaatkan secara maksimal sebagai acuan bagi pemerintah daerah untuk menganalisis dan melakukan upaya upaya pencegahan, pengantisipasian dan penanggulangan bencana yang mungkin sewaktu waktu bisa terjadi di wilayah Kabupaten Purbalingga. Kelompok-kelompok daerah rawan bencana yang sudah ditetapkan diharapkan bahwa antisipasi yang dilakukan terhadap adanya bencana yang mungkin timbul dapat terus dilakukan secara tepat sehingga dapat meminimalisir efek bencana bagi masyarakat. Akan tetapi yang lebih utama adalah bahwa segenap lapisan masyarakat di wilayah kabupagen Purbalingga harus memiliki kesadaran akan pentingnya menjaga alam sebagai upaya pencegahan terjadinya bencana, serta kemauan semua pihak untuk bekerjasma bahu membahu menanggulangi setiap bencana yang terjadi.
REFERENCES
[1] B. Satria and M. Sari, “Tingkat Resiliensi Masyarakat Di Area Rawan Bencana,” Idea Nurs. J., vol. 8, no. 2, pp. 30–34, 2017, [Online]. Available: http://e-repository.unsyiah.ac.id/INJ/article/view/8818/7425.
[2] A. Rosyida, R. Nurmasari, and Suprapto, “Jumlah Korban Dan Kerusakan ( Studi : Data Kejadian Bencana Indonesia 2018 ),” J.
Dialog Penanggulangan Bencana, vol. 10, no. 1, pp. 1–10, 2018, [Online]. Available:
https://perpustakaan.bnpb.go.id/jurnal/index.php/JDPB/article/view/127/97.
[3] M. G. Sadewo et al., “PENERAPAN ALGORITMA CLUSTERING DALAM MENGELOMPOKKAN BANYAKNYA DESA / KELURAHAN MENURUT UPAYA ANTISIPASI / MITIGASI BENCANA ALAM MENURUT PROVINSI DENGAN K- MEANS,” vol. 2, pp. 311–319, 2018.
[4] S. Setiawan, “Analisis Cluster Menggunakan Algoritma K-Means Untuk Mengetahui Kemampuan Pegawai Dibidang IT Pada CV. Roxed Ltd,” J. Pelita Inform., vol. 18, pp. 80–86, 2019.
[5] I. Junaedi, N. Nuswantari, and V. Yasin, “Perancangan Dan Implementasi Algoritma C4 . 5 Untuk Data Mining,” J. Inf. Syst.
Informatics Comput., vol. 3, no. 1, pp. 29–44, 2019, [Online]. Available:
http://journal.stmikjayakarta.ac.id/index.php/jisicom/article/view/203%0Ahttp://journal.stmikjayakarta.ac.id/index.php/jisicom/
article/download/203/158.
[6] sabrina aulia Rahmah, “Klasterisasi Pola Penjualan Pestisida Menggunakan Metode K-Means Clustering (Studi Kasus Di Toko Juanda Tani Kecamatan Hutabayu Raja),” Djtechno J. Teknol. Inf., vol. 1, no. 1, pp. 1–5, 2021, doi: 10.46576/djtechno.v1i1.964.
[7] A. H. Ardiansyah, W. Nugroho, N. H. Alfiyah, R. A. Handoko, and M. A. Bakhtiar, “Penerapan Data Mining Menggunakan Metode Clustering untuk Menentukan Status Provinsi di Indonesia 2020,” Semin. Nas. Inov. Teknol., vol. 4, no. 3, pp. 329–333, 2020.
[8] N. Karolina, “Data Mining Pengelompokan Pasien Rawat Inap Peserta BPJS Menggunakan Metode Clustering (Studi Kasus : RSU.Bangkatan),” J. Inf. Technol., vol. 1, no. 2, pp. 47–53, 2021, doi: 10.32938/jitu.v1i2.1470.
[9] P. Studi, M. Arsitektur, U. Kristen, and D. Wacana, “PENDAHULUAN Pengertian Potensi Becana Alam di Indonesia,” pp. 1–
17, 2020.
[10] M. F. Museum, “HUBUNGAN TINGKAT PENGETAHUAN MASYARAKAT DENGAN PENANGGULANGAN BENCANA TANAH LONGSOR DI DESA WAKOKO KABUPATEN BUTON,” vol. 45, no. 45, pp. 95–98, 2019.
[11] Z. Nabila, A. Rahman Isnain, and Z. Abidin, “Analisis Data Mining Untuk Clustering Kasus Covid-19 Di Provinsi Lampung Dengan Algoritma K-Means,” J. Teknol. dan Sist. Inf., vol. 2, no. 2, p. 100, 2021, [Online]. Available:
http://jim.teknokrat.ac.id/index.php/JTSI.
[12] L. Suriani, “Pengelompokan Data Kriminal Pada Poldasu Menentukan Pola Daerah Rawan Tindak Kriminal Menggunakan Data Mining Algoritma K-Means Clustering,” J. Sist. Komput. dan Inform., vol. 1, no. 2, p. 151, 2020, doi: 10.30865/json.v1i2.1955.
[13] F. Indriyani and E. Irfiani, “Clustering Data Penjualan pada Toko Perlengkapan Outdoor Menggunakan Metode K-Means,”
JUITA J. Inform., vol. 7, no. 2, p. 109, 2019, doi: 10.30595/juita.v7i2.5529.
[14] M. I. Ramadhan and Prihandoko, “Penerapan Data Mining untuk Analisis Data Bencana Milik BNPB Menggunakan Algoritma K-Means dan Linear Regression,” J. Inform. dan Komput., vol. 22, no. 1, pp. 57–65, 2017.
[15] E. Muningsih, I. Maryani, and V. R. Handayani, “Penerapan Metode K-Means dan Optimasi Jumlah Cluster dengan Index Davies Bouldin untuk Clustering Propinsi Berdasarkan Potensi Desa,” J. Sains dan Manaj., vol. 9, no. 1, pp. 95–100, 2021, [Online].
Available: https://ejournal.bsi.ac.id/ejurnal/index.php/evolusi/article/view/10428/4839.