Jurnal Teknik Informatika dan Sistem Informasi ISSN 2407-4322
Vol. 10, No. 1, Maret 2023, Hal. 231-240 E- ISSN 2503-2933 231
Penerapan Algoritma Clustering K-Means Untuk Menentukan Prioritas Penerima Bantuan Rumah Akibat
Bencana Alam
Siti Mariam*1, Fitri Handayani2, Christina Jualiane3
1,2STMIK LIKMI School of Business & IT; Ir. H. Juanda No.96/62222502121/info@likmi.ac.id
3Master in System Information Business, STMIK Likmi, Bandung, Indonesia e-mail: *1sm389082@gmail.com, 2fitrikupit4@gmail.com, 3christina.juliane@likmi.ac.id
Abstrak
Bencana memiliki dampak yang luar biasa terhadap masyarakat salah satu dampak dari bencana alam yaitu kerusakan rumah, provinsi yang sangat rawan terjadinya bencana alam yaitu provinsi Jawa Barat dan mengakibatkan banyaknya kerusakan rumah akibat bencana, solusi dari bencana ini perlu adanya bantuan rumah yang disebabkan oleh bencana alam. Pada penelitian ini membahas tentang penerapan algoritma Clustering K-Means untuk penerima bantuan akibat bencana alam, penelitian ini mengambil data dari open data Jawa Barat dengan data set kerusakan rumah data ini terdiri dari tahun 2012-2021 meliputi 27 Kabupaten/kota yang ada di Provinsi Jawa Barat. Penelitian ini menggunakan metode Cross- Industry Standard Process for Data Mining (CRISPDM) yang memiliki enam tahapan dimulai dari Business Understanding, Data Understanding, Data Preparation, Modelling, Evaluation, dan Deployment. Hasil data yang diolah dengan menggunakan K-Means clustering terbagi menjadi 4 cluster yaitu, tingkat cluster sangat prioritas(C0), tingkat cluster prioritas (C1), tingkat cluster kurang prioritas(C2), dan tingkat cluster tidak prioritas (C3), Dalam penelitian ini cluster yang sangat prioritas dalam penerimaan bantuan adalah Kota Bekasi, Kabupaten Subang, Kabupaten Karawang, dan Kabupaten Indramayu.
Kata kunci— K-Means Clustering, CRISPDM (Cross-Industry Standard Process for Data Mining), cluster
Abstract
Disasters have a tremendous impact on society, one of the impacts of natural disasters is damage to houses, a province that is very prone to natural disasters, namely the province of West Java and results in a lot of house damage due to disasters, the solution to this disaster needs housing assistance caused by natural disasters . In this study discusses the application of the K-Means Clustering algorithm for beneficiaries due to natural disasters, this study takes data from open data in West Java with a data set of house damage. This data consists of the years 2012-2021 covering 27 regencies/cities in Java Province. West. This study uses the Cross- Industry Standard Process for Data Mining (CRISPDM) method which has six stages starting from Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, and Deployment. The results of the data processed using K-Means clustering are divided into 4 clusters, namely, the very priority cluster level (C0), the priority cluster level (C1), the less priority cluster level (C2), and the non-priority cluster level (C3). These clusters that are very prioritized in receiving aid are Bekasi City, Subang Regency, Karawang Regency, and Indramayu Regency
Keywords— K-Means Clustering, CRISPDM (Cross-Industry Standard Process for Data Mining), cluster
232 Jatisi ISSN 2407-4322 Vol. 10, No. 1, Maret 2023, Hal. 231-240 E-ISSN 2503-2933
1. PENDAHULUAN
encana menurut [1] merupakan sebuah peristiwa atau rangkaian peristiwa yang berdampak kepada kehidupan masyarakat bencana ini disebabkan oleh beberapa faktor seperti faktor alam, non alam, maupun faktor manusia. Menurut Undang-Undang Nomor 24 Tahun 2007 bencana di definisikan menjadi 3 jenis yang pertama adalah bencana alam bencana ini diakibatkan karena adanya sebuah peristiwa contohnya yaitu gempa bumi, banjir, angin topan, dan tanah longsor yang kedua adalah bencana non alam bencana ini terjadi karena adanya rangkaian peristiwa yang diakibatkan oleh faktor alam contohnya yaitu pencemaran lingkungan, kebakaran hutan, dan dampak industri yang ketiga adalah bencana sosial bencana yang diakibatkan oleh manusia seperti kerusuhan antar kelompok.
Bencana dapat memiliki dampak bagi kehidupan masyarakat salah satunya dampak dari bencana alam yang dapat mengakibatkan adanya korban jiwa, kerusakan fasilitas umum, kerusakan sarana dan prasarana serta rusaknya rumah tinggal. Menurut [2] Badan Nasional Penanggulangan Bencana (BNPB) mengemukakan bahwa Jawa Barat merupakan daerah rawan bencana alam di Indonesia, pada bulan januari hingga maret 2022 Jawa Barat mengalami bencana alam sebanyak 260 kejadian, kejadian ini mengakibatkan kerusakan pada bangunan rumah, tercatat kerusakan tersebut sebanyak 19.887 kerusakan rumah tersebut terdiri dalam beberapa kategori, yaitu kategori rusak berat mencapai 3.462 kerusakan, kategori rusak sedang mencapai 3.792 kerusakan dan untuk katerogi rusak ringan mencapai 12.633 kerusakan.
Terdapat penelitian sebelumnya yang dilakukan oleh Ipin Sugiyarto pada tahun 2021 dengan judul Pengelompokan Dampak Gempa Bumi dan Kerusakan Pada Wilayah Berpotensi Gempa di Provinsi Sumatera Barat, penelitian ini menghasilkan tiga kluster dalam mengelompokan dampak akibat gempa bumi[3], selanjutnya terdapat penelitian yang dilakukan oleh Elly Muningsih dkk pada tahun 2021 tentang optimalisasi jumlah kluster dengan index davies bouldin untuk clustering propinsi berdasarkan potensi desa penelitian ini menghasilkan tiga kategori kluster untuk mengetahui kelompok propinsi berdasarkan jumlah industri[4]
penelitian selanjutnya yang berkaitan dengan algoritma k-means yaitu penelitian yang dilakukan oleh Yunita Ratna Sari pada tahun 2020 tentang Clustering kemiskinan provinsi banten dengan menggunakan rapid miner hasil yang didapatkan yaitu 3 kluster dengan kategori tingkat kemiskinan sedang, tertinggi dan rendah[5]. Melihat penelitian sebelumnya yang telah dilakukan mengenai algoritma k-means, penelitian tersebut menjadi acuan bagi penulis dalam melakukan penelitian ini dimulai dari metode clustering yang akan digunakan yaitu algoritma k- means, dan tools yang digunakan yaitu rapid miner.
Maka dari itu penelitian yang akan dilakukan yaitu menentukan prioritas penerima bantuan akibat bencana alam dengan metode K-means Clustering, metode ini sering digunakan untuk pengelompokan data mining, dalam metode ini dapat melihat optimalisasi jumlah cluster berdasarkan Indeks Davies Bouldin atau sering disebut DBI, optimalisasi jumlah kluster ini dilihat dari hasil nilai DBI yang paling terkecil[6] Teknik Clustering menurut [7] adalah Teknik yang digunakan dalam mengelompokan record sehingga dapat membentuk kelas objek yang memiliki kemiripan. Analisis kluster adalah sebuah metode yang digunakan untuk membagi data menjadi beberapa grup, grup tersebut didasarkan pada kesama-kesaman pada objek[8].
Salah satu algoritma yang dapat digunakan dalam menggunakan Teknik Clustering yaitu algoritma K-Means Clustering karena algoritma ini adalah alternatif pengelompokan untuk data yang memiliki ukuran lebih besar dan memiliki kecapatn yang lebih tinggi. Metode ini dikategorikan kedalam metode non-hierarki karena metode ini digunakan untuk memperjelas sebuah algoritma dalam menentukan suatu objek kedalam cluster tertentu berdasarkan nilai pusat massanya yang paling dekat [9].
B
Jatisi ISSN 2407-4322
Vol. 10, No. 1, Maret 2023, Hal. 231-240 E- ISSN 2503-2933 233
2. METODE PENELITIAN
Dalam metodologi penelitian ini menggunakan metode Cross-Industry Standard Process for Data Mining atau biasa disingkat dengan CRISPDM. Dalam metode ini terdiri dari enam tahapan menurut [10] tahapan tersebut terdapat pada gambar 1:
Gambar 1 Metode Cross-Industry Standard Process for Data Mining.
Sumber [10]
2.1 Business Understanding
Tahapan ini digunakan untuk memahami tujuan dan Analisa kebutuhan bisnis yang kemudian diubah kedalam pengetahuan untuk menyusun dan menentukan rencana serta strategi.
Pada tahapan ini menentukan tujuan penelitian yaitu menentukan prioritas penerima bantuan berdasarkan kerusakan rumah akibat bencana alam yang di Provinsi Jawa Barat.
2.2 Data Understanding
Tahapan ini merupakan tahapan pengumpulan data, proses pengumpulan data ini menggunakan open data jabar, data yang diambil adalah data kerusakan rumah pada tahun 2012-2021.
2.3 Data Preparation
Tahapan ini digunakan untuk membangun data set yang akan dilanjutkan ketahap pemodelan dari data tersebut, tahap ini dimulai dari pemilihan tabel, atribut, dan proses pembersihan data.
234 Jatisi ISSN 2407-4322 Vol. 10, No. 1, Maret 2023, Hal. 231-240 E-ISSN 2503-2933
2.4 Modelling
Tahapan ini merupakan tahapan pemilihan teknik data mining, metode yang digunakan adalah metode clustering dengan menggunakan algoritma K-means Clustering.
2.5 Evaluation
Melakukan proses evaluasi untuk mengetahui optimaliasi dari masing-masing tiap cluster evaluasi ini diambil berdasarkan performance Davies Bouldin Index sehingga dapat menghasilkan jumlah optimal untuk cluster.
2.6 Deployment
Merupakan tahap akhir untuk mengetahui hasil dari pengujian, hasil tersebut dapat berupa pengetahuan dan informasi.
3. HASIL DAN PEMBAHASAN
3.1 Data Understanding/Data Set
Penelitian ini mengambil sumber data dari open data jabar dimana data tersebut merupakan data kerusakan rumah akibat bencana yang ada di Provinsi Jawa Barat, data tersebut terdiri dari tahun 2012-2021. Keseluruhan data tersebut terdiri dari 1620 data jumlah data tersebut belum dihitung dan belum ditransformasikan berdasarkan kabupaten/kota, dalam melakukan penelitian ini data akan dihitung terlebih dahulu berdasarkan jumlah kerusakan rumah dan kondisi kerusakan rumah yaitu hancur, rusak ringan, rusak sedang, rusak berat, terendam, dan terancam, penjumlahan tersebut di hitung dari tahun 2012-2022 sehingga akan menghasilkan rata-rata jumlah kerusakan rumah berdasarkan kabupaten/kota dari tahun 2012- 2021. Berikut merupakan atribut yang akan digunakan dalam penelitian ini
a.
Nama kabupaten/kota terdiri dari Kota Tasikmalaya, Kota Sukabumi, Kota Depok, Kota Cirebon, Kabupaten Cianjur, Kabupaten Ciamis, Kabupaten Bogor, Kabupaten Bandung Barat, dan lain sebagainyab.
Kondisi kerusakan rumah terdiri dari hancur, rusak berat, rusak sedang, rusak ringan, terancam, dan terendam.Berikut merupakan rata-rata jumlah kerusakan rumah dari tahun 2012-2021 berdasarkan kabupaten/kota yang ada di Jawa Barat, Data tersebut berada pada tabel 1:
.
Tabel 1. Rata-rata Jumlah Kerusakan Rumah Tahun 2012-2021
Kode Nama
Kabupaten Hancur Rusak Berat
Rusak Sedang
Rusak
Ringan Terancam Terendam 3201
Kabupaten
Bogor 2,6 116,8 230,8 568 143,1 1975,3
3202
Kabupaten
Sukabumi 5,7 264,8 376,9 1000,7 175,6 212,3
3203
Kabupaten
Cianjur 1,8 72,5 43,8 225,4 319,8 250,4
3204
Kabupaten
Bandung 63 61,5 60,1 246,8 334,1 20705
3205
Kabupaten
Garut 27,8 175,8 269,8 377,4 210,5 739,4
3206
Kabupaten
Tasikmalaya 1,4 79,8 192,9 406,3 65,5 356,6
Jatisi ISSN 2407-4322
Vol. 10, No. 1, Maret 2023, Hal. 231-240 E- ISSN 2503-2933 235
Tabel 2 Rata-Rata Jumlah Kerusakan Rumah tahun 2012-2021 Lanjutan
Kode Nama
Kabupaten Hancur Rusak Berat
Rusak Sedang
Rusak
Ringan Terancam Terendam 3207 Kabupaten
Ciamis 5,2 171,1 271 631,4 71,8 906,7
3208 Kabupaten
Kuningan 0,4 20,4 26 90,7 84,8 394,7
3209 Kabupaten
Cirebon 0 6 5,6 132,2 620,7 5810,2
3210 Kabupaten
Majalengka 0,6 79,9 22,9 258,6 86,7 1200,2
3211 Kabupaten
Sumedang 0,5 31,8 17,3 47 147,8 381,2
3212 Kabupaten
Indramayu 2,7 12,1 22,3 39,5 0 11007,6
3213 Kabupaten
Subang 0 8,5 20,5 62,7 6,4 10428,7
3214 Kabupaten
Purwakarta 1,1 16,4 6,4 26,7 28 57,8
3215 Kabupaten
Karawang 0 52,9 172,1 131 22,1 10840,3
3216 Kabupaten
Bekasi 0 12,6 8,4 128,5 2,4 4540,8
3217
Kabupaten Bandung
Barat
1,1 47,6 36,8 91,8 108 52
3218 Kabupaten
Pangandaran 0 40,1 83,3 267,4 87,1 375,1
3271 Kota Bogor 0,3 21,7 49,6 80,1 209,2 184
3272 Kota
Sukabumi 0,5 3,2 5,8 9,7 2,7 11,2
3273 Kota Bandung 1,7 39,5 162,8 21,2 8,9 536,3
3274 Kota Cirebon 0,1 4,8 1 5,2 0,5 48,9
3275 Kota Bekasi 0 3,2 162,8 24,4 0,5 11262
3276 Kota Depok 0 2,4 1,2 13,9 0,3 18,6
3277 Kota Cimahi 0,4 8,6 6,8 17 1,8 516
3278 Kota
Tasikmalaya 0,5 10,6 53,3 122,8 4,8 31,5
3279 Kota Banjar 0 13 61,6 43,5 2,8 1,9
3.2 Data Preparation
Setelah mengetahui data set yang akan digunakan selanjutnya melakukan prepocessing data, prepocessing data digunakan untuk pembersihan data dan digunakan untuk melakukan penyesuaian tipe data atribut, dalam data set kerusakan rumah ini tipe data dari atribut yang akan digunakan adalah tipe data real, selain itu untuk nama kabupaten diberikan role label.
Berikut merupakan data preparation terdapat dalam gambar 2.
236 Jatisi ISSN 2407-4322 Vol. 10, No. 1, Maret 2023, Hal. 231-240 E-ISSN 2503-2933
Gambar 2. Tahap Prepocessing Data
3.3 Modelling dan Evaluation
Tahapan selanjutnya adalah modelling menggunakan tools RapidMiner dengan menggunakan metode Clustering dan algoritma yang akan digunakan adalah K-means. Berikut merupakan tahapan dalam melakukan modelling dan Evaluation.
a.
Membuat modelling cluster dengan menggunakan metode K-Means, model cluster ini terdiri dari beberapa clustering, yang memiliki jumlah 2-4 clusterb.
Tiap cluster dievaluasi dengan operator performance dan di cek nilai dari Index Davies Bouldin (IDB) dari masing-masing clusterc.
Nilai Index Davies Bouldin (IDB) terkecil merupakan cluster yang memiliki jumlah yang optimal.Gambar 3. Modelling K-means Clustering
Dalam modelling tersebut terdapat beberapa operator, operator pertama adalah multiply operator digunakan agar dapat menggunakan beberapa operator dari K-means, selanjutnya terdapat operator clustering k-means untuk melakukan pengelompokan berdasarkan jumlahnya, selanjutnya terdapat operator performance, operator ini digunakan untuk mengetahui nilai Index Davies Bouldin (IDB).
Jatisi ISSN 2407-4322
Vol. 10, No. 1, Maret 2023, Hal. 231-240 E- ISSN 2503-2933 237
Setelah melakukan modelling dengan menggunakan rapid miner maka selanjutnya mencari nilai pada Index Davies Bouldin(IDB) dari tiap-tiap cluster. Nilai terkecil dari IDB digunakan untuk mengetahui optimalisasi jumlah cluster, Berikut merupakan Nilai Index Davies Bouldin(IDB) dari tiap-tiap cluster terdapat pada tabel 2.
Tabel 3. Nilai Index Davies Bouldin Cluster Nilai Index
Davies Bouldin
2 0.346
3 0.218
4 0.177
Dari hasil diatas bahwa optimalisasi jumlah cluster adalah 4 dengan Nilai Index Davies Bouldin(IDB) 0.177, maka dari itu data kerusakan rumah di bagi menjadi 4 cluster, daftar cluster tersebut terdapat pada gambar 4 yaitu sebagai berikut:
Gambar 4. Cluster Model
Berdasarkan pada gambar 4 dapat diuraikan bahwa cluster 0 terdiri 4 kabupaten/kota, cluster 1 terdiri dari 20 kabupaten/kota, cluster 2 terdiri 1 kabupaten/kota, dan cluster 3 terdiri dari 2 kabupaten/kota. Dan untuk nilai centroid dari masing-masing cluster terdapat pada gambar 5 yaitu:
Gambar 5. Centroid Tabel
Berdasarkan nilai centroid maka masing-masing cluster memiliki kategori yaitu sebagai berikut:
1. Cluster 0 merupakan kabupaten/kota yang memiliki skala sangat prioritas untuk penerimaan bantuan
2. Cluster 1 merupakan kabupaten/kota yang memiliki skala prioritas untuk penerimaan bantuan
3. Cluster 2 merupakan kabupaten/kota yang memiliki skala kurang prioritas untuk penerimaan bantuan
4. Cluster 3 merupakan kabupaten/kota yang memiliki skala tidak prioritas untuk penerimaan bantuan
238 Jatisi ISSN 2407-4322 Vol. 10, No. 1, Maret 2023, Hal. 231-240 E-ISSN 2503-2933
Selanjutnya adalah data kabupaten/kota dari yang masuk kedalam tiap-tiap cluster, data tersebut terdapat dalam tabel 3:
Tabel 4. Data Cluster Bedasarkan Kabupuaten/Kota
Cluster Jumlah Kabupaten/Kota
0 4 Kota Bekasi, Kabupaten Subang, Kabupaten Karawang, dan Kabupaten Indramayu
1 20 Kota Tasikmalaya, Kota Sukabumi, Kota Depok, Kota Cirebon, Kota Cimahi, Kota Bogor, Kota Banjar, Kota Bandung, Kabupaten Tasikmalaya, Kabupaten Sumedang, Kabupaten Sukabumi, Kabupaten Purwakarta, Kabupaten Pangandaran, Kabupaten Majalengka, Kabupaten Kuningan, Kabupaten Garut, Kabupaten Cianjur, Kabupaten Ciamis, Kabupaten Bogor, Kabupaten Bandung Barat.
2 1 Kabupaten Bandung
3 2 Kabupaten Bekasi, dan Kabupaten Cirebon
Dari data diatas dapat diketahui bahwa Kota Bekasi, Kabupaten Subang, Kabupaten Karawang, dan Kabupaten Indramayu, memiliki skala pririotas yang sangat besar untuk penerimaan bantuan rumah yang disebabkan oleh bencana alam. Selanjutnya yaitu grafik dari penyebaran anggota dari tiap-tiap cluster terdapat pada gambar 6 yaitu sebagai berikut:
Gambar 6. Grafik Cluster Perkabupaten
4. KESIMPULAN
Dari hasil penelitian dapat disimpulkan bahwa dalam penelitian ini mengambil data dari open data Jawa Barat tentang data kerusakan rumah yang ada di Provinsi Jawa Barat yang terdiri dari tahun 2012-2021, dengan menggunakan tools Rapid Miner, pengujian cluster pada Rapid Miner ini berdasarkan performance dari Nilai Index Davies Bouldin(IDB), sehingga
Jatisi ISSN 2407-4322
Vol. 10, No. 1, Maret 2023, Hal. 231-240 E- ISSN 2503-2933 239
dalam penelitian didapatkan Nilai Index Davies Bouldin(IDB) 0.177 yang menghasilkan optimalisasi cluster yaitu empat cluster. Dengan kategori yaitu kategori sangat prioritas(C0), prioritas (C1), kurang prioritas (C2), dan tidak prioritas (C3), dan yang termasuk kedalam kategori sangat prioritas dalam penerima bantuan rumah akibat bencana alam yang ada di Jawa Barat yaitu Kota Bekasi, Kabupaten Subang, Kabupaten Karawang, dan Kabupaten Indramayu
5. SARAN
Saran untuk penelitian selanjutnya apabila ingin mendapatkan hasil pengujian yang lebih optimal yaitu sebagai berikut:
a. Dalam penelitian ini penulis menyarankan agar dapat dilakukan penelitian lebih lanjut dengan menggunakan metode yang lain seperti K-medoids dan lain-lain
b. Hasil dari penelitian ini dapat digunakan sebagai bahan petimbangan dalam mengambil keputusan tentang penerima bantuan rumah yang ada di Provinsi Jawa Barat yang disebakan oleh bencana alam, sehingga proses bantuan dapat disalurkan dengan baik sesuai dengan kelompok kondisi kerusakan rumah.
UCAPAN TERIMA KASIH
Penulis mengucapkan terima kasih kepada penulis satu dan penulis dua yang telah melakukan kerjasama dalam melakukan penelitian ini, selanjutnya penulis mengucapkan terimakasih kepada penulis tiga yang telah memberikan bimbingan selama proses penelitian ini.
DAFTAR PUSTAKA