PENGELOMPOKKAN KASUS PENYAKIT DEMAM BERDARAH DI PROVINSI JAWA TIMUR MENGGUNAAN METODE K-MEANS
CLUSTERING
Susilowati1, Abdulloh Hamid2, Dian C. Rini Novitasari3
1UIN Sunan Ampel Surabaya, [email protected]
2UIN Sunan Ampel Surabaya, [email protected]
3UIN Sunan Ampel Surabaya, [email protected]
Abstrak. Di Indonesia, Demam Berdarah Dengue (DBD) merupakan penyakit yang menjadi masalah kesehatan masyarakat dan banyak daerah yang menjadi endemik.
Penyakit ini telah menjadi masalah kesehatan global. Penyakit ini merupakan penyakit yang dapat menyerang semua usia, sehingga perlu penanganan yang serius. Sehingga dalam penelitian ini bertujuan mengelompokan Kabupaten/Kota di Jawa Timur untuk mengetahui daerah mana yang memiliki resiko tinggi tertular penyakit demam berdadah.
Cluster diperlukan untuk mengelompokkan kabupaten/kota di Jawa Timur yang memiliki resiko tinggi, sedang dan rendah terjangkit penyakit DBD. Dari data jumlah keseluruhan Kabupaten/Kota di Jawa Timur tahun 2017 – 2019 di peroleh 15 Kabupaten/Kota yang tergolong cluster tinggi (C1), 7 Kabupaten/Kota yang tergolong cluster sedang (C2), dan 16 Kabupaten/Kota yang tergolong cluster rendah (C3).
Kata kunci: Demam Berdarah Dengue, K-means, Clustering, Provinsi Jawa Timur
Abstract. In Indonesia, Dengue Hemorrhagic Fever (DHF) is a disease that is a public health problem and many areas are endemic. This disease has become a global health problem. This disease is a disease that can affect all ages, so it needs serious treatment.
So, in this study, the aim of this study is to group districts/cities in East Java to find out which areas have a high risk of contracting dengue fever. Clusters are needed to classify districts/cities in East Java that have a high, medium and low risk of contracting DHF.
From the data on the total number of regencies/cities in East Java in 2017 – 2019 it was found that 15 districts/cities classified as high clusters (C1), 7 districts/cities classified as medium clusters (C2), and 16 districts/cities classified as low clusters (C3).
Keywords: Dengue Hemorrhagic Fever, K-Means, Clustering, East Java Province
1. Pendahuluan
Di Indonesia, Demam Berdarah Dengue (DBD) merupakan penyakit yang menjadi masalah kesehatan masyarakat dan banyak daerah yang menjadi endemik. Penyakit ini telah menjadi masalah kesehatan global. Penyakit ini merupakan penyakit yang dapat menyerang semua usia, sehingga perlu penanganan yang serius. DBD ditularkan melalui gigitan nyamuk jenis Aedes, terutama Aedes Aegypti atau Aedes albopictus. Kedua jenis nyamuk ini ada di seluruh Indonesia selain daerah dengan ketinggian lebih dari 1000 meter di atas permukaan laut. Waktu penetasan infeksi diperkirakan sekitar 7 hari. DBD dapat terjadi setiap tahun [1].
DBD merupakan kasus kesejahteraan yang signifikan di Indonesia. Dengan meningkatnya mobilitas dan kepadatan penduduk, jumlah korban dan ruang sirkulasi bertambah. DBD pertama kali dialami di Indonesia pada tahun 1968 di Surabaya dengan berbagai masalah, yaitu 58 orang terinfeksi dan 24 lainnya meninggal. Sejak saat itu penyakit ini telah menyebar secara umum di Indonesia [2].
Infeksi ini juga sering menyebabkan Kejadian Luar Biasa (KLB) dengan lalu lintas yang sangat besar dan menimbulkan dampak finansial bagi penduduknya. Banyaknya aspek yang berhubungan dengan
terbentuknya kenaikan kasus DBD dan KLB yang susah atau tidak bisa dikendalikan semacam kepadatan penduduk, mobilitas, lancarnya transportasi (darat, laut serta udara), kebersihan lingkungan, sikap hidup sehat, perubahan musim, dan perubahan cuaca di dunia serta keganasan virusnya [3]. Akhir- akhir ini kasus Demam Berdarah Dengue (DBD) sering terjadi pada masa-masa perkembangan, terutama pada bulan Januari menjelang awal tahun. Selanjutnya, penghuni perlu memahami pemicu DBD, memahami tanda dan manifestasinya, agar dapat mencegah dan beradaptasi dengan baik [4].
Di Indonesia, kasus demam berdarah masih sangat besar. Salah satu daerah dengan kasus DBD yang cukup besar adalah Wilayah Jawa Timur. Dari pengecekan data Dinas Kesehatan Jatim (Dinkes Jatim) jumlah kasus DBD di wilayah/kelurahan Jatim pada 2019 meningkat drastis [5] dari 2018 dari 9.425 kasus menjadi 18.397 kasus [6]. Sementara itu, kasus meninggalnya pasien DBD bertambah 73 orang. Realitas ini menunjukkan bahwa penyebaran DBD di Kabupaten/Kota Jawa Timur tergolong tinggi dan memerlukan penanganan administrasi kesejahteraan.
Penelitian ini bertujuan mengelompokkan Kabupaten/Kota di Jawa Timur untuk mengetahui daerah mana yang memiliki risiko tinggi tertular penyakit demam berdarah. Pemeriksaan berkelompok atau kelompok adalah mengumpulkan informasi (objek) berdasarkan data yang ditemukan dalam informasi yang menggambarkan artikel ini dan hubungan di antara mereka. cluster memiliki beberapa teknik untuk mengumpulkan informasi, salah satunya dapat memanfaatkan strategi K-Means [7]. K-Means adalah teknik pengelompokan informasi non-progresif yang berusaha untuk membagi informasi yang ada ke dalam setidaknya satu cluster/kumpulan. Teknik ini membagi informasi ke dalam cluster/kumpulan sehingga informasi dengan kualitas yang sama dikumpulkan ke dalam kelompok yang sama dan informasi dengan berbagai atribut dikumpulkan ke dalam pertemuan yang berbeda [8].
Dari penelitian sebelumnya, ada banyak penelitian yang diarahkan pada pengumpulan daerah rawan infeksi, seperti penelitian yang berjudul “Implementasi Algoritma K-Means dalam Pengelompokan Kasus Penyakit Tuberkulosis Paru berdasarkan Provinsi” dengan hasil akhir penelitian tersebut menyebutkan bahwa didapat 3 cluster yaitu cluster tinggi sebanyak 3 provinsi, cluster sedang sebanyak 3 provinsi dan cluster rendah sebanyak 28 provinsi [9]. Kemudian penelitian selanjutnya yang berjudul “Penerapan Algoritma K- Means Clustering Untuk Pengelompokkan Penyebaran Diare Di Kabupaten Langkat” dari hasil penelitian tersebut didapatkan 2 cluster yaitu cluster 1 ada 3 Kecamatan dan cluster 2 ada 2 Kecamatan [10]. Lalu penelitian selanjutnya yang berjudul “Implementasi Data Mining Untuk Clustering Daerah Penyebaran Penyakit Demam Berdarah di Kota Tangerang Selatan Menggunakan Algoritma K-means” hasil penelitian tersebut mengatakan bahwa didapatkan 3 cluster yaitu cluster 1 ada 20 Kelurahan, cluster 2 ada 13 Kelurahan dan cluster 3 ada 19 Kelurahan [11]. dan masih banyak penelitian pengelompokan daerah rentan penyakit lainnya. Sehingga K-Means Clustering adalah algoritma yang cukup baik yang bisa digunakan untuk menyelesaikan suatu permasalahan yang berhubungan dengan pengklasteran objek.
Dalam penelitian ini pengelompokan Kabupaten/Kota yang ada di Jawa Timur pada tahun 2017 - 2019 menggunakan K-Means Clustering sesuai tingkat terjadinya kasus penyakit DBD agar dapat memberikan kebijakan untuk membantu pemerintah setempat dalam pencegahan dan penanggulangan penyakit DBD.
2. Kajian Teori
2.1 Demam Berdarah Dengue (DBD)
Demam Berdarah Dengue (DBD) adalah penyakit yang disebabkan oleh infeksi dengue yang bertempat dengan Arthropoda-Borne Infection, famili Flavivirus dan Flacicharidae. Penularan DBD melalui semua infeksi, terutama golongan Aedes, Aedes Aegypti atau Aedes albopictus dengan demam tinggi sampai 40℃, muka merah, demam, badan, lemas dan syok yang dapat membahayakan nyawa (meninggal) [12]. Vektor utama penyakit demam berdarah di Indonesia adalah nyamuk Aedes aegypti. Aedes aegypti merupakan salah satu jenis hewan eksotik nyamuk yang produktif sebagai
regulasi infeksi, karena sangat merusak dan berkembang biak di iklim manusia. Dari penelitian laboratorium dan lapangan, faktor perusak yang sangat membingungkan adalah nyamuk Aedes Aigypti. Tempat yang disukai untuk pemeliharaan adalah iklim yang terdapat dalam kompartemen untuk penimbunan air seperti bak mandi, drum, ember, dll [13].
2.2 K-Means
K-Means adalah sebuah algoritma yang digunakan untuk membagi data menjadi beberapa kelompok yang berbeda-berbeda. Algoritma ini mampu meminimalkan jarak antara data dan cluster.
Pada dasarnya proses menggunakan algoritma clustering ini tergantung pada data yang diperoleh dan kesimpulan yang ingin dicapai pada akhir proses. Pada dasarnya algoritma k-means hanya membutuhkan bagian dari banyak komponen yang diperoleh untuk digunakan sebagai pusat cluster awal, Penentuan pusat cluster awal ini dipilih secara acak dari populasi data. Lalu algoritma k-means akan menguji setiap komponen dalam populasi data tersebut dan menandai Komponen-komponen tersebut menjadi salah satu pusat cluster yang sebelumnya tergantung dari Jarak minimum antara setiap komponen pusat cluster. Selain itu, lokasi pusat cluster akan dihitung ulang sampai semua komponen data dibagi menjadi masing-masing cluster, dan akhirnya akan membentuk cluster baru [14]. Berikut tahapan – tahapan menggunakan K-Means [15]:
a. Menentukan jumlah cluster yang akan dibentuk.
b. Memiliki centroid awal yang diperoleh secara acak dan jumlah centroid sebanyak angka cluster
c. Melakukan perhitungan jarak terdekat dari setiap data ke centroid. Metode yang paling efektif untuk menghitung jarak selesai menggunakan persamaan Eucledian Distance:
(1)
d. Menggabungkan data berdasarkan jarak terdekat dengan titik pusat centroid.
e. Mengubah nilai centroid yang didapat dari rata- rata cluster dengan persamaan:
(2)
dimana :
= Jumlah data dalam cluster
= Jumlah dari nilai jarak yang masuk dalam masing-masing cluster
f. Jika anggota tidak ada yang berubah tiap cluster, maka iterasi selesai Lakukan tahap 2 sampai tahap 5 jika iterasi masih ada yang berubah tiap cluster.
3. Metode Penelitian
Dalam pemanfaatan perhitungan cluster untuk pengumpulan kasus demam berdarah di Wilayah Jawa Timur, diperlukan data terkait. Sumber data pemeriksaan diperoleh dari data yang dikumpulkan berdasarkan arsip data kesejahteraan yang disampaikan oleh Dinas Kesehatan Provinsi Jawa Timur melalui https://dinkes.jatimprov.go.id/ atau dokumen catatan Profil Kesehatan Masyarakat Jawa Timur Tahun 2017 - 2019. Data yang dikumpulkan yang digunakan dalam pemeriksaan ini adalah data jumlah kasus DBD di Wilayah Jawa Timur pada Juli 2017, Juni 2018 dan Agustus 2019 yang terdiri dari 38 kelurahan. Data akan ditangani dengan mengelompokkan dan dipartisi menjadi 3 cluster, yaitu cluster tinggi ,sedang, rendah.
4. Hasil dan Pembahasan
Berikut data jumlah kasus penyakit DBD di Jawa Timur tahun 2017 – 2019 :
Tabel 1: Data Penderita DBD Kabupaten/Kota di Jawa Timur No Nama Kab/Kota
Jumlah Penderita 2017 2018 2019
1 Pacitan 122 268 629
2 Ponorogo 117 443 1721
3 Trenggalek 368 276 507
4 Tulungagung 128 463 899
5 Blitar 19 355 671
6 Kediri 405 466 1398
7 Malang 262 751 1570
8 Lumajang 206 33 171
9 Jember 338 389 988
10 Banyuwangi 47 34 138
11 Bondowoso 103 249 383
12 Situbondo 238 120 448
13 Probolinggo 155 80 440
: : : : :
37 Kota Surabaya 451 321 277
38 Kota Batu 351 78 25
Dari tabel diatas, data akan memasuki tahap pengelompokan dengan menerapkan perhitungan K- Means untuk mengelompokkan data menjadi tiga kelompok.
a. Clustering Data
Dalam clustering data, data yang diperoleh akan ditentukan terlebih dahulu berdasarkan data jumlah kasus DBD di Jawa Timur. Sebelumnya sudah ditentukan cluster yang akan digunakan pada analisa ini, cluster dibagi menjadi 3 yaitu cluster tinggi, cluster sedang dan cluster rendah.
b. Centroid Data
Tentukan nilai centroid awal yang telah diselesaikan secara acak tergantung pada nilai variabel data dalam kelompok/cluster sebanyak cluster yang telah ditentukan. Cluster tinggi (C1) diperoleh dari nilai maximum pada data, cluster sedang (C2) diperoleh dari nilai rata-rata, dan cluster rendah (C3) diperoleh dari nilai minimum pada rata-rata data. Berikut adalah nilai centroid data:
Tabel 2 : Centroid Data
Centroid 2017 2018 2019
C1 316 235 310
C2 238 561 1215
C3 90,9 122 328
c. Perhitungan Jarak
Melakukan perhitungan jarak dengan menggunakan persamaan Euclidean Distance.
Dari rumus tersebut menghasilkan data jumlah penderita DBD dengan jarak terdekat langsung dari tiga tempat centroid. Data akan digabungkan dalam cluster yang ditunjukkan dengan jarak
terdekat. Nilai rasio ditentukan mengingat jarak antar pusat kelompok yang kemudian dijadikan tolak ukur dalam iterasi berikut. Kemudian, pada iterasi berikutnya, perhitungan selesai dengan mengubah nilai centroid yang didapat dari rata – rata yang diperoleh. Nilai rasio dari perhitungan yang telah dilakukan akan dikontraskan dengan nilai rasio pada iterasi berikutnya. Dilakukan pengecekan nilai dari kedua rasio, apakah perbedaan dalam nilai rasio sekarang lebih besar/lebih kecil dari nilai rasio di iterasi sebelumnya. Jika nilai proporsi masih sangat besar dibandingkan dengan nilai proporsi sebelumnya, maka pada saat itu iterasi akan dilanjutkan dengan mengubah nilai pusat dan menghitung data lagi. Iterasi akan berhenti jika nilai rasio selanjutnya lebih rendah dari nilai rasio pada iterasi sebelumnya. Berikut adalah hasil perhitungan menggunakan K-Means Clustering:
Tabel 3 : Hasil Pengelompokkan
No Kab/Kota C1 C2 C3
1 Pacitan I
2 Ponorogo I
3 Trenggalek I
4 Tulungagung I
5 Blitar I
6 Kediri I
7 Malang I
8 Lumajang I
9 Jember I
10 Banyuwangi I
11 Bondowoso I
12 Situbondo I
13 Probolinggo I
: : : : :
37 Kota Surabaya I
38 Kota Batu I
Dari tabel diatas dapat diketahui bahwa hasil cluster penyakit demam berdarah di Kabupaten/Kota Jawa Timur diperoleh 15 Kabupaten/Kota yang tergolong daerah yang tinggi terpapar penyakit demam berdarah atau cluster 1 yaitu Trenggalek, Situbondo, Pasuruan, Sidoarjo, Mojokerto,Jombang, Nganjuk, Gresik, Sampang, Pamekasan, Sumenep, Kota Blitar, Kota Madiun, Kota Surabaya dan Kota Batu. 7 Kabupaten/Kota yang tergolong daerah yang sedang terpapar penyakit demam berdarah atau cluster 2 yaitu Ponorogo, Tulungagung, Kediri, Malang, Jember, Ngawi dan Bojonegoro. 16 Kabupaten/Kota yang tergolong daerah yang rendah terpapar penyakit demam berdarah atau cluster 3 yaitu Pacitan, Blitar, Lumajang, Banyuwangi, Bondowoso, Probolinggo, Madiun, Magetan, Tuban, Lamongan, Bangkalan, Kota Kediri, Kota Malang, Kota Probolinggo, Kota Pasuruan dan Kota Mojokerto. Berikut adalah gambar pemetaan kasus penyakit demam berdarah di Kabupaten/Kota Jawa Timur pada tahun 2017 – 2019.
= Cluster Tinggi
= Cluster Sedang = Cluster Rendah
Gambar 1 : Peta Cluster Penyakit Demam Berdarah 2017 - 2019 5. Simpulan
Hasil yang didapat dalam penelitian ini adalah dari jumlah keseluruhan Kabupaten/Kota di Jawa Timur tahun 2017 – 2019 disimpulkan bahwa telah di dapat nilai dengan 3 cluster yaitu cluster tinggi (C1) sebanyak 15 Kab/Kota, cluster sedang (C2) sebanyak 7 Kab/Kota, dan cluster rendah (C3) sebanyak 16 Kab/Kota di Jawa Timur. Penelitian ini diharapkan dapat dijadikan bahan bagi berbagai ilmuwan yang perlu mengangkat hal yang sama untuk mengetahui dampak lanjutan dari eksplorasi untuk tahun berikutnya dengan tujuan dapat memberikan kontribusi bagi otoritas publik, khususnya pada jumlah kasus DBD sebagai mempertimbangkan kelompok tinggi dengan tujuan akhir untuk mengurangi jumlah kasus DBD dalam waktu dekat.
Referensi
[1] Dinas Kesehatan (2019). Profil Kesehatan Provinsi Jawa Timur Tahun 2019. Agustus. Dinas Kesehatan Provinsi Jawa Timur. Surabaya.
[2] Kementerian Kesehatan. (2016). Pusat Data dan Informasi. Kementerian Kesehatan RI. Jakarta Selatan.
[3] Sitorus, Rotua Sumihar. (2009). Perilaku Masyarakat dalam Pencegahan Penyakit Demam Berdarah Dengue di Puskesmas Medan Johor Kota Medan Tahun 2009 .Tesis. Medan:
Universitas Sumatera Utara.
[4] Muhammad Hariyanto, Rizky Tahara Shita. (2018). Clustering pada Data Mining untuk Mengetahui Potensi Penyebaran Penyakit DBD Menggunakan Metode Algoritma K-Means dan Metode Perhitungan Jarak Euclidean Distance. SKANIKA, Vol 1, No 1.
[5] Dinas Kesehatan (2018). Profil Kesehatan Provinsi Jawa Timur Tahun 2018. Juni . Dinas Kesehatan Provinsi Jawa Timur.
[6] Dinas Kesehatan (2017) . Profil Kesehatan Provinsi Jawa Timur Tahun 2017. Juli . Dinas Kesehatan Provinsi Jawa Timur.
[7] Prasetyo, E. (2014). Data Mining Mengolah Data Menjadi Informasi Menggunakan Matlab.
September. Penerbit Andi. Yogyakarta.
[8] Sari R.W, D. Hartama, I. Gunawan, and P. Windarto. (2018) .Aplikasi RapidMiner dalam Pengelompokkan Kasus Penyakit AIDS berdasarkan Provinsi dengan Data Mining Kmeans Clustering. pp. 59–69.
[9] Triyansyah, D., & Fitrianah, D. (2018).Analisis Data Mining Menggunakan Algoritma K- Means Clustering Untuk Menentukan Strategi Marketing. Jurnal Telekomunikasi dan Komputer, 8(3), 163- 182
[10] Vivi Febriyanti, heru Satria, and Ilham Syahputra. (2020). Implementasi Algoritma K-Means Dalam Pengelompokan Kasus Penyakit Tuberkulosis Paru Berdasarkan Provinsi. Prosiding Seminar Nasional Riset Dan Information Science (SENARIS), Vol. 2, pp. 450-456
[11] Fina Nasari, Charles Jhony Manto Sianturi. (2016). Penerapan Algoritma KMeans Clustering Untuk Pengelompokkan Penyebaran Diare Di Kabupaten. Cogito Smart Journal, Vol 2, No 2, 108
[12] Nurul Chafid, ismail Ari Wibowo. (2018). Implementasi Data Mining Untuk Clustering Daerah Penyebaran Penyakit Demam Berdarah Di Kota Tangerang Selatan Menggunakan Algoritma K-Means (Studi Kasus : Dinas Kesehatan Tangerang Selatan). Jurnal Satya Informatika, Vol. 3 No. 1, Halaman 12-24
[13] Syafruddin Side, Wahidah Sanusi, dan Mustati’atul Waidah. (2020) . Model Regresi Semiparametrik Spline untuk Data Longitudinal pada Kasus Demam Berdarah Dengue di Kota Makassar. Journal of Mathematics, Computations, and Statistics (hal. 20 – 31) Vol. 3. No. 1.
[14] WHO. (2018). Dengue: Immunization, Vaccines and Biologicals. Media Center WHO.
[15] SilviR. (2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K- Means Clustering untuk Pengelompokkan Indikator HIV/AIDS di Indonesia. Jurnal Matematika MANTIK, 4(1), 22-31