KLASTERISASI LOKASI TINGKAT PENYEBARAN COVID-19 MENGGUNAKAN ALGORITMA K-MEANS

(1)

1 KLASTERISASI LOKASI TINGKAT PENYEBARAN COVID-19

MENGGUNAKAN ALGORITMA K-MEANS Nickhallen Sabrillian, Alfirman

Mahasiswa Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia

[email protected], [email protected] ABSTRACT

Disease is a bad condition in specific organs or body parts caused by harmful micro- organisms such as bacteria, viruses, wounds, chemical imbalances in the body, exposure to toxins, and the appearance of imperfect cells. From 2020 until now, Indonesia has been shocked about the spread of a fairly serious disease. The case was caused by the coronavirus, known as covid-19 (Corona Virus Disease-2019). The spread of the Covid-19 virus is swift. Human-to-human transmission occurs near an infected person. The main transmission is an infected person sneezing and respiratory droplets such as influenza, the oral or nasal mucosa, and the lungs of people who breathe infected air. The government has issued various policies to minimize the spread of COVID-19 by imposing social distancing, physical distancing, large-scale social restrictions (PSBB), and restrictions on community activities (PPKM) in several areas.

Problems arise that make it difficult for the Health Office to group areas that will produce the central points for the spread of COVID-19 sufferers, so data is grouped based on the number of sufferers. This study aimed to determine the regional grouping of the spread of COVID-19 in Pekanbaru City. The data used is data on positive cases of COVID-19 obtained from the Pekanbaru City Health Office and data on the number of residents in Pekanbaru City based on 83 villages. The method used in this research is K-Means Clustering. K-Means Clustering is a method that can group areas with the potential for COVID-19. Based on the research results, there are 46 villages in cluster 1, 7 villages in cluster 2 and 30 villages in cluster 3.

Keywords: Cluster, Covid-19, K-Means, Village.

ABSTRAK

Penyakit adalah kondisi buruk pada organ atau bagian tubuh tertentu yang disebabkan oleh mikro organisme berbahaya seperti bakteri, virus, luka. Pada tahun 2020 hingga saat ini, Indonesia dihebohkan mengenai penyebaran penyakit yang cukup serius. Kasus tersebut di akibatkan oleh virus corona atau yang dikenal dengan covid-19 (Corona Virus Disease-2019). Penyebaran virus covid-19 sangat cepat. Penularan manusia ke manusia terjadi di dekat orang yang terinfeksi. Penularan utamanya adalah orang yang terinfeksi bersin dan tetesan pernapasan seperti influenza, mukosa mulut atau hidung, dan paru-paru orang yang menghirup udara yang terinfeksi. Berbagai kebijakan telah dikeluarkan oleh pemerintah guna meminimalisir penyebaran covid-19 dengan

(2)

2 memberlakukan social distancing, physical distancing, pemberlakuan pembatasan social berskala bersar (PSBB), hingga pemberlakuan pembatasan kegiatan masyarakat (PPKM) pada beberapa daerah. Timbul masalah yang menyulitkan Dinas Kesehatan untuk mengelompokkan daerah yang akan menghasilkan titik-titik pusat penyebaran penderita covid-19, maka dilakukan pengelompokan data berdasarkan jumlah penderita.

Tujuan dalam penelitian ini adalah untuk mengetahui pengelompokan daerah tingkat penyebaran covid-19 di Kota Pekanbaru. Data yang digunakan adalah data kasus positif covid-19 dan data jumlah penduduk di Kota Pekanbaru berdasarkan 83 Kelurahan.

Metode yang digunakan dalam penelitian ini adalah K-Means Clustering. K-Means Clustering merupakan metode yang mampu untuk mengelompokkan daerah-daerah berpotensi covid-19. Berdasarkan hasil penelitian, terdapat 46 kelurahan berada di cluster 1, 7 kelurahan berada di cluster 2 dan 30 kelurahan berada di cluster 3.

Kata Kunci: Cluster, Covid-19, K-Means, Kelurahan.

PENDAHULUAN

Penyakit adalah kondisi buruk pada organ atau bagian tubuh tertentu yang disebabkan oleh mikro organisme berbahaya seperti bakteri, virus, luka, ketidakseimbangan kimiawi dalam tubuh, terkena racun, dan munculnya sel tidak sempurna. Semakin hari semakin banyak pula penyakit berkembang dan semakin kebal dengan obat yang ada.

Pada tahun 2020 hingga saat ini, Indonesia dihebohkan mengenai penyebaran penyakit yang cukup serius. Kasus tersebut di akibatkan oleh virus corona atau yang dikenal dengan covid-19 (Corona Virus Disease-2019). Karakteristik virus ini adalah kecepatan penyebaran yang tinggi. Dampak yang ditimbulkan dari pandemi covid-19 telah mengubah berbagai aspek kehidupan manusia.

Berbagai kebijakan telah dikeluarkan oleh pemerintah guna meminimalisir penyebaran covid-19 dengan memberlakukan social distancing, physical distancing, pemberlakuan pembatasan social berskala bersar (PSBB), hingga pemberlakuan pembatasan kegiatan masyarakat (PPKM) pada beberapa daerah.

Meningkatnya penderita penyakit covid-19 dikarenakan kurangnya kesadaran masyarakat terhadap kesehatan lingkungan. Timbul masalah yang menyulitkan Dinas Kesehatan untuk mengelompokkan daerah yang akan menghasilkan titik-titik pusat penyebaran penderita covid-19, maka dilakukan pengelompokan data berdasarkan jumlah penderita.

METODE PENELITIAN

a. Teknik Pengumpulan Data

Pengumpulan data terdiri dari beberapa tahapan diantaranya, studi literatur,

(3)

3 wawancara, observasi, dan pengumpulan dokumen terkait.

b. Peralatan yang Digunakan

Adapun peralatan yang digunakan dalam penelitian ini terbagi menjadi 2 kategori, yaitu hardware dan software. Peralatan hardware dapat dilihat pada Tabel 1 dan software pada Tabel 2.

Tabel 1. Hardware yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Laptop Pengolahan data Lenovo

2 Printer Mencetak laporan EPSON

Tabel 2. Software yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Microsoft Office Word Membuat Laporan Versi 2010 2 Microsoft Office Excel Mengolah Data Versi 2010

3 Python Bahasa Pemrograman -

4 Google Collab Membuat Script -

c. Metode Algoritma K-Means

Algoritma K-Means pertama kali diperkenalkan oleh MacQueen JB pada tahun 1976 (Tes., 2016). Metode ini adalah salah satu metode non hierarci yang umum digunakan. Metode ini termasuk dalam teknik partisi yang membagi atau memisahkan objek ke kelompok daerah bagian terpisah. Pada k-means, setiap objek harus masuk dalam kelompok tertentu, objek yang sudah masuk dalam satu kelompok pada satu tahapan akan pindah ke kelompok lain ditahapan berikutnya.

Hasil clustering dengan metode k-means sangat bergantung pada nilai awal yang diberikan. Ada beberapa cara memberi nilai awal misalnya dengan mengambil sampel awal dari objek, lalu mencari nilai pusatnya, memberi nilai awal secara random, atau menggunakan hasil dari kelompok hirarki dengan jumlah kelompok yang sesuai.

Adapun cara kerja algoritma K-Means (Darmi & Setiawan, 2017)sebagai berikut : 1. Menentukan nilai ‘K’ untuk menentukan banyaknya jumlah tetangga terdekat

dengan data uji.

2. Bangkitkan K centroid (titik pusat) awal secara random.

3. Kemudian menghitung jarak antara data uji terhadap setiap data latih dengan rumus Euclidean Distance (menghitung nilai Euclidean Distance)

4. Kemudian urutkan hasil perhitungan jarak Euclidean Disctance.

5. Setelah itu menghitung frekuensi prediksi terbanyak dari data yang sudah dihitung dan diurutkan serta menentukan prediksi yang frekuensinya paling banyak.

6. Tentukan posisi centroid yang baru dengan cara menghitung nilai rata-rata dari data yang terletak pada centroid yang sama.

(4)

4 7. Kembali ke langkah 3 jika posisi centroid baru berubah.

8. Yang terakhir adalah memilih prediksi dengan frekuensi tertinggi untuk menentukan prediksi terhadap data uji. Untuk menghitung jarak titik ‘x’ dan ‘y’

menggunakan rumus Euclidean Distance, yaitu:

Keterangan:

d = Jarak kedekatan.

𝑥 𝑡𝑟𝑎𝑖𝑛𝑖𝑛𝑔 = data latih (training) ke – i.

y 𝑡𝑒𝑠𝑡𝑖𝑛𝑔 = data uji (testing).

n = jumlah data (training).

d. Covid-19

Pada tanggal 31 Desember 2019 muncul kasus serupa pneumonia yang tidak diketahui di Wuhan, China (A Lee, 2020). Kasus tersebut di akibatkan oleh virus corona atau yang dikenal dengan covid-19 (Corona Virus Disease-2019). Karakteristik virus ini adalah kecepatan penyebaran yang tinggi. Dampak yang ditimbulkan dari pandemic covid-19 telah mengubah berbagai aspek kehidupan manusia.

Penyebaran virus covid-19 sangat cepat. Virus covid-19 awalnya ditularkan dari hewan ke manusia, namun sekarang menular dengan cepat dari manusia ke manusia.

Penularan manusia ke manusia terjadi di dekat orang yang terinfeksi. Penularan utamanya adalah orang yang terinfeksi bersin dan tetesan pernapasan seperti influenza, mukosa mulut atau hidung, dan paru-paru orang yang menghirup udara yang terinfeksi (Marzuki, 2021).

Adapun beberapa tindakan pemerintah untuk merincikan kriteria zona penyebaran covid 19 yang dilihat berdasarkan tingkat transmisi atau penyebarannya menurut (BNPB, 2020) yaitu :

1. Zona Hijau : Pada level ini, suatu daerah dapat dikategorikan ke dalam Zona Hijau apabila risiko penyebaran virus ada, akan tetapi tidak melebihi 100 jiwa kasus positif.

2. Zona Kuning : Pada level ini, suatu daerah dianggap masuk dalam Zona Kuning apabila penyebaran COVID-19 dapat terkendali dan tetap ada kemungkinan transmisi. Dalam hal ini, kasus positif mencapai angka 101 hingga 300 kasus konfirmasi.

3. Zona Oranye : Pada level ini, transmisi lokal hingga imported case kemungkinan dapat terjadi dengan cepat. Pemerintah di daerah harus memantau dan mengontrol pergerakan melalui testing dan tracking yang agresif. Dalam hal ini, kasus positif mencapai angka 301 hingga 500 kasus konfirmasi.

4. Zona Merah : Pada level ini, penyebaran virus SARS-CoV-2 atau korona jenis baru penyebab COVID-19 tidak terkendali. Transmisi lokal sudah terjadi dengan cepat, wabah menyebar secara luas. Dalam hal ini, kasus positif melebihi angka 500 kasus.

𝑑(x, y) = √∑(𝑥_{𝑡𝑟𝑎𝑖𝑛𝑖𝑛𝑔}− 𝑦_{𝑡𝑒𝑠𝑡𝑖𝑛𝑔})²

𝑛

𝑖=1

……….………...(1)

(5)

5 HASIL DAN PEMBAHASAN

a. Data Collection

Pada tahap ini data diambil dengan cara manual yaitu mengambil langsung data ke kantor Dinas Kesehatan Kota Pekanbaru. Dengan alur izin pengambilan data dari fakultas dikirim ke Dinas Penanaman Modal dan Pelayanan Terpadu Satu Pintu (DPMPTSP) Provinsi Riau secara online, lalu dilanjutkan surat ke Badan Kesatuan Bangsa dan Politik (KESBANGPOL) provinsi Riau untuk menerbitkan izin penelitian, dan terakhir mengirimkan surat kepada Dinas Kesehatan Kota Pekanbaru. Surat izin penelitian diterima oleh Kasubbag Umum Dinas Kesehatan Kota Pekanbaru, lalu diberikan nota dinas kepada Kepala Bidang P2P untuk meminta data yang dibutuhkan sesuai judul penelitian. Setelah itu data diperoleh dan diberikan melalui media sosial What’sApp atau berbentuk softfile dengan jumlah data 51.695 pasien konfirmasi Covid- 19. Berikut contoh data yang didapatkan :

Tabel 1. Contoh Data Konfirmasi Covid-19

No Kelurahan 2021 (Jiwa) Total

(Jiwa) Jan Feb … Nov Des

1 Air Putih 8 15 … 2 2 291

2 Bina Widya 7 15 … 0 1 289

3 Delima 53 45 … 4 3 1.475

4 Sialang Munggu 22 19 … 3 1 647

5 Sidomulyo Barat 92 83 … 8 3 1.942

6 Simpang Baru 42 72 … 3 1 890

… … … … ... … … …

83 Tebing Tinggi Okura 1 0 … 0 0 32

Selain itu ada data yang bersumber dari Badan Pusat Statistik (BPS) Kota Pekanbaru dengan cara mendatangi langsung kantor dan mengunduh data melalui website resmi BPS Kota Pekanbaru. Data yang diminta merupakan data jumlah penduduk Kota Pekanbaru berbentuk softfile dengan jumlah data 983.357 penduduk.

Berikut contoh data yang didapatkan :

Tabel 2. Contoh Data Jumlah Penduduk 2021

No Kecamatan Kelurahan Total (Jiwa)

1 Tampan

Air Putih 20.293

Bina Widya 10.485

Delima 20.342

Sialang Munggu 35.404

Sidomulyo Barat 41.075

Simpang Baru 13.608

Tabek Godang 18.639

… … … …

(6)

6 12 Rumbai Pesisir Tebing Tinggi Okura 3.087

b. Preprocessing Data

Pada tahap ini dilakukan pembersihan data dengan cara mensortir data pesebaran Covid-19. Keseluruhan data pesebaran Covid-19 dilakukan tahapan preprocessing berdasarkan batasan masalah yaitu bulan Juli 2021 hingga bulan September 2021.

Selanjutnya dilakukan penghapusan kolom-kolom yang tidak diperlukan dalam meng- clustering pada tabel data pesebaran covid-19 seperti kolom bulan Januari hingga bulan Juni, kolom bulan Oktober hingga bulan Desember dan pada tabel data jumlah penduduk seperti kolom kecamatan. Kemudian kedua tabel tersebut akan disatukan menjadi sebuah tabel. Berikut contoh hasil preprocessing data dapat dilihat pada tabel 3.

Tabel 3. Contoh Hasil Preprocessing Data No Kelurahan Positif

Covid (Jiwa)

Penduduk (Jiwa)

1 Agrowisata 68 4.455

2 Air Dingin 482 26.520

3 Air Hitam 326 8.615

4 Air Putih 171 20.293

5 Bambu Kuning 244 13.419

… … … …

83 Wonorejo 255 12.040

c. Proses Clustering

Proses clustering akan dilakukan menggunakan 51.695 data covid-19 berdasarkan 83 kelurahan di Kota Pekanbaru. Adapun langkah-langkah proses clustering dengan menggunakan metode K-Means adalah sebagai berikut :

1.

Mula-mula system akan mengambil pusat cluster (centroid) awal. Pusat cluster (centroid) awal yang digunakan untuk memulai proses clustering dengan metode K- Means diperoleh dengan cara membangkitkan secara random dari data yang telah diinputkan. Dari data yang didapat maka dipilih secara random centroid untuk masing-masing cluster. Centroid kriteria satu adalah data ke-66, centroid kriteria dua adalah data ke-22, centroid kriteria tiga adalah data ke-26 dan centroid kriteria empat adalah data ke-73 berdasarkan zona penyebaran covid-19.

Tabel 4. Titik Pusat Cluster Centroid Kelurahan Positif Covid

(Jiwa)

Penduduk (Jiwa)

C1 (Hijau) Sungai Ukai 2 1.833

C2 (Kuning) Kulim 110 3.420

C3(Oranye) Lembah Sari 307 13.159

C4 (Merah) Tangkerang Timur 518 16.469

(7)

7

2.

Kemudian dihitung jarak tiap data dengan masing-masing centroid cluster menggunakan persamaan Euclidean Distance (1). Adapun hasil clustering pada perhitungan dapat dilakukan sebagai berikut :

d1 = √(𝑥1 − 𝑦1)²+ (𝑥2 − 𝑦2)² d1 = √(68 − 2)²+ (4.455 − 1.833)² d1 = 2.622,83

d2 = √(𝑥1 − 𝑦1)²+ (𝑥2 − 𝑦2)²

d2 = √(68 − 110)²+ (4.455 − 3.420)² d2 = 1.035,85

d3 = √(𝑥1 − 𝑦1)²+ (𝑥2 − 𝑦2)²

d3 = √(68 − 307)²+ (4.455 − 16.469)² d3 = 8.707,28

d4 = √(𝑥1 − 𝑦1)²+ (𝑥2 − 𝑦2)²

d4 = √(68 − 518)²+ (4.455 − 16.469)² d4 = 12.022, 42

3. Berdasarkan hasil perhitungan jarak, setiap data akan menjadi anggota suatu cluster yang memiliki jarak terdekat (hasil perhitungan terkecil) dari pusat clusternya.

Misalnya untuk data pertama memperoleh hasil jarak terdekatnya pada pusat cluster pertama maka data pertama menjadi anggota cluster pertama. Contoh pengelompokan cluster dapat dilihat pada tabel 5.

(8)

8 Tabel 5. Contoh Perhitungan Jarak Centroid

JARAK Terdekat

ke c

C1 C2 C3 C4

2622,830532 1035,851823 8707,280689 12022,42471 2 24691,66598 23102,99513 13362,14601 10051,06447 4 6789,734899 5199,488533 4544,039723 7856,346479 3 18524,5147 16934,47915 7197,270177 3880,553182 4 3776,413775 2187,16666 7553,913158 10868,68 2 400,4996879 1190,257535 10929,71642 14244,63801 1 2663,803296 1075,046511 8666,472466 11981,29375 2

4. Menghitung pusat cluster baru. Perhitungan pusat cluster baru dilakukan dengan menghitung nilai rata-rata masing-masing kriteria dari seluruh anggota yang menjadi anggota masing-masing cluster.

5. Proses 2 sampai 4 akan terus berulang hingga posisi data sudah tidak mengalami perubahan dan nilai pusat cluster sama. Pada penelitian ini dilakukan 10 kali iterasi.

d. Hasil Clustering

Adapun hasil clustering pada perhitungan dapat dilihat pada tabel 6 adalah hasil akhir perhitungan jarak clustering dari data yang sebenarnya dengan jumlah K=4.

Tabel 6. Hasil Clustering

No Kelurahan C1 C2 C3 C4 Anggota

1 Agrowisata 884,46 4602,18 12303,32 24440,94 1 2 Air Dingin 22953,27 17466,85 9766,99 2372,33 4 3 Air Hitam 5051,29 461,82 8138,77 20277,31 2 4 Air Putih 16722,79 11237,39 3548,79 8606,89 3 5 Bambu Kuning 9850,11 4363,74 3339,01 15475,22 3 6 Bandar Raya 4852,69 633,80 8334,95 20472,64 2 7 Bencah Lesung 10260,72 4774,52 2929,91 15064,73 3 8 Bina Widya 6915,10 1429,68 6273,80 18410,39 2 9 Cinta Raja 1010,37 4478,77 12179,21 24317,40 1 10 Delima 16785,92 11300,88 3604,57 8551,15 3

… … … …

83 Wonorejo 8471,62 2985,13 4716,20 16853,74 2 Dari tabel 6 menjelaskan bahwa kolom C1 adalah hasil dari perhitungan jarak data 1 sampai ke-n ke pusat cluster 1 menggunakan persamaan (1), kolom C2 adalah hasil dari perhitungan jarak data 1 sampai ke-n ke pusat cluster 2, kolom C3 adalah hasil dari perhitungan jarak data 1 sampai ke-n ke pusat cluster 3 dan kolom C4 adalah hasil dari perhitungan jarak data 1 sampai ke-n ke pusat cluster 4. Sedangkan blok berwarna menandakan jarak terdekat data pada pusat clusternya, dan kolom anggota menjelaskan bahwa 1 adalah cluster pertama, 2 adalah cluster kedua, 3 adalah cluster ketiga dan 4 adalah cluster keempat.

(9)

9 e. Analisa Hasil

Berdasarkan hasil analisis pesebaran Covid-19 di Kota Pekanbaru dengan jumlah cluster sebanyak 4 (K=4) yaitu Cluster 1 (Zona Hijau) dengan jumlah 27 Kelurahan, Cluster 2 (Zona Kuning) dengan jumlah 24 Kelurahan, Cluster 3 (Zona Oranye) dengan jumlah 21 Kelurahan, dan Cluster 4 (Zona Merah) dengan jumlah 11 Kelurahan.

KESIMPULAN

Berdasarkan hasil penelitian yang didapatkan, maka dapat diambil kesimpulan sebagai berikut:

1.

Tahapan-tahapan yang telah dilakukan pada penelitian adalah preparation data, preprocessing data, proses clustering dengan K-Means, dan menyimpulkan hasil.

Dengan jumlah 83 kelurahan di Kota Pekanbaru menggunakan metode K-Means telah berhasil dilakukan.

2.

Hasil dari data mining dengan algoritma K-Means dapat memberikan pengetahuan untuk menentukan strategi menghentikan penyebaran Covid-19 di Kota Pekanbaru.

SARAN

Berdasarkan kesimpulan diatas, maka penulis mengemukakan beberapa saran sebagai berikut :

1. Penelitian ini hanya meneliti tingkat pesebaran Covid-19 di Kota Pekanbaru pada bulan Juli 2021 hingga bulan September 2021 saja, untuk penelitian selanjutnya diharapkan bisa dilanjutkan bulan-buan berikutnya.

2. Penelitian ini juga dapat dikembangkan dengan metode clustering lain atau penerapan data mining lain seperti klasifikasi.

UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada bapak Alfirman, M.Kom., yang telah membimbing, memotivasi serta membantu penelitian dan penulisan karya ilmiah ini.

DAFTAR PUSTAKA

A Lee. (2020). Wuhan Novel coronavirus (COVID-19): why global is challenging?

Public Health, January, 19–21. https://pubmed.ncbi.nlm.nih.gov/32111295/

BNPB. (2020). No Title. bnpb.go.id

Darmi, Y. D., & Setiawan, A. (2017). Penerapan Metode Clustering K-Means Dalam Pengelompokan Penjualan Produk. Jurnal Media Infotama, 12(2), 148–157.

https://doi.org/10.37676/jmi.v12i2.418

Marzuki, I. (2021). COVID-19: Seribu Satu Wajah.

Tes., R. S. and N. (2016). Penerapan Data Mining Menggunakan Algoritma K-Means Clustering Untuk Menentukan Strategi Promosi Mahasiswa Baru ( Studi Kasus : Politeknik Lp3i Jakarta ). Jurnal Lentera Ict, 3(1), 76–92.