• Tidak ada hasil yang ditemukan

ANALISIS PENYAKIT GANGGUAN KEJIWAAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PRA DAN PASCA PANDEMI COVID-19

N/A
N/A
Protected

Academic year: 2023

Membagikan "ANALISIS PENYAKIT GANGGUAN KEJIWAAN MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PRA DAN PASCA PANDEMI COVID-19"

Copied!
15
0
0

Teks penuh

(1)

1 ANALISIS PENYAKIT GANGGUAN KEJIWAAN MENGGUNAKAN

ALGORITMA K-MEANS CLUSTERING PRA DAN PASCA PANDEMI COVID-19

Gita Syafitri, Gita Sastria

Mahasiswa Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia

gita.syafitri4542@student.unri.ac.id gita.sastria@lecturer.unri.ac.id

ABSTRACT

Psychiatric disorders are psychological diseases that occur in the human brain that are not normal with various causes but are predominantly caused by great stress. Turning to the global crisis caused by a virus (Covid-19), this virus has triggered an increase in psychiatric disorders. Many studies have described that the Covid-19 pandemic has affected the nervous system and psychiatric disorders, so mental health is included in planning for dealing with a pandemic.

Based on data from the WHO survey results, it was found that the data pattern changed drastically. This study aims to determine changes in data patterns of patients with psychiatric disorders before and after the Covid-19 pandemic who were handled from January 2019 to February 2021 at Engku Haji Daud Hospital, Riau Islands Province, and measure the accuracy of the method used. This study uses the K-Means Clustering algorithm method to cluster data and uses the Silhouette Coefficient to see how well the quality of a cluster is produced. The stages in this research are data collection, data pre-processing, clustering process, Silhouette Coefficient Process, and result analysis. Based on this research, the graph of the experimental results of all pre-pandemic Covid-19 data obtained the highest value at k5 with a silhouette coefficient value of 0.547. Meanwhile, in the post-pandemic Covid-19 data, the highest value is k2 with a silhouette coefficient value of 0.385. Based on the pre-pandemic covid-19 clustering structure criteria, each experiment differs from one another, while the post-pandemic conditions of the covid-19 structure criteria are the same.

Keywords: Mental Disorders, Pre and Post Covid-19 Pandemic, K-Means Clustering, Silhouette Coefficient

(2)

2 ABSTRAK

Gangguan kejiwaan merupakan penyakit psikologis yang terjadi pada otak manusia yang tidak normal dengan penyebab yang beranekaragam, tetapi dominan disebabkan oleh tekanan yang besar. Beralih pada krisis global yang disebabkan oleh virus (Covid-19), virus ini memicu terjadinya peningkatan gangguan kejiwaan.

Banyak penelitian yang menjabarkan bahwa pandemi Covid-19 berpengaruh terhadap sistem saraf maupun gangguan kejiwaan, sehingga memasukkan kesehatan kejiwaan dalam rencana menghadapi pandemi. Berdasarkan data dari hasil survei WHO didapatkan perubahan pola data secara dratis. Penelitian ini bertujuan untuk mengetahui perubahan pola data pasien penyakit gangguan kejiwaan pra dan pasca pandemi covid-19 yang ditangani dari bulan Januari 2019 sampai bulan Februari 2021 di RSUD Engku Haji Daud Provinsi Kepulauan Riau serta mengukur akurasi dari metode yang digunakan. Penelitian ini menggunakan metode algoritma K-Means Clustering untuk meng-cluster data dan menggunakan Silhouette Coefficient untuk melihat seberapa baik kualitas suatu cluster yang dihasilkan. Tahapan dalam penelitian ini adalah pengumpulan data, pre-processing data, proses clustering, Proses Silhouette Coefficient dan analisa hasil. Berdasarkan penelitian ini, grafik hasil percobaan keseluruhan data pra pandemi covid-19 didapatkan nilai tertinggi pada k5 dengan nilai silhouette coefficient nya adalah 0,547. Sedangkan pada data pasca pandemi covid-19 nilai tertinggi pada k2 dengan nilai silhouette coefficient nya adalah 0,385. Berdasarkan kriteria struktur clustering pra pandemi covid-19 dari setiap percobaan berbeda antara satu dengan yang lain, sedangkan kondisi pasca pandemi covid-19 kriteria struktur sama.

Kata Kunci: Gangguan Kejiwaan, Pra dan Pasca Pandemi Covid-19, K-Means Clustering, Silhouette Coefficient.

(3)

3 PENDAHULUAN

Kesehatan merupakan hal yang penting bagi manusia. Permasalahan kesehatan yang banyak dialami dan dikeluhkan oleh masyarakat adalah kesehatan pada jiwa yakni gangguan kejiwaan. Menurut World Health Organization (WHO), kesehatan sebagai “kesejahteraan fisik, kejiwaan, sosial, dan bukan hanya tidak adanya penyakit dan kelemahan” dan pada tahun 2017 jumlah penderita gangguan kejiwaan di dunia sekitar 450 juta jiwa. Sedangkan hasil riset kesehatan dasar (Riskedas) di Indonesia khususnya Provinsi Kepulauan Riau tahun 2018 terdapat 7.798 orang. Beralih pada dunia yang mengalami krisis global yaitu disebabkan oleh virus (covid-19) sehingga pada virus ini memicu teradinya peningkatan gangguan kejiwaan yang disebabkan oleh somatogenik dan sosiogenik. Kembali WHO melakukan survei pada Juni dan Agustus 2020 terdapat 83% dari 130 negara yang mengalami peningkatan. Penelitian terbaru dari China, Prancis, dan Inggris telah mengidentifikasi adanya gejala neurologis pada pasien covid-19. Berdasarkan hasil penelitian tersebut pandemi covid-19 berpengaruh terhadap sistem saraf maupun gangguan kejiwaaan serta didapatkan perubahan pola data. Oleh karena itu dibutuhkan penelitian lebih lanjut mengenai perubahan pola data penyakit gangguan kejiwaan dari pra dan pasca pandemi. Untuk melihat perubahan pola data dapat menggunakan algoritma K-Means Clustering dan pengujian clustering menggunakan Silhouette Coefficient.

TINJAUAN PUSTAKA a. Analisis

Kemampuan untuk memecahkan masalah dengan menyelidiki, menguraikan, menelaah suatu informasi untuk dipahami secara lebih mendalam.

b. Gangguan Kejiwaan

Penyakit psikologis yang terjadi pada otak manusia yang tidak normal, penderita terlihat sehat dari luar namun berbagai tekanan di dalam dirinya (Suhaimi, 2015).

c. Data Mining

Proses mendapatkan informasi dari basis data dalam skala besar, cara penggalian data dengan memanfaatkan kumpulan data (kurnia et al., 2019).

d. Clustering

Metode mencari/menentukan dan mengelompokkan data yang memiliki karakteristik mirip antara satu dengan data yang lain (Wardhani, 2016).

e. Algoritma K-Means Clustering

K-Means mempartisi data ke dalam cluster atau kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain (Kurnia et al., 2019). Adapun karakteristik algoritma K- Means salah satunya ialah sangat sensitif dalam penentuan titik pusat awal cluster, karena K-Means membangkitkan titik pusat cluster awal secara random. Selain itu algoritma K-Means hanya bisa digunakan untuk data yang atributnya bernilai numerik (Indrawan, 2018). Algoritma ini mampu meminimalkan jarak antara data ke cluster nya. Pada dasarnya penggunaan algoritma ini dalam proses clustering tergantung pada data yang didapatkan dan konklusi yang ingin dicapai di akhir

(4)

4 proses (Wardhani, 2016). Menurut (Wardhani, 2016), proses dasar algoritma K- Means secara berurutan sebagai berikut:

1. Tentukan jumlah cluster (k) yang ingin dibentuk dan tetapkan pusat cluster 2. Menghitung jarak setiap data ke masing-masing centroid menggunakan

persamaan Euclidean Distance yaitu sebagai berikut:

𝑑(𝑖𝑘) = √∑𝑚𝑗 (𝐶𝑖𝑗− 𝐶𝑘𝑗)2 ... (1) 3. Kelompokkan data ke dalam cluster dengan jarak yang paling pendek dengan

persamaan:

𝑀𝑖𝑛 ∑𝑘𝑘 = 𝑑(𝑖𝑘) = √∑𝑚𝑗 (𝐶𝑖𝑗− 𝐶𝑘𝑗)2 ... (2) 4. Hitung pusat cluster yang baru menggunakan persamaan:

𝐶𝑘𝑗 =

𝑝 𝑖=1 𝑥𝑖𝑗

𝑝 ... (3) Dengan :

𝑥𝑖𝑗cluster ke – k

𝑝 = banyaknya anggota cluster ke - k

5. Ulangi langkah ke dua hingga ke empat sehingga tidak ada data berpindah.

f. Silhouette Coefficient

Hasil clustering yang didapat harus dilakukan evaluasi terlebih dahulu guna melihat kualitas hasil pengelompokan masing-masing perhitungan jarak, maka perlu dilakukan uji homogenitas(Hidayati et al., 2021). Tahapan perhitungan Silhoutte Coefficient (Handoyo et al., 2016) adalah sebagai berikut:

1. Pada Silhoutte Coefficient untuk menghitung jarak antar objek menggunakan euclidean distance dengan menggunakan persamaan (4)

d(x, y) = √∑𝑛𝑖=1 (𝑥𝑖− 𝑦𝑖)2; 𝑖 = 1,2,3, … , n ... (4) dimana x merupakan objek data cluster dan y merupakan objek data cluster sebagai pembanding terhadap anggota cluster lain.

2. Menghitung rata-rata jarak dari suatu dokumen misalkan i dengan semua dokumen lain yang berada dalam satu cluster pada persamaan (5)

𝑎(𝑖) = 1

[𝐴]−1 𝑗 € 𝐴, 𝑗≠1 𝑑(𝑖, 𝑗) ... (5) Dengan j adalah dokumen lain dalam satu cluster A dan d(i,j) adalah jarak antara dokumen i dan j.

3. Menghitung rata-rata jarak dari dokumen i tersebut dengan semua dokumen di cluster lain pada persamaan (6). Selanjutnya menghitung nilai b(i) yang merupakan nilai minimum dari jarak rata-rata data ke-i dengan semua data di cluster berbeda asumsikan cluster berbeda selain A dengan cluster C. Maka, jarak rata-rata data ke-i dengan semua data di cluster C ditulis sebagai berikut.

𝑑(𝑖, 𝐶) = 1

[𝐴] 𝑗 € 𝐶 𝑑(𝑖, 𝑗)

... (6) Setelah menghitung d(i,C) untuk semua cluster C ≠ A, selanjutnya memilih nilai jarak paling minimum sebagai nilai b(i). dengan d(i,C) adalah jarak rata-rata dokumen i dengan semua objek pada cluster lain C dimana A != C

𝑏(𝑖) = min 𝐶 ≠ 𝐴 𝑑(𝑖, 𝐶) ... (7)

(5)

5 4. Nilai Silhoutte Coefficient menggunakan persamaan (8)

𝑆(𝑖) = b(i)−a(i)

max(𝑎(𝑖),𝑏(𝑖) ... (8) 5. Nilai Silhoutte Coefficient untuk keseluruhan data dengan jumlah cluster k, dapat didefenisikan sebagai S(i) yang dihitung dengan persamaan (9) yakni rata- rata silhouette value untuk semua cluster

𝑆(𝑐) = 𝑠𝑖𝑙(𝑘) 1

|𝑘|𝑘𝑖=1𝑠𝑖𝑙 (𝑐𝑖) ... (9) Silhoutte Coefficient terletak pada rentang nilai antara -1 sampai 1. Rentang nilai ini digunakan untuk menunjukkan kedekatan kemiripan data yang dikelompokkan di dalam suatu cluster. Jika nilai rata-rata Silhoutte Coefficient mendekati nilai 1, maka cluster semakin baik. Sebaliknya jika nilai rata-rata Silhoutte Coefficient mendekati -1, maka cluster tersebut tidak baik. Kriteria pengukuran nilai Silhoutte Coefficient (Farissa et al., 2021) pada Tabel 1. berikut:

Tabel 1. Kriteria Silhoutte Coefficient

No Silhoutte Coefficient Kriteria Penilaian

1 0.7 < SC ≤ 1.0 Struktur Cluster Kuat 2 0.5 < SC ≤ 0.7 Struktur Cluster Sedang

3 0.25 < SC ≤ 0.5 Struktur Cluster Lemah

4 SC ≤ 0.25 Cluster Tidak Terstruktur g. Bahasa Pemograman Python

Python merupakan bahasa pemrograman interpretative multiguna dengan filosofi perancangan yang berfokus pada tingkat keterbacaan kode. Python menggabungkan kapabilitas, kemampuan, dengan sintaksis kode yang sangat jelas dan dilengkapi dengan fungsionalitas pustaka standar yang besar serta komprehensif. (Syahrudin & Kurniawan, 2018). Python merupakan bahasa interpreter, yaitu memiliki cara kerja yang cukup mudah dengan membaca program setiap baris yang tertulis dengan bahasa tingkat tinggi (memproses langsung per baris untuk mengeluarkan output). Python termasuk jajaran bahasa pemrograman tingkat tinggi seperti bahasa pemrograman C, C++, Java, Perl, dan Pascal (Wibowo et al., 2020).

h. Pra dan Pasca Pandemi

Menurut WHO tahun 2017 jumlah penderita gangguan jiwa di dunia sekitar 450 juta jiwa termasuk skizofrenia. Secara global gangguan mental dapat dipresentasi kan sebesar 14,4%. Kondisi Asia Tenggara tidak berbeda dengan kondisi global pada gangguan mental sebesar 13,5%. Di Indonesia gangguan mental sebesar 13,4%. Beberapa jenis gangguan jiwa yang diprediksi dialami oleh penduduk di Indonesia antaranya adalah gangguan depresi, cemas, skizofrenia, bipolar, gangguan perilaku, autis, gangguan perilaku makan, cacat intelektual, Attention Deficit Hyperactivity Disorder (ADHD).

Berdasarkan hasil Riset Kesehatan Dasar (Riskesdas) di Indonesia khususnya Provinsi Kepulauan Riau pada tahun 2018, menunjukkan bahwa prevalensi gangguan kejiwaan emosional yang ditunjukkan dengan gejala-gejala depresi dan kecemasan adalah sebesar 3,7% untuk usia 15 tahun ke atas atau sekitar 5.431 orang. Sedangkan, prevalensi gangguan jiwa berat, seperti schizophrenia adalah 2,8% untuk usia 15 tahun ke atas atau sekitar 2.367 orang. Beralih pada dunia yang mengalami krisis global yaitu yang disebabkan oleh virus (covid-19)

(6)

6 sehingga pada virus ini memicu terjadinya peningkatan gangguan kejiwaan yang disebabkan oleh somatogenik dan sosiogenik.

Virus menyebar dengan cepat dan menyebabkan wabah Pneumonia yang meluas secara global, sehingga disebut Coronavirus Disease (Covid-19) dan ditetapkan sebagai pandemi global oleh organisasi kesehatan dunia (WHO) (Andrian, 2021).

Penelitian terbaru dari China, Prancis, atau Inggris telah mengidentifikasi adanya gejala neurologis pada pasien covid-19. Tercatat ada sekitar 84% pasien covid-19 parah di Prancis mengalami tanda-tanda neurologis saat masuk ICU sebelum perawatan dan pasien yang mengalami gejala delirium sebesar 44%. Di Wuhan, China terdapat 36,4% pasien rawat inap yang didiagnosa covid-19 yang menunjukkan gejala neurologis serta gangguan kesadaran sebesar 14,8%. Dalam studi pengawasan di Inggris komplikasi neurologis dan neuropsikiatri dicatat pada pasien yang mengembangkan covid-19, dengan 31% dari 125 pasien menunjukkan perubahan status mental (Andrian, 2021).

Berdasarkan penelitian studi yang dijabarkan bahwa pandemi covid-19 berpengaruh terhadap sistem saraf maupun gangguan kejiwaan. Lalu hasil survei yang dilakukan WHO antara Juni dan Agustus tahun 2020, ada sekitar 83% dari 130 negara yang telah memasukkan kesehatan kejiwaan dalam rencana menghadapi pandemi. Berdasarkan data-data yang sudah ada didapatkan perubahan pola data secara drastis.

i. RSUD Engku Haji Daud

Penelitian ini dilakukan di Rumah Sakit Umum Daerah (RSUD) Engku Haji Daud, Provinsi Kepulauan Riau yang mana telah pelayanan dokter spesialis kesehatan jiwa sejak 2014. Kini RSUD Engku Haji Daud menjadi menjadi pemusatan fasilitas kejiwaan (rsudehd.kepriprov.go.id).

METODE PENELITIAN a. Metode Penelitian

Metode yang digunakan dalam penelitian ini adalah secara terapan, yaitu menerapkan metode data mining dengan algoritma K-Means Clustering. Terdapat dua kondisi yaitu pra pandemi covid-19 (kondisi sebelum memasuki pandemi yakni Januari 2019 – Januari 2020) dan pasca pandemi covid-19 (kondisi memasuki pandemi yakni Februari 2020 – Februari 2021) untuk melihat perubahan pola data pasien penyakit gangguan kejiwaan dari pra dan pasca pandemi covid-19 menggunakan algoritma K-Means Clustering dan pengujian hasil clustering menggunakan Silhoutte Coefficient serta mengukur akurasinya.

b. Peralatan Yang Digunakan

Peralatan yang digunakan dalam penelitian ini berupa perangkat lunak (software) agar dapat berjalan sesuai dengan yang diharapkan. Adapun perangkat lunak (software) yang dibutuhkan:

1. Sistem Operasi Windows 10.

2. Microsoft Word 2016 untuk pengetikan skripsi.

3. Microsoft Excel 2016 untuk pengolahan data.

4. Mendeley untuk daftar referensi.

(7)

7 c. Tahapan Penelitian

Tahapan penelitian yang dilakukan dapat dilihat pada Gambar 1. berikut ini:

Gambar 1. Metodologi Penelitian 1. Pengumpulan Data

Dalam proses pengumpulan data dalam penelitian ini menggunakan metode studi literatur guna mencari landasan teori dengan referensi dari jurnal ilmiah maupun e-book. Selanjutnya data diambil secara manual langsung di Rumah Sakit Umum Daerah Engku Haji Daud untuk melengkapi hasil data yang dibutuhkan.

2. Pre-processing Data

Pre-processing data merupakan tahapan dimana data yang didapatkan, dipilah, dan dipisahkan untuk mendapatkan data yang dibutuhkan pada proses selanjutnya.

Beberapa proses tahapan yang saling berhubungan yaitu:

1. Data Reduction, proses untuk mereduksi atau mengurangi dimensi, atribut, ataupun sejumlah data yang tidak dibutuhkan.

2. Data Cleaning, proses untuk mendeteksi, memperbaiki data, mengubah, dan memodifikasi data agar memperbaiki kualitas data.

3. Data Transformation, proses mengubah data atribut menjadi numerik.

3. Proses Clustering

Setelah data melalui tahap pre-processing, data sudah dapat digunakan menggunakan metode algoritma K-Means Clustering. Proses clustering dilakukan secara berurutan sesuai dengan proses algoritma K-Means Clustering.

4. Evaluasi Clustering

Selanjutnya proses pengujian hasil clustering. Pengujian dilakukan untuk mengetahui kualitas hasil clustering menggunakan algoritma Silhoutte Coefficient.

5. Analisa Hasil

Hasil yang didapat dibandingkan dari kondisi pra dan pasca pandemi covid-19 untuk mengetahui apakah terjadi perubahan pola data diantara dua kondisi.

HASIL DAN PEMBAHASAN a. Pengumpulan Data

Dalam proses pengumpulan data dalam penelitian ini menggunakan metode studi literatur guna mencari landasan teori dengan referensi dari jurnal ilmiah maupun e-book. Selanjutnya data diambil secara manual langsung di Rumah Sakit Umum Daerah Engku Haji Daud untuk melengkapi hasil data yang dibutuhkan.

Pengumpulan Data

Pre-processing Data

Proses Clustering

Evaluasi Clustering Analisa Hasil

(8)

8 Data yang didapat dibagi menjadi dua kondisi yaitu pra pandemi covid-19 (kondisi sebelum pandemi yakni Januari 2019 – Januari 2020) dengan jumlah data 69 data pasien dan pasca pandemi covid-19 (kondisi masa pandemi yakni Februari 2020 – Februari 2021) dengan jumlah data 125 data pasien. Dengan demikian, total jumlah data yang diperoleh berjumlah 194 data pasien. Dari masing-masing data pasien terdiri dari 11 atribut (kolom). Adapun atribut (kolom) yang digunakan dapat dilihat pada Tabel 4.1

Tabel 2 Atribut (Kolom)

No Atribut (Kolom)

1 Nomor Rekam Medis (No. RM)

2 Nama

3 Umur

4 Tanggal Masuk

5 Jenis Kelamin (JK)

6 Kelas Rawatan (KR)

7 Masuk ke Ruangan Melalui (MRM)

8 Diagnosa Medis

9 Jaminan

10 Tanggal Keluar

11 Cara Keluar

b. Pre-processing Data

Pre-processing data merupakan tahapan dimana data yang didapatkan dipilah dan dipisahkan untuk mendapatkan data yang dibutuhkan pada proses selanjutnya, beberapa proses yang saling berhubungan yaitu:

1. Data reduction, proses mereduksi atau mengurangi dimensi, atribut, ataupun sejumlah data yang tidak dibutuhkan dalam file data. Data pra pandemi covid- 19 berjumlah 69 data dan pasca pandemi covid-19 berjumlah 125 data sehingga total data pasien yang didapat adalah 194 data dengan masing-masing memiliki 11 atribut. Pada proses data reduction mengalami pengurangan atribut dari 11 atribut menjadi tiga atribut tanpa pengurangan jumlah data.

Tabel 3. Hasil Reduksi Atribut

Atribut (Kolom) Tindakan Keterangan

Nomor Rekam Medis Tidak Digunakan -

Nama Tidak Digunakan -

Umur Digunakan Umur

Tanggal Masuk Digabung Jangka Penyembukan (hari)

Jenis Kelamin Tidak Digunakan -

Kelas Rawatan Tidak Digunakan -

Masuk ke Ruangan Melalui Tidak Digunakan -

Diagnosa Medis Digunakan Diagnosa Medis

Jaminan Tidak Digunakan -

Tanggal Keluar Digabung Jangka Penyembuhan (hari)

Cara Keluar Tidak Digunakan -

2. Data Cleaning, guna memperbaiki kualitas data. Pada data terdapat data yang tidak konsisten dalam penulisan pada kolom diagnosa medis. Oleh karena itu data harus dikoreksi dan diubah agar data menjadi konsisten.

3. Data Transformasi, mengubah data diagnosa medis menjadi numerik.

(9)

9 c. Proses Clustering

Adapun proses clustering dengan menggunakan metode K-Means adalah sebagai berikut:

1. Data centroid awal dipilih secara random untuk masing-masing cluster.

Centroid pra dan pasca pandemi covid-19 cluster satu adalah data ke-10dan data ke-20 dengan variabel Umur, Diagnosa Medis, dan Jangka Penyembuhan.

2. Kemudian menghitung jarak tiap data pasien dengan masing-masing centroid cluster berdasarkan persamaan (2.1).

Iterasi 1 pra pandemi covid-19

Perhitungan jarak data 1 terhadap cluster 1:

(𝑑1, 𝑐1) = √(46-18)2+(1-4)2+(14-2)2=30.61 Perhitungan jarak data 1 terhadap cluster 2:

(𝑑1, 𝑐2) = √(46-32)2+(1-1)2+(14-14)2=14.00

Selanjutnya dilanjutkan dengan perhitungan jarak awal pada iterasi-1 terhadap data 2 sampai data 69. Sedangkan iterasi 1 pasca pandemi covid-19

Perhitungan jarak data 1 terhadap cluster 1:

(𝑑1, 𝑐1) = √(30-16)2+(2-18)2+(20-15)2=21.84 Perhitungan jarak data 1 terhadap cluster 2:

(𝑑1, 𝑐2) = √(30-28)2+(2-2)2+(20-2)2=18.11

Dilanjutkan perhitungan jarak awal pada iterasi-1 terhadap data 2 hingga 125.

3. Menghitung pusat cluster baru. Pusat cluster baru di dapatkan dengan menghitung nilai rata-rata setiap kriteria dari seluruh anggota masing-masing cluster.

4. Proses 2 sampai 4 akan berulang hingga posisi data sudah tidak mengalami perubahan dan nilai pusat cluster sama. Berikut hasil clustering pra pandemi covid-19 pada 2 cluster, 3 cluster, 4 cluster, 5 cluster dapat dilihat pada Tabel 4 hingga Tabel 7.

Tabel 4 Hasil Clustering Pra Pandemi Covid-19 Pada 2 Cluster

Data ke- Jarak

Terdekat t ke c

C1 C2

1 14,74 5,81 2

2 17,19 5,55 2

69 18,69 15,53 2

Tabel 5 Hasil Clustering Pra Pandemi Covid-19 Pada 3 Cluster

Data ke- Jarak

Terdekat t ke c

C1 C2 C3

1 15,36 7,24 7,01 3

2 17,77 7,60 6,96 3

69 18,96 18,02 10,84 3

(10)

10 Tabel 6 Hasil Clustering Pra Pandemi Covid-19 Pada 4 Cluster

Data ke-

Jarak

Terdekat ke c

C1 C2 C3 C4

1 12,90 12,93 17,99 48,09 1

2 15,91 7,95 20,28 51,23 2

69 18,63 13,52 28,37 51,12 2

Tabel 7 Hasil Clustering Pra Pandemi Covid-19 Pada 5 Cluster Data

ke-

Jarak

Terdekat ke c

C1 C2 C3 C4 C5

1 28,26 14,88 16,95 10,00 19,04 4

2 31,70 17,93 20,72 10,16 14,35 4

69 32,26 20,68 28,02 11,19 19,68 4

Tabel 8 hingga Tabel 11 merupakan hasil clustering pasca pandemi covid-19 Tabel 8 Hasil Clustering Pasca Pandemi Covid-19 Pada 2 Cluster

Data ke- Jarak

Terdekat t ke c

C1 C2

1 18,68 12,59 2

2 18,10 24,08 1

125 48,5 35,5 2

Tabel 9 Hasil Clustering Pasca Pandemi Covid-19 Pada 3 Cluster

Data ke- Jarak

Terdekat t ke c

C1 C2 C3

1 20,09 9,88 14,44 2

2 19,03 22,87 25,59 1

125 42,02 45,47 32,52 1

Tabel 10 Hasil Clustering Pasca Pandemi Covid-19 Pada 4 Cluster Data

ke-

Jarak

Terdekat ke c

C1 C2 C3 C4

1 11,31 21,60 23,66 36,11 1

2 23,97 19,23 20,99 44,42 2

125 37,7 39,2 54,5 73,4 1

Tabel 11 Hasil Clustering Pasca Pandemi Covid-19 Pada 5 Cluster Data

ke-

Jarak

Terdekat ke c

C1 C2 C3 C4 C5

1 21,50 8,64 11,41 16,82 25,49 2

2 18,89 21,14 24,13 28,04 29,95 1

125 47,6 36,9 47,1 32,8 21,2 5

d. Evaluasi Clustering

Evaluasi clustering yang telah didapatkan dilakukan dengan pengujian Silhoutte Coefficient digunakan untuk melihat kualitas suatu cluster, dengan menggunakan metode ini kualitas suatu cluster tingkat keakurasiannya dapat diukur. Kualitas suatu cluster dapat dikatakan baik apabila berada pada range 0-1.

(11)

11 Gambar 2. Penyebaran Data Umur

Gambar 2 (a) merupakan penyebaran data umur pasien pra pandemi covid- 19 dapat dilihat bahwa cluster 2 dan cluster 4 terlihat lebih dominan dari cluster lainnya. Sedangkan Gambar 2 (b) adalah penyebaran data umur pasien pasca pandemi covid-19 dengan cluster 2 terlihat lebih dominan.

Gambar 3. Penyebaran Data Diagnosa Medis

Gambar 3 (a) merupakan penyebaran data diagnosa medis pasien pra pandemi covid-19 dapat dilihat bahwa cluster 2 terlihat lebih dominan dari cluster lainnya. Sedangkan Gambar 3 (b) adalah penyebaran data diagnosa medis pasien pasca pandemi covid-19 dengan cluster 2 terlihat lebih dominan.

Gambar 4. Penyebaran Data Jangka Penyembuhan

Gambar 4 (a) merupakan penyebaran data jangka penyembuhan pasien pra pandemi covid-19 dapat dilihat bahwa cluster 2 terlihat lebih dominan dari cluster lainnya. Sedangkan Gambar 4 (b) adalah penyebaran data jangka penyembuhan pasien pasca pandemi covid-19 dengan cluster 2 terlihat lebih dominan.

0 20 40 60 80 100

0 50 100

Umur

Data ke

Cluster 1 Cluster 3 Cluster 2 Cluster 4 Cluster 5

0 20 40 60 80

0 50 100

Umur

Data ke

Cluster 1 Cluster 2

(a) (b)

(a) (b)

(a) (b)

0 5 10 15 20

0 50 100

Diagnosa Medis

Data ke

Cluster 1 Cluster 3 Cluster 2 Cluster 4 Cluster 5

0 10 20 30 40

0 50 100

Diagnosa Medis

Data ke

Cluster 1 Cluster 2

0 10 20 30 40 50

0 50 100

Jangka Penyembuhan

Data ke

Cluster 1 Cluster 3 Cluster 2 Cluster 4

Cluster 5 0

5 10 15 20 25 30

0 50 100

Jangka Penyembuhan

Data ke

Cluster 1 Cluster 2

(12)

12 Tabel 12 Hasil Karakteristik Seluruh Cluster

Kondisi

Cluster Karakteristik

Umur Diagnosa Medis Jangka

Penyembuhan

Pra Pandemi Covid-19

1 Rentang umur 18 - 19 tahun

Diagnosa medis lebih dominan pada Skizofrenia Paranoid

Rentang penyembuhan

2 - 15 hari 2 Rentang umur

27 - 39 tahun

Diagnosa medis lebih dominan pada Skizofrenia

Rentang penyembuhan

1 - 21 hari 3 Rentang umur

33 - 51 tahun

Diagnosa medis lebih dominan pada Skizofrenia Paranoid

Rentang penyembuhan

22 - 40 hari 4 Rentang umur

34 - 51 tahun

Diagnosa medis lebih dominan pada Skizofrenia Paranoid

Rentang penyembuhan

0 - 16 hari 5 Rentang umur

57 - 81 tahun

Diagnosa medis lebih dominan pada Skizofrenia Paranoid

Rentang penyembuhan

2 - 20 hari

Pra Pandemi Covid-19 1 Rentang umur

16 - 43 tahun Diagnosa medis lebih dominan pada Skizofrenia Tak Terinci

Rentang penyembuhan

0 - 28 hari 2 Rentang umur

23 - 73 tahun

Diagnosa medis lebih dominan pada Skizofrenia Paranoid

Rentang penyembuhan

0 - 24 hari

Gambar 5. Jarak Terdekat Antar Cluster Pra Pandemi Covid-19

1.32 6.32 11.32 16.32 21.32 26.32 31.32 36.32 41.32 46.32 51.32 56.32 61.32 66.32

0 10 20 30 40 50 60 70 80

Jarak Terdekat

Data ke-

C1 C2 C3 C4 C5

(13)

13 Gambar 6. Jarak Terdekat Antar Cluster Pasca Pandemi Covid-19

Berdasarkan Gambar 5. dapat dilihat grafik jarak terdekat cluster pra pandemi covid-19 dari 69 data. Pada Gambar 6. merupakan grafik jarak terdekat antar cluster pasca pandemi covid-19 dari 128 data.

e. Analisa Hasil

Berdasarkan penelitian hasil analisis dari algoritma K-Means Clustering yang telah diuji menggunakan Silhoutte Coefficient pada kondisi pra pandemi covid-19 didapatkan 5 cluster sebagai cluster terbaik setelah dilakukan beberapa percobaan cluster. Dengan masing-masing cluster memiliki karakteristik sendiri.

Karakteristik dari segi umur pada cluster 1 masuk masa remaja awal, cluster 2 masa dewasa awal, cluster 3 masa dewasa akhir, cluster 4 masa dewasa akhir, dan cluster 5 masa lansia akhir. Karakteristik dari segi diagnosa medis pada cluster 1, cluster 3, dan cluster 5 masing-masing terdapat tiga diagnosa medis dan cluster 2 dan cluster 4 terdapat tujuh diagnosa medis dan setiap cluster memiliki satu diagnose medis yang sama yaitu Skizofrenia Paranoid. Jangka penyembuhan yang dibutuhkan pada pra pandemi covid-19 berada di rentang waktu 2 – 5 minggu.

Sedangkan pada kondisi pasca pandemi covid-19 mengalami pengurangan cluster dari kondisi pra pandemi covid-19 yaitu menjadi 2 cluster. Karakteristik dari segi umur pada cluster 1 masuk pada masa dewasa awal dan pada cluster 2 masuk pada masa dewasa akhir. Karakteristik dari segi diagnosa medis pada cluster 1 terdapat 16 diagnosa medis dan pada cluster 2 terdapat tiga diagnosa medis yang mana juga masuk pada cluster 1 yaitu Skizofrenia, Skizofrenia Paranoid, Skizofrenia Tak Terinci. Serta jangka waktu penyembuhan yang dibutuhkan berada di rentang 0 – 4 minggu.

Data penelitian pra pandemi covid-19 yang memiliki nilai tertinggi Silhoutte Coefficient senilai 0,547 pada percobaan 5 cluster menunjukan bahwa cluster dominan nya adalah cluster 2 dengan jumlah data 25 data pasien. Variabel atribut dominan umur dari hasil rata-rata adalah 32 tahun (masa dewasa awal) dengan diagnosa medis Skizofrenia jangka penyembuhannya adalah 9 hari (rentang 2 minggu). Selanjutnya data penelitian pasca pandemi covid-19 yang memiliki nilai tertinggi Silhoutte Coefficient senilai 0,385 pada percobaan 2 cluster menunjukan bahwa cluster dominan nya adalah cluster 2 dengan jumlah data 86 data pasien.

Variabel atribut dominan umur dari hasil rata-rata adalah 38 tahun (masa dewasa

0.66 5.66 10.66 15.66 20.66 25.66 30.66 35.66 40.66 45.66 50.66

0 20 40 60 80 100 120 140

Jarak Terdekat

Data ke-

C1 C2

(14)

14 akhir) dengan diagnosa medis Skizofrenia Paranoid dan jangka penyembuhannya adalah 10 hari (rentang 2 minggu).

Perubahan hasil analisis dari penelitian ini juga dapat dilihat dari segi kriteria struktur clustering, dimana pada kondisi pra pandemi covid-19 kriteria struktur clustering yang didapat dari masing-masing percobaan berbeda antara satu dengan yang lainnya. Pada kondisi pasca pandemi covid-19 kriteria struktur clustering keseluruhan percobaan sama. Percobaan hasil pra pandemi covid-19 didapatkan kriteria struktur clustering 2 cluster struktur lemah, 3 cluster struktur tidak terstruktur, 4 cluster struktur lemah, dan 5 cluster struktur sedang. Kriteria struktur clustering pasca pandemi covid-19 pada percobaan 2 cluster, 3 cluster, 4 cluster, dan 5 cluster adalah struktur lemah. Perubahan dari kondisi pra dan pasca pandemi covid-19 dapat dilihat pada Gambar 6.

Gambar 6. Perubahan dari Kondisi Pra dan Pasca Pandemi Covid-19 KESIMPULAN

Adapun kesimpulan dari penelitian penerapan metode algoritma K-Means Clustering pada data pasien penyakit gangguan kejiwaan pra dan pasca pandemi covid-19 dapat menghasilkan perubahan pola data.

SARAN Adapun saran yang dapat diberikan yaitu:

1. Penggunakan metode algoritma K-Means Clustering dapat digunakan sebagai salah satu metode untuk menganalisis data mining.

2. Penelitian ini dapat dikembangkan untuk menganalisa perubahan dari segi yang berbeda.

UCAPAN TERIMAKASIH

Penulis ucapkan terima kasih kepada Bapak Gita Sastria, ST., MIT. yang telah membimbing serta membantu penelitian dan penulisan karya ilmiah ini.

0 10 20 30 40

Umur Diagnosa Medis JP (hari)

Nilai Rata-rata

Variabel

Pra Pasca

(15)

15 DAFTAR PUSTAKA

Farissa, R. A., Mayasari, R., & Umaidah, Y. (2021). Perbandingan Algoritma K- Means dan K-Medoids Untuk Pengelompokkan Data Obat dengan Silhouette Coefficient di Puskesmas Karangsambung. Journal of Applied Informatics and Computing, 5(2), 109–116. https://doi.org/10.30871/jaic.v5i1.3237 Handoyo, R., M, R. R., & Nasution, S. M. (2016). Perbandingan Metode Clustering

Menggunakan Metode Single Linkage dan K-Means Pada Pengelompokkan Dokumen. JSM STMIK Mikroskil, Vol. 15, 1–10.

Hidayati, R., Zubair, A., Pratama, A. H., & Indana, L. (2021). Analisis Silhouette Coefficient pada 6 Perhitungan Jarak K-Means Clustering. Techno.Com, 20(2), 186–197. https://doi.org/10.33633/tc.v20i2.4556

Indrawan, B. R. (2018). PENERAPAN ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN STRATEGI PROMOSI UNIVERSITAS ISLAM NEGERI SUNAN KALIJAGA YOGYAKARTA.

Kurnia, F., Fahmi, I., Wahyudi, E., & Mige, G. E. . (2019). PENERAPAN ALGORITMA K-MEANS UNTUK PENGELOMPOKAN DIAGNOSA PENYAKIT MATA BERDASARKAN RENTANG USIA. Jurnal Spektro, 2(1), 10–17.

Suhaimi. (2015). Gangguan Jiwa Dalam Perspektif Kesehatan Mental Islam.

Risalah, 26(4), 197–205.

Wardhani, A. K. (2016). ( K-MEANS ALGORITHM IMPLEMENTATION FOR CLUSTERING OF PATIENTS DISEASE IN KAJEN CLINIC OF PEKALONGAN ) Anindya Khrisna Wardhani Magister Sistem Informasi Universitas Diponegoro. 14, 30–37.

Wibowo, W., Ulama, B. S. S., & Azies, H. Al. (2020). Belajar Pemrograman Bahasa Python.

Referensi

Dokumen terkait

Penggunaan Dana Desa Lingga Raja II Sesudah Pandemi Covid-19 Pandemi covid-19 terjadi di Indonesia menjelang pertengahan tahun 2020 yaitu pada bulan Maret, pengalokasian atau