• Tidak ada hasil yang ditemukan

View of PENERAPAN DATA MINING CLASSIFICATION UNTUK DATA PASIEN COVID- 19 MENGGUNAKAN METODE NAÏVE BAYES

N/A
N/A
Protected

Academic year: 2024

Membagikan "View of PENERAPAN DATA MINING CLASSIFICATION UNTUK DATA PASIEN COVID- 19 MENGGUNAKAN METODE NAÏVE BAYES"

Copied!
6
0
0

Teks penuh

(1)

PENERAPAN DATA MINING CLASSIFICATION UNTUK DATA PASIEN COVID- 19 MENGGUNAKAN METODE NAÏVE BAYES

Tessalonika Siahaan1), Yonata Laia2) Manusun Silitonga3), Friska Claudia Pasaribu4)

1-4 Fakultas Sains dan Teknologi, Universitas Prima Indonesia email: tessalonikasiahaan_23@gmail.com, yonata@unprimdn.ac.id,

manusun_silitonga@gmail.com, friskacp@gmail.com Abstract

Covid-19 is an infectious disease caused by a new coronavirus discovered in 2019, hereafter Sars-Cov 2 (Severe Acute). Coronavirus Respiratory Syndrome 2). This virus is very small in size (120-Knowledge is participants' understanding of a given topic. Knowledge is the ability to receive, store and use information, influenced by experience and skills. This research creates a system that can help anyone who wants to know what causes are behind the increasing spread of bacteria in the form of viruses. Therefore, it is necessary to find out what factors have caused the increase in the number of people infected with this deadly virus. Using the Naive Bayes method, researchers identified the factors causing the increase in the number of medical records for Covid-19 patients. The results obtained are based on attributes that have values, so the Bayesian value is 19.8714.

.

Kata Kunci: Bayes, Datamining, Covid-19.

1. PENDAHULUAN

Penyebaran pandemi COVID-19 yang meluas di seluruh dunia telah menyebabkan dampak yang signifikan pada kesehatan masyarakat dan sistem perawatan kesehatan.

Dalam menghadapi tantangan ini, analisis data menjadi semakin penting dalam membantu pengambilan keputusan yang efektif [1]–[4].

Salah satu pendekatan yang digunakan dalam analisis data adalah data mining [4], [5], yang dapat mengungkap pengetahuan yang berharga dari kumpulan data yang besar dan kompleks.

Dalam konteks ini, penelitian ini bertujuan untuk menerapkan metode klasifikasi data mining, khususnya metode Naïve Bayes, untuk menganalisis data pasien COVID-19.

Metode Naïve Bayes telah terbukti efektif dalam berbagai bidang [6]–[10], termasuk dalam analisis data kesehatan. Dengan memanfaatkan probabilitas dan teori Bayes, metode ini dapat mengklasifikasikan data ke dalam kategori yang relevan berdasarkan fitur- fitur yang ada. Dalam konteks penelitian ini, metode Naïve Bayes akan digunakan untuk mengklasifikasikan data pasien COVID-19

berdasarkan atribut-atribut yang terkait dengan gejala, riwayat kontak, dan faktor risiko lainnya.

Tujuan utama dari penelitian ini adalah untuk mengidentifikasi faktor-faktor yang berkontribusi terhadap penyebaran COVID-19 dan mengembangkan model prediktif yang dapat membantu dalam pengambilan keputusan yang lebih baik dalam pengendalian dan penanggulangan pandemi.

Penelitian sebelumnya [11] membahas tentang Analisis Pola Penyebaran Penyakit Dengan Menggunakan Algoritma C4.5 memiliki akurasi yang sangat baik dalam klasifikasi penyakit tuberkulosis. Penelitian lainnya [12]

membahas tentang penggunaan klasifikasi teks berita hoax dan non hoax pada media sosial dengan pengklasifikasi Naive Bayes. Penelitian ini menggunakan 75 data berita hoax dan 75 data berita non hoax pada media sosial. Naive Bayes dapat berfungsi dengan baik sebagai pengklasifikasi text. Penelitian lainnya juga menunjukkan bahwa data klasifikasi sangat membantu dalam menganalisis data lebih akurat pada analisis perkembangan produksi beras dan impor beras di Indonesia [13].

(2)

Menurut penelitian sebelumnya [14]

Naive Bayes dalam penilaian status gizi balita.

Algoritma naive bayes dapat memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya [15]. Metode Naive Bayes termasuk algoritma yang akurat untuk memprediksi karena hasil akurasi menggunakan Rapid Miner [16].

Klasifikasi naïve bayes dapat digunakan untuk mengelompokkan atau klasifikasi dengan baik [17], [18], [19].

Penelitian [6] menggunakan metode Naive Bayes untuk mencari nilai peluang terbesar munculnya penyakit kulit kucing. Aplikasi ini dikembangkan berbasis web dengan menggunakan framework CodeIgniter.

Pengujian dilakukan dengan membandingkan hasil diagnosis sistem dengan hasil diagnosa pakar. Penelitian [20]

membahas kinerja Naive Bayes Classifier yang diterapkan dalam menyelesaikan permasalahan penelitian cukup baik.

Penelitian sebelumnya telah memberikan wawasan yang berharga dalam penerapan data mining untuk analisis data pasien COVID-19. Namun, masih ada kebutuhan untuk penelitian lebih lanjut dalam mengoptimalkan penerapan metode klasifikasi, terutama metode Naïve Bayes, untuk meningkatkan akurasi dan keandalan prediksi. Dalam penelitian ini, akan dilakukan pengujian dan evaluasi terhadap metode Naïve Bayes dalam klasifikasi data pasien COVID-19. Selain itu, akan dilakukan perbandingan hasil diagnosa sistem dengan hasil diagnosa dari tenaga medis yang berpengalaman untuk mengevaluasi kinerja metode yang digunakan. Diharapkan hasil dari penelitian ini dapat memberikan kontribusi yang signifikan dalam pemahaman dan penanganan COVID-19 melalui penerapan data mining classification dengan metode Naïve Bayes.

2. METODE PENELITIAN

Langkah-langkah yang dilakukan dalam penyelesaian masalah pada penelitian ini disajikan pada gambar 1.

Tahapan yang dilakukan untuk menyelesaikan penelitian ini antara lain:

1. Pengumpulan Data. Data pasien COVID-19 akan dikumpulkan dari sumber-sumber yang valid, seperti pusat kesehatan atau rumah sakit terkait. Data mencakup atribut-atribut seperti daftar gejala penyakit.

2. Preprocessing Data: Data yang terkumpul dianalisis dan dievaluasi untuk memastikan integritas dan kualitasnya. Langkah-langkah preprocessing data akan dilakukan, termasuk pembersihan data, penghapusan nilai yang hilang, normalisasi, dan pengkodean atribut jika diperlukan.

Gambar 1. Kerangka Kerja Penelitian

3. Pembagian Dataset: Dataset akan dibagi menjadi dua subset, yaitu data pelatihan (training data) dan data pengujian (testing data).

4. Penerapan Metode Naïve Bayes. Model klasifikasi Naïve Bayes diterapkan pada dataset pelatihan untuk membangun model yang dapat mengklasifikasikan data pasien COVID-19.

5. Evaluasi dan Validasi Model.

(3)

6. Analisis Hasil. Hasil dari penelitian akan dianalisis secara statistik untuk mengevaluasi keakuratan dan keandalan model klasifikasi Naïve Bayes.

7. Kesimpulan. Berdasarkan hasil penelitian, kesimpulan akan diambil mengenai keefektifan penerapan metode Naïve Bayes dalam mengklasifikasikan data pasien COVID-19.

3. Hasil Dan Pembahasan

Analisis sistem merupakan kegiatan penguraian suatu sistem informasi yang utuh dan nyata ke dalam bagian-bagian atau komponen -komponen komputer yang bertujuan untuk mengidentifikasikan serta mengevaluasi masalah -masalah yang muncul, hambatan- hambatan yang mungkin terjadi dan kebutuhan - kebutuhan yang diharapkan sehingga mengarah kepada suatu solusi untuk perbaikan maupun pengembangan ke arah yang lebih baik dan sesuai dengan kebutuhan serta perkembangan teknologi yang diantaranya membahas mengenai sistem yang terdapat dalam Data Pasien Covid-19 Menggunakan Metode Naïve Bayes yang selama ini ada, baik dari segi kelebihan dan kekurangannya.

a. Analisa Metode Teorema Bayes

Metode Naive Bayes adalah algoritme yang digunakan dalam pembelajaran mesin untuk klasifikasi berdasarkan teorema Bayes dengan asumsi bahwa setiap fitur dalam dataset adalah independen. Dalam perhitungan Naive Bayes, terdapat beberapa langkah yang perlu dilakukan. Berikut adalah langkah-langkah umum dalam perhitungan metode Naive Bayes:

1. Mengumpulkan dataset: Kumpulkan dataset yang berisi contoh-contoh yang sudah diklasifikasikan dengan benar. Dataset ini harus berisi fitur- fitur yang relevan dengan klasifikasi yang ingin dilakukan.

2. Menyusun dataset: Susun dataset dalam format yang tepat, yaitu dengan menyusun fitur-fitur dan label klasifikasi dari setiap contoh.

3. Menghitung probabilitas prior:

Hitunglah probabilitas prior untuk setiap kelas yang ada dalam dataset.

Probabilitas prior adalah probabilitas dari masing-masing kelas tanpa mempertimbangkan fitur-fitur yang ada.

4. Menghitung probabilitas kondisional: Hitunglah probabilitas kondisional untuk setiap fitur dalam dataset, berdasarkan kelasnya.

Probabilitas kondisional adalah probabilitas munculnya suatu fitur, dengan mempertimbangkan kelas yang ada.

5. Menghitung probabilitas posterior:

Dalam tahap ini, kita menghitung probabilitas posterior untuk setiap kelas berdasarkan fitur-fitur yang ada. Probabilitas posterior menggambarkan probabilitas munculnya suatu kelas berdasarkan fitur-fitur yang diamati.

6. Mengklasifikasikan contoh baru:

Dalam langkah ini, kita menggunakan probabilitas posterior yang sudah dihitung untuk mengklasifikasikan contoh-contoh baru. Pilihlah kelas dengan probabilitas posterior tertinggi sebagai kelas yang distribusikan kepada contoh tersebut.

Data atribut

Kode Atribut

A01

batuk kering

A02

demam lebih dari 38°C

A03

hidung tersumbat

A04

nyeri otot

A05

merasa kelelahan

A06

Lemas

A07

sakit tenggorokan
(4)

A08

mual dan diare

A09

Penciuman Tidak

Berfungsi

A10

Sulit Bernapas

Pada penelitian ini akan melakukan perhitungan dari 5 atribut di atas.

Kode Nama Nilai

A.01 Batu Kering 0.3 A.02

demam lebih

dari 38°C

0.5

A.03

hidung

tersumbat

0.4

A.04

nyeri otot

0.5

A.05

merasa

kelelahan

0.3

Perhitungan Data Uji:

P=A.01+A.02+A.03+A.04+A.05 P= 0,3+0,5+0,4+0,5+0,3=2

Perhitungan Nilai Semesta

= 0,3

2 = 0,15

=0,5

2 = 0,25

=0,4

2 = 0,2

=0,5

2 = 0,25

=0,3

2 = 0,15

Perhitungan Total Nilai Semesta adalah 1

Jika nilai P(Hi) (probabilitas hipotesis Hi) telah diketahui, dan kita tidak memperhitungkan adanya bukti (evidence), maka probabilitas hipotesis H tanpa memandang evidence apapun dapat dihitung menggunakan konsep probabilitas a priori.

=(0,15*03)+(0,25*0,5)+(0,2*0,4)+(0,25

*0,5)+(0,15*0,3) Maka = 0,42

Setelah nilai P(Hi) diketahui, langkah selanjutnya adalah mengumpulkan dan memperoleh evidence (bukti) yang relevan untuk menghitung probabilitas kondisional P(E|Hi), yaitu probabilitas evidence E terjadi jika hipotesis Hi benar

=0,3∗0,45

0,42 =0,032143

=0,5∗0,125

0,42 =0,14881

=0,2∗0,8

0,42 =0,07619

=0,5∗0,125

0,42 =0,14881

=0,3∗0,024

0,42 =0,0312143 Maka = 0,184

Setelah seluruh nilai P(Hi|E) diketahui, maka jumlahkan seluruh nilai Bayes nya

=(0,3*

0,032143)+(0,5*0,14881)+(0,4*0,07619) +(0,5*0,14881)+(0,0312143)

Maka: 0,198571*100%

Hasil yang didapatkan dalam perhitungan metode Nave Bayes dengan sistem yang sudah di buat adalah 19,8714

4. KESIMPULAN

Berdasarkan sistem yang direncanakan untuk klasifikasi data Covid-19 dan pengujian yang dilakukan, dapat disimpulkan bahwa metode Naive Bayes Classifier dapat digunakan untuk mengklasifikasikan data sesuai dengan perhitungan metode Naive Bayes. Hasil yang diperoleh berdasarkan atribut yang memiliki nilai. Jadi nilai Bayesian adalah 19,8714.

5. REFERENSI

[1] Edric and S. P. Tamba, “Prediksi Penyakit Gagal Jantung Dengan Menggunakan Random Forest,” J.

Sist. Inf. dan Ilmu Komput.

Prima(JUSIKOM PRIMA), vol. 5, no.

2, pp. 176–181, 2022, doi:

10.34012/jurnalsisteminformasidanil mukomputer.v5i2.2445.

[2] V. M. M. Siregar et al.,

“Implementation of ELECTRE

Method for Decision Support

System,” IOP Conf. Ser. Mater. Sci.

(5)

Eng., vol. 1088, no. 1, p. 012027, Feb. 2021, doi: 10.1088/1757- 899x/1088/1/012027.

[3] V. Sihombing et al., “Additive Ratio Assessment (ARAS) Method for Selecting English Course Branch Locations,” J. Phys. Conf. Ser., vol.

1933, no. 1, p. 012070, Jun. 2021,

doi: 10.1088/1742-

6596/1933/1/012070.

[4] S. P. Tamba, A. W. Tan, Y.

Gunawan, and ..., “Penerapan Data Mining Untuk Pembuatan Paket Promosi Penjualan Menggunakan Kombinasi Fp-Tree Dan Tid-List,” … (Teknik Inf. dan …, vol. 4, 2021.

[5] W. Purba, S. Tamba, and J. Saragih,

“The effect of mining data k-means clustering toward students profile model drop out potential,” J. Phys.

Conf. Ser., vol. 1007, no. 1, p. 12049, 2018, [Online]. Available:

http://stacks.iop.org/1742- 6596/1007/i=1/a=012049

[6] F. Dwiramadhan, M. I. Wahyuddin, and D. Hidayatullah, “Sistem Pakar Diagnosa Penyakit Kulit Kucing Menggunakan Metode Naive Bayes Berbasis Web,” J. JTIK (Jurnal Teknol. Inf. dan Komunikasi), vol. 6, no. 3, pp. 429–437, 2022, doi:

10.35870/jtik.v6i3.466.

[7] Fricles Ariwisanto Sianturi, “Analisa metode teorema bayes dalam mendiagnosa keguguran pada ibu hamil berdasarkan jenis makanan,”

Tek. Inf. dan Komput., vol. 2, no. 1, pp. 87–92, 2019.

[8] H. Brawijaya, S. Samudi, and S.

Widodo, “Komparasi Algoritma K- Nearest Neighbor dan Naiive Bayes Pada Pengobatan Penyakit Kutil Menggunakan Cryotheraphy,” JUITA J. Inform., vol. 7, no. 2, pp. 93–100,

2019, doi: 10.30595/juita.v7i2.5609.

[9] A. Riani, Y. Susianto, and N.

Rahman, “Implementasi Data Mining Untuk Memprediksi Penyakit Jantung Mengunakan Metode Naive Bayes,”

J. Innov. Inf. Technol. Appl., vol. 1, no. 01, pp. 25–34, 2019, doi:

10.35970/jinita.v1i01.64.

[10] M. A. Bianto, K. Kusrini, and S.

Sudarmawan, “Perancangan Sistem Klasifikasi Penyakit Jantung Mengunakan Naïve Bayes,” Creat.

Inf. Technol. J., vol. 6, no. 1, p. 75,

2020, doi:

10.24076/citec.2019v6i1.231.

[11] A. Amrin, I. Satriadi, and O. Rosanto,

“Algoritma C4.5 Untuk Diagnosa Penyakit Tuberkulosis,” J.

Khatulistiwa Inform., vol. 7, no. 2, pp. 79–84, 2019, doi:

10.31294/jki.v7i2.6725.

[12] R. Wati, “Penerapan Algoritma Naive Bayes Dan Particle Swarm Optimization Untuk Klasifikasi Berita Hoax Pada Media Sosial,” JITK (Jurnal Ilmu Pengetah. dan Teknol.

Komputer), vol. 5, no. 2, pp. 159–

164, 2020, doi:

10.33480/jitk.v5i2.1034.

[13] S. E. Rahayu and H. Febriaty,

“Analisis Perkembangan Produksi Beras Dan Impor Beras Di Indonesia,” Proseding Semin. Nas.

Kewirausahaan, vol. 1, no. 1, pp.

219–226, 2019.

[14] J. Informatika, F. Matematika, D. A.

N. Ilmu, P. Alam, and U. S. Maret,

“Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita,”

2015.

(6)

[15] D. Nofriansyah, K. Erwansyah, and M. Ramadhan, “Penerapan Data Mining dengan Algoritma Naive Bayes Clasifier untuk Mengetahui Minat Beli Pelanggan terhadap Kartu Internet XL ( Studi Kasus di CV.

Sumber Utama Telekomunikasi),” J.

Saintikom, vol. 15, no. 2, pp. 81–92, 2018.

[16] H. D. Wijaya and S. Dwiasnati,

“Implementasi Data Mining dengan Algoritma Naïve Bayes pada Penjualan Obat,” J. Inform., vol. 7, no. 1, pp. 1–7, 2020, doi:

10.31311/ji.v7i1.6203.

[17] A. Deolika, K. Kusrini, and E. T.

Luthfi, “Analisis Pembobotan Kata Pada Klasifikasi Text Mining,” J.

Teknol. Inf., vol. 3, no. 2, p. 179, 2019, doi: 10.36294/jurti.v3i2.1077.

[18] S. Seimahuira, “Berdasarkan Online Reviews Tripadvisor Menggunakan,”

vol. 12, no. 1, pp. 53–58, 2021.

[19] M. Ridho Handoko and Neneng,

“Sistem Pakar Diagnosa Penyakit Selama Kehamilan Menggunakan Metode Naive Bayes Berbasis Web,”

J. Teknol. dan Sist. Inf., vol. 2, no. 1, pp. 50–58, 2021.

[20] Y. Yuliana, P. Paradise, and K.

Kusrini, “Sistem Pakar Diagnosa Penyakit Ispa Menggunakan Metode Naive Bayes Classifier Berbasis Web,” CSRID (Computer Sci. Res. Its Dev. Journal), vol. 10, no. 3, p. 127,

2021, doi:

10.22303/csrid.10.3.2018.127-138.

Referensi

Dokumen terkait

Dari penelitian yang sudah dilakukan, maka dapat disimpulkan bahwa untuk memprediksi partisipasi masyarakat dalam Pemilihan Umum (PEMILU) di Desa Jemirahan

Pada penelitian ini dengan menggunakan metode perbandingan Naïve Bayes dan Naïve Bayes Multinomial yang bertujuan melakukan analisis sentimen pengguna twitter

Analisis sistem (system analysis) adalah penguraian dari suatu sistem informasi yang utuh kedalam bagian-bagian atau komponen komponennya dengan maksud untuk mengidentifikasikan

Analisa Sistem adalah penguraian dari suatu sistem informasi yang utuh kedalam bagian – bagian komponen dengan maksud untuk mengidentifikasikan dan mengevaluasi

analisis sistem adalah Penguraian dari suatu sistem informasi yang utuh kedalam bagian- bagian komponennya dengan maksud untuk mengidentifikasi dan mengevaluasi

Analisis sistem merupakan kegiatan penguraian dari suatu sistem informasi yang utuh dan nyata ke dalam komponen-komponen yang memiliki tujuan untuk mengindentifikasi

Analisa sistem didefinisikan sebagai penguraian dari suatu sistem informasi yang utuh kedalam bagian komponen-komponennya dengan maksud untuk mengidentifikasi dan

Analisis sistem adalah penguraian dari sistem informasi utuh kedalam bagian-bagiannya kedalam komponen-komponennya dengan maksud untuk mengidentifikasi dan