Prediksi Awal Penyakit Diabetes Mellitus Menggunakan Algoritma Naive Bayes

(1)

Prediksi Awal Penyakit Diabetes Mellitus Menggunakan Algoritma Naive Bayes

Rumini^1*, Ahmad Nasruddin²

1,2 Program Studi Informatika, Universitas Amikom yogyakarta, Indonesia Email: ¹[email protected], ²[email protected]

INFORMASI ARTIKEL ABSTRAK

Histori artikel:

Naskah masuk, 26 Oktober 2021

Direvisi, 2 November 2021 Diiterima, 3 November 2021

Abstract- Health is the most important thing in this life. If human health is being disturbed, then their daily activities will also be disrupted. One of the diseases that interfere with human activities is Diabetes Mellitus. Based on data from the International Diabetes Federation, Indonesia is ranked 6th in the world with more than 10 million people with Diabetes Mellitus. The World Health Organization predicts the number of people with Diabetes Mellitus in Indonesia will reach 21 million in 2030. The increasing number of people with Diabetes Mellitus indicates the level of awareness of the Indonesian population is still low. For this reason, it is necessary to understand and know about the early symptoms of Diabetes Mellitus in order to prevent the disease early. Because the earlier the disease is detected, the greater the chance for recovery. To do that, researchers will use information from the UCI Machine Learning website to obtain a dataset that can later be processed with the Naïve Bayes algorithm in predicting Diabetes Mellitus. Naïve Bayes algorithm is one of the algorithms that can be used to predict the probability of membership of a class. This algorithm has a high level of accuracy and speed when applied to large data. With the Naïve Bayes algorithm, it will be used to predict Diabetes Mellitus based on the symptoms experienced. Prediction results will be positive and negative classes. Testing of this system was carried out 3 times. The total amount of data used is 500 data. From the test results obtained the highest accuracy in the third test with an accuracy of 89%. In the third test using a comparison of training data and testing data of 80% and 20% (400 training data and 100 testing data).

Kata Kunci:

Prediction,

Naïve Bayes Algorithm, Diabetes Mellitus

Abstrak- Kesehatan merupakan hal terpenting dalam kehidupan ini. Jika kesehatan manusia sedang terganggu, maka aktivitas sehari - harinya juga akan terganggu. Salah satu penyakit yang mengganggu aktivitas manusia adalah Diabetes Mellitus. Dari data International Diabetes Federation, Indonesia menduduki peringkat ke-6 dunia dengan jumlah penderita Diabetes Mellitus lebih dari 10 juta jiwa. World Health Organization memprediksi jumlah penderita Diabetes Mellitus di Indonesia akan mencapai 21 juta jiwa di tahun 2030. Angka penderita Diabetes Mellitus yang semakin meningkat menandakan tingkat kesadaran penduduk Indonesia yang masih rendah. Untuk itulah, diperlukan pemahaman dan pengetahuan tentang gejala-gejala awal Diabetes Mellitus guna mencegah secara dini penyakit tersebut, karena semakin dini penyakit terdeteksi akan semakin besar juga kesempatan untuk sembuh. Untuk melakukan itu, peneliti akan memanfaatkan informasi dari situs UCI Machine Learning untuk mendapatkan dataset yang nantinya dapat diproses dengan algoritma Naïve Bayes dalam memprediksi penyakit Diabetes Mellitus. Algoritma Naïve Bayes merupakan salah satu algoritma yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Algoritma ini memiliki tingkat akurasi dan kecepatan yang tinggi saat diaplikasikan pada data yang besar. Dengan algoritma Naïve Bayes, akan digunakan untuk memprediksi penyakit Diabetes Mellitus berdasarkan gejala – gejala yang dialami. Hasil prediksi akan berupa kelas positif dan negatif. Pengujian sistem ini dilakukan sebanyak 3 kali. Total jumlah data yang digunakan yaitu sebanyak 500 data. Dari hasil pengujian didapatkan akurasi tertinggi pada pengujian ketiga yaitu dengan akurasi 89 %. Pada pengujian ketiga menggunakan perbandingan data training dan data testing sebesar 80% dan 20% (400 data training dan 100 data testing).

(2)

Penulis Korespondensi:

Rumini

Program Studi Informatika, Universitas Amikom Yogyakarta

Jl. Padjajaran, Depok, Sleman, D.I. Yogyakarta, Indonesia Email: [email protected]

1. Pendahuluan

Kesehatan merupakan hal terpenting dalam kehidupan ini. Jika kesehatan manusia sedang terganggu, maka aktivitas sehari - harinya juga akan terganggu. Salah satu penyakit yang mengganggu aktivitas manusia adalah Diabetes Mellitus. Diabetes Mellitus merupakan penyakit kronis serius yang terjadi karena pankreas tidak menghasilkan cukup insulin (hormon yang mengatur gula darah atau glukosa), atau ketika tubuh tidak dapat secara efektif menggunakan insulin yang dihasilkan.

Diabetes Mellitus terbagi menjadi beberapa tipe. Diabetes Mellitus tipe 1 terjadi karena sistem kekebalan tubuh penderita menyerang dan menghancurkan sel - sel pankreas yang memproduksi insulin. Diabetes Mellitus tipe 2 disebabkan oleh sel - sel tubuh yang menjadi kurang sensitif terhadap insulin, sehingga insulin yang dihasilkan tidak dapat dipergunakan dengan baik. Diabetes Mellitus Gestasional yaitu diabetes yang terjadi pada ibu hamil, yang disebabkan oleh perubahan hormon dan gula darah setelah persalinan [1].

Penyakit ini juga termasuk penyakit yang dapat diturunkan dari orang tua ke anaknya.

Penderita Diabetes Mellitus di dunia mencapai 415 juta jiwa, dan meningkat 425 juta pada tahun 2017.

Dari data International Diabetes Federation, Indonesia menduduki peringkat ke - 6 dunia dengan jumlah penderita Diabetes Mellitus lebih dari 10 juta jiwa. World Health Organization memprediksi jumlah penderita Diabetes Mellitus di Indonesia akan mencapai 21 juta jiwa di tahun 2030 [2].

Angka penderita Diabetes Mellitus yang semakin meningkat menandakan tingkat kesadaran penduduk Indonesia yang masih rendah. Selain itu, salah satu faktor yang menyebabkan penderita penyakit Diabetes Mellitus terus meningkat adalah pola perilaku hidup. Pola hidup yang dapat menyebabkan Diabetes Mellitus yaitu seringnya mengkonsumsi makanan cepat saji, kurangnya olahraga, dan banyak pikiran atau stres. Faktor lain penyebab Diabetes Mellitus adalah keturunan, usia, atau kelebihan berat badan. Akan tetapi, di era globalisasi ini penyebab terbesar Diabetes Mellitus adalah perubahan gaya hidup atau perilaku hidup akibat meningkatnya kondisi ekonomi.

Selain sekarang era globalisasi, sekarang juga merupakan era teknologi, yang dimana kita dapat

menemukan berbagai informasi melalui internet, salah satunya dari UCI Machine Learning. Di situs UCI Machine Learning, kita dapat menemukan berbagai macam informasi yang datanya bersifat publik, salah satunya data tentang penderita penyakit Diabetes Mellitus. Data yang didapat dari UCI Machine Learning akan digunakan sebagai dataset dalam penelitian ini. Dataset ini dapat diproses dengan menggunakan algoritma Naïve Bayes untuk memprediksi seseorang menderita penyakit Diabetes Mellitus.

Algoritma Naïve Bayes merupakan salah satu algoritma yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class.

Algoritma ini memiliki tingkat akurasi dan kecepatan yang tinggi saat diaplikasikan pada data yang besar. Dari penelitian ini akan diketahui bahwa algoritma Naïve Bayes dapat digunakan untuk memprediksi penyakit atau tidak.

Penggunaan algoritma Naïve Bayes juga diharapkan dapat memberikan ketepatan dalam memprediksi penyakit Diabetes Mellitus berdasarkan gejala – gejala yang terjadi.

2. Penelitian Terkait

Beberapa teori – teori penelitian yang berkaitan dengan penelitian akan dijelaskan pada bab ini. Teori – teori penelitian sebelumnya yang pernah dilakukan akan digunakan sebagai dasar acuan untuk memberi batasan penerapan teori teori yang berkaitan dalam penelitian. Adapun referensi

Untuk hasil dari prediksi Diabetes Mellitus akan terbagi menjadi dua kelas positif, negatif.

Tabel 2.1 merupakan tabel perbandingan penelitian sebelumnya.

Tabel 2.1 Perbandingan penelitian No Judul

Penelitian

Hasil Penelitian

Perbanding an 1 Perbandinga

n Algoritma Klasifikasi Data Mining Model C4.5 dan Naïve Bayes untuk Prediksi Penyakit Diabetes [3]

Penelitian ini ditekankan dalam membandingk an kinerja algoritma C4.5 dan Naïve Bayes dengan menggunakan tool Rapid Miner.

Penelitian ditekankan dalam menguji kinerja Naïve Bayes, yang diimplemen tasi dalam bahasa pemrogram an PHP

(3)

dengan media web.

2 Sistem Pakar Diagnosa Diabetes Mellitus dengan Metode Naïve Bayes Berbasis Online [4]

Penelitian ini menghasilkan tingkat akurasi yang tinggi, tetapi hanya memiliki data pengujian yang sangat kecil yaitu 10 data dan tanpa menggunakan metode pengujian.

Penelitian ini menggunak an 500 dataset, yang dibagi menjadi data uji dan data latih.

Kemudian akan dilakukan beberapa pengujian.

3 Classificatio

n of

Diabetes Disease Using Naïve Bayes [5]

Penelitian ini ditekankan untuk menguji kinerja Naïve Bayes tanpa media desktop maupun web.

Penelitian ditekankan dalam menguji kinerja Naïve Bayes, yang diimplemen tasi dalam bahasa pemrogram an PHP dengan media web Dengan referensi yang telah dijabarkan diatas, penelitian ini akan menggunakan algoritma Naïve Bayes digabungkan dengan metode Confusion Matrix untuk mengetahui tingkat akurasi sistem.

3. Metode

Naïve Bayes adalah salah satu metode klasifikasi dalam Data Mining untuk memecahkan suatu kasus. Metode ini diciptakan oleh Thomas Bayes [3]. Metode ini termasuk dalam Supervised Learning, yang artinya data yang dijadikan sumber terdapat label, kelas, atau target sebagai acuan.

Naïve Bayes menggunakan teori probabilitas untuk menyelesaikan suatu kasus. Dalam menggunakan algoritma Naïve Bayes, terdapat beberapa fase dalam membuat keputusan yang akurat. Fase tersebut yaitu Training Data, Learning Algorithm, Model, Testing Data, dan Accuracy. Yang dimaksud Learning dalam algoritma ini adalah proses pembelajaran yang menghitung probabilitas dari suatu kasus menggunakan algoritma. Testing adalah pengujian menggunakan Model yang dibuat berdasarkan Training Data dan Learning Algorithm sebelumnya pada suatu data baru. Sedangkan Accuracy adalah pengukuran performa untuk mengetahui tingkat akurasi.

Dasar teori Bayesian menggunakan rumus untuk menentukan nilai peluang dari hipotesis yaitu sebagai berikut [4]:

(1) Penjelasan dari persamaannya adalah:

A = Hipotesis data B merupakan suatu kelas B = Data dengan kelas yang belum diketahui P(A|B) = Probabilitas akhir (posterior) suatu kelas A jika kondisi atribut B terjadi

P(A) = Probabilitas awal (prior) kelas A terjadi, tanpa ada kondisi atribut apapun

P(B|A) = Probabilitas atribut B terjadi akan mempengaruhi kelas A

P(B) = Probabilitas awal atribut B terjadi, tanpa memandang kelas apapun.

Naïve Bayes mengasumsikan bahwa nilai suatu atribut dalam suatu kelas tertentu tidak tergantung dengan nilai atribut yang lainnya [3][11]. Karena itu persamaan Naïve Bayes, disesuaikan sebagai berikut:

(2)

Dimana variabel A merupakan kelas, sementara variabel B1...Bn erupakan atribut yang dibutuhkan untuk menganalisis data. Karena pada kasus ini

P(B) tidak relevan atau tidak berguna secara langsung, maka rumus yang yang digunakan untuk mencari probabilitas pada penelitian ini adalah:

(3) Adapun langkah – langkah perhitungannya dapat dijabarkan secara singkat adalah sebagai berikut [11]:

Tahap 1, memisahkan kelas (A) yang terdapat di dataset

Tahap 2, menghitung prior probability (P(A)) Tahap 3, menghitung likehood dari setiap atribut (P(B1...Bn|A)

Tahap 4, menghitung likehood probability (P(B1|A) x P(B2|A)x…P(Bn|A)

Tahap 5, menghitung posterior probability (P(B1|A)xP(B2|A)x...P(Bn|A) x P(A))

Tahap 6, membandingkan hasil posterior probability. Nilai probabilitas kelas yang lebih besar merupakan hasil dari analisis.

Laplace Correction

Laplace Correction merupakan suatu teknik untuk menghindari agar hasil probabilitas pada perhitungan Naïve Bayes tidak menghasilkan nilai 0 yang dikarenakan tidak adanya data untuk suatu atribut tertentu dalam suatu kelas [15]. Dalam teknik ini dilakukan penambahan nilai satu data pada setiap perhitungannya. Dengan cara ini tidak

(4)

akan membuat perbedaan yang berarti pada nilai probabilitas, sehingga bisa menghindari kasus nilai probabilitas nol. Laplace Correction memiliki rumus sebagai berikut:

(3)

dimana k adalah jumlah bin atau kelas dari atribut

m

i.

Transformasi Data

Transformasi data adalah pengubahan data ke dalam suatu format yang sesuai untuk diproses sistem [16]. Sebagai contoh beberapa metode standar seperti analisis kelompok hanya bisa menerima masukan berupa data kategori. Oleh karena itu, data yang awalnya berupa angka numerik, perlu dibagi – bagi menjadi suatu kategori untuk dapat diproses lebih lanjut.

Confusion Matrix

Confusion Matrix merupakan sebuah tabel yang terdiri atas banyaknya baris data yang diuji / diprediksi benar dan salah oleh suatu model klasifikasi. Tujuannya untuk menentukan kinerja dari suatu model klasifikasi [5].

Tabel 2.2. menunjukan contoh Confusion Matrix

Tabel 2.2 Confusion Matrix Kelas Prediksi

+ -

Kelas Aktual

+ True

Positive (TP)

False Negative

(FN)

- False

Positive (FP)

True Negative

(TN)

Keterangan:

True Positive (TP) = hasil dari prediksi sistem yang positif dan sesuai dengan aktualnya positif

True Negative (TN) = hasil dari prediksi sistem yang negatif dan sesuai dengan aktualnya negatif.

False Positive (FP) = hasil dari prediksi sistem yang positif, sedangkan aktualnya negatif.

False Negative (FN) = hasil dari prediksi sistem yang negatif, sedangkan aktualnya posistif.

Precision adalah klasifikasi positif yang benar (true positive) dan keseluruhan data yang diprediksikan sebagai kelas positif [6][7].

Persamaan precision, yaitu:

(4) Recall adalah jumlah dokumen yang memiliki klasifikasi positif yang benar (true positive) dari

semua data yang benar-benar positif (termasuk didalamnya false negative) [6] [7]. Persamaan recall, yaitu:

(5) Accuracy adalah nilai kedekatan antara jumlah dokumen yang memiliki klasifikasi benar (true positive dan true negative) dengan jumlah semua data [6] [7]. Persamaan accuracy, yaitu:

(6)

4. Hasil dan Pembahasan

Langkah – langkah dari analisis prediksi awal penyakit Diabetes Mellitus dengan algoritma Naïve Bayes:

Sebelum melakukan analisis prediksi awal penyakit Diabetes Mellitus dengan algoritma Naïve Bayes, terlebih dahulu harus membuat data training dari dataset. Kemudian dapat ditentukan atribut dan kelas pada kasus Diabetes Mellitus ini. Untuk kelas pada kasus ini adalah positif dan negatif.

Sedangkan atributnya yaitu umur, jenis kelamin, polyuria, polydipsia, berat badan turun, keletihan, polyphagia, iritasi genital, pandangan kabur, gatal, mudah marah, penyembuhan lambat, partial paresis, otot kaku, rambut rontok, dan obesitas. Data training ini akan dianalisis menggunakan algoritma Naïve Bayes dan menjadi dasar dari perhitungan prediksi penyakit Diabetes Mellitus.

4.1 Transformasi data

Pada tahap ini akan dilakukan perubahan data numerik menjadi data kategori. Perubahan data ini dilakukan guna mempermudah proses perhitungan sistem nanti. Data yang mengalami perubahan pada tahap ini adalah data umur. Perubahan data umur pada tahap ini mengikuti hasil riset Office of National Statistics di Inggris sebagai berikut:

1) Umur dibawah 33 diketegorikan Muda 2) Umur 33 sampai 54 dikategorikan Paruh

Baya

3) Umur diatas 54 dikategorikan Tua 4.2 Naive Bayes

Setelah memiliki data training, selanjutnya diperlukan data testing sebagai data yang akan diprediksi hasilnya.

Pada tabel 1 contoh model suatu data testing.

Jumlah data 1.

Tabel 1.Model data testing Atribut (√ = Ya ─ = Tidak)

Umur 36 (Paruh Baya)

Jenis Kelamin Laki - Laki

Polyuria √

Polydipsia √

BB turun -

Keletihan -

(5)

Polyphagia √

Iritasi Genital -

Pandangan kabur √

Gatal -

Mudah marah -

Sembuh Lambat -

Partial Paresis -

Otot Kaku -

Rambut Rontok √

Obesitas -

Diabetes (Kelas) ?

Selanjutnya adalah proses perhitungan probabilitas setiap kelas dan setiap atribut berdasarkan masing - masing kelas. Tabel 2 menunjukkan perhitungan probabilitas berdasarkan atribut pada model data testing.

Tabel 2 Perhitungan probabilitas

Perhitungan Hasil

P (kelas = “Positif”) 4/10 = 0.4 P (kelas = “Negative”) 6/10 = 0.6 P (Umur = “Paruh

Baya” | Positif)

1/4 = 0.25

P (Jenis Kelamin =

“Laki – laki” | Positif)

2/4 = 0.5

P (Polyuria = “Ya” | Positif)

4/4 = 1

P (Polydipsia = “Ya” | Positif)

3/4 = 0.75

P (BB turun = “Tidak” | Positif)

0/4 = 0

P (Keletihan = “Tidak” | Positif)

1/4 = 0.25

P (Polyphagia = “Ya” | Positif)

2/4 = 0.5

P (Iritasi Genital =

“Tidak” | Positif)

4/4 = 1

P (Pandangan kabur =

“Ya” | Positif)

2/4 = 0.5

P (Gatal = “Tidak” | Positif)

3/4 = 0.75

P (Mudah marah =

2/4 = 0.5

P (Penyembuhan lambat

= “Tidak” | Positif)

4/4 = 1

P (Partial Paresis =

2/4 = 0.5

P (Otot Kaku = “Tidak”

| Positif)

2/4 = 0.5

P (Rambut Rontok =

“Ya” | Positif)

0/4 = 0

P (Obesitas = “Tidak” | Positif)

1/4 = 0.25

P (Umur = “Paruh Baya” | Negatif)

3/6 = 0.5

P (Jenis Kelamin =

“Laki – laki” | Negatif)

4/6 = 0.667

P (Polyuria = “Ya” | Negatif)

0/6 = 0

P (Polydipsia = “Ya” | Negatif)

1/6 = 0.167

P (BB turun = “Tidak” | Negatif)

4/6 = 0.667

P (Keletihan = “Tidak” | Negatif)

3/6 = 0.5

P (Polyphagia = “Ya” | Negatif)

1/6 = 0.167

P (Iritasi Genital =

“Tidak” | Negatif)

6/6 = 1

P (Pandangan kabur =

“Ya” | Negatif)

2/6 = 0.333

P (Gatal = “Tidak” | Negatif)

3/6 = 0.5

P (Mudah marah =

“Tidak” | Negatif)

6/6 = 1

P (Penyembuhan lambat

= “Tidak” | Negatif)

4/6 = 0.667

P (Partial Paresis = 4/6 = 0.667

(6)

“Tidak” | Negatif) P (Otot Kaku = “Tidak”

| Negatif)

4/6 = 0.667

P (Rambut Rontok =

“Ya” | Negatif)

3/6 = 0.5

P (Obesitas = “Tidak” | Negatif)

6/6 = 1

P (B|kelas = “Positif”) (0.25 * 0.5 * 1 * 0.75

* 0 * 0.25 * 0.5 * 1 * 0.5 * 0.75 * 0.5 * 1 * 0.5 * 0.5 * 0 * 0.25) * (0.4) = 0

P (B|kelas = “Negatif”) (0.5 * 0.667 * 0 * 0.167 * 0.667 * 0.5 * 0.167 * 1 * 0.333 * 0.5 * 1 * 0.667 * 0.667 * 0.667 * 0.5 * 1) * (0.6) = 0

4.3 Laplace Correction

Sepertinya yang diketahui dari tabel 2. Hasil probabilitas untuk semua kelas adalah nol. Untuk mengatasi hal tersebut dilakukan Laplace Correction yakni menambah satu data pada setiap perhitungannya. Dengan cara ini tidak akan membuat perbedaan yang berarti pada nilai probabilitas, sehingga bisa menghindari kasus nilai probabilitas nol.

Sebagai contoh, pada kelas = “positif”

memiliki 4 data, ada 0 data dengan atribut Umur =

“Muda”, 1 data dengan atribut Umur = “Paruh Baya”, dan 3 data dengan atribut Umur = “Tua”.

Probabilitas dari contoh ini tanpa Laplace Correction adalah 0, 0.25, dan 0.75. Dengan menggunakan Laplace Correction dari data diatas, diasumsikan ada 1 data lagi untuk masing – masing atribut. Dengan cara ini, nilai probabilitas yang didapat adalah 1/7 = 0,143 (Umur = “Muda”), 2/7 = 0,286 (Umur = “Paruh Baya”), 4/7 = 0,571 (Umur

= “Tua”). Tabel 3 menunjukan perhitungan probabilitas dengan menerapkan Laplace Correction.

Tabel 3. Perhitungan probabilitas setelah laplace correction

Perhitungan Hasil

P (B|kelas =

“Positif”)

(0.286 * 0.5 * 0.833 * 0.667 * 0.167 * 0.333 * 0.5 * 0.833 * 0.5 * 0.667 * 0.5 * 0.833 * 0.5 * 0.5 * 0.167 * 0.333) * (0.4) = 0.00000141755757325030 P (B|kelas =

“Negatif”)

(0.444 * 0.625 * 0.125 * 0.25 * 0.625 * 0.5 * 0.25 * 0.875 * 0.375 * 0.5 * 0.875 * 0.625 * 0.625 * 0.625 * 0.5 * 0.875) * (0.6) =

0.00000623913365416229 Setelah mendapatkan nilai probabilitas, bandingkan antara nilai kelas positif dan kelas negatif untuk mencari nilai terbesarnya.

Berdasarkan tabel diatas, nilai probabilitas negatif yakni 0.00000623913365416229, lebih besar jika dibandingkan dengan nilai probabilitas positif yakni 0.00000141755757325030, sehingga hasil prediksi dari model data testing adalah negatif.

4.4 Evaluasi

Evaluasi data akan dilakukan setelah dilakukannya proses prediksi dengan algoritma Naïve Bayes. Metode evaluasi data yang digunakan pada penelitian ini adalah Confusion Matrix.

Dengan metode ini akan menghasilkan nilai accuracy, recall, dan precision. Pada tabel 4 menunjukan contoh hasil perbandingan prediksi dengan aktual.

Tabel 4. Contoh hasil perbandingan prediksi dengan aktual

Data Diabetes Aktual

Diabetes Prediksi

1 Positif Positif

2 Positif Positif

3 Positif Positif

4 Positif Negatif

5 Positif Negatif

6 Negatif Positif

7 Negatif Negatif

8 Negatif Negatif

9 Negatif Negatif

10 Negatif Negatif

(7)

Dari data hasil prediksi diatas, selanjutnya akan diproses dengan Confusion Matrix. Tabel 5.

menunjukan Confusion Matrix.

Tabel 5. Confusion Matrix Data Diabetes

Aktual

Diabetes Prediksi

Confusion Matrix 1 Positif Positif TP 2 Positif Positif TP 3 Positif Positif TP 4 Positif Negatif FN 5 Positif Negatif FN 6 Negatif Positif FP 7 Negatif Negatif TN 8 Negatif Negatif TN 9 Negatif Negatif TN 10 Negatif Negatif TN

Dari table 5 diatas, maka dapat dilakukan perhitungan sebagai berikut:

1) Accuracy

Merupakan rasio prediksi benar dengan keseluruhan data.

Accuracy = (TP+TN) / (TP+TN+FP+FN)

= (3+4) / (3+4+1+2)

= 7 / 10 = 0.7 * 100 = 70 % 2) Recall

Merupakan rasio prediksi benar positif dengan keseluruhan data yang benar positif.

Recall = TP / (TP+FN)

= 3 / (3+2)

= 4 / 6 = 0.6 *100 = 60.0%

3) Precision

Merupakan rasio prediksi benar positif dibandingkan dengan keseluruhan hasil yang diprediksi positif.

Precision = TP / (TP+FP)

= 3 / (3+1)

= 3 / 4 = 0.75 * 100 = 75.0 %

5. Kesimpulan

Berdasarkan penelitian yang telah dilakukan sebelumnya, maka dapat diperoleh kesimpulan sebagai berikut: Algoritma Naïve Bayes dapat memprediksi penyakit Diabetes Mellitus berdasarkan gejala - gejala yang dialami. Hasil prediksi yang didapat adalah kelas positif dan kelas negatif. Pengujian yang telah dilakukan pada dataset dengan menggunakan algoritma Naïve Bayes, setelah dilakukan evaluasi dengan Confusion Matrix mendapatkan nilai accuracy tertinggi sebesar 89.00%. Jumlah komposisi data kelas positif dan negatif yang ada dalam data latih akan mempengaruhi akurasi sistem. Semakin banyak jumlah data latih, maka akan semakin bervariasi komposisi datanya, sehingga dapat menghasilkan akurasi yang semakin tinggi. Penelitian selanjutnya dilakukan proses klasifikasi yang dapat menghasilkan akurasi lebih baik dengan metode lain selain naive bayes.

Ucapan Terima kasih

Ucapan terima kasih kepada Mahasiswa dan Universitas Amikom Yogyakarta sehingga penelitian ini dapat dilakukan dan selesai.

Daftar Pustaka

[1] Alodokter, “Diabetes,” 2020. [Online]. Available:

https://www.alodokter.com/diabetes. [Accessed:

03-Nov-2020].

[2] Fakultas Kedokteran UI, “Hari Diabetes Nasional 2019: Atasi Obesitas Hindari Diabetes,” 2019.

[Online]. Available: https://fk.ui.ac.id/berita/hari- diabetes-nasional-2019-atasi-obesitas-hindari- diabetes.html. [Accessed: 03-Nov-2020].

[3] Fatmawati, “Perbandingan Algoritma Klasifikasi Data Mining Model C4.5 dan Naïve Bayes untuk Prediksi Penyakit Diabetes,” Jurnal Techno Nusa Mandiri, vol. XIII, no. 1, pp. 50-59, Maret 2016.

[4] S. I. Komang dan A. F. Setiawan, “Sistem Pakar Diagnosa Diabetes Mellitus dengan Metode Naïve Bayes Berbasis Online,” Jurnal MNEMONIC, vol.

I,

no. 1, pp. 1-3, Februari 2018.

[5] Q. I. Lailatul, E. Prasetyo dan R. F. Zainal,

“Classification of Diabetes Disease Using Naïve Bayes,” Journal of Electrical Engineering and Computer Sciences, vol. 1, no. 2, pp. 147-151, Desember 2016.

[6] A. L. Aji, N. A. P. Amalia, dan Respatiwulan,

“Analisis Sentimen Masyarakat terhadap Hasil Quick Count Pemilihan Presiden Indonesia 2019 pada Media Sosial Twitter Menggunakan Metode Naïve Bayes Classifier,”Indonesian Journal of Applied Statistics, vol 2, no. 1, pp. 34-41, Mei 2019.

[7] P. Utomo dan P. Y. Ristanti, “Perbandingan Kinerja Metode C4.5 dan Naïve Bayes dalam Klasifikasi Artikel Jurnal PGSD berdasarkan Mata Pelajaran,”TEKNO Jurnal Teknologi, Elektro, dan Kejuruan, vol. 29, no. 1, pp. 50- 67, Maret 2019.

[8] I. Rita dan R. Oktaviana, “Aplikasi Perpustakaan Pada SMAN 1 Kelumbayan Barat Menggunakan Visual Basic,” Jurnal Technology Acceptance Model, vol. 8, no. 1, pp. 63-69, Juli 2017.

[9] S. Rini dan J. Febio, “Membangun Aplikasi E- Library Menggunakan HTML, PHP Script, dan MySQL Database,” Jurnal Processor, vol.

6, no.2, pp. 38-54, Agustus 2011.

[10] M. Muhamad dan A. Larasati, “Perancangan Sistem Aplikasi Penerimaan

Mahasiswa Baru di STMIK Pringsewu menggunakan PHP dan MySQL,”

Jurnal Technology Acceptance Model, vol. 3, pp. 32-39, Desember 2014.

[11] R. Ade, S. Yessy dan N. Rahman,

“Implementasi Data Mining Untuk Memprediksi Penyakit Jantung Menggunakan Metode Naïve Bayes,” Journal of Innovation

(8)

Information Technology and Application, vol.

1, no.1, pp. 25-34, Desember 2019.

[12] S. Muhammad, N. N. Yuki, dan F. D. T.

Amijaya, “Aplikasi Metode Naïve Bayes dalam Prediksi Risiko Penyakit Jantung,”

Jurnal EKSPONESIAL, vol.8, no. 2, pp. 111- 118, November 2017.

[13] Agustini dan J. K. Wahyu, “Sistem E- Learning Doa dan Iqro dalam Peningkatan Proses Pembelajaran pada TK Amal Ikhlas,”

Jurnal Mahasiswa Aplikasi Teknologi Komputer dan Informasi, vol. 1, no. 3, pp.

154-159, April 2020.

[14] R. Ade, S. Yessy dan R. Nur, “Implementasi Data Mining Untuk Memprediksi Penyakit Jantung Menggunakan Metode Naïve Bayes,”

Journal of Innovation Information Technology and Application, vol. 1, no.01, pp. 25-34, Desember 2019.

[15] K. S. Indra, A. B. Fitra dan A. W. Satrio,

“Implementasi Data Mining Untuk Prediksi Mahasiswa Pengambil Mata Kuliah Algoritma Naïve Bayes, ”Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol.

2, no. 11, pp. 5902-5910, November 2018.

[16] A. Yuli, dan M. Rodhyah, “Aplikasi Data Mining Untuk Menampilkan

Informasi Tingkat Kelulusan Mahasiswa,”

Jurnal Informatika, vol. 8, no. 1, pp. 837-848, Januari 2014.