Fakultas Ilmu Komputer
4491
Implementasi
Naive Bayes
Dengan
Certainty Factor
Untuk Diagnosis
Penyakit Anjing
Desy Setya Rositasari1, Nurul Hidayat2, Fitra A. Bachtiar3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1[email protected], 2[email protected], 3[email protected]
Abstrak
Minat masyarakat Indonesia dalam memelihara anjing tergolong tinggi. Anjing menjadi hewan peliharaan favorit karena anjing memiliki tingkah yang lucu dan menggemaskan. Selain itu perawatan anjing peliharaan juga tergolong praktis. Tindakan pencegahan dan deteksi terhadap penyakit yang menjangkit anjing sangat diperlukan. Sehingga anjing yang terjangkit penyakit dapat segera ditangani dengan tepat untuk mencegah penularan penyakit ke anjing yang lain dan penularan ke manusia. Pada saat melakukan diagnosis penyakit yang menyerang anjing tidak jarang seorang dokter menemukan gejala yang hampir mirip antara satu penyakit dengan penyakit yang lain. Hal ini menyebabkan seorang dokter menemui kesulitan dalam menentukan penyakit apa yang menyerang anjing tersebut. Selain permasalahan tersebut, kurangnya jumlah klinik hewan yang membuka pelayanan sampai 24 jam membuat masyarakat yang memelihara anjing kesulitan pada saat anjing peliharaan mereka tiba-tiba terserang penyakit pada jam-jam diluar jam kerja klinik hewan pada umumnya. Sistem diagnosis penyakit anjing dibuat untuk membantu pekerjaan dokter hewan dalam mendiagnosis penyakit anjing, selain itu sistem ini diharapkan dapat membantu masyarakat dalam melakukan diagnosis awal terhadap anjing peliharaan mereka yang terserang penyakit. Sistem ini menerapkan metode Naïve Bayes dan Certainty Factor berbasis Android. Metode Naïve Bayes digunakan untuk melakukan proses klasifikasi penyakit anjing berdasarkan pola gejala yang biasa dialami, sedangkan metode Certainty Factor digunakan untuk mengetahui nilai kepastian hasil klasifikasi dari metode Naïve Bayes. Berdasarkan pengujian akurasi yang dilakukan selama lima kali. Diperoleh nilai rata-rata akurasi sistem sebesar 97.2%.
Kata kunci: penyakit anjing, klasifikasi, dignosis, naïve bayes, certainty factor
Abstract
The interest of Indonesians in having dog as pets is high. Dogs become favorite pets because dogs have funny and adorable habits. In addition, taking care of dogs is quite easy. Prevention and detection of diseases that infect dogs is necessary, so the infected dogs can be taken care of immediately to prevent transmission of the disease to other dogs and to human. Diagnosing the diseases could be a bit difficult sometimes because some diseases have similar symptoms. Another problem is that there are not many veterinary clinics that open for 24 hours so it would be difficult for dog owners if they found out that
their dog was sick outside of the clinics’ working hours. The system of dog diseases diagnosis is made to assist veterinarians in diagnosing dog diseases, in addition the system is expected to assist the community in making an initial diagnosis of their dogs. This system is Android-based and applies the method of Naïve Bayes and Certainty Factor. The Naïve Bayes method is used to classify dog diseases based on the usual pattern of symptoms, while the Certainty Factor method is used to determine the value of certainty of classification results from the Naïve Bayes method. Based on the accuracy test that was done for five times, the average accuracy value obtained was 97.2%.
Keywords: dog disease, classification, diagnosis, naïve bayes, certainty factor
1. PENDAHULUAN
Minat masyarakat Indonesia dalam
yang penurut. Selain itu perawatan anjing peliharaan juga tergolong praktis. Tindakan pencegahan dan deteksi terhadap penyakit yang menjangkit anjing sangat diperlukan. Sehingga anjing yang terjangkit penyakit dapat segera ditangani dengan tepat untuk mencegah penularan penyakit ke anjing yang lain dan penularan ke manusia. Pada saat melakukan diagnosis penyakit yang menyerang anjing tidak jarang seorang dokter menemukan gejala yang hampir mirip antara satu penyakit dengan penyakit yang lain. Sehingga hal ini menyebabkan seorang dokter menemui kesulitan dalam menentukan penyakit apa yang menyerang anjing tersebut. Selain permasalahan tersebut, kurangnya jumlah klinik hewan yang membuka pelayanan sampai 24 jam membuat masyarakat yang memelihara anjing kesulitan pada saat anjing peliharaan mereka tiba-tiba terserang penyakit pada jam-jam diluar jam kerja klinik hewan pada umumnya. Sistem diagnosis penyakit anjing dibuat untuk membantu pekerjaan dokter hewan dalam mendiagnosis penyakit anjing, selain itu sistem ini diharapkan dapat membantu masyarakat dalam melakukan diagnosis awal terhadap anjing peliharaan mereka yang terserang penyakit.
Untuk itulah diperlukan sistem yang dapat mengidentifikasi penyakit yang menyerang anjing dan diharapkan dapat membantu mempermudah dan mempercepat proses diagnosis yang dilakukan oleh dokter. Selain membantu dokter dalam mendiagnosis penyakit yang menyerang anjing diharapkan pula sistem dapat digunakan oleh masyarakat umum yang memiliki anjing sebagai hewan peliharaan sehingga apabila anjing yang mereka pelihara terjangkit suatu penyakit dapat segera diketahui penyakit yang menyerang anjing tersebut sehingga anjing yang terserang penyakit dapat segera mendapat penanganan yang tepat.
Penelitian sebelumnya yang menggunakan metode Naïve Bayes dan Certainty Factor adalah penelitian yang dilakukan oleh Nugraha (2017), yang membahas tentang penerapan metode metode Naïve Bayes dan Certainty Factor untuk mendiagnosis penyakit kucing. Dari pengujian yang dilakukan dari 25 kasus penyakit menghasilkan nilai akurasi sistem sebesar 80%. Penelitian kedua yang menggunakan metode Naïve Bayes dan Certainty Factor adalah penelitian yang dilakukan oleh Ferdiansyah (2017), dimana penelitian ini menerapkan metode Naïve Bayes dan Certainty Factor untuk diagnosis penyakit
kambing. Dimana dari proses pengujian sistem yang dilakukan diperoleh nilai akurasi sistem sebesar 86,80%.
Berdasarkan masalah dan pemaparan diatas maka disusunlah penelitian dengan menerapkan metode Naïve Bayes dan Certainty Factor untuk melakukan klasifikasi data gejala klinis penyakit anjing sehingga dicapai sebuah diagnosis penyakit yang tepat. Metode Naïve Bayes digunakan untuk melakukan proses klasifikasi penyakit anjing berdasarkan pola gejala yang biasa dialami, sedangkan metode Certainty Factor digunakan untuk mengetahui nilai kepastian hasil klasifikasi dari metode Naïve Bayes.
Tujuan dari penelitian ini adalah menerapkan metode Naïve Bayes dan Certainty Factor untuk mendiagnosis penyakit pada anjing. Selain itu penelitian ini dilakukan untuk mengetahui tingkat akurasi dari sistem diagnosis penyakit anjing dengan menggunakan metode Naïve Bayes dan Certainty Factor.
2. LANDASAN KEPUSTAKAAN
2.1. Data Mining
Data mining merupakan disiplin ilmu yang memiliki perhatian utama dalam menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki. Data mining biasanya juga disebut sebagai knowledge discovery ataupun pattern recognition. Data mining disebut sebagai knowledge discovery atau penemuan pengetahuan karena salah satu tujuan utama dari data mining adalah untuk menggali bongkahan data yang di dalamnya terdapat pengetahuan yang tersembunyi sehingga didapatkan pengetahuan yang tersembunyi tersebut. Data mining disebut sebagai pattern recognition atau pengenalan pola karena pengetahuan yang ditemukan dalam bongkahan data berbentuk pola-pola (Susanto dan Suryadi, 2010).
Menurut Larose (2005), data mining mempunyai 6 fungsi diantaranya fungsi deskripsi (description), estimasi (estimation), prediksi (prediction), klasifikasi (classification), pengelompokan (clustering) dan asosiasi (association).
2.2. Klasifikasi
diterapkan dalam mengklasifikasikan berbagai macam jenis data. Klasifikasi digunakan hampir disetiap bagian kehidupan manusia. Klasifikasi berfungsi untuk mengklasifikasikan item sesuai dengan fitur item sehubungan dengan kelompok kelas yang telah ditentukan.
Classification analysis atau yang biasanya disebut supervised classification merupakan pengelompokan data pada kelas yang telah ditentukan. Klasifikasi menggunakan label kelas tertentu untuk menyusun objek pada kumpulan data. Pendekatan yang biasanya digunakan dalam klasifikasi adalah dengan menggunakan training set dimana semua objek dalam training set sudah diketahui label kelasnya. Algoritma klasifikasi belajar dari training set dalam membangun sebuah model. Model ini nantinya digunakan untuk mengklasifikasikan objek baru.
2.3. Metode Naïve Bayes
Naïve Bayes merupakan salah satu algoritma pembelajaran induktif (inductive learning algorithm) yang paling efisien dan efektif untuk machine learning dan data mining (Zhang, 2004). Naïve Bayes Classifier dikenal sebagai teknik yang paling baik dalam hal waktu komputasi dibanding teknik data mining yang lain. Proses klasifikasi yang menggunakan metode Naïve Bayes telah terbukti efektif diterapkan dalam aplikasi praktis misalkan saja klasifikasi teks, diagnosis medis dan manajemen kinerja sistem (Rish, 2001).
Teorema Bayes memiliki bentuk umum sebagai berikut:
𝑃(𝐻 | 𝑋) = 𝑃(𝑋|𝐻) 𝑃(𝐻)
𝑃(𝑋) (1)
X = Data dengan kelas yang belum diketahui
H = Hipotesis data X merupakan suatu kelas spesifik
P(H|X) = Probabilitas hipotesis H berdasarkan kondisi X (posterior prob.)
P(H) = Probabilitas hipotesis H (prior prob.)
P(X|H) = Probabilitas X berdasarkan kondisi tersebut
P(X) = Probabilitas dari X
Secara tidak formal, persamaan (2) dapat juga ditulis dengan cara:
𝑃𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 =𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 × 𝑃𝑟𝑖𝑜𝑟𝐸𝑣𝑖𝑑𝑒𝑛𝑐𝑒 (2)
Dalam proses klasifikasi, nilai dari posterior sebuah kelas akan dibandingkan dengan nilai dari posterior dari kelas lain. Nilai posterior tertinggi menunjukkan bahwa data tersebut masuk dalam kategori kelas tersebut. Untuk setiap kelas pada sebuah sampel, evidence selalu bernilai tetap. Dalam mencari nilai Likelihood menggunakan persamaan (3) berikut:
𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑓𝑖𝑡𝑢𝑟 𝑑𝑎𝑟𝑖 𝑘𝑒𝑙𝑎𝑠 𝑋𝑇𝑜𝑡𝑎𝑙 𝑑𝑎𝑡𝑎 𝑠𝑎𝑚𝑝𝑙𝑒 (3)
Untuk melakukan perhitungan nilai Prior setiap kelas dapat menggunakan persamaan (4).
𝑃𝑟𝑖𝑜𝑟 = 𝑋𝐴 (4)
Keterangan: P = Nilai Prior
X = Jumlah data tiap kelas A = Jumlah data seluruh kelas
2.4. Certainty Factor
Menurut Kusrini (2016), Certainty Factor merupakan metode yang diperkenalkan oleh Shortliffe Buchanan dalam pembuatan MYCIN. MYCIN adalah awal dari sistem pakar yang dikembangkan untuk menangani infeksi darah pada tahun 1972 di Standford University, California.
Certainty Factor digunakan untuk menyelesaikan masalah ketidakpastian data. Certainty Factor merupakan nilai parameter klinis yang diberikan oleh MYCIN untuk menunjukkan besarnya nilai kepastian. Faktor kepastian dibedakan menjadi 2 macam yaitu: 1. Faktor kepercayaan yang diisikan oleh pakar
beserta aturan.
2. Faktor kepastian yang diisikan oleh pengguna.
Menurut Giarattano dan Riley (1994), nilai dari Certainty Factor dapat diperoleh dengan menggunakan persamaan (5).
𝐶𝐹 (𝐻, 𝐸) = 𝑀𝐵 (𝐻, 𝐸) − 𝑀𝐷 (𝐻, 𝐸) (5)
Keterangan:
• MB (H,E) = Ukuran kenaikan kepercayaan terhadap Hipotesis H yang dipengarui oleh gejala E.
• MD (H,E) = Ukuran kenaikan ketidak percayaan terhadap hipotesis H yang dipengaruhi oleh gejala E.
CF gabungan merupakan nilai CF akhir berupa kesimpulan yang diperoleh dari penggabungan beberapa aturan sekaligus. Perhitungan nilai CF Combine dapat dilakukan dengan menggunakan persamaan (2.6).
𝐶𝐹(1) + 𝐶𝐹(2) ∗ (1 − 𝐶𝐹(1)) (6)
2.5. Penyakit anjing
Sama halnya dengan makhluk hidup yang lain, anjing juga dapat terjangkit berbagai macam penyakit mulai dari yang disebabkan oleh virus, bakteri, cacing maupun jamur. Berbagai macam penyakit yang menyerang anjing diantaranya Demodicosis, Scabiosis, Otitis, Ringworm, Helminthiasis, Canine Parvovirus, Canine Distemper, Ehrlichiosis, Coccidiosis dan Urolithiasis.
3. TAHAPAN PENELITIAN
Penelitian berawal dari studi literatur, kemudian pengumpulan data, analis kebutuhan, perancangan sistem, implementasi, pengujian sistem dan yang terakhir adalah pengambilan kesimpulan dan saran. Diagram alir tahapan penelitian dapat dilihat pada Gambar 1.
Studi literatur
Analisis kebutuhan
Pengumpulan data
Perancangan
Implementasi
Pengujian dan Analisis
Kesimpulan dan Saran
Gambar 1. Diagram Alir Penelitian
4. PERANCANGAN
Perancangan sistem bertujuan untuk mengetahui langkah-langkah yang harus dilakukan untuk membangun sebuah sistem. Pada penelitian ini sitem yang akan dibuat adalah sistem diagnosis penyakit anjing dengan
menggunakan metode Naïve Bayes dan Certainty Factor.
4.1. Perancangan Perangkat Lunak
Salah satu tahapan dalam perancangan adalah perancangan perangkat lunak. Tahapan perancangan perangkat lunak ini menjabarkan proses-proses dalam membangun sistem. Untuk lebih jelasnya dapat dilihat pada flowchart sistem seperti pada Gambar 2.
Tahapan sistem dalam melakukan klasifikasi penyakit anjing dengan menerapkan metode Naïve Bayes dan Certainty Factor yaitu: 1. User melakukan input data gejala klinis. 2. User menekan tombol diagnosis, dimana
secara otomatis sistem menjalankan selanjutnya mengambil data latih yang merupakan dasar pengetahuan dalam sistem. Data latih disimpan dalam array.
3. Sistem akan melakukan perhitungan nilai prior pada setiap kelas penyakit dimana jumlah keseluruhan kelas penyakit ada 10 kelas.
4. Sistem akan melakukan perhitungan untuk mencari nilai likelihood.
5. Sistem akan melakukan proses perhitungan untuk mencari nilai posterior pada setiap kelas penyakit, diamana kelas penyakit dengan nilai posterior tertinggi disimpulkan sebagai diagnosis penyakit yang menyerang anjing.
Start
Gambar 2. Flowchart sistem
4.2. Data Aturan Gejala Klinis Penyakit Anjing
Data aturan gejala klinis penyakit anjing merupakan data yang berfungsi sebagai dasar pengetahuan sistem dalam melakukan proses klasifikasi dan penentuan nilai derajat keyakinan. Data aturan gejala klinis penyakit anjing dapat dilihat pada Tabel 1.
Tabel 1. Data Aturan Penyakit Anjing
Nama
Penyakit Gejala Klinis
Nilai
Demodicosis Rambut rontok 0.8 G1
Feses hitam 0.5 G41
5. PENGUJIAN DAN ANALISIS
5.1. Pengujian
Pengujian akurasi diperlukan untuk mengetahui seberapa besar tingkat akurasi dari diagnosis penyakit anjing yang dilakukan oleh sistem. Pengujian akurasi dilakukan sebanyak 5 kali dengan sekali pengujian menggunakan 100 data uji. 100 data uji dipilih dari 150 data secara acak.
Kemudian diperoleh nilai akurasi dari pengujian pertama sampai pengujian ke lima. Selanjutnya akan diambil nilai rata-rata dari pengujian yang telah dilakukan.
Hasil dari pengujian akurasi yang dilakukan dapat dilihat pada Tabel 2.
Tabel 2. Hasil Pengujian Akurasi Pengujian Pengujian rata-rata dari lima skenario pengujian yang dilakukan pada sistem diagnosis penyakit anjing menggunakan metode Naïve Bayes Classifier dan Certainty Factor diperoleh sebesar 97.2%.
Daftar anjing yang mengalami kesalahan diagnosis selama 5 kali skenario pengujian dapat dilihat pada Tabel 3.
Tabel 3. Daftar Anjing Salah Diagnosis
Nama
G21 Helminthiasis Coccidiosis 0.96
Doggy G20,
G21 Helminthiasis Parvo 0.96
Numa G21,
G24 Coccidiosis Parvo 0.92
5.2. Analisis
Berdasarkan skenario pengujian akurasi yang telah dilakukan. Sistem diagnosis penyakit anjing menggunakan metode Naïve Bayes dan Certainty Factor diperoleh nilai akurasi sebesar 97.2%. Hasil tersebut menunjukkan jika sistem diagnosis penyakit anjing dengan menggunakan metode Naïve Bayes Classifier dan Certainty Factor dapat mendiagnosis penyakit anjing dengan baik dan akurat.
Kesalahan diagnosis terjadi jika penyakit yang satu dan penyakit yang lain meiliki pola gejala yang hampir mirip. Sehingga beberapa gejala penyakit dari suatu penyakit tersebut memiliki nilai probabilitas yang lebih besar terhadap penyakit yang lain.
Nilai CF atau nilai keyakinan dari penyakit yang mengalami kesalahan diagnosis tetap menunjukkan angka yang besar hal ini disebabkan karena perhitungan nilai keyakinan selalu mengikuti hasil akhir klasikasi. Jika hasil akhir klasifikasi menyimpulkan anjing terdiagnosis penyakit A. Maka nilai CF yang akan dihitung adalah nilai CF dari penyakit A tersebut.
6. KESIMPULAN
2.
Tingkat akurasi dari sistem diagnosis penyakit anjing menggunakan metode Naïve Bayes dan Certainty Factor adalah sebesar 97.2%. Tingkat akurasi diperoleh dengan cara melakukan 5 kali skenario pengujian, kemudian diambil nilai rata-rata akurasi dari kelima pengujian tersebut. Setiap kali pengujian, 150 dataset diacak untuk memperoleh 100 data untuk digunakan sebagai data uji. Kesalahan diagnosis terjadi jika penyakit yang satu dan penyakit yang lain meiliki pola gejala yang hampir mirip. Sehingga beberapa gejala penyakit dari suatu penyakit tersebut memiliki nilai probabilitas yang lebih besar terhadap penyakit yang lain. Nilai CF atau nilai keyakinan dari penyakit yang mengalami kesalahan diagnosis tetap menunjukkan angka yang besar hal ini disebabkan karena perhitungan nilai keyakinan selalu mengikuti hasil akhir diagnosis.7. SARAN
Adapun saran untuk pengembangan sistem selanjutnya adalah menerapkan metode lain yang dapat mengklasifikasikan penyakit dengan banyak pola kemiripan gejala.
DAFTAR PUSTAKA
Ferdiansyah, Wahyu Rizki. 2017. Sistem Pakar Diagnosis Penyakit Kambing Menggunakan Metode Naïve Bayes dan Certainty Factor. S1. Universitas Brawijaya. Tersedia di: <http://j-
ptiik.ub.ac.id/index.php/j-ptiik/article/download/822/325/> [Diakses 5 September 2017]
Haryanto, Toto. 2011. Certainty Factor (CF).
Tersedia di: <
http://achamad.staff.ipb.ac.id/wp-
content/plugins/as- pdf/TOTO%20HARYANTO-Certainty%20Factor%20(CF).pdf> [Diakses 18 September 2017]
Larose, Daniel T., 2005. Discovering knowledge in data an introduction to data mining. [e-book] New Jersey: A John Wiley & Sons, INC., Publication. Tersedia di: Google Books <http://booksgoogle.com> [Diakses 17 September 2017]
Nugraha, Achmad Affan Suprayogi. 2017. Sistem Pakar Diagnosis Penyakit Kucing Menggunakan Metode Naïve Bayes –
Certainty Factor Berbasis Android. S1. Universitas Brawijaya. Tersedia di:
<http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/download/903/351/> [Diakses 5 September 2017]
Patil, Tina R., dan Sherekar, S. S. 2013. Performance analysis of anive bayes and J48 classification algorithm for data classification. International Journal Of Computer Science And Apllication. Vol. 6, No.2. (Diterima untuk publikasi April 2013).
Ridwan, M., Suyono, H. , dan M. Sarosa. 2013. Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes. Jurnal EECCIS Vol.7, NO. 1, Juni 2013 Rish, Irina. 2001. An Empirical Study of the
Naïve Bayes Classifier. T.J. Watson Research Center. Tersedia di: <http://www.research.ibm.com/people/r/r ish/papers/RC22230.pdf> [Diakses 7 September 2017]
Sasadara, MMV. 2015. Anjing Kintamani.
Tersedia di:
<http://erepo.unud.ac.id/10065/3/de35dce e2849dfbec6ae8f3c26210cea.pdf> [Diakses 17 September 2017]
Suriyani, Luh De. 2015. Ketika Rabies Mengancam Pariwisata Bali. Tersedia di: <https://balebengong.id/opini/ketika-rabies-mengancam-pariwisata-bali.html > [Diakses 16 Oktober 2017]
Suryai, Made I. 2015. 5 Strategi Bali Kendalikan Rabies. Tersedia di: < http://www.antaranews.com/berita/43796 8/5-strategi-bali-kendalikan-rabies > [Diakses 16 Oktober 2017]
Susanto, Sani dan Suryadi, Dedi. 2010. Pengantar data mining menggali pengetahuan dari bongkahan data. Yogyakarta: Andi.
Zhang, Harry. 2004. The optimality of naive bayes. Faculty of computer science University of New Brunswick. Tersedia
di: American Association for Artificial