i
SISTEM DIAGNOSA PENYAKIT HEPATITIS DENGAN
MENGGUNAKAN METODE NAÏVE BAYESIAN
SKRIPSI
Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer
Jurusan Teknik Informatika
Oleh :
Estu Karunianingtyas 065314045
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
ii
THE HEPATITIS DIAGNOSE SYSTEM BY USING THE
NAÏVE BAYESIAN METHODE
A Thesis
Presented as Partial Fulfillment of the Requirements To Obtain the Engineering Bachelor Degree
In Informatics Engineering
By :
Estu Karunianingtyas Student Number : 065314045
INFORMATICS ENGINEERING STUDY PROGRAM
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
iii
HALAMAN PERSETUJUAN
SKRIPSI
SISTEM DIAGNOSA PENYAKIT HEPATITIS DENGAN
MENGGUNAKAN METODE NAÏVE BAYESIAN
Disusun Oleh : Estu Karunianingtyas
065314045
Telah diperiksa dan disetujui Di Yogyakarta
Pada tanggal : .... Februari 2012
Dosen Pembimbing
v
HALAMAN PERSEMBAHAN
Yakobus 2:22b
“ bahwa iman bekerjasama dengan perbuatan -perbuatan dan oleh
perbuatan-perbuatan itu iman menjadi sempurna”
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagai mana layaknya karya ilmiah.
Yogyakarta, 8 Februari 2012 Penulis
vii
LEMBAR PERNYATAAN PERSETUJUAN
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan dibawah ini, saya mahasiswa Univer sitas Sanata Dharma : Nama : Estu Karunianingtyas
NIM : 065314045
Demi pengembangan pengetahuan, saya memberikan kepada perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul :
SISTEM DIAGNOSA PENYAKIT HEPATITIS DENGAN
MENGGUNAKAN METODE NAÏVE BAYESIAN
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data mendistribusikan secara terbatas, dan mempublikasikan di internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis.
Demikian pernyataan ini saya buat dengan sebe narnya. Yogyakarta, 8 Februari 2012
Yang menyatakan,
viii
SISTEM DIAGNOSA PENYAKIT HEPATITIS DENGAN
MENGGUNAKAN METODE NAIVE BAYESIAN
ABSTRAK
Penyakit hepatitis dapat meningkatkan risiko kematian bagi penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan kematian. Sistem pakar adalah sistem berbasis komputer yang menggunakan pengetahuan, fakta, dan teknik penalaran dalam memecahkan masalah yang biasanya hanya dapat dipecahkan oleh seorang pakar dalam bidang tert entu. Sistem pakar memberikan nilai tambah pada teknologi untuk membantu dalam menangani era informasi yang semakin canggih. Pada penelitian ini dibangun aplikasi sistem pakar yang menghasilkan keluaran berupa kemungkinan penyakit hepatitis yang diderita berdasarkan gejala yang dirasakan oleh user. Sistem ini juga menampilkan besarnya kepercayaan gejala tersebut terhadap kemungkinan penyakit hepatitis yang diderita oleh user. Besarnya nilai kepercayaan tersebut merupakan hasil perhitungan dengan menggunakan metode Naïve Bayesian Classification.
ix
ABSTRACT
Hepatitis can increase the death risk to the patient and it can also become the cause of another disease which can cause death. The Expert System is a system which is based on computer which uses knowledge, fact, and technique to solve a problem which usually can be solved by an expert of certain field. The Expert System gives an additional value to the technology to help in handling the information in this modern era.In this research, the Expert System Application is made to get a result about the hep atitis possibility which is suffered by the patient based on the symptoms which are felt by the patient. This system will show how big of possibilities on hepatitis symptoms which are suffered by the patient . The mount of possibilities is a result of coun ting by using the Naive Bayesian Classification method.
x
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena atas kebaikan dan kehendak-Nya saya dapat menyelesaikan tugas akhir yang berjudul
“Sistem Diagnosa Penyakit Hepatitis Dengan Menggunakan Naive
Bayesian”. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelar sarjana program studi Te knik Informatika, Fakultas Sains dan Teknologi Universitas Sanata Dharma.
Dalam proses penulisan tugas akhir ini , penulis mengucapkan terima kasih yang sebesar-besarnya kepada :
1. Romo Dr. Cyprianus Kuntoro Adi, SJ, MA, M.Sc selaku Dosen Pembimbing, terimakasih atas segala bimbingan , kesabaran dan mengarahkan serta membimbing penulis dalam menyelesaikan tugas akhir ini.
2. Ibu Ridowati Gunawan, sela ku ketua program studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta. 3. Ibu P.H. Prima Rosa, S.Si, M.Sc . dan Bapak Albert Agung Hadhiatma,
S.T.,M.T. selaku dosen penguji yang telah memberikan banyak kritik dan saran untuk tugas akhir saya.
xi
5. Seluruh staff Sekretariat Teknik, yang banyak membantu saya dalam urusan administrasi akademik terutama menjelang ujian tugas akhir.
6. Kedua orang tua, yaitu papa Idrisman yang disurga dan mama Suwaningsih . Terima kasih atas semua yang telah dilakukan untukku, doa, semangat, dukungan dan cintanya sehingga saya bisa menyelesaikan studi dengan lancar.
7. Kakak-kakakku, Norma Ika Damasanti, Purbo Yohanes Cristo Oktova, dan Kinasih Amrih Rahayu, walau kita sering berjauhan tapi aku selalu sayang pada kalian. Selain itu terima kasih juga untuk keponakan tersayang Ezekiel Locano Yovada yang selalu mendukung dengan penuh semangat.
8. Teman-teman Teknik Informatika : Ridoan Wibisono, Floriska Nuhan, Fransiskus Anggit Dwi Suhendro, Hendra Christian, Ellis Renatal Samosir, Caecilia Nova P, Tulus Wardoyo , dan semua teman-teman TI lainnya. 9. Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhir
ini yang tidak bisa saya sebutkan satu per satu.
Dengan rendah hati penulis menyadari bahwa tugas akhir ini masih jauh dari sempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan tug as akhir ini sangat penulis harapkan. Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak. Terima kasih.
Yogyakarta, 8 Februari 2012
xii
HALAMAN PERNYATAAN KEASLIAN KARYA ………...
HALAMAN PERSETUJUAN PUBLIKASI ……… ………...
ABSTRAK ………...
1.5 Metodelogi Penelitian ... ...
1.6 Sistematika Penulisan ...
BAB II. LANDASAN TEORI
2.1 Data Mining ...
xiii
2.2.1 Teorema Bayes ...
2.2.2 Naive Bayesian...
2.2.3 Naive Bayes Algorithm...………...
2.3 K-fold Cross Validation...……….
2.4 Penyakit Hepatitis...
BAB III. DESAIN SISTEM
3.1 Data ……...
3.2 Desain Sistem...
3.3 Tahap Pelatihan (Training)...
3.4 Tahap Pengujian (Testing)...
3.5 Penghitungan Akurasi...
3.6 Desain User Interface ...
3.7 Spesifikasi Software dan Har dware...
BAB IV. IMPLEMENTASI DAN ANALISA HASIL
4.1 Hasil Penelitian dan Analisa..………...
4.2 Perancangan Naive Bayes... ...
4.3 Seleksi Atribut...
4.4 Hasil dan Akurasi...………...
4.5 Implementasi User Interface... .
xiv
5.2 Saran ……… ………...
DAFTAR PUSTAKA LAMPIRAN
64
65
xv
DAFTAR GAMBAR
Gambar Keterangan Halaman
2.1 Langkah Penambangan Data (Data Mining) 9
2.2
Ilustrasi Pemodelan teknik Classification untuk mengukur akurasi
17
3.1 Garis Besar Sistem Pengenalan 35
3.2 Skema Tahap Pelatihan 36
3.3 Skema Tahap Pengujian 37
3.4 Tampilan Awal 40
3.5 Halaman Bantuan 40
3.6 Halaman Pengujian Sistem 41
3.7 Halaman Klasifikasi Sistem 42
4.1 Grafik Akurasi Percobaan per -gejala Hepatitis 52 4.2 Grafik Akurasi Percobaan kombinasi gejala Hepatitis 55
4.3 Menu Utama 57
4.4 Halaman Bantuan 59
4.5 Halaman Pengujian Sistem 59
4.6 Error Handling 60
4.7 Halaman Klasifikasi Sistem 61
xvi
DAFTAR TABEL
Tabel Keterangan Halaman
3.1 Data Gejala Hepatitis 26
3.2 PembagianSample 29
3.3 Percobaan Hepatitis 29
3.4 Sample Penyakit Hepatitis 30
3.5 FeatureGejala Otot 30
3.6 FeatureGejala Perut 30
3.7 FeatureGejala Kulit 31
3.8 FeatureGejala Mata 31
3.9 FeatureGejala Mirip Flu 31
3.10 SampelPenyakit Hepatitis dengan nilai Probabilitas 32
3.11 Sample Penyakit Hepatitis (2) 33
3.12 Confusion Matrix 39
4.1 Deskripsi Data Gejala Hepatitis 45
4.2 Data Nominal Gejala Hepatitis 48
4.3 Data Binerisasi Gejala Hepatitis 50
4.4 Hasil Akurasi Percobaan per -gejala 52
4.5 Confusion MatrixGejala Perut 53
4.6 Hasil Akurasi Percobaan Kombinasi Gejala 54
1
Bab I.
Pendahuluan
1.1 Latar Belakang
Perkembangan Teknologi Informasi yang semakin berkualitas dan menuntut kemudahan manusia dalam setiap melakukan aktifitasnya. Hal tersebut memicu terus berkembangnya perangkat keras dan perangkat lunak dalam penggunaan komputer di bidang teknologi informasi. Komputer yang dalam penggunaannya dulu hanya terbatas pada bidang -bidang tertentu saja, telah digunakan secara luas diberbagai bidang.
Kecerdasan buatan atau artificial intelligence merupakan bagian dari ilmu komputer yang membuat agar komputer dapat melakukan pekerjaan seperti dan sebaik yang dilakukan oleh manusia. Ada beberapa cabang yang terdapat dalam kecerdasan buatan yang salah satunya adalah sistem pakar.
Metode Naïve Bayesian Classification yang digunakan dalam sistem diagnosa penyakit hepatitis berfungsi untuk mengatasi ketidakpastian pada penalaran sistem. Sistem akan memberikan pengetahuan berupa output (hasil diagnosa) berdasar input yang diberikan (gejala penyakit) berupa nilai kepastian sebuah data (akurasi nilai data). Metode Naïve Bayesian Classification melakukan perhitungan berupa probabilitas, hasil nilai probabilitas yang diperoleh akan dijadikan nilai kepastian (akurasi nilai). Dengan adanya nilai kepastian (akurasi nilai), maka memudahkan untuk mengambil keputusan terhadap permasalahan yang ada.
Hati atau liver merupakan organ terbesar dalam tubuh manusia. Di dalam hati terjadi proses-proses penting bagi kehidupan kita, yaitu proses penyimpanan energi, pembentukan protein dan asam empedu, pengaturan metabolisme kolesterol, dan penetralan racun atau obat yang masuk dalam tubuh kita. Sehingga dapat dibayangkan akibat yang akan timbul apabila terjadi kerusakan pada hati. Berbagai penyakit pada hati seperti hepatitis A, B dan C kini menjadi masalah kesehatan masyarakat. Khususnya di Indonesia penyakit -penyakit infeksi pada hati masih merupakan penyebab kematian yang sangat penting. Oleh sebab i tu, apabila penyakit hepatitis ini bisa dideteksi secara dini, penyakit ini pun segera diatasi. Sehingga penyakit hati tidak akan menyebabkan kematian. Dari tahapan awal, bisa dilakukan deteksi dini sebelum pasien menderita penyakit yang lebih ganas, yang akan menyebabkan kematian seperti hepatitis A, B dan C.
mengambil keputusan berupa diagnosa jenis penyak it hepatitis pada userapabila usertersebut positif mengidap penyakit hepatitis.
1.2 Rumusan Masalah
Dari latar belakang tersebut, dapat dirumuskan suatu masalah yaitu bagaimana metode Naive Bayesian membantu ketepatan diagnosa penyakit hepatitis.
1.3 Tujuan
Membangun sistem yang digunakan untuk mengenali diagnosa penyakit hepatitis khususnya hepatitis A, B dan C dengan menggunakan metode Naïve Bayesian Classification.
1.4 Batasan Masalah
Pembuatan sistem diagnosa penyakit hepatitis terbatas pada:
1. Data yang diolah hanya data yang berhubungan dengan penyakit yang menyerang hati khususnya gejala penyakit hepatitis A, B dan C.
3. Metode yang akan digunakan untuk mengenali gejala hepatitis adalah metodeNaïve Bayesian Classification.
4. Software yang digunakan adalah Matlab R2010a.
1.5 Metodologi Penelitian
Dalam penyelesaian tugas akhir yang berjudul Sistem Diagnosa Penyakit Hepatitis Dengan Metode Naïve Bayesian Classification ini, akan ditempuh langkah-langkah kerja sebagai berikut:
1. Studi Pustaka
a. Penelitian pustaka, yaitu dengan mempelajari hal -hal yang berkaitan dengan Data Mining metode Naive Bayesian, dengan mengumpulkan dan mempelajari informasi dari buku -buku, artikel dan website internet.
b. Interview, yaitu dengan melakukan konsultasi atau tanya jawab dengan orang-orang yang memiliki pengetahuan dan wawasan yang berhubungan dengan topik tugas akhir ini.
c. Penelitian dan pengumpulan data pasien penyakit hepatitis di rekam medis Rumah Sakit Panti Rapih Yogyakarta.
2. Teknik Penambangan Data
a. Pembersihan data yaitu membersihkan dan menyiapkan data dengan cara menghilangkannoisedan data yang tidak konsisten .
b. Integrasi data yaitu proses menggabungkan data dari bermacam -macamfeature atau atribut gejala ke dalam satu tempat penyimpanan data yang koheren.
c. Seleksi data yaitu proses seleksi data, dimana dipilih atribut-atribut yang relevan untuk dilakukan penambangan d ata. Atribut yang tidak relevan akan dibuang karena atribut yang diharapkan adalah atribut yang bersifat independen.
d. Transformasi data yaitu data ditransformasikan ke dalam bentuk yang tepat untuk di proses penambangan . Data mentah hepatitis yang semula merupakan data berbentuk file teks terdiri gejala -gejala yang terdiagnosa berupa gejala otot, gejala perut, gejala kulit, gejala mata dan gejala mirip flu. Gejala dari tiap pasien tersebut per gejalanya di konversi menjadi nilai 0 sampai 1. Konversi dari seb uah file yang berbentuk teks menjadi nilai 0 -1 ini disebut binerisasi. Hasil binerisasi adalah berupa vektor baris yang bernilai 0 -1 untuk tiap elemennya. e. Penambangan data yaitu mengaplikasikan metode yang tepat untuk
mengekstrak pola data, yaitu dengan m enggunakan metode Naive Bayesian.
1.6 Sistematika Penulisan
Sistematika penulisan dalam tugas akhir yang berjudul Sistem Diagnosa Penyakit Hepatitis Dengan Metode Naïve Bayesian Classification ini dijelaskan sebagai berikut :
Bab I. Pendahuluan
Pada Bab ini dijelaskan mengenai latar belakang masalah yang mendorong dibangunnya sistem ini, rumusan masalah, tujuan , batasan masalah ,metodologi penelitian yang dilakukan dan sistematika penulisan yang digunakan dalam menyelesaikan laporan tugas akhir .
Bab II. Landasan Teori
Pada Bab ini berisi tentang Landasan Teori yang berfungsi sebagai sumber dalam memahami permasalahan yang berkaitan dengan Penambangan Data (Data Mining), metodeNaïve Bayesian Classification, teori-teori yang berhubungan dan yang diperlukan dalam pembuatan sistem informasi , yaitu mengenai jenis penyakit hepatitis, dan gejala -gejalanya khususnya gejala dan jenis penyakit hepatitis A, B, dan C.
Bab III. Desain Sistem
Pada bagian ini digambarkan komponen dan algoritma yang digunakan dalam penelitian.
Bab IV. Implementasi dan Analisa Hasil
Bab V. Penutup
8
BAB II. LANDASAN TEORI
Pada bab ini akan dibahas mengenai teori -teori yang digunakan untuk mendukung penulisan tugas akhir sistem diagnosa penyakit hepatitis dengan metode Naive Bayesian classification. Teori-teori yang akan dibahas mencakup pengertian dasar data mining, metode Naive Bayesian Classification, dan pengertian hepatitis serta jenis -jenisnya yang mencakup hepatitis A, B dan C.
2.1 Data Mining
Data Mining yang merupakan bagian dari Knowledge Discovery in Databases (KDD), adalah kegiatan yang meliputi pengumpulan, pemak aian data historis untuk menemukan keteraturan, pola atau hubungan dalam sekumpulan data berukuran besar (Budi Santosa, 2006).
Penambangan data (data mining) didefinisikan sebagai proses pengambilan atau menambang informasi/pengetahuan dari sekumpulan data dengan jumlah yang sangat besar. Secara fungsional, penambangan data adalah proses dari pengumpulan informasi penting dari sejumlah data yang besar yang tersimpan di basis data, gudang data, atau tempat penyimpanan informasi lainnya (Han&Kamber, 2006).
Gambar 2.1 Langkah Penambangan Data(Data Mining)
Menurut : Han&Kamber(2006)
1. Pembersihan Data (data cleaning)
Ketidakcocokan tersebut dapat disebabkan oleh beberapa faktor antara lain gejala masukan data yang kurang lengkap sehingga menyebabkan munculnya kesalahan, yang mana petugas rumah sakit kurang memperhatikan kelengkapan dalam memasukkan data pasien.
2. Integrasi data(data integration)
Pada langkah ini akan dilakukan penggabungan data. Data dari bermacam -macam tempat penyimpanan data akan digabungkan ke dalam satu tempat penyimpanan data yang sesuai. Saat melakukan integrasi data, hal yang perlu dipertimbangkan secara khusus adalah masalah struktur data. Struktur data yang perlu diperhatikan ketika mencocokkan atribut dari satu gejala ke gejala data lain.
3. Seleksi data (data selection)
Data yang relevan akan diambil dari bas is data untuk dianalisis. Pada langkah ini akan dilakukan analisis korelasi untuk analisis gejala. Atribut -atribut data akan dicek apakah relevan untuk dilakukan penambangan data. Atribut yang tidak relevan tersebut tidak akan digunakan. Atribut yang diharapkan adalah atribut yang bersifat independen. Artinya, antara atribut satu dengan atribut yang lain tidak saling mempengaruhi.
4. Transformasi data (data transformation)
(generalization) yaitu mengganti data level r endah menjadi data level tinggi, (normalization) yaitu mengemas data atribut ke d alam skala kecil. Dan konstruksi atribut (attribute construction/feature construction) yaitu mengkonstruksi dan menambahkan atribut baru untuk membantu proses penambangan. Selanjutnya dilakukan binerisa si yaitu mengkonversi dari sebuah file yang berbentuk teks menjadi nilai 0 -1. Hasil binerisasi adalah berupa vektor baris yang bernilai 0 -1 untuk tiap elemennya.
5. Penambangan data (data mining)
Langkah ini adalah langkah yang penting di mana akan di aplikas ikan metode yang tepat untuk mengekstrak pola data.
6. Evaluasi pola (pattern evaluation)
Langkah ini berguna untuk mengidentifikasi pola yang benar dan menarik. Pola tersebut akan direpresentasikan dalam bentuk pengetahuan berdasarkan beberapa pengukuran yan g penting.
7. Presentasi pengetahuan(knowledge presentation)
Pada langkah ini informasi yang sudah ditambang akan divisualisasikan dan direpresentasikan kepada pengguna.
Secara umum penambangan data adalah sekumpulan aktifitas yang dilakukan untuk menggali pengetahuan dari sekumpulan data agar didapatkan model yang berarti (Jiawei Han dan Micheline Kamber, 2006). Dua tujuan utama yang diperoleh dari penambangan data yaitu menjelaskan (description) dan memprediksi (prediction). Oleh karena itu ada kemungkinan aktifitas penambangan data diarahkan ke dalam salah satu dari dua kategori berikut: a. Data mining yang bersifat prediksi menghasilkan pemodelan dari sistem
yang diuraikan oleh keadaan data.
b. Data mining yang bersifat deskripsi menghasilkan informasi yang baru dan bersifat penting berdasarkan pada data yang tersedia.
Tujuan-tujuan tersebut dapat tercapai dengan penggunaan teknik data mining. Berdasarkan tugas data mining, metode -metode yang biasa dipakai terdiri atas:
a. Classification adalah proses penemuan model yang bersifat prediksi dan menggolongkan data itemke dalam beberapa kelas yang sudah dikenal. b. Regression adalah proses penemuan model yang bersifat prediksi dan
mampu memetakan data item dengan sebuah angka nyata (real value) dari nilai variabel ramalan.
d. Summarization adalah suatu tugas deskriptif tambahan yang melibatkan metode untuk penemuan sebuah uraian ringkas dari keseluruhan atau sebagian data.
e. Dependecy Modeling adalah menemukan perubahan dan penyimpangan yang paling penting dalam data.
2.2 Metode Naïve Bayesian Classification
2.2.1 Teorema Bayes
Teorema Bayesian mengungkapkan bahwa hasil probabilitas posterior sebanding dengan hasil perkalian antara likelihood dengan probabilitas prior. Probabilitas posterior adalah probabilitas bersyarat dari sebuah hipotesis jika diberikan data. Likelihood adalah probabilitas bersyarat dari sebuah data jika diberikan hipotesis. Probabilitas prior adalah prob abilitas bahwa hipotesis itu benar sebelum data terlihat. Pada saat klasifikasi, pendekatan Bayes akan menghasilkan label kategori yang paling tinggi probabilitasnya (vMAP) dengan masukan atribut (a1,a2, …. ,an),(Budi Santosa, 2006).
atau dengan kata lain persamaan diatas dapat digambarkan sebagai:
Posterior= (2.3)
P(h | D)adalahposterior probability, Contoh : kondisi kemungkinan dari hipotesishsetelah training data (evidence) muncul.
P(h)adalahprior probabilitydari hipotesish. Kuantitas non-klassikal ini sering ditemukan dengan melihat data dari masa lampau (atau dalam training data).
P(D)adalahprior probability dari training data D. Kuantitas ini sering berupa nilai yang konstan, P(D)P(D|h)P(h)P(D|h)P(h), dimana dapat dikomputasi dengan mudah ketika kita menemukan bahwa
) | (h D
P dan P(h|D) adalah 1.
P(D|h)adalah probabilitas dari Dyang berasal dari hipotesis h, dan biasa disebut denganlikelihood. Kuantitas ini mudah untuk dihitung selama memberikan nilai 1 ketikaDdanhkonsisten, dan memberikan nilai 0 ketika tidak konsisten.
Bayesian Theorem adalah metode classifier yang berdasarkan probabilitas dan Teorema Bayesian dengan asumsi bahwa setiap variabel bersifat bebas (independence). Dengan kata lain, Naïve Bayesian Classifier mengansumsikan bahwa keberadaan sebuah feature(atribut) tidak ada kaitannya dengan keberadaan feature(atribut) yang lain.
menggunakan teorema Bayes ini, persamaan (2.1) ini dapat ditulis:
vMAP = arg maxvj€V= (2.4)
vMAP = arg maxvj€V P(a1,a2, …. ,an| vj) P(vj) (2.5)
Naïve Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secaraconditional saling bebas jika diberikan nilai output. Atau dengan kata lain. diberikan nilai output, probabilitas mengamati secara bersama adalah produk dari probabilitas individu atau P( a1, a2, a3, …,an | vj) = ∏iP( a1| vj). memasukan persamaan ini akan didapat perdekatan yang dipakai dalam klasifier N aïve Bayes (Budi Santosa, 2007).
P(a1,a2, …. ,an| vj) =∏iP( a1| vj) (2.6) substitusi persamaan ini dengan persa maan 2.5 akan menghasilkan: vMAP= arg maxvj€V P( vj)∏iP( a1| vj) (2.7) akurasi dihitung dengan cara:
Akurasi = x 100% (2.8)
2.2.2 Naive Bayesian
Dengan asumsi Naive Bayesian dimana a tribut– atribut dari training data dianggap terpisah dan independen maka rumus 2.1 berubah menjadi seperti dibawah ini.
Dadalah himpunan training data hadalah hipotesis
P(h) adalah probabilitas dari hipotesis h sebelum evidence D muncul atau sering disebutprior probability.
P(D) adalah probabilitas dari evidenceD, dimana P(D) bernilaiirrelevantatau sama dengan kelas yang lain.
P(D1|h), P(D2|h),P(Dn|h) adalah probabilitas dari setiap D1,D2,Dn untuk hipotesishbiasa disebut dengan likelihood.
Oleh karena P(D) bernilai irrelevant maka hanya persamaan
)
mencegah hal itu maka dilakukan penambahan nilai 1 ke setiap evidence dalam perhitungan sehingga probabilitas tidak akan bernilai 0. Langkah ini sering disebutLaplace Estimator.Jika dalam memprediksi ada evidencepadatest datayang tidak diketahui, maka atribut itu tidak perlu dimasukan dalam proses perhitungan prediksi.
2.2.3 Naive Bayes Algorithm(Classification)
Classification adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu
Bayesian Classificationdidasarkan pada Teorema Bayesian. Konsep dasar teori bayes itu pada dasarnya adalah peluang bersyarat P(H|X). Dimana dalam Bayesian H adalah posterior dan X adalah prior. Prior adalah pengetahuan tentang karakteristik suatu atribut (bisa diartikan sebagai pengalaman di masa lalu atas suatu atribut atau juga bisa berdasarka n teori), sedangkan posterior adalah karakteristik yang akan kita duga pada kejadian yang akan datang. Teorema Bayesian berguna untuk melakukan kalkulasi probabilitas posterior, P(H|X), dari P(H), dan P(X) dan P(X|H). Teori Bayes adalah sebagai berikut:
P(H|X)= (2.10)
Proses classification biasanya dibagi menjadi dua fase: learning dan test. Padafase learning, sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraa n. Kemudian pada fase test model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi kelas data yang belum diketahui.
Gambar 2.2 Ilustrasi Pemodelan teknik Classification untuk mengukur akurasi
2.3 K-fold Cross Validation
Cross Validation adalah salah satu metode yang bisa digunakan untuk mengukur kinerja dari sebuah model prediktif. Dalam k-fold Cross Validation,data akan dipartisi secara acak ke dalam k partisi, D1, D2, …Dk, masing-masing D mempunyai jumlah yang sama. Pada iterasi ke – i partisi Di digunakan sebagai data uji, sedangkan sisa partisi digunakan sebagai data pelatihan. Maka dari itu pada iterasi pertama, D1 digunakan sebagai data uji dan D2, D3, ….Dkdigunakan sebagai data pelatihan. Pada iterasi kedua, D2digunakan sebagai data uji, sedangakanD1, D3, ….Dkdigunakan sebagai data pelatihan. Pada iterasi ketiga, D3digunakan sebagai data uji, sedangkan D1, D2, …Dk digunakan sebagai data pelatihan dan seterusnya. Setiap sample D, hanya digunakan sekali sebagai data uji dan berkali-kali sebagai data pelatihan (Han&Kamber, 2006).
2.4 Penyakit Hepatitis
Penyakit hepatitis adalah penyak it yang disebabkan oleh beberapa jenis virus yang menyerang dan menyebabkan peradangan serta merusak sel -sel organ hati manusia. Hepatitis dikategorikan dalam beberapa golongan, diantaranya hepatitis A, B, C, D, E, F dan G. di Indonesia penderita penyakit Hepatitis umumnya cenderung lebih banyak mengalami golongan hepatitis B dan hepatitis C. Namun dalam Tugas Akhir ini penulis hanya membahas pada fokus penyakit Hepatitis A, B, dan C.
termasuk obat tradisional. Virus hepatitis juga ada beberapa jenis, hepatitis A, hepatitis B, C, D, E, F dan G. Manifestasi penyakit hepatitis akibat virus bisa akut (hepatitis A) dapat pula hepatitis kronik ( hepatitis B, C) dan adapula yang kemudian menjadi kanker hati (Marzuki Suryaatmadja, 2010).
Penyakit hepatitis yang diambil oleh penulis terdiri atas hepatitis A, B dan C. Untuk lebih jelasnya diuraikan sebagai berikut:
1. Penyakit Hepatitis A
Hepatitis A adalah golongan penyakit Hepatitis yang ringan dan jarang sekali menyebabkan kematian, Virus hepatitis A (VHA=Virus Hepatitis A) penyebarannya melalui kotoran/tinja penderita yang penularannya melalui makanan dan minuman yang terkomtaminasi, bukan melalui aktivitas se ksual atau melalui darah. Penyakit Hepatitis A memiliki masa inkubasi 2 sampai 6 minggu sejak penularan terjadi, barulah kemudian penderita menunjukkan beberapa tanda dan gejala terserang penyakit Hepatitis A.
Untuk gejala penyakit Hepatitis A diantaranya yaitu pada minggu pertama, individu yang dijangkiiti akan mengalami sakit seperti kuning, keletihan, demam, hilang selera makan, muntah -muntah, pusing dan kencing yang berwarna hitam pekat. Demam yang terjadi adalah demam yang terus menerus, tidak seperti demam yang lainnya yaitu demam berdarah, TBC, thpyus, dll .
2. Penyakit Hepatitis B
menyerang hati dan menyebabkan peradangan hati akut atau menahun. Seperti hal Hepatitis C, kedua penyakit ini dapat menjadi kronis dan akhirnya menjadi kanker hati. Proses penularan Hepatitis B yaitu melalui pertukaran cairan tubuh atau kontak dengan darah dari orang yang terinfeksi Hepatitis B.
Adapun beberapa hal yang menjadi pola penularan antara lain penularan dari ibu ke bayi saat melahirkan, hubungan seksual, transfusi darah, jarum suntik, maupun penggunaan alat kebersihan diri (sikat gigi, handuk) secara bersama-sama. Hepatitis B dapat menyerang siapa saja, akan tetapi umumnya bagi mereka yang berusia produktif akan lebih beresiko terkena penyakit ini.
Untuk gejala penyakit Hepatitis B Secara khusus tanda dan gejala terserangnya hepatitis B yang akut adalah demam, sakit perut dan kuning (terutama pada area mata yang putih/sklera). Namun bagi penderita hepatitis B kronik akan cenderung tidak tampak tanda -tanda tersebut, sehingga penularan kepada orang lain menjadi lebih beresiko.
3. Penyakit Hepatitis C
Untuk gejala penyakit Hepatitis C diantaranya yaitu penderita Hepatitis C sering kali orang yang menderita Hepatitis C tidak menunjukkan gejala, walaupun infeksi telah terjadi bertahun -tahun lamanya. Namun beberapa gejala yang samar diantaranya adalah ; lelah, hilang selera makan, sakit perut, urin menjadi gelap dan kulit atau mata menjadi kuning yang disebut "jaundice" (jarang terjadi). Pada beberapa kasus dapat ditemukan peningkatan enzyme hati pada pemeriksaan urine, namun demikian pada penderita Hepatit is C justru terkadang enzyme hati fluktuasi bahkan normal.
Sekilas membahas ulang tentang penyakit h epatitis yaitu peradangan pada sel-sel hati. Virus merupakan penyebab hepatitis yang paling sering, terutama virus hepatitis A, B, dan C. pada umumnya pend erita hepatitis A dapat sembuh, sebaliknya hepatitis B dan C menjadi kronis. Virus hepatitis D hanya dapat menyerang penderita yang telah terinfeksi virus hepatitis B dapat memperparah keadaan penderita.
Pemeriksaan laboratorium diperlukan untuk memastikan diagnosis hepatitis karena penderita hepatitis sering tidak bergejala atau gejala tidak khas. Berikut ini tahap-tahap pemeriksaan untuk hepatitis yag harus dilalui selain melihat dari sisi gejala-gejala yang tampak dari luar (Marzuki Suryaatmadja, 2010).
1. Pemeriksaan untuk hepatitis akut:
Enzim GOT, GPT
Penanda hepatitis C (Anti HCV, HCV RNA)
2. Pemeriksaan untuk hepatitis kronis:
Enzim GOT, GPT
Penanda hepatitis B (HbsAg, Hbe, Anti H Bc, Anti Hbe, HBV DNA) Penanda hepatitis C (Anti HCV, HCV RNA)
3. Penanda imunitas:
Anti HAV Anti HbsAg
4. Sirosis Hati
Sirosis hati adalah keadaan penyakit yang sudah lanjut dimana fungsi hati sudah sangat terganggu akibat banyaknya jaringan ikat didalam hati. Sirosis hati dapat terjadi karena virus Hepatitis B dan C yang berkelanjutan, karena alkohol, salah gizi, atau karena penyakit lain yang menyebabkan sumbatan saluran empedu. Sirosis tidak dapat disembuhkan, pengobatan dilakukan untuk mengobati komplikasi yang terjadi (seperti muntah dan berak darah, asites/perut membesar, mata kuning serta koma hepatikum).
Pemeriksaan untuk mendeteksi sirosis hati : Enzim GOT, GPT (rasio GOT/GPT>1), waktu Protombin, Protein Elektroforesis.
5. Kolestasis dan Jaundice
sirkulasi darah dan penumpukan pigmen empedu pada kulit, membran mukosa dan bola mata disebut jaundice. Pada keadaan ini kulit penderita terlihat kuning, warna urin menjadi gelap, sedangkan faeces lebih terang.
Pemeriksaan untuk kolestasis dan jaundice: Fosfatase Alkali, Gamma GT, Bilirubin Total, Bilirubin Direk.
6. Terapi Albumin pada Asites Refraktori
25
BAB III.
Desain Sistem
Pada bab ini diuraikan desain sistem yang akan dibuat untuk sistem diagnosa penyakit hepatitis menggunakan metode Naive Bayes sehingga menghasilkan akurasi yang optimal.
3.1 Data
Setiap tahun Rumah Sakit Panti Rapih menerima pasien yang mengidap penyakit hepatitis. Hepatitis itu sendiri merupakan peradangan pada sel-sel hati. Virus merupakan penyebab hepatitis yang paling sering, terutama virus hepatitis A, B, C, D dan E. Pada umumnya penderita hepatitis A & E dapat sembuh, sebaliknya hepatitis B & C dapat menjadi kronis. Dalam Tugas Akhir ini penulis membatasi pembahasan data h epatitis A, B dan C. Hati atau liver merupakan organ vital dalam tubuh manusia. Maka jika terjadi kerusakan dalam fungsi hati, akan menimbulkan penyakit pada hati s eperti hepatitis A, B dan C yang menjadi kerisauan masyarakat. Untuk pendeteksian dini penya kit ini pasien dapat dikaji dari gejala-gejala yang dialaminya, seperti menginputkan gejala otot, gejala perut, gejala kulit, gejala mata dan gejala mirip flu. Selain dari pada itu pada hasil rekam medis di rumah sakit Panti Rapih juga di simpan data hasi l laboratorium pasien yang periksa. Tetapi peneliti hanya membatasi 5 gejala diatas, tidak dilengkapi dengan data hasil laboratorium. S emua keterangan tentang status data pasien tersebut dikumpulkan dan didokumentasikan oleh pihak rekam medis.
diagnosa pasien yang bersangkutan. Untuk meneliti apakah ada keterkaitan antara data pasien dengan hasil dia gnosa akhir seorang pasien, akan dilakukan proses penambangan data. Penambangan data akan menemukan informasi/ pengetahuan yang mendeskripsikan pasien dengan data status pasien seperti apa yang memiliki hasil diagnosa akhir baik hepatitis A, B maupun C.
Data status pasien rawat inap di rumah sakit panti rapih ini yang digunakan adalah data pasien penyakit hepatitis A, B dan C tahun 2000 sampai dengan tahun 2010. (data seluruh pasien hepatitis terdapat pada halaman L1 sampai dengan L3. Contoh data dapat dilihat pada tabel 3.1 dibawah ini.
Tabel 3.1 Data Gejala Hepatitis
feature
Hepatitis No. Gejala Otot Gejala Perut Gejala Kulit Gejala Mata Gejala Mirip Flu
1 Pegal Muntah Normal Kuning Demam A
2 Pegal Diare Normal Kuning Pusing A
3 Pegal Kencing Berwarna gelap Normal Normal Demam A
4 Pegal Nafsu makan berkurang Kuning Normal Lesu A
5 Pegal Muntah Kuning Normal Mialgia A
6 Nyeri Sendi Mual Kuning Normal Lelah A
7 Pegal Mual Kuning Normal Demam A
8 Nyeri Sendi Muntah Kuning Normal Pusing A
9 Nyeri Sendi Nyeri Perut sebelah kanan Normal Normal Demam A
10 Nyeri Sendi Nyeri Perut sebelah kanan Kuning Normal Menggigil A
11 Nyeri Sendi Illeus obstructiva Kuning Kuning Pusing B
12 Pegal Diare Normal Kuning Menggigil B
13 Pegal Kencing Berwarna gelap Kuning Normal Lelah B
15 Nyeri Sendi Nafsu makan berkurang Normal Kuning Pusing B
16 Pegal Mual Kuning Kuning Pusing B
17 Nyeri Sendi Muntah Kuning Kuning Pusing B
18 Nyeri Sendi Nyeri Perut sebelah kanan Kuning Kuning Pusing B
19 Nyeri Sendi Kencing Berwarna gelap Kuning Kuning Demam B
20 Nyeri Sendi Nyeri Perut sebelah kanan Kuning Kuning Lelah B
21 Pegal Nafsu makan berkurang Normal Kuning Pusing B
22 Nyeri Sendi Nafsu makan berkurang Normal Kuning Mialgia B
23 Pegal Nyeri Perut sebelah kanan Kuning Kuning Pusing C
24 Pegal Nafsu makan berkurang Kuning Kuning Pusing C
25 Pegal Nyeri Perut sebelah kanan Normal Demam C
26 Nyeri Sendi Diare Kuning Kuning Lesu C
27 Pegal Mual Kuning Kuning Mialgia C
28 Pegal Kencing Berwarna gelap Kuning Kuning Menggigil C
29 Nyeri Sendi Haemotom esis Kuning Kuning Lelah C
Pada sistem klasifikasi hepatitis ini, digunakan metode five fold untuk membagi data menjadi 5 kelompok. Dimana 4 kelompok digunakan untuk data trainingsedangkan 1 kelompok yang lain digunakan untuk data testing.
Untuk penelitian ini, jumlah data yang digunakan sebanyak 130 sample, dimana terdiri dari:
a. 50sampleuntuk data hepatitis A
b. 50sampleuntuk data hepatitis B
c. 30sampleuntuk data hepatitis C
Dari hasil perhitungan diperoleh data pembagian sample untuk setiap kelompok.
Tabel 3.2 PembagianSample
Kelompok Hepatitis A Hepatitis B Hepatitis C
1 10sample 10sample 6sample
2 10sample 10sample 6sample
3 10sample 10sample 6sample
4 10sample 10sample 6sample
5 10sample 10sample 6sample
sample) digunakan untuk data training dan 1 kelompok (30 sample) digunakan untuk datatesting.
Tabel 3.3 Percobaan Hepatitis
Percobaan Training Testing 1 Kelompok 1,2,3,4 Kelompok 5
2 Kelompok 1,2,3,5 Kelompok 4
3 Kelompok 1,2,4,5 Kelompok 3
4 Kelompok 1,3,4,5 Kelompok 2
5 Kelompok 2,3,4,5 Kelompok 1
Pada tabel 3.3 ditunjukkan banyaknya percobaan yang akan dilakukan dan kelompok data yang digunakan sebagai data trainingdan datatesting. Jikasample kelompok 1, 2, 3, dan 4 digunakan untuk data training, makasamplekelompok 5 digunakan untuk data testing begitu seterusnya sesuai tabel 3.3. Percobaan hepatitis pada tabel 3.3 ini berlaku untuk hepatitis A, B dan C.
Contoh perhitungan Naive Bayes telah disediakan data sebagai berikut:
Tabel 3.4Samplehepatitis
Gejala Otot Gejala Perut Gejala Kulit Gejala Mata Gejala MiripFl u Hepatitis
Nyeri Sendi Diare Kuning Kuning Pusing ?
(Gejala Otot= nyeri sendi, Gejala Per ut= diare, Gejala Kulit=kuning, Gejala Mata=kuning, Gejala Mirip Flu= pusing)
vNB = arg max
vj
€
[hepatitis A, B, C ]P( vj)∏iP( a1| vj)Pengujian atau testing model, dilakukan dengan pengenalan data baru. Untuk mengenali suatu penyakit hepatitis apa yang diderita oleh pasien apakah hepatitis A, B atau C, sistem akan menghitung berapa probabilitas data ini dengan masing-masing model yang telah ada.
Tabel 3.5FeatureGejala Otot
Hep A Hep B Hep C
P (pegal | A )=6/10 P(pegal | B)=5/12 P (pegal | C )=5/8 P (nyeri sendi | A )=4/10 P(nyeri sendi | B)=7/12 P(nyeri sendi | C)=3/8
Tabel 3.6FeatureGejala Perut
Hep A Hep B Hep C P(illeus Obstructiva | A )
= 0
P(illeus Obstructiva | B) =1/12
P(illeus Obstructiva | C ) = 0
P (haematomesis | B ) =0 P (haematomesis | B ) =0 P (haematomesis | C )= 1/8
P (diare | A )=1/10 P(diare | B )=1/12 P(diare | C )=1/8
Tabel 3.7 FeatureGejala Kulit
Hep A Hep B Hep C
Tabel 3.8 Feature Gangguan Mata
Hep A Hep B Hep C
P (kuning | A ) = 2/10 P(kuning | B )=11/12 P (kuning | C ) =1 P (normal | A ) =8/10 P (normal | B )=1/12 P (normal | C) = 0
Tabel 3.9 Feature Gangguan Mirip Flu
Hep A Hep B Hep C
Tabel 3.10 Sampel Penyakit Hepatitis dengan nilai Probabilitas
Gejala Otot Gejala Perut Gejala Kulit
A B C A B C A B C
pegal 6 5 5 Muntah 3 1 0 Normal 4 4 0
nyeri sendi 4 7 3 Diare 1 1 1 Kuning 6 8 7
Kencing berwarna gelap 1 2 1
Nafsu makan berkurang 1 3 2
Mual 2 2 1
Nyeri Perut sebelah kanan 2 2 2
Illeus Obstructiva 0 1 0
Haemotom Esis 0 0 1
pegal 6/10 5/12 5/8 Muntah 3/10 1/12 0/8 Normal 4/10 4/12 0/8
nyeri sendi 4/10 7/12 3/8 Diare 1/10 1/12 1/8 Kuning 6/10 8/12 7/8
Kencing berwarna gelap 1/10 2/12 1/8 Nafsu makan berkurang 1/10 3/12 2/8
Mual 2/10 2/12 1/8
Nyeri Perut sebelah kanan 2/10 2/12 2/8 Illeus Obstructiva 0/10 1/12 0/8
Gejala Mata Gejala Mirip Flu Hepatitis
A B C A B C A B C
Normal 8 1 0 Demam 4 2 2 10 12 8
Kuning 6 11 8 Pusing 2 6 2
Lesu 1 0 1
Mialgia 1 1 1
Lelah 1 2 1
Menggigil 1 1 1
Normal 8/10 1/12 0/8 Demam 4/10 2/12 2/8 10/30 12/30 8/30
Kuning 6/10 11/12 8/8 Pusing 2/10 6/12 2/8
Lesu 1/10 0/12 1/8
Mialgia 1/10 1/12 1/8
Lelah 1/10 2/12 1/8
Menggigil 1/10 1/12 1/8
Tabel 3.11 Sampel Penyakit Hepatitis (2) Tabel Contoh:
Gejala Otot Gejala Perut Gejala Kulit Gejala Mata Gejala Mirip Flu Hepatitis
PROBABILITAS KEPUTUSAN HEPATITIS A: 10/30 = 1/3 HEPATITIS B: 12/30 = 2/5 HEPATITIS C: 8/30 = 4/15
X=(NYERI SENDI, DIARE, KUNING, KUNING, PUSING) MAKA:
diberikan nilai-nilai atribut. untuk soal diatas , probabilitasnya adalah sebagai berikut:
P total = 0,00032 + 0,00593 + 0,00273 = 0,00898
P Hepatitis A = (0,00032/0,00898) x 100% = 0,03563 x 100% = 3,563 % P Hepatitis B = (0,00593/0,00898) x 100% = 0,6603 x 100% = 66,03 % P Hepatitis B = (0,00273/0,00898) x 100% = 0,3040 x 100% = 3,04%
3.2 Desain Sistem
Gambar 3.1 Garis Besar Sistem Pengenalan
konversi menjadi nilai 0 sampai 1. Konversi dari sebuah file yang berbentuk teks menjadi nilai 0-1 ini disebut binerisasi. Hasil binerisasi adalah berupa vektor baris yang bernilai 0-1 untuk tiap elemennya. Sample yang telah direduksi dijadikan data masukan dalam tahap training dan testing dengan metode Naive Bayes, tahapan terakhir dalam sistem yang dibuat adalah pengenalan. Hasil pengenalan berupa diagnosa pasien mengid ap jenis penyakit hepatitis A, B atau C.
Pada sistem diagnosa penyakit hepatitis ini, digunakan metode five fold untuk membagi data menjadi 5 kelompok. Dimana 4 kelompok digunakan untuk datatrainingsedang 1 bagian yang lain digunakan untuk data testing.
3.3 Tahap Pelatihan(Training)
Gambar 3.2 Skema Tahap Pelatihan.
Sebanyak 120 data hasil ekstraksi feature digunakan untuk membentuk model hepatitis A. Dan Sebanyak 120 data hasil ekstraksi featuredigunakan untuk membentuk model hepatitis B. Sedangkan 72 sample. Dalam tahap ini penulis menggunakan 2 percobaan yaitu percobaan per gejala dan percobaan kombinasi gejala.
3.4 Tahap Pengujian(Testing)
Gambar 3.3 Skema Tahap Pengujian.
Dengan menggunakan 30 sample di hepatitis A, 30 sample di hepatitis B dan 12 sample di hepatitis C yang merupakan hasil ekstraksi sample dilakukan klasifikasi. Klasifikasi dilakukan dengan cara membandingkan model Naive Bayesianyang telah terbentuk pada tahap trainingdengan data testing. Dari tahap klasifikasi, dihasilkan hasil klasifikasi hepatitis yang berupa jumlah sample yang dapat dikenali dengan dari setiap kelompok hepatitis.
3.5 Penghitungan Akurasi
Karena menggunakan metode five fold dalam pembagian data, maka dilakukan 5 kali percobaan training dan testing. Hasil dari percobaan berupa confusion matrix. Confusion matrix menunjukkan data yang dikenali sesuai dengan kelompok data.
C. Dan untuk pengukuran tingkat akurasi menggunakan confusion matrix dengan tabel seperti dibawah ini:
Tabel 3.12Confusion Matrix
A B C
A X
B X
C X
Dari confusion matrix dihitung besar akurasi. Penghitun gan akurasi dilakukan untuk melihat seberapa optimal Naive Bayesian dalam mengenali gejala penyakit hepatitis baik A, B maupun C.
Evaluasi ketepatan confusion matrix di atas dilakukan dengan cara membandingkan output hasil identifikasi oleh sistem uji yang tersedia untuk data tersebut. Perhitungan jumlah persentase model yang dikenal secara tepat sebagai berikut:
data benar = jumlah angka pada diagonal matriks,
seluruh data= keseluruhan data yang digunakan untuk pengujian /testing
3.6 Desain User Interface
1. Tampilan Awal.
Gambar 3.4 Tampilan Awal.
Gambar 3.4 menunjukkan tampilan awal dar i aplikasi yang akan dibuat. Terdapat 4 menu utama. Terdiri atas menu bantuan, uji sistem, klasifikasi dan menu keluar dari aplikasi.
2. Halaman Bantuan
Pada gambar 3.5 menampilkan bantuan berupa langkah -langkah
penggunaan sistem. Untuk keluar dari halaman bantuan, tekan tombol ’Tutup’.
3. Halaman Pengujian Sistem
Gambar 3.6 Halaman Pengujian Sistem
Gambar 3.6 menunjukkan halaman pengujian sistem dia gnosa menggunakan Naive Bayes. Kotak pilih gejala terdiri 5 gejala yang terdiri atas gejala mata, mirip flu, otot, perut dan kulit. Dimana bisa dipilih lebih dari satu gejala yang dinamakan pengujian kombinasi gejala, atau juga bisa pilih per -gejala yang disebut pengujian per-gejala. Kemudian untuk mengetahui hasilnya tekan
tombol ‘PROSES’ maka pengujian per-gejala atau pengujian kombinasi gejala sesuai pilihan tadi dapat dijalankan. Kotak hasil menampilkan tahapan yang dilalui dalam pengujian yang terdiri atas confusion matrix dari proses pengujian, jumlah data yang benar dan nilai akurasi per -fold. Untuk keluar dari halaman
4. Halaman Klasifikasi Sistem
Gambar 3.7 Halaman Klasifikasi Sistem
Gambar 3.7 menunjukkan halaman klasifikasi. Terdapat 5 kotak gejala yang terdiri atas gejala otot, perut, kulit, mata dan mirip flu. Userdisini dapat memilih semua gejala masing-masingnya lebih dari satu, kemudian untuk mengetahui user menderita jenis penyakit hepatitis A, B, atau C, setelah menginputkan gejala
-gejala yang diderita maka selanjutnya tekan tombol ‘PROSES’ untuk mengetahui
hasilnya. Kotak hasil akurasi menampilkan prosentase nilai akurasi untuk masing-masing hepatitis, kemudian akan ditampilkan prosentase nilai akurasi yang tertinggi. Dengan demikian nilai akurasi yang tertinggi tersebut merupakan hasil jenis hepatitis yang diderita oleh user. Untuk keluar halaman klasifikasi tekan tombol‘TUTUP’.
Klasifikasi Penyakit Hepatitis Menggunakan Naive Bayes
Hepatitis A % Hepatitis B %Hepatitis C %
Hasil Akurasi Output
Hepatitis TUTUP
3.7 Spesifikasi Software dan Hardware
Spesifikasi software dan hardware yang digunakan dalam implementasi sistem diagnosa penyakit hepatitis menggunakan Naive Bayesian adalah sebagai berikut:
1. Software :
Sistem Operasi : Microsoft Widows 7 Home Premium 32 -bit Bahasa Pemrograman : Matlab R2010a
2. Hardware :
Processor : Intel(R) Core(TM) i3 CPU M370
@2.40GHz
Memory : 2 GB.
44
BAB IV.
Implementasi dan Analisa Hasil
Pada bab ini dibahas mengenai hasil penelitian dan analisis hasil penelitian dari implementasi sistem yang telah dibuat. Hasil penelitian yang terpenting berupa perbandingan akurasi yang diperoleh dari serangkaian pengujian yang telah dilakukan beberapa percobaan dengan metode Naive Bayesian yang telah disebutkan pada bab 3. Pada bab ini juga dibahas mengenai user interface yang dibangun berdasarkan algoritma yang telah dirancang.
4.1 Hasil Penelitian dan Analisa
Tabel 4.1 Deskripsi Data Gejala Hepatitis
No Gejala Keterangan(feature)
1. Otot Pegal, nyeri sendi, normal dan linu -linu
2. Perut Muntah, diare, kencing berwarna gelap, mual, nyeri perut sebelah kanan, nafsu makan berkurang dan perut
acites(perut membuncit)
3. Kulit Normal, kuning, lembab, gatal, kemerahan, kering 4. Mata Normal, kuning
5. Mirip Flu Demam, pusing, lesu, mialgia, lelah, menggigil, batuk
4.2 Perancangan Naive Bayes
Data mentah yang digunakan untuk pelatihan ini adalah data status pasien dan data hasil diagnosa akhir pasien hepatitis yang didapat dari Rekam Medis Rumah Sakit Panti Rapih. Data diberikan dalam bentuk manual, yaitu berupa map yang berisi lembaran data pasien, baik hasil pencatatan anamnesa/ gejala penyakit dan hasil laboratorium serta data diagnosa keperawatan yang mana pasien telah dirawat inap. Peneliti melakukan pencatatan data pasien dalam format ekstensi xls yang terdiri dari 10 sheet. Sheet pertama menampung data -data pasien hepatitis tahun 2010, sheet 2 sampai sheet 10 berturut -turut menampung data-data pasien hepatitis A, B dan C tahun 2009, 2008, 2007, 2006, 2005, 2004, 2003, 2002, 2001 dan 2000. Data pasien ters ebut terdiri dari feature gejala otot, gejala perut, gejala kulit , gejala kulit, gejala mata dan hasil diagnosa akhir.
Langkah-langkahPreprocessingyang dilakukan sebagai berikut:
1. Pembersihan Data
yang sebelumnya keseluruhan data terdapat 192 data, setelah dilakukan pembersihan data menjadi 130 data.
2. Integrasi Data
Pada langkah ini, dilakukan proses penggabungan data. Data mentah yang didapat disajikan secara terpisah untuk setiap hepatitis baik A, B dan C, begitu pula dilakukan pemisahan data untuk setiap gejala (otot, perut, kulit, mata dan mirip flu). Pada penelitian ini dilakukan 2 kali percobaan yang pertama pengenalan masing-masing gejala hepatitis dan kombinasi. Hal yang penting dilakukan pada pengenalan kombinasi yaitu penggabungan data mentah dari gejala satu dengan yang lainny a, misalkan penggabungan data gejala kulit dan gejala mata.
3. Seleksi Data
4. Transformasi Data
Pada langkah transfomasi data, data st atus pasien penyakit hepatitis rawat inap diklasifikasikan menjadi hepatitis A, hepatitis B dan h epatitis C. Data mentah hepatitis yang semula merupakan data berbentuk file teks terdiri gejala-gejala yang terdiagnosa berupa gejala otot, gejala perut, gejal a kulit, gejala mata dan gejala mirip flu, sebagaimana tertulis pada tabel 4.2. Gejala dari tiap pasien tersebut per gejalanya di konversi menjadi nilai 0 sampai 1. Konversi dari sebuah file yang berbentuk nominal (teks) menjadi nilai 0 -1 ini disebut binerisasi. Hasil binerisasi adalah berupa vektor baris yang bernilai 0-1 untuk tiap elemennya, setelah melewati proses transformasi data teks dikonversikan menjadi binerisasi dapat dilihat pada tabel 4.3 dibawah ini.
Tabel 4.2 Data Nominal Gejala Hepatitis
Feature
1 Pegal Muntah Normal Kuning Demam A
2 Pegal Diare Normal Kuning Pusing A
3 Pegal
Kencing Berwarna
gelap Normal Normal Demam A
4
Nyeri
Sendi Muntah Kuning Normal Pusing A
5
Nyeri Sendi
Nafsu makan
berkurang Normal Kuning Pusing B
6 Pegal Mual Kuning Kuning Pusing B
7
Nyeri
Pada tabel 4.3 dibawah ini menunjukkan data binerisasi gejala hepatitis yang berkaitan dengan tabel 4.2 diatas yang semula data asli yaitu data teks, seperti menyatakan seseorang yang di identifikasi hepatitis A, dengan gejala yang tampak yaitu gejala otot terdiagnosa pegal, gejala perut terdiagnosa muntah, gejala kulit terdiagnosa normal serta gejala mata terdiagnosa kuning dan yang terakhir gejala mirip flu terdiagnosa demam. Dengan melalui langkah transformasi seperti yang diuraikan pada langkah preprocessing diatas yaitu dengan mengkonversikan data teks menjadi binerisasi, maka bila dinyatak an
terdiagnosa nilainya dinyatakan ‘1’ sedangkan bila tidak terdiagnosa bernilai ‘0’
seperti yang dinyatakan pada tabel 4.3 berikut ini: 8
Nyeri Sendi
Nyeri Perut
sebelah kanan Kuning Kuning Pusing B
9 Pegal
Nyeri Perut
sebelah kanan Normal Kuning Demam C
10
Nyeri
Sendi Diare Kuning Kuning Lesu C
11 Pegal Mual Kuning Kuning Mialgia C
12 Pegal
Kencing Berwarna
Tabel 4.3 Data Binerisasi Gejala Hepatitis
4.3 Seleksi Atribut
Pada penelitian ini dilakukan seleksi data, karen a tidak semua data memenuhi kriteria menjadi data pasien hepatitis yang akurat. Dalam proses seleksi data ini terdapat dua macam percobaan seperti berikut ini:
a. Percobaan per-gejala
b. Percobaan Kombinasi Gejala (Penggabungan Gejala)
Pada percobaan ini merupakan proses pengenalan akan penyakit hepatitis berdasarkan gabungan beberapa gejala/feature hepatitis. Dalam menggabungan gejala dilakukan berdasarkan gejala dengan akurasi te rbaik yang ditunjukkan pada tabel akurasi percobaan kombinasi gejala. Yaitu akurasi tertinggi dimiliki oleh gabungan gejala dengan urutan pertama adalah mata dan yang kedua adalah gejala mirip flu, dan yang ketiga gejala otot, maka gejala mata, mirip flu dan otot dikombinasikan, kemudian dilakukan kembali proses pengenalan hepatitis ini seperti yang dilakukan dalam percobaan per-gejala, yaitu diurutkan dari prosentase tertinggi hingga rendah berdasarkan hasil akurasi dari percobaan kombinasi tersebut.
4.4 Hasil dan Akurasi
a. Grafik Akurasi
1. Percobaan per-gejala:
Tabel 4.4 Hasil Akurasi Percobaan per-gejala
No Attribut /feature Akurasi (%)
1. Perut 44,44%
2. Kulit 37,78%
3. Mirip Flu 35,56%
4. Otot 33,33%
5. Mata 16,67%
Pada gambar 4.1 menunjukkan grafik akurasi percobaan per -gejala hepatitis berdasarkan urutan data gejala dan prosentase hasil akurasi pada tabel 4. 4 hasil percobaan per-gejala.
Gambar 4.1 Grafik Akurasi Percobaan per -gejala Hepatitis
b. Confusion MatriksGejala Mata
diatas. Padaconfusion matrixdiketahui setiap kolom dari matriks mewakili gejala hepatitis yang dikenal, sedangkan baris mewakili klasifikasi yang diberikan oleh systemuntuk setiap hepatitis.
Tabel 4.5Confusion Matrix Gejala Perut
A B C
A 26 4 0
B 25 5 0
C 17 4 9
c. Analisis
Dalam proses pengenalan hepatitis A, B dan C, dilakukan 2 percobaan yang terdiri dari percobaan pergejala dan percobaan kombinasi gejala, yang masing -masingnya pertama diberlakukan langkah -langkah preprosesing dengan menggunakan metode Naive Bayes dan diharapkan memperoleh akurasi yang terbaik.
ditunjukkan hasil pengenalan terbaik terdapat pada pengenalan hepatitis A, 26 data A dikenal sebagai hepatitis A, sedangkan pengenalan terburuk terdap at pada pengenalan hepatitis B dan C, karena hanya 5 data B dikenal sebagai hepatitis B, begitu pula untuk 9 data C yang dikenal sebagai hepatitis C.
2. Percobaan Kombinasi gejala
Pada tabel 4.8 menunjukkan hasil percobaan kombinasi gejala yang didalamnya terdiri urutan percobaan kombinasi gejala /feature hepatitis beserta hasil prosentase akurasi dari pengenalan penyakit hepatitis . Sehingga berdasarkan tabel 4.6 ini diperoleh gejala/feature yang paling berpengaruh dalam pengenalan penyakit hepatitis, sehi ngga dapat diperoleh prosentase hasil akurasi yang terbaik pada kombinasi gejala mata, mirip flu dan otot.
Tabel 4.6 Hasil Akurasi Percobaan kombinasi gejala
Attribut /feature Keterangan Attribut /feature Akurasi (%)
1. Perut, Kulit & Otot 51,11%
2. Perut, Otot, Mirip Flu & Mata 48,89% 3. Perut, Kulit, Mirip Flu & Mata 47,78%
4. Perut, Mirip Flu & Otot 46,67%
a. Grafik Akurasi
Pada gambar 4.2 menunjukkan grafik akurasi percobaan kombinasi gejala hepatitis berdasarkan urutan data kombinasi gejala dan prosentase hasil akurasi pada tabel 4.8 hasil percobaan kombinasi gejala.
Gambar 4.2 Grafik Akurasi Percobaan Kombinasi Gejala Hepatitis
b. Confusion Matrikskombinasi gejala otot,perut dan kulit
Tabel 4.7Confusion MatrixKombinasi Gejala
A B C
A 29 1 0
B 18 7 5
C 14 6 10
c. Analisis
Pada tabel 4.7 diatas ditunjukkan hasil pe rcobaan pengenalan hepatitis A, B dan C menggunakan Naive Bayes. Dari hasil percobaan kombinasi gejala yang telah dilakukan, maka akurasi yang terbaik diperoleh pada percobaan pengenalan gejala perut, kulit dan otot sebesar 51,11%. Nilai akurasi yang diperoleh dari percobaan kombinasi gejala yang mencakup kombinasi gejala pertama yaitu gejala mata, mirip flu dan otot, yang kedua kombinasi gejala perut, otot, mirip flu dan mata, yang ketiga kombinasi gejala perut, kulit, mirip flu, dan mata, yang keempat kombinasi gejala perut, mirip flu dan otot, yang kelima kombinasi gejala perut, kulit dan mata. Masing-masing nilai akurasi diurutkan dari prosentase hasil akurasi tertinggi sampai rendah. Pada tabel 4.7 ini ditunjukkan hasil pengenalan terbaik terdapat pada pengenalan hepatitis A, 29 data A dikenal sebagai hepatitis A, sedangkan pengenalan terburuk terdapat pada pengenalan hepatitis B dan C, karena hanya 7 data B dikenal sebagai hepatitis B, begitu pula untuk 10 data C yang dikenal sebagai hepatitis C.
atribut untuk tahap pengenalan penyakit hepatitis menggunakan Naive Bayes, yang perlu diperhatikan mungkin untu k penambahan feature hasil laboratorium seorang pasien penyakit hepatitis, yang mencakup hasil tes darah yang terdiri atas bilirubin, SGOT dan albumin.
4.5 Implementasi User Interface
Implementasi sistem diagnosa penyakit hepatitis dengan menggunakan Naive Bayesian ini dibangun dengan menggunakan program matlab R2010. Source code program terdapat pada halaman Lampiran.
4.5.1 Menu Utama
Gambar 4.3 Menu Utama.
1. Bantuan
Menu bantuan fungsinya untuk penuntun langkah bagi pengguna yang hendak menjalankan aplikasi ini. Didalam menu bantuan terdiri langkah untuk menjalankan operasi Uji Sistem dan operasi Klasifikasi.
2. Uji Sistem
Menu pilihan uji sistem digunakan untuk menampilkan halaman Pengujian Sistem Diagnosa Penyakit Hepatitis dengan menggunakan Naive Bayesian. 3. Klasifikasi
Menu pilihan klasifikasi digunakan untuk s i pengguna bila ingin mengetahui menderita penyakit hepatitis berjenis A, B atau C, dengan cara menginputkan gejala-gejala hepatitis terlebih dahulu.
4. Keluar
4.5.2 Bantuan
Gambar 4.4 Halaman Bantuan
Pada gambar 4.4 ditunjukkan halaman bantuan yang berisi petunjuk penggunaan sistem, yang terdiri atas petunjuk menjalankan sistem baik dengan tahap pengujian maupun tahap klasifikasi sistem diagnosa penyakit hepatitis dengan menggunakan metode Naive Bayes.
4.5.3 Uji Sistem
Pada gambar 4.5 ditunjukkan halaman pengujian sistem diagnosa penyakit hepatitis dengan menggunakan metode Naive Bayesian. Jumlah keseluruhan data adalah 50 data hepatitis A, 50 data hepatitis B dan 30 data hepatitis C. 50 data dari hepatitis A dan B dibagi menjadi 2 bagian, 10 data digunakan untuk data testing sedangkan 40 sisa data digunakan untuk data training, begitu juga 30 data hepatitis C dibagi menjadi 2 bagian, 6 data digunakan untuk data testingsedang 24 sisa data digunakan untuk data training.
Tombol proses digunakan un tuk memulai proses training. Pada layar hasil ditampilkan 5 hasil tahapan trainingkarena sistem menggunakan metode five-fold dalam pembagian data. Oleh karena itu ditampilkan jugaconfusion matrix dari ke-5 fold tersebut, kemudian disertai jumlah data benar yang dikenali oleh sistem dan hasil prosentase dari jumlah data benar tersebut. Dan yang terakhir ditampilkan juga untuk hasil total yang ditunjukkan hasil total data benar beserta prosentase data benar secara keseluruhan . Jika pengguna atau user belum memilih gejala
yang ada kemudian menekan tombol ‘ Proses’ maka akan tampil dialog error
seperti yang ditunjukkan pada gambar 4. 6 dibawah ini. Untuk melanjutkan proses dan memilih gejala dapat dilakukan dengan menekan tombol ‘OK‘.
Untuk keluar dari halaman pengenalan sistem diagnosa hepatitis digunakan
tombol ‘TUTUP’.
4.5.4 Klasifikasi
Gambar 4.7 Halaman Klasifikasi Sistem
Pada gambar 4.7 ditunjukkan halaman klasifikasi sistem diagnosa penyakit hepatitis dengan menggunakan metode Naive Bayesian. Di halaman iniuserdapat memasukkan data gejala sesuai dengan yang sedang dialami, gejala dapat dipilih lebih dari satu dari masing-masing gejala, baik gejala ot ot, perut, kulit, mata dan mirip flu, olehkarena itu penulis menggunakan checkbox agar sub gejala dapat
dipilih lebih dari satu. Setelah sudah memilih gejala, tekan tombol ‘PROSES’
pada Hasil Akurasi yang menampilkan prosentase masing -masing hepatitis baik hepatitis A,B dan C, untuk hasil akhir akan ditampilkan pada layar ‘OUTPUT’
yang akan menampilkan jenis hepatitis yang dimiliki oleh pasien tersebut, ini berdasarkan nilai prosentase tertinggi dari ketiga hepatitis yang sudah ditampilkan nilainya setelah program dijalankan. Jika user belum memasukkan atau memilih gejala kemudian menekan tombol ‘Proses’ maka akan ditampilkan informasi yag menyatakan “Selamat Anda Tidak Terdeteksi Hepatitis”, seperti dinyatakan pada
gambar 4.8 dibawah ini.
Untuk keluar dari halaman pengenalan sistem dia gnosa hepatitis digunakan
tombol ‘TUTUP’.
63
Bab V.
Penutup
5.1 Kesimpulan
Penerapan algoritma Naive Bayesian telah digunakan untuk mengklasifikasikan hepatitis A, B dan C berdasarkan data gejala - gejala yang mendeteksi pasien mengidap penyakit hepatitis. Berdasarkan hasil 2 percobaan dapat ditarik kesimpulan sebagai berikut
1. Pengujian dilakukan pada data 130 sample dengan menggunakan metode k-fold cross validation khususnya fivefold cross validation. Dilakukan 2 percobaan dengan hasil sebagai berikut
percobaan per-gejala yang dipilih berdasarkan akurasi tertinggi yaitu gejala perut menghasilkan tingkat keakuratan sebesar 44,44%
percobaan kombinasi gejala nilai akurasi mencapai 5 1,11, akurasi tersebut merupakan hasil akurasi pengujian kombinasi gejala perut, kulit dan otot.
5.2 Saran
Saran yang diperlukan untuk perbaikan dan pengembangan program lebih lanjut adalah:
1. Untuk meningkatkan akurasi, dapat ditambahkan feature/ atribut hasil laboratorium yang mendeteksi masing -masing pasien penyakit hepatitis baik A, B dan C, ini dilakukan saat penelitian dan pengambilan data di Rekam Medis Rumah Sakit yang bersangkutan.
2. Program bisa menerima masukan tambahan gejala/ feature dari pengguna. 3. Program bisa menampilkan informasi cara pencegahan dan pengobatan
DAFTAR PUSTAKA
Away, Gunaidi Abdia, (2006), The Shortcut Of MATLAB Programming,Informatika Bandung, Bandung.
J.Han dan M. Kamber, (2006), Data Mining Concept and Techniquies, Second Edition, Morgan Kaufman Publishers, San Francisco, USA.
Kantardzic Mehmed,(2003), Data Mining -Concept, Models, and Algorithms. New Jersey: Penerbit IEEE.
Santosa, Budi, (2007), Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis, Graha Ilmu, Yogyakarta,5 ,75-86.
Suryaatmadja, Marzuki, Diagnosis Laboratorium Hepatitis Virus dengan Penanda Virus Hepatitis.
http://[email protected]. Diakses tanggal 28 November 2011
Tabel 3.12 Gejala Hepatitis A
Mata Gejala Mirip Flu Hepatitis
normal
muntah,mual,
npsk,nmb normal kuning demam,batuk A
normal
muntah,mual,
nmb normal normal demam,pusing batuk A
normal
muntah,mual,
npsk,nmb kering kuning demam,pusing A
normal
muntah,mual,
npsk,nmb kuning kuning lesu,batuk A
nyeri sendi
muntah,mual,
npsk,nmb normal normal pusing A
normal
kbg,mual,npsk
,nmb normal normal demam A
normal
M l,npsk
,nmb normal normal demam,pusing,batuk A
normal mual,npsk kuning kuning demam A
normal
mual,npsk,
nmb kuning normal pusing,lesu A
normal mual,nmb normal normal pusing,lesu,lelah A
normal
mual kuning kuning pusing,batuk A
normal
mual,npsk,
nmb kuning kuning demam,pusing A
nyeri sendi
muntah,diare,
nmb normal normal demam,batuk A
normal
muntah,mual,
nmb normal normal demam,lesu A
normal mual kuning kuning pusing A
normal
muntah,mual,
nmb normal normal demam,pusing A
normal
muntah,mual,
nmb kuning kuning demam,pusing,lesu A
normal mual normal kuning lesu A
nyeri
sendi diare,mual normal normal demam,pusing,lesu A
normal muntah,diare normal kuning demam,batuk A
normal
muntah,diare,
kbg,mual normal normal pusing, lesu,batuk A normal
muntah,kbg,