Pada Bab ini berisi kesimpulan-kesimpulan yang merupakan rangkaian dari hasil analisis kinerja pada bab sebelumnya dan saran untuk pengembangan lebih lanjut pada penelitian tugas akhir ini
8
BAB II. LANDASAN TEORI
Pada bab ini akan dibahas mengenai teori -teori yang digunakan untuk mendukung penulisan tugas akhir sistem diagnosa penyakit hepatitis dengan metode Naive Bayesian classification. Teori-teori yang akan dibahas mencakup pengertian dasar data mining, metode Naive Bayesian Classification, dan pengertian hepatitis serta jenis -jenisnya yang mencakup hepatitis A, B dan C.
2.1 Data Mining
Data Mining yang merupakan bagian dari Knowledge Discovery in Databases (KDD), adalah kegiatan yang meliputi pengumpulan, pemak aian data historis untuk menemukan keteraturan, pola atau hubungan dalam sekumpulan data berukuran besar (Budi Santosa, 2006).
Penambangan data (data mining) didefinisikan sebagai proses pengambilan atau menambang informasi/pengetahuan dari sekumpulan data dengan jumlah yang sangat besar. Secara fungsional, penambangan data adalah proses dari pengumpulan informasi penting dari sejumlah data yang besar yang tersimpan di basis data, gudang data, atau tempat penyimpanan informasi lainnya (Han&Kamber, 2006).
Secara sederhana, penambangan data merupakan langkah-langkah dalam menemukan pengetahuan (Han&Kamber, 2006). Proses KDD itu akan ditunjukkan pada gambar 2.1 dan terdiri dari urutan -urutan sebagai berikut :
Gambar 2.1 Langkah Penambangan Data(Data Mining)
Menurut : Han&Kamber(2006)
1. Pembersihan Data (data cleaning)
Pada langkah ini noise dan data yang tidak konsisten akan dihapus. Langkah pertama yang dilakukan dalam proses pembersihan data (data cleaningatau disebut juga data cleansing) adalah deteksi ketidakcocokan.
Ketidakcocokan tersebut dapat disebabkan oleh beberapa faktor antara lain gejala masukan data yang kurang lengkap sehingga menyebabkan munculnya kesalahan, yang mana petugas rumah sakit kurang memperhatikan kelengkapan dalam memasukkan data pasien.
2. Integrasi data(data integration)
Pada langkah ini akan dilakukan penggabungan data. Data dari bermacam -macam tempat penyimpanan data akan digabungkan ke dalam satu tempat penyimpanan data yang sesuai. Saat melakukan integrasi data, hal yang perlu dipertimbangkan secara khusus adalah masalah struktur data. Struktur data yang perlu diperhatikan ketika mencocokkan atribut dari satu gejala ke gejala data lain.
3. Seleksi data (data selection)
Data yang relevan akan diambil dari bas is data untuk dianalisis. Pada langkah ini akan dilakukan analisis korelasi untuk analisis gejala. Atribut -atribut data akan dicek apakah relevan untuk dilakukan penambangan data. Atribut yang tidak relevan tersebut tidak akan digunakan. Atribut yang diharapkan adalah atribut yang bersifat independen. Artinya, antara atribut satu dengan atribut yang lain tidak saling mempengaruhi.
4. Transformasi data (data transformation)
Data ditransformasikan ke dalam bentuk yang tepat untuk ditambang. Yang termasuk dalam langkah transformasi data adalah penghalusan (smooting) yaitu menghilangkan noise yang ada pada data, pengumpulan (aggregation) yaitu mengaplikasikan kesimpulan pada data, generalisasi
(generalization) yaitu mengganti data level r endah menjadi data level tinggi, (normalization) yaitu mengemas data atribut ke d alam skala kecil. Dan konstruksi atribut (attribute construction/feature construction) yaitu mengkonstruksi dan menambahkan atribut baru untuk membantu proses penambangan. Selanjutnya dilakukan binerisa si yaitu mengkonversi dari sebuah file yang berbentuk teks menjadi nilai 0 -1. Hasil binerisasi adalah berupa vektor baris yang bernilai 0 -1 untuk tiap elemennya.
5. Penambangan data (data mining)
Langkah ini adalah langkah yang penting di mana akan di aplikas ikan metode yang tepat untuk mengekstrak pola data.
6. Evaluasi pola (pattern evaluation)
Langkah ini berguna untuk mengidentifikasi pola yang benar dan menarik. Pola tersebut akan direpresentasikan dalam bentuk pengetahuan berdasarkan beberapa pengukuran yan g penting.
7. Presentasi pengetahuan(knowledge presentation)
Pada langkah ini informasi yang sudah ditambang akan divisualisasikan dan direpresentasikan kepada pengguna.
Pada langkah 1 sampai dengan langkah 4 merupakan langkah praproses data (preprocessing) di mana data akan disiapkan terlebih dahulu sel anjutnya dilakukan penambangan. Sebagai catatan, dalam urutan pro ses diatas, penambangan data hanya terdapat satu langkah. Meskipun penambangan data hanya terdapat dalam satu langkah, penambangan data merupakan langkah yang penting karena bisa menemukan pola tersembuny i yang nantinya akan dievaluasi.
Secara umum penambangan data adalah sekumpulan aktifitas yang dilakukan untuk menggali pengetahuan dari sekumpulan data agar didapatkan model yang berarti (Jiawei Han dan Micheline Kamber, 2006). Dua tujuan utama yang diperoleh dari penambangan data yaitu menjelaskan (description) dan memprediksi (prediction). Oleh karena itu ada kemungkinan aktifitas penambangan data diarahkan ke dalam salah satu dari dua kategori berikut: a. Data mining yang bersifat prediksi menghasilkan pemodelan dari sistem
yang diuraikan oleh keadaan data.
b. Data mining yang bersifat deskripsi menghasilkan informasi yang baru dan bersifat penting berdasarkan pada data yang tersedia.
Tujuan-tujuan tersebut dapat tercapai dengan penggunaan teknik data mining. Berdasarkan tugas data mining, metode -metode yang biasa dipakai terdiri atas:
a. Classification adalah proses penemuan model yang bersifat prediksi dan menggolongkan data itemke dalam beberapa kelas yang sudah dikenal. b. Regression adalah proses penemuan model yang bersifat prediksi dan
mampu memetakan data item dengan sebuah angka nyata (real value) dari nilai variabel ramalan.
c. Clustering adalah suatu tugas deskriptif umum yang dipakai orang untuk mencari serta mengidentifikasi suatu himpunan yang terbatas untuk cluster kategorial sehingga dapat menguraikan data.
d. Summarization adalah suatu tugas deskriptif tambahan yang melibatkan metode untuk penemuan sebuah uraian ringkas dari keseluruhan atau sebagian data.
e. Dependecy Modeling adalah menemukan perubahan dan penyimpangan yang paling penting dalam data.
2.2 Metode Naïve Bayesian Classification 2.2.1 Teorema Bayes
Teorema Bayesian mengungkapkan bahwa hasil probabilitas posterior sebanding dengan hasil perkalian antara likelihood dengan probabilitas prior. Probabilitas posterior adalah probabilitas bersyarat dari sebuah hipotesis jika diberikan data. Likelihood adalah probabilitas bersyarat dari sebuah data jika diberikan hipotesis. Probabilitas prior adalah prob abilitas bahwa hipotesis itu benar sebelum data terlihat. Pada saat klasifikasi, pendekatan Bayes akan menghasilkan label kategori yang paling tinggi probabilitasnya (vMAP) dengan masukan atribut (a1,a2, …. ,an),(Budi Santosa, 2006).
vMAP = arg maxvj€V P(vj| a1,a2, …. ,an) (2.1) Teorema Bayes menyatakan :
) ( ) ( ) | ( ) | ( D P h P h D P D h P (2.2)
atau dengan kata lain persamaan diatas dapat digambarkan sebagai:
Posterior= (2.3)
Dadalah himpunan training data. hadalah hipotesis.
P(h | D)adalahposterior probability, Contoh : kondisi kemungkinan dari hipotesishsetelah training data (evidence) muncul.
P(h)adalahprior probabilitydari hipotesish. Kuantitas non-klassikal ini sering ditemukan dengan melihat data dari masa lampau (atau dalam training data).
P(D)adalahprior probability dari training data D. Kuantitas ini sering berupa nilai yang konstan, P(D)P(D|h)P(h)P(D|h)P(h), dimana dapat dikomputasi dengan mudah ketika kita menemukan bahwa
) | (h D
P dan P(h|D) adalah 1.
P(D|h)adalah probabilitas dari Dyang berasal dari hipotesis h, dan biasa disebut denganlikelihood. Kuantitas ini mudah untuk dihitung selama memberikan nilai 1 ketikaDdanhkonsisten, dan memberikan nilai 0 ketika tidak konsisten.
Bayesian Theorem adalah metode classifier yang berdasarkan probabilitas dan Teorema Bayesian dengan asumsi bahwa setiap variabel bersifat bebas (independence). Dengan kata lain, Naïve Bayesian Classifier mengansumsikan bahwa keberadaan sebuah feature(atribut) tidak ada kaitannya dengan keberadaan feature(atribut) yang lain.
menggunakan teorema Bayes ini, persamaan (2.1) ini dapat ditulis:
vMAP = arg maxvj€V= (2.4)
P(a1,a2,….an) nilainya konstan untuk semua vj sehingga persamaan ini dapat ditulis sebagai berikut:
vMAP = arg maxvj€V P(a1,a2, …. ,an| vj) P(vj) (2.5)
Naïve Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secaraconditional saling bebas jika diberikan nilai output. Atau dengan kata lain. diberikan nilai output, probabilitas mengamati secara bersama adalah produk dari probabilitas individu atau P( a1, a2, a3, …,an | vj) = ∏iP( a1| vj). memasukan persamaan ini akan didapat perdekatan yang dipakai dalam klasifier N aïve Bayes (Budi Santosa, 2007).
P(a1,a2, …. ,an| vj) =∏iP( a1| vj) (2.6) substitusi persamaan ini dengan persa maan 2.5 akan menghasilkan: vMAP= arg maxvj€V P( vj)∏iP( a1| vj) (2.7) akurasi dihitung dengan cara:
Akurasi = x 100% (2.8)
2.2.2 Naive Bayesian
Dengan asumsi Naive Bayesian dimana a tribut– atribut dari training data dianggap terpisah dan independen maka rumus 2.1 berubah menjadi seperti dibawah ini. ) ( ) ( ) | ( )... | ( ) | ( ) | ( 1 2 D P h P h D P h D P h D P D h P n (2.9)
Dadalah himpunan training data hadalah hipotesis
P(h | D) adalah probabilitas dari hipotesis h setelah evidence D muncul atau sering disebutposterior probability.
P(h) adalah probabilitas dari hipotesis h sebelum evidence D muncul atau sering disebutprior probability.
P(D) adalah probabilitas dari evidenceD, dimana P(D) bernilaiirrelevantatau sama dengan kelas yang lain.
P(D1|h), P(D2|h),P(Dn|h) adalah probabilitas dari setiap D1,D2,Dn untuk hipotesishbiasa disebut dengan likelihood.
Oleh karena P(D) bernilai irrelevant maka hanya persamaan
)
(
)
|
(
)...
|
(
)
|
(
)
|
(h D PD
1hPD
2H PD hPD
P
n yang perlu digunakan untuk mencarisuatu peluang.
Jika ada P(Dn|h) yang memiliki nilai = 0, maka P(h | D) = 0. Untuk mencegah hal itu maka dilakukan penambahan nilai 1 ke setiap evidence dalam perhitungan sehingga probabilitas tidak akan bernilai 0. Langkah ini sering disebutLaplace Estimator.
Jika dalam memprediksi ada evidencepadatest datayang tidak diketahui, maka atribut itu tidak perlu dimasukan dalam proses perhitungan prediksi.
2.2.3 Naive Bayes Algorithm(Classification)
Classification adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu
sendiri bisa berupa aturan “jika-maka”. Dalam teknik classification terdapat beberapa algoritma yang bisa digunakan antara lain Decision Tree, Naive Bayes, Adaptive Naive Bayes,Logistic RegressiondanSupport Vector Machine.
Bayesian Classificationdidasarkan pada Teorema Bayesian. Konsep dasar teori bayes itu pada dasarnya adalah peluang bersyarat P(H|X). Dimana dalam Bayesian H adalah posterior dan X adalah prior. Prior adalah pengetahuan tentang karakteristik suatu atribut (bisa diartikan sebagai pengalaman di masa lalu atas suatu atribut atau juga bisa berdasarka n teori), sedangkan posterior adalah karakteristik yang akan kita duga pada kejadian yang akan datang. Teorema Bayesian berguna untuk melakukan kalkulasi probabilitas posterior, P(H|X), dari P(H), dan P(X) dan P(X|H). Teori Bayes adalah sebagai berikut:
P(H|X)= (2.10)
Proses classification biasanya dibagi menjadi dua fase: learning dan test. Padafase learning, sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraa n. Kemudian pada fase test model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi kelas data yang belum diketahui.
Gambar 2.2 Ilustrasi Pemodelan teknik Classification untuk mengukur akurasi
2.3 K-fold Cross Validation
Cross Validation adalah salah satu metode yang bisa digunakan untuk mengukur kinerja dari sebuah model prediktif. Dalam k-fold Cross Validation,data akan dipartisi secara acak ke dalam k partisi, D1, D2, …Dk, masing-masing D mempunyai jumlah yang sama. Pada iterasi ke – i partisi Di digunakan sebagai data uji, sedangkan sisa partisi digunakan sebagai data pelatihan. Maka dari itu pada iterasi pertama, D1 digunakan sebagai data uji dan D2, D3, ….Dkdigunakan sebagai data pelatihan. Pada iterasi kedua, D2digunakan sebagai data uji, sedangakanD1, D3, ….Dkdigunakan sebagai data pelatihan. Pada iterasi ketiga, D3digunakan sebagai data uji, sedangkan D1, D2, …Dk digunakan sebagai data pelatihan dan seterusnya. Setiap sample D, hanya digunakan sekali sebagai data uji dan berkali-kali sebagai data pelatihan (Han&Kamber, 2006).
2.4 Penyakit Hepatitis
Penyakit hepatitis adalah penyak it yang disebabkan oleh beberapa jenis virus yang menyerang dan menyebabkan peradangan serta merusak sel -sel organ hati manusia. Hepatitis dikategorikan dalam beberapa golongan, diantaranya hepatitis A, B, C, D, E, F dan G. di Indonesia penderita penyakit Hepatitis umumnya cenderung lebih banyak mengalami golongan hepatitis B dan hepatitis C. Namun dalam Tugas Akhir ini penulis hanya membahas pada fokus penyakit Hepatitis A, B, dan C.
Istilah "Hepatitis" dipakai untuk semua jenis peradangan pada hati (liv er). Penyebabnya dapat berbagai macam, mulai dari virus sampai dengan obat -obatan,
termasuk obat tradisional. Virus hepatitis juga ada beberapa jenis, hepatitis A, hepatitis B, C, D, E, F dan G. Manifestasi penyakit hepatitis akibat virus bisa akut (hepatitis A) dapat pula hepatitis kronik ( hepatitis B, C) dan adapula yang kemudian menjadi kanker hati (Marzuki Suryaatmadja, 2010).
Penyakit hepatitis yang diambil oleh penulis terdiri atas hepatitis A, B dan C. Untuk lebih jelasnya diuraikan sebagai berikut:
1. Penyakit Hepatitis A
Hepatitis A adalah golongan penyakit Hepatitis yang ringan dan jarang sekali menyebabkan kematian, Virus hepatitis A (VHA=Virus Hepatitis A) penyebarannya melalui kotoran/tinja penderita yang penularannya melalui makanan dan minuman yang terkomtaminasi, bukan melalui aktivitas se ksual atau melalui darah. Penyakit Hepatitis A memiliki masa inkubasi 2 sampai 6 minggu sejak penularan terjadi, barulah kemudian penderita menunjukkan beberapa tanda dan gejala terserang penyakit Hepatitis A.
Untuk gejala penyakit Hepatitis A diantaranya yaitu pada minggu pertama, individu yang dijangkiiti akan mengalami sakit seperti kuning, keletihan, demam, hilang selera makan, muntah -muntah, pusing dan kencing yang berwarna hitam pekat. Demam yang terjadi adalah demam yang terus menerus, tidak seperti demam yang lainnya yaitu demam berdarah, TBC, thpyus, dll . 2. Penyakit Hepatitis B
Hepatitis B merupakan salah satu penyakit menular yang tergolong berbahaya didunia, Penyakit ini disebabkan oleh Virus Hepatit is B (VHB) yang
menyerang hati dan menyebabkan peradangan hati akut atau menahun. Seperti hal Hepatitis C, kedua penyakit ini dapat menjadi kronis dan akhirnya menjadi kanker hati. Proses penularan Hepatitis B yaitu melalui pertukaran cairan tubuh atau kontak dengan darah dari orang yang terinfeksi Hepatitis B.
Adapun beberapa hal yang menjadi pola penularan antara lain penularan dari ibu ke bayi saat melahirkan, hubungan seksual, transfusi darah, jarum suntik, maupun penggunaan alat kebersihan diri (sikat gigi, handuk) secara bersama-sama. Hepatitis B dapat menyerang siapa saja, akan tetapi umumnya bagi mereka yang berusia produktif akan lebih beresiko terkena penyakit ini.
Untuk gejala penyakit Hepatitis B Secara khusus tanda dan gejala terserangnya hepatitis B yang akut adalah demam, sakit perut dan kuning (terutama pada area mata yang putih/sklera). Namun bagi penderita hepatitis B kronik akan cenderung tidak tampak tanda -tanda tersebut, sehingga penularan kepada orang lain menjadi lebih beresiko.
3. Penyakit Hepatitis C
Penyakit Hepatitis C adalah penyakit hati yang disebabkan oleh virus Hepatitis C (VHC). Proses penularannya melalui kontak darah seperti contoh transfusi, jarum suntik (terkontaminasi) . Penderita Hepatitis C kadang tidak menampakkan gejala yang jelas, akan tetapi pada penderita Hepatitis C kronik menyebabkan kerusakan/kematian sel -sel hati dan terdeteksi sebagai kanker (cancer) hati. Sejumlah 85% dari kasus, infeksi Hepatitis C menjadi kronis dan secara perlahan merusak hati bertahun -tahun.
Untuk gejala penyakit Hepatitis C diantaranya yaitu penderita Hepatitis C sering kali orang yang menderita Hepatitis C tidak menunjukkan gejala, walaupun infeksi telah terjadi bertahun -tahun lamanya. Namun beberapa gejala yang samar diantaranya adalah ; lelah, hilang selera makan, sakit perut, urin menjadi gelap dan kulit atau mata menjadi kuning yang disebut "jaundice" (jarang terjadi). Pada beberapa kasus dapat ditemukan peningkatan enzyme hati pada pemeriksaan urine, namun demikian pada penderita Hepatit is C justru terkadang enzyme hati fluktuasi bahkan normal.
Sekilas membahas ulang tentang penyakit h epatitis yaitu peradangan pada sel-sel hati. Virus merupakan penyebab hepatitis yang paling sering, terutama virus hepatitis A, B, dan C. pada umumnya pend erita hepatitis A dapat sembuh, sebaliknya hepatitis B dan C menjadi kronis. Virus hepatitis D hanya dapat menyerang penderita yang telah terinfeksi virus hepatitis B dapat memperparah keadaan penderita.
Pemeriksaan laboratorium diperlukan untuk memastikan diagnosis hepatitis karena penderita hepatitis sering tidak bergejala atau gejala tidak khas. Berikut ini tahap-tahap pemeriksaan untuk hepatitis yag harus dilalui selain melihat dari sisi gejala-gejala yang tampak dari luar (Marzuki Suryaatmadja, 2010).
1. Pemeriksaan untuk hepatitis akut:
Enzim GOT, GPT
Penanda hepatitis A (Anti HAV IgM)
Penanda hepatitis C (Anti HCV, HCV RNA) 2. Pemeriksaan untuk hepatitis kronis:
Enzim GOT, GPT
Penanda hepatitis B (HbsAg, Hbe, Anti H Bc, Anti Hbe, HBV DNA)
Penanda hepatitis C (Anti HCV, HCV RNA) 3. Penanda imunitas:
Anti HAV
Anti HbsAg 4. Sirosis Hati
Sirosis hati adalah keadaan penyakit yang sudah lanjut dimana fungsi hati sudah sangat terganggu akibat banyaknya jaringan ikat didalam hati. Sirosis hati dapat terjadi karena virus Hepatitis B dan C yang berkelanjutan, karena alkohol, salah gizi, atau karena penyakit lain yang menyebabkan sumbatan saluran empedu. Sirosis tidak dapat disembuhkan, pengobatan dilakukan untuk mengobati komplikasi yang terjadi (seperti muntah dan berak darah, asites/perut membesar, mata kuning serta koma hepatikum).
Pemeriksaan untuk mendeteksi sirosis hati : Enzim GOT, GPT (rasio GOT/GPT>1), waktu Protombin, Protein Elektroforesis.
5. Kolestasis dan Jaundice
Kolestasis merupakan keadaan akibat kegag alan memproduksi dan atau pengeluaran empedu. Lamanya menderita kolestasis dapat menyebabkan gagalnya penyerapan lemak dan vitamin A, D, E, K oleh usus, juga adanya penumpukan asam empedu, bilirubin dan kolesterol di hati. Adanya kelebihan bilirubin dalam
sirkulasi darah dan penumpukan pigmen empedu pada kulit, membran mukosa dan bola mata disebut jaundice. Pada keadaan ini kulit penderita terlihat kuning, warna urin menjadi gelap, sedangkan faeces lebih terang.
Pemeriksaan untuk kolestasis dan jaundice: Fosfatase Alkali, Gamma GT, Bilirubin Total, Bilirubin Direk.
6. Terapi Albumin pada Asites Refraktori
Pemberian albumin pada tindakan paracentesis meningkatkan respon terhadap pemberian diuretika pada pasien asites refraktori. T erapi paracentesis merupakan pengobatan dini pertama untuk asites refraktori karena penerimaannya yang luas dikalangan medis. Prosedur ini merupakan pengulangan pemberian large volume paracentesis (LVP) ditambah albumin. Pemberian LVP 5L/hari dengan infus albumin (6-8 g/l asites yang dibuang) lebih efektif mengeliminasi asites dan menghasilkan komplikasi yang minimal jika dibandingkan dengan terapi diuretika. Kombinasi paracentesis dengan infus albumin ini juga menyingkat masa perawatan di rumah sakit. Tind akan paracentesis dapat dilakukan tiap 2 hingga 4 pekan tanpa keharusan opname. Namun tindakan ini tidak berarti menghilangkan kebutuhan akan diuretic(spironolakton atau furosemida), karena kekambuhan asites bisa ditunda pada pasien yang men erima diuretik pascaparacentesis. Hipovolemia pascaparacentesis efektif bisa dicegah dengan pemberian albumin dibandingkan pemberian plasma sintetik ekspander. Penggunaan albumin dimaksudkan untuk memelihara colloid oncotic pressure (COP), mengikat dan menyalurkan obat, dan sebagai penangkap radikal bebas. Albumin juga memiliki
efek antikoagulan, efek prokoagulatori, efek permeabilitas vaskular, serta ekspansi volume plasma.
25
BAB III. Desain Sistem
Pada bab ini diuraikan desain sistem yang akan dibuat untuk sistem diagnosa penyakit hepatitis menggunakan metode Naive Bayes sehingga menghasilkan akurasi yang optimal.
3.1 Data
Setiap tahun Rumah Sakit Panti Rapih menerima pasien yang mengidap penyakit hepatitis. Hepatitis itu sendiri merupakan peradangan pada sel-sel hati. Virus merupakan penyebab hepatitis yang paling sering, terutama virus hepatitis A, B, C, D dan E. Pada umumnya penderita hepatitis A & E dapat sembuh, sebaliknya hepatitis B & C dapat menjadi kronis. Dalam Tugas Akhir ini penulis membatasi pembahasan data h epatitis A, B dan C. Hati atau liver merupakan organ vital dalam tubuh manusia. Maka jika terjadi kerusakan dalam fungsi hati, akan menimbulkan penyakit pada hati s eperti hepatitis A, B dan C yang menjadi kerisauan masyarakat. Untuk pendeteksian dini penya kit ini pasien dapat dikaji dari gejala-gejala yang dialaminya, seperti menginputkan gejala otot, gejala perut, gejala kulit, gejala mata dan gejala mirip flu. Selain dari pada itu pada hasil rekam medis di rumah sakit Panti Rapih juga di simpan data hasi l laboratorium pasien yang periksa. Tetapi peneliti hanya membatasi 5 gejala diatas, tidak dilengkapi dengan data hasil laboratorium. S emua keterangan tentang status data pasien tersebut dikumpulkan dan didokumentasikan oleh pihak rekam medis.
Data status pasien yang terdiri gejala otot, gejala perut, gejala kulit dan gejala mata serta gejala mirip flu tersebut akan diteliti apakah mempengaruhi hasil
diagnosa pasien yang bersangkutan. Untuk meneliti apakah ada keterkaitan antara data pasien dengan hasil dia gnosa akhir seorang pasien, akan dilakukan proses penambangan data. Penambangan data akan menemukan informasi/ pengetahuan yang mendeskripsikan pasien dengan data status pasien seperti apa yang memiliki hasil diagnosa akhir baik hepatitis A, B maupun C.
Data status pasien rawat inap di rumah sakit panti rapih ini yang digunakan adalah data pasien penyakit hepatitis A, B dan C tahun 2000 sampai dengan tahun 2010. (data seluruh pasien hepatitis terdapat pada halaman L1 sampai dengan L3. Contoh data dapat dilihat pada tabel 3.1 dibawah ini.
Tabel 3.1 Data Gejala Hepatitis
feature
Hepatitis No. Gejala Otot Gejala Perut Gejala Kulit Gejala Mata Gejala Mirip Flu
1 Pegal Muntah Normal Kuning Demam A
2 Pegal Diare Normal Kuning Pusing A
3 Pegal Kencing Berwarna gelap Normal Normal Demam A
4 Pegal Nafsu makan berkurang Kuning Normal Lesu A
5 Pegal Muntah Kuning Normal Mialgia A
6 Nyeri Sendi Mual Kuning Normal Lelah A
7 Pegal Mual Kuning Normal Demam A
8 Nyeri Sendi Muntah Kuning Normal Pusing A
9 Nyeri Sendi Nyeri Perut sebelah kanan Normal Normal Demam A 10 Nyeri Sendi Nyeri Perut sebelah kanan Kuning Normal Menggigil A 11 Nyeri Sendi Illeus obstructiva Kuning Kuning Pusing B
12 Pegal Diare Normal Kuning Menggigil B
13 Pegal Kencing Berwarna gelap Kuning Normal Lelah B
15 Nyeri Sendi Nafsu makan berkurang Normal Kuning Pusing B
16 Pegal Mual Kuning Kuning Pusing B
17 Nyeri Sendi Muntah Kuning Kuning Pusing B
18 Nyeri Sendi Nyeri Perut sebelah kanan Kuning Kuning Pusing B 19 Nyeri Sendi Kencing Berwarna gelap Kuning Kuning Demam B
20 Nyeri Sendi Nyeri Perut sebelah kanan Kuning Kuning Lelah B
21 Pegal Nafsu makan berkurang Normal Kuning Pusing B
22 Nyeri Sendi Nafsu makan berkurang Normal Kuning Mialgia B 23 Pegal Nyeri Perut sebelah kanan Kuning Kuning Pusing C
24 Pegal Nafsu makan berkurang Kuning Kuning Pusing C
25 Pegal Nyeri Perut sebelah kanan Normal Demam C
26 Nyeri Sendi Diare Kuning Kuning Lesu C
27 Pegal Mual Kuning Kuning Mialgia C
28 Pegal Kencing Berwarna gelap Kuning Kuning Menggigil C
29 Nyeri Sendi Haemotom esis Kuning Kuning Lelah C
Pada sistem klasifikasi hepatitis ini, digunakan metode five fold untuk membagi data menjadi 5 kelompok. Dimana 4 kelompok digunakan untuk data