Pengelompokan penyakit hepatitis dengan metode Fuzzy C-Means.

(1)

Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means

( Studi Kasus Data Penyakit hepatitis di Rumah Sakit Panti Rapih Yogyakarta )

SKRIPSI

Ditujukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

Jurusan Teknik Informatika

Disusun Oleh :

RAFAELA ROSI PRIHANINGRUM (095314012)

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

(2)

Clustering Hepatitis Disease Using Fuzzy C-Means

(Case Study HepatitisDataat Panti Rapih Hospital Yogyakarta)

A Thesis

Presented as Partial Fulfillment of the Requirements

To Obtain the Sarjana Komputer Degree

In Study Program of Informatics Engineering

By

Rafaela Rosi Prihaningrum

095314012

INFORMATICS ENGINEERING STUDY PROGRAM

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

(3)

(4)

(5)

HALAMAN PERSEMBAHAN

Be faithful i s all thi gs e ause it’s i the that your stre gth lies

-Mother Theresa-

Skripsi ini saya persembahkan untuk : Tuhan Yesus Kristus, Keluarga tercinta dan Sahabat terkasih

(6)

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidakmemuat

karya atau bagian karya orang lain, kecuali yang telah disebutkan dalamkutipan dan daftar

pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 23 Agustus 2013

Penulis

(7)

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan dibawah ini, saya mahasiswa Univer sitas Sanata Dharma :

Nama :Rafaela Rosi Prihaningrum

NIM :095314012

Demi pengembangan pengetahuan, saya memberikan kepada perpustakaanUniversitas Sanata

Dharma karya ilmiah yang berjudul :

Pengelompokan Penyakit Hepatitis

dengan Menggunakan Metode Fuzzy C-Means

Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikankepada

perpustakaan Universitas Sanata Dharma hak untuk menyimpan,mengalihkan dalam bentuk

media lain, mengelolanya dalam bentuk pangkalandata mendistribusikan secara terbatas, dan

mempublikasikan di internet ataumedia lain untuk kepentingan akademis tanpa perlu

meminta ijin dari sayamaupun memberikan royalti kepada saya selama tetap mencantumkan

nama sayasebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Yang menyatakan,

(8)

Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means

ABSTRAK

Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan telah

terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit yang

dapat mengakibatkan kematian. Penyakit hepatitis dapat meningkatkan risiko kematian bagi

penderita dan dapat juga menjadi pemicu timbulnya penyakit lain yang menyebabkan

kematian. Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang

bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan

kesamaan karakteristik.

Dalam penelitian ini, proses pengelompokkan penyakit hepatitis menggunakanFuzzy

C-Means dalam proses pengujian sistem yang dilakukan dengan empatpercobaan yaitu

percobaan dengan data anamnesa dokter menghasilkan akurasi sebe sar50% , percobaan

yang kedua yaitu percobaan dengan data laboratorium menghasilkan akurasi sebesar

83.871%, yang ketiga yaitu percobaan dengan data anamnesa dokter yang telah di PCA (

Principal Component Analysis ) menghasilkan akurasi sebesar 40.6504% dan yang terakhir

adalah percobaan dengan data anamnesa yang telah digabung dengan data laboratorium

(9)

ABSTRACT

Health is the most important factor in a person's life. If health has disrupted the activities

of a person will be disturbed. Currently, there are many diseases that can lead to death. Liver

disease can increase the risk of death for patients and can also be triggers of other diseases

that cause death. Grouping analysis or cluster analysis is one of the data analysis that aims to

determine which group or groups from a group of data based on similar characteristics.

In the research, the process of grouping hepatitis disease using Fuzzy C-Means in the

process of testing the system four experiments conducted, first experiments with the

anamnesa the data which produce an accuracy of 50%, a second trial is an experiment with

laboratory data which produced 83.871% accuracy, the third experiment with anamnesa the

data that has been in the PCA (Principal Component Analysis) produces an accuracy of

40.6504% and the last experiment is anamnesa which has been in the pca combined with

(10)

KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena atas kebaikan dan

kehendak-Nya saya dapat menyelesaikan tugas akhir yang berjudul“Pengelompokan Penyakit Hepatitis dengan Menggunakan Metode Fuzzy C-Means”. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelarsarjana program studi Teknik Informatika,

Fakultas Sains dan TeknologiUniversitas Sanata Dharma.

Dalam proses penulisan tugas akhir ini , penulis mengucapkan terima kasihyang

sebesar-besarnya kepada :

1. Ibu PH.Prima Rosa, S.Si., M.Sc., selaku Dekan Fakultas Sains dan Teknologi

Universitas Sanata Dharma Yogyakarta.

2. Ibu Ridowati Gunawan, S.Kom.,M.T., selaku Dosen Pembimbing sekaligus ketua

program studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata

Dharma Yogyakarta, terimakasih atas segala bimbingan, kesabaran dan mengarahkan

serta membimbing penulis dalam menyelesaikan tugas akhir ini.

3. Ibu Sri Hartati Wijono, S.Si.,M.Kom.dan Bapak Albert Agung Hadhiatma,S.T.,M.T.

selaku dosen penguji yang telah memberikan banyak kritik dansaran untuk tugas akhir

saya.

4. Bapak Iwan Binanto, M.Cs., selaku Dosen Pembimbing Akademik Teknik

Informatika Tahun 2009.

5. Seluruh staff dosen Teknik Informatika Universitas Sanata Dharma yang telah banyak

memberikan bekal ilmu, arahan dan pengalaman selama sayamenempuh studi.

6. Seluruh staff Sekretariat Teknik, yang banyak membantu saya dalam

urusanadministrasi akademik terutama menjelang ujian tugas akhir.

7. Kedua orang tua dan kakak saya, terima kasih atas semua yang telah dilakukan

untukku, doa, semangat,dukungan dan cintanya sehingga saya bisa menyelesaikan

studi denganlancar.

8. Estu Karunianingtyas, terimakasih atas bantuan yang diberikan dalam penyusunan

tugas akhir ini.

9. Teman-teman Teknik Informatika : Mirella Tri Ratnasari, Christina Wienda Asrini,

(11)

10. Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhirini yang

tidak bisa saya sebutkan satu per satu.

Dengan rendah hati penulis menyadari bahwa tugas akhir ini masih jauh

darisempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan tugas akhir ini sangat

penulis harapkan.Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak.Terima

kasih.

Penulis

(12)

Daftar Isi

HALAMAN PERSETUJUAN ... ERROR! BOOKMARK NOT DEFINED. HALAMAN PERSEMBAHAN ... IV PERNYATAAN KEASLIAN KARYA ... VI LEMBAR PERNYATAAN PERSETUJUAN ... VII PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... VII ABSTRAK ... VIII

2.2.1 Himpunan Tegas (Crisp) ... 7

2.1.1 Himpunanfuzzy ... 7

2.8.1 Penyebab Hepatitis ... 15

2.8.2 Jenis dan Gejala Hepatitis ... 15

2.8 CONTOH PENGGUNAAN FUZZY C-MEANS ... 17

ANALISIS DAN DESAIN SISTEM ... 24

3.1 DATA ... 24

3.2 GAMBARAN UMUM SISTEM ... 25

(13)

3.4 PERANCANGAN ANTARMUKA ... 26

3.5 SPESIFIKASI PERANGKAT LUNAK DAN PERANGKAT KERAS ... 27

IMPLEMENTASI DAN ANALISIS HASIL ... 28

4.1HASIL PENGUMPULAN DATA ... 28

4.2PERANCANGAN FUZZY C-MEANS ... 29

4.2.1 Pembersihan Data ... 30

4.2.2 Normalisasi data laboratorium ... 30

4.2.3 PCA ( Principal Component Analysis) ... 30

4.2.4Membentuk derajat Keanggotaan ( Matriks Uik) ... 34

5.3 IMPLEMENTASI USER INTERFACE ... 35

5.4 HASIL PENGUJIAN ... 38

5.5 ANALISIS ... 41

PENUTUP ... 43

5.1KESIMPULAN ... 43

5.2SARAN ... 44

DAFTAR PUSTAKA ... 45

(14)

DAFTAR GAMBAR

Gambar Keterangan Halaman

2.1 (Kohavi&Provost,1998) : Confusion Matrix 10

3.1 Flowchart Sistem 25

3.2 Use Case Diagram 26

3.3 Perancangan Antarmuka 26

4.1 Halaman Pengelompokkan Penyakit Hepatitis 35

4.2 dialog box untuk memilih data 36

4.3 Data awal 36

4.4 inisialisasi data 36

4.5 Nilai derajat keanggotaan iterasi terakhir 37

4.6 Fungsi Objektif 37

(15)

DAFTAR TABEL

Tabel Keterangan Halaman

2.1 Nilai normal pemeriksaan laboratorium 14

2.2 Kegunaan pemeriksaan labratorium 14

2.3 Jenis Hepatitis 15

4.1 Deskripsi data gejala anamnesis 28

4.2 Deskripsi data gejala Laboratorium 29

4.3 KMO and Bartlett;s Test 31

4.4 Communalities 31

4.5 Total Variance Explained 32

4.6 Conponent Matrix 33

4.7 Score Faktor 34

4.8 Component Score Coefficient Matrix 34

4.9 Fungsi FFCM_InitV 34

(16)

4.11 Hasil Pengujian data laboratorium 39

4.12 Hasil Pengujian data anamnesa dokter(PCA) 40

4.13 Hasil Pengujian data anamnesa dokter(PCA) dan data laboratorium

(17)

BAB I

PENDAHULUAN

Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya penelitian serta

pengidentifikasian masalah penelitian. Komponen-komponen yang terdapat dalam bab

pendahuluan ini meliputi latar belakang masalah, perumusan masalah, tujuan penelitian,

batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.

1.1 Latar Belakang

Kesehatan merupakan faktor terpenting dalam kehidupan seseorang. Jika kesehatan

telah terganggu maka aktivitas seseorang akan terganggu. Saat ini terdapat banyak penyakit

yang dapat mengakibatkan kematian.Salah satunya adalah penyakit hepatitis.Indonesia

merupakan Negara ketiga dengan penderita hepatitis terbanyak setelah China dan

India.Penderita hepatitis B dan C di Indonesia diperkirakan mencapai 30 juta orang.(

Dimyati, Vien, 2011).

Hepatitis merupakan salah satu penyakit yang membahayakan jika tidak segera

ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya

yang tidak selalu tampak.Fungsi utama dari hati atau liver adalah menyaring racun-racun

yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika seseorang

menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat

menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap

pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati

menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh

darah.

Ada 5 macam virushepatitis yang dinamai sesuai abjad. Kelima virus itu adalah

virushepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D

(VHD) dan virus hepatitis E (VHE). Virus-virus ini terus berkembang dan bahkan

(18)

Penyakit hepatitisdipilih dalam penelitian ini karena banyaknya orang tidak sadar jika sudah terkena penyakit hepatitissehingga menyebabkan keterlambatan penanganan dan dapat

berakibat fatal.Di harapkan dengan adanya penelitian ini dapat membantu dalam

pendeteksian penyakit hepatitis agar dapat di lakukan penanganan lebih lanjut dan supaya

orang mengenal status kesehatan lebih dini.

Analisis pengelompokkan atau cluster analysis adalah salah satu analisis data yang

bertujuan untuk menentukan kelompok atau group dari sekelompok data berdasarkan

kesamaan karakteristik. Analisis ini sudah banyak digunakan untuk menyelesaikan

permasalahan dan penelitian dalam beberapa disiplin ilmu, seperti bidang akademik, bidang

kesehatan,bidang kewilayahan dan bidang marketing.

Perkembangan analisis kelompok dimulai dari metode hirarki yang secara garis besar

membentuk sebuah tree diagram yang biasa disebut dendogram. Sedangkan metode

nonhirarki lebih dikenal dengan cara partisi, contohnya K-means, metode ini menentukan

terlebih dahulu jumlah kelompok yang akan dibentuk. Perkembangan lebih lanjut dari analisa

kelompok adalah dengan mempertimbangkan tingkat keanggotaan yang mencangkup

himpunan fuzzy sebagai dasar pembobotan bagi pengelompokkan yang disebut dengan fuzzy

clustering.

Dalam teknik fuzzy clustering, terdapat beberapa algoritma salah satunya adalah Fuzzy

C-Means.Fuzzy C-Meansadalah salah satu teknik pengelompokkan data yang mana

keberadaan tiap titik data dalam suatu kelompok (cluster) ditentukan oleh derajat keanggotan.

Metode Fuzzy C-Meanstermasuk metode supervised clusteringdimana jumlah pusat

clusterditentukan di dalam proses clustering.

Konsep dasar Fuzzy C-Means adalah menentukan pusat cluster, yang akan menandai

lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum

akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara

memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara berulang, maka

akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan

ini didasarkan pada minimalisasi fungsi obyektif yang menggambarkan jarak dari titik data

yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.

Output dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat

(19)

Algoritma Fuzzy C-Means sering dipakai dalam berbagai bidang baik bisnis,kesehatan

atau pendidikan. Beberapa penelitian yang menggunakan algoritma Fuzzy C-Means misalnya

penelitian dalam pengelompokkan wilayah kecamatan menurut partisipasi sekolah,

pengembangan algoritma Fuzzy C-means untuk brain medical image analysis, dan penelitian

lainnya.

Pada penelitian ini algoritma Fuzzy C-means digunakan untuk mengelompokan orang

yang terkena penyakit hepatitis A, hepatitis B, hepatitis C. Algoritma Fuzzy C-means ini di

pilih karena metode ini dapat memberikan hasil yang cukup baik dalam hal meningkatkan

homogenitas tiap kelompok yang dihasilkan.

Pendeteksian penyakit hepatitis sudah pernah dilakukan oleh Estu Karunianingtyas

(Karunianingtyas,2011) menggunakan metode naïve Bayesiandengan 26 atribut dari data

anamnesis dokter, namun tingkat keakuratan yang didapat masih rendah karena hanya

mencapai 51.11% maka dari itu penulis ingin melanjutkan penelitian dengan menggunakan

metode Fuzzy C-means.

1.2 Rumusan Masalah

Dari uraian diatas maka permasalahan yang dicoba untuk diselesaikan adalah :

1. Apakah metode Fuzzy C-means dapat dipergunakan untuk mengelompokkan

orang berpenyakit hepatitis dengan memberikan keakuratan yang baik ?

1.3 Tujuan

Tujuan yang ingin dicapai dalam penelitian ini adalah :

1. Menganalisis, mendisain, mengimplementasikan metode Fuzzy C-Means untuk

mengelompokkan penyakit hepatitis.

2. Mengetahui tingkat keakuratan metode Fuzzy C-Means dalam mengelompokkan

(20)

1.4 Batasan Masalah

Batasan masalah dalam penelitian ini adalah :

1. Data set yang di gunakan adalah data hasil pemeriksaan laboratorium rumah sakit

dan data hasil anamnesa.

2. Jenis hepatitis yang akan diteliti hanya 3 jenis yaitu hepatitis A, hepatitis B, dan

hepatitis C karena jenis hepatitis D dan hepatitis E jarang ditemukan.

1.5 Manfaat

Manfaat yang diproleh dalam penelitian ini antara lain :

1. Memberikan gambaran tentang langkah – langkah analisis, design dan implementasi metodeFuzzy C-means dalam mengelompokkan orang yang

berpenyakit hepatitis.

2. Sebagai referensi untuk penelitian yang berhubungan dengan clustering penyakit

hepatitis yang lebih lanjut lagi.

1.6 Metodologi Penelitian

Metodologi yang digunakan adalah sebagai berikut:

1. Melakukan pengumpulan data.

2. Melakukan normalisasi pada data laboratorium.

3. Mengekstrak data anamnesis dokter menggunakan metode PCA ( Principal

Component Analysis).

4. Menggabungkan data laboratorium yang sudah di normalisasi dengan data anamnesis

yang sudah di ekstraks.

5. Menghitung data dengan menggunakan metode FCM ( Fuzzy C-Means).

6. Menghitung nilai keakuratan hasil pengelompokkan dengan menggunakan Confusion

(21)

1.7 Sistematika Penulisan

Penulisan tugas akhir ini tersusun dari 5 (lima) bab dengan sistematikapenulisan

sebagai berikut :

BAB I PENDAHULUAN

Bab pendahuluan ini berisi tentang hal-hal yang mendasari dilakukannya

penelitian serta pengidentifikasian masalah penelitian. Komponen-komponen yang

terdapat dalam bab pendahuluan ini meliputi latar belakang masalah, perumusan

masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian

dan sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan

tugas akhir ini untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada

bab 1. Penjelasan yang diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy

clustering dan Fuzzy C-means. Kemudian menjelaskan tentang permasalahan penyakit

hepatitis dan yang terakhir mengenai pengujian keakuratan metode

BAB III Desain dan Analisis SISTEM

Bab ini berisi tentang desain dan analisis system meliputi contoh perhitungan,

perancangan antarmuka, dan usecase.

BAB IV IMPLEMENTASI SISTEM DAN HASIL

Bab ini berisi implementasi program dari sistem yang akan dibuat, pembahasan

penerapan algoritma Fuzzy C-Means, implemantasi antarmuka dan hasil implementasi.

BAB V PENUTUP

Bab ini berisi kesimpulan dari sistem yang telah dibuat, serta saran untuk

(22)

BAB II

TINJAUAN PUSTAKA

Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini

untuk memperjelas materi-materi yang sudah sedikit dijelaskan pada bab 1. Penjelasan yang

diberikan mulai dari Fuzzy logic dan dilanjutkan dengan Fuzzy clustering dan Fuzzy

C-means.Kemudian menjelaskan tentang permasalahan penyakit hepatitis dan yang terakhir

mengenai pengujian keakuratan metode.

2.1 Fuzzy Logic

Teori Himpunan Fuzzyakan memberikan jawaban terhadap suatu masalah

yangmengandung ketidak pastian. Aplikasi logika fuzzy untuk mendukung keputusan

semakindiperlukan ketika semakin banyak kondisi yang menuntut adanya keputusan yang

tidakhanya bisa dijawab dengan „Ya‟ atau „Tidak‟.Fuzzy Logic memberikan rata-rata dariperhitungan angka, yang terletak antara nilai benar mutlak dan nilai salah mutlak,

yangberupa range antara 0.0 dan 1.0. Dengan Fuzzy Logic, pengguna dimungkinkan

untukmenghitung derajat keanggotaan dari sebuah data. Fuzzy Logic berurusan dengan

kondisiyang tidak pasti, dimana benar dan salah tidak dapat ditentukan secara mutlak.

Konsep dari Fuzzy Logic diperkenalkan oleh Professor Lotfi A. Zadeh, di Barkley pada

Universitas California (University of California) pada 1960an.Logika Fuzzy dikatakan

sebagai logika baru yang lama, sebab ilmu tentang logika Fuzzy modern dan metodis baru

ditemukan beberapa tahun yang lalu, padahal sebenarnya konsep tentang logika fuzzy itu

sendiri sudah ada sejak lama.

Ada beberapa alasan mengapa orang menggunakan logika Fuzzy, antara lain :

1. Konsep logika Fuzzy mudah dimengerti. Konsep matematis yang mendasari

penalaran Fuzzy sangat sederhana dan mudah dimengerti.

2. Logika Fuzzy sangat fleksibel.

3. Logika Fuzzy memiliki toleransi terhadap data-data yang tidak tepat.

4. Logika Fuzzy mampu memodelkan fungsi-fungsi non-linear yang sangat

(23)

2.2 Himpunan Fuzzy

2.2.1 Himpunan Tegas (Crisp)

Pada himpunan tegas, nilai keanggotaan suatu item (x) dalam suatu himpunan

A, sering ditulis dengan µA(x), memiliki dua kemungkinan yaitu :

a. 1 (satu), yang bearti suatu item menjadi anggota dalam suatu himpunan

b. 0 (nol), yang bearti suatu item tidak menjadi anggota himpunan tersebut.

2.1.1 Himpunanfuzzy

Pada himpunan fuzzy nilai keanggotaan terletak pada rentang 0 sampai 1.

Apabila x memiliki nilai keanggotaan fuzzy µA(x)=0 bearti x tidak menjadi

anggota himpunan A. demikian pula, apabila x memiliki nilai keanggotaan

µA(x)=1 bearti x menjadi anggota penuh himpunan A.

2.3 Fuzzy Clustering

Fuzzy clustering adalah salah satu teknik menentukan cluster optimal dalam suatu ruang

vektor yang didasarkan pada bentuk normal euclidean untuk jarak antar vektor

(Kusumadewi,2004).

Metode ini merupakan pengembangan dari metode partitioning data dengan

pembobotan fuzzy. Keunggulan utama fuzzy clustering adalah dapat memberikan hasil

pengelompokkan objek – objek yang tersebar tidak teratur, karena jika terdapat suatu data yang penyebarannya tidak teratur maka terdapat kemungkinan suatu titik data mempunyai

sifat atau karakteristik dari cluster lain sehingga diperlukan pembobotan kecenderungan titik

data terhadap suatu cluster.

Dalam teori logika fuzzy suatu nilai bisa bernilai benar atau salah secara

bersama.Namun berapa besar keberadaan dan kesalahan suatu tergantung pada bobot

keanggotaan yang dimilikinya.Logika fuzzy memiliki derajat keanggotaan dalam rentang 0

hingga 1.

Logika fuzzy adalah suatu cara yang tepat untuk memetakan suatu ruang input kedalam

(24)

keanggotaan dan derajat dari kebenaran. Oleh sebab itu sesuatu dapat dikatakan sebagian

benar dan sebagian salah pada waktu yang sama (Kusumadewi. 2004).

1.4 Fuzzy C-Means

Dalam teknik clustering data terdapat beberapa algoritma, salah satunya adalah Fuzzy

C-means. Fuzzy C-means merupakan pengembangan dari metode K-mean clustering karena

pada awalnya ditentukan dulu jumlah kelompok atau cluster yang akan dibentuk. Kemudian

dilakukan iterasi sampai mendapatkan keanggotaan kelompok tersebut.

Konsep dasar Fuzzy C-means, pertama kali adalah menentukan pusat cluster, yang akan

menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih

belum akurat.Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster.

Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara

berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang

tepat. Perulangan ini didasarkan pada minimasi fungsi objektif yang menggambarkan jarak

dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik

data tersebut.

Algoritma pengelompokan Fuzzy C-means menurut Kusumadewi diberikan sebagai

berikut :

i. Tentukan :

1. Matriks X berukuran n x m dengan n = jumlah data yang akan di cluster dan

m= jumlah variabel (criteria)

2. Jumlah cluter yang akan di bentuk = C

3. w> 1 adalah tingkat ke fuzzy-an dari hasil pengelompokkan. Parameter ini

disebut dengan fuzzier, nilai dari w yang sering dipakai dan dianggap paling

halus adalah w=2 (Klawoon dan Hopper,2001)

4. Iterasi tertinggi

5. Kriteria penghentian = e (nilai positif yang sangat kecil)

6. Iterasi awal t=1,dan ∆=1

ii. Bentuk matriks partisi awal Uik seperti rumus (2,1) sebagai berikut

(25)

Matrik partisi Uik mempunyai komponen i= banyaknya data, k = banyaknya

cluster. Matrik ini random dengan kisaran nilai 0 sampai 1.

iii. Hitung pusat cluster dengan menggunakan rumus (2,2) :

iv. Hitung fungsi objektif pada iterasi ke –i dengan menggunakan rumus (2,3)

dik merupakan ukuran jarak untuk jarak Euclidean antara pusat cluster ke-i

dengan data ke-k. untuk menghitung dik digunakan rumus (2,4) :

v. Perbaiki drajat keanggotaan tiap data pada tiap cluster dengan menggunakan

rumus (2,5)

vi. Cek kondisi berhenti jika :

a) Jika: (|Pi-Pi-1 |<e) atau (t>MaxIter) maka berhenti.

b) Jika tidak: t=t+1, ulangi langkah iii.

Dari algoritma tersebut dapat disimpulkan bahwa langkah pertama yang dilakukan

adalah menentukan matriks derajat keanggotaan secara acak yang kemudian dijadikan acuan

terhadap perhitungan pusat cluster. Pada kondisi awal pusat cluster masih belum akurat, yang

ditunjukkan dengan besarnya selisih nilai objektif, sehingga dilakukan langkah iteratif

(26)

cluster bergerak menuju lokasi yang tepat. Langkah ini dilakukan berdasarkan minimisasi

fungsi objektif.

Output dari Fuzzy C-means merupakan matriks pusat cluster berukuran c x p dan

matriks derajat keanggotaan untuk tiap – tiap data berbentuk n x c. Pengelompokkan cluster

dapat dilihat dari kedua output ini. Matriks pusat cluster menunjukkan pusat cluster untuk

tiap – tiap variabel yang diamati dalam setiap cluster-nya. Matriks derajat keanggotaan menunjukkan kecenderungan suatu data untuk masuk kedalam cluster tertentu. Semakin

besar nilai derajat keanggotaannya, maka semakin besar peluang data tersebut masuk

kedalamclustertertentu.

2.5 Confusion Matrix

Validasi merupakan proses untuk menilai hasil metode cluster. Oleh karena itu,

proses ini bertujuan untuk menjamin bahwa solusi cluster yang di hasilkan dalam analisis

cluster dapat menggambarkan populasi sebenarnya.

Confusion Matrix merupakan bagian dari uji validasi dengan metode external test.Uji

validasi external test ini digunakan untuk mengukur sejauh mana label pada cluster dengan

label pada class yang disediakan.

Menurut Kohavi dan Provost (Kohavi dan Provost,1998) confusion Matrix berisi

informasi tentang actual (fakta)dan predicted (prediksi). Confusion matrix pada gambar 2.1

berbentuk matrix 2 x 2 yang digunakan untuk mendapatkan jumlah ketepatan yang didapat

dengan menggunakan algoritma tertentu

Predicted

Negative Positif

Actual

Negative A B

(27)

Gambar 2.1 (Kohavi&Provost,1998) : Confusion Matrix

Keterangan :

A, jikaactual dan predicted bernilai negative.

B, jika actual bernilai negative dan predicted bernilai positive.

C, jika actual bernilai positive dan predicted bernilai negative

D, jika actual dan predicted bernilai positive.

Rumus yang digunakan untuk menghitung akurasi dengan confusion

matrix,yaitu :

2.6 Data Preparation

Proses preparasi ini dilakukan sehingga data dapat lebih mudah untuk diolah. Terdapat 3 hal dalam data preparationyaitu :

1. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam proses ini dilakukan juga pemilihan atribut-atribut yang disesuaikan dengan proses

data mining.

2. Data Preprocessing: Memastikan kualitas data yang telah dipilih pada tahap

dataselection, pada tahap ini masalah yang harus dihadapi adalah noisy data dan

missing values. Proses pembersihan data (cleansing) dilakukan dengan melakukan

metode-metode query sederhana untuk menemukan anomali-anomali data yang bisa

saja masih terdapat pada sistem.

3. Data Transformation: Mengelompokkan atribut-atribut atau field-yang telah terpilih

menjadi 1 tabel dengan cara melakukan denormalisasi.

(28)

2.7 PCA (Principal Component Analysis)

Terdapat dua metode Dimensionality Reduction yang paling sering digunakan yaitu

Feature Selection dan Feature Extraction.Feature selection merupakan sebuah proses

pemilihan subset feature dari feature asli, sedangkan feature extraction adalah proses

mengekstrak feature baru dari feature asli melalui pemetaan fungsional.

Salah satu metode feature extraction adalah PCA ( Principal Component Analysis ).

Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel dengan cara

menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi

diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak

berkorelasi sama sekali atau yang biasa disebut dengan principal component

Analisis Komponen Utama (Principal Component Analysis) atau PCA adalah suatu

metodeyang melibatkan prosedur matematika yangmengubah dan mentransformasikan

sejumlah besarvariabel yang berkorelasi menjadi sejumlah kecilvariabel yang tidak

berkorelasi, tanpa menghilangkaninformasi penting di dalamnya

2.8 Hepatitis

Hepatitis telah menjadi masalah global. Saat ini diperkirakan 400 juta orang di dunia

terinfeksi hepatitis B kronis, bahkan sekitar 1 juta orang meninggal setiap tahun karena

penyakit ini (Wening,2008).

Hepatitis adalah istilah umum yang berarti radang hati.“Hepa” berarti kaitan dengan

hati, sementara “itis” berarti radang.Hepatitis atau peradangan hati dapat diartikan sebagai suatu proses peradangan yang menimpa sel-sel hati (Cahyono,2008). Secara objektif, adanya

hepatitis dibuktikan melalui biopsi jaringan hati (pengambilan sedikit jaringan hati

menggunankan jarum).Namun, secara sederhana pemeriksaan dapat digantikan dengan

pemeriksaan darah.

Hepatitismerupakan salah satu penyakit yang membayakan jika tidak segera

ditangani.Penyakit yang menyerang hati atau liver ini semakin berbahaya karena gejalanya

(29)

Hati adalah organ yang terbesar dalam tubuh. Kurang lebih sama besar dengan buah

pepaya, dan terletak di perut kanan-atas.Fungsi utama dari hatiatau liver adalah menyaring

racun-racun yang ada pada darah. Selain itu, masih ada sekitar 500 fungsi lain dari hati. Jika

seseorang menderita hepatitis, yang merupakan peradangan pada hati atau liver ini, dapat menghancurkan kesehatan orang tersebut secara keseluruhan karena racun tetap mengendap

pada darah dan merusak atau mengganggu kerja organ lain. Akibat lainnya adalah hati

menolak darah yang mengalir sehingga tekanan darah menjadi tinggi dan pecahnya pembuluh

darah.

Ada 5 macam virus hepatitis yang dinamai sesuai abjad. Kelima virus itu adalah virus

hepatitis A (VHA), virus hepatitis B (VHB), virus hepatitis C (VHC), virus hepatitis D(VHD), virus hepatitis E (VHE).

Diagnosis hepatitis dapat dipastikan melalui anamnesis dengan dokter serta

pemeriksaan fisik dan laboratorium. Dokter akan menanyakan hal – hal yang terkait dengan penularan hepatitis karena hepatitis jenis A, B, C, dan jenis lainnya memberikan gejala yang

hampir sama.

Pemeriksaan laboratorium pada pasien yang diduga mengidap penyakit hepatitis

dilakukan untuk memastikan diagnosis, mengetahui penyebab dan menilai fungsi hati.Secara

garis besar, pemeriksaan laboratorium dibadakan menjadi dua yaitu, tes seralogi dan biokimia

hati.

Tes seralogi dilakukan dengan cara memeriksa kadar antigen maupun antibodi

terhadap virus penyebab hepatitis. Tes ini bertujuan untuk memastikan diagnosis serta

mengetahui jenis virus penyebabnya. Tes biokimia hati dilakukan dengan cara memeriksa

parameter zat – zat kimia maupun enzim yang dihasilkan atau diproses oleh jaringan hati. Tes biokimia hati dapat dipergunakan untuk mengetahui derajat keparahan atau kerusakan sel

sehingga dapat menilai fungsi hati.

Penderita penyakit hati secara umum termasuk hepatitis, akan diperiksa darahnya

untuk beberapa jenis pemeriksaan parameter biokimia, seperti AST, ALT (alanin

aminotransferase), alkaline fosfatase,bilirubin, albumin, dan protombin (Wening, 2008).

Adapun nilai normal untuk pemeriksaan laboratorium disajikan dalam tabel 2.1 dan kegunaan

(30)

Tabel 2.1 : Nilai normal pemeriksaan laboratorium

Parameter Biokimia Hati Rentang Nilai Normal

AST / SGOT ≥ 37 U/L (Pria) | ≥ 31 U/L (wanita)

ALT / SGPT ≥ 42 U/L (Pria) | ≥ 32 U/L (wanita)

HBsAg

NEGATIF : < 1,0 S/CO atau < 1,0 COI (ECLIA)

Anti HAV

NEGATIF : < 1,0 COI POSITIF : >= 1,0 COI (EIA)

Anti HCV

NEGATIF : < 1,0 S/CO atau < 1,0 COI (EIA)

Tabel 2.2 : Kegunaan Pemeriksaan Laboratorium

Jenis Pemeriksaan Kegunaan

SGOT Untuk mengetahui fungsi hati , membantu mendiagnosis kelainan hati

SPGT Untuk mengetahui fungsi hati, membantu mendiagnosis kelainan hati

HBsAg Untuk mengetahui adanya infeksi virus Hepatitis B. Jika HBsAg

positif maka terinfeksi virus hepatitis B. Jika HBsAg positif selama

lebih dari 6 bulan, berarti pasien menderita Hepatitis B kronis dan

disarankan untuk rutin memeriksakan fungsi hati (SGOT, SGPT,

Protein Total, Albumin, AFP) paling tidak 6 bulan – 1 tahun sekali

Anti HAV/ IgM

Anti HAV

Untuk mengetahui adanya antibody terhadap virus Hepatitis A

Anti HCV Untuk mengetahui adanya antibody terhadap virus Hepatitis C. Anti

(31)

2.8.1 Penyebab Hepatitis

Penyebab hepatitis sendiri sangat banyak,misalnya hepatitis akibat virus, bahan kimia,

obat – obatan, alkohol, dan lain – lain. Pada saat ini penyakit hepatitis yang sering menjadi masalah adalah hepatitis virus, terutama akibat virus hepatitis B dan C sebab kedua jenis

hepatitis ini sering menimbulkan hepatitis kronis yang dapat berakhir menjadi sironishati dan

kanker hati (Cahyono,2008).

2.8.2 Jenis dan Gejala Hepatitis

Menurut Cahyono (2008), perbedaan dari setiap jenis hepatitis dapat dilihat pada tabel

2 dibawah ini :

Tabel 2.3 : Jenis Hepatitis

Sifat

Darah (Parental) Oral

(Peroral)

Pada fase awal hepatitis, penderita belum merasakan gejala yang spesifik. Keluhan yang

dirasakan antara lain mual, muntah, tidak nafsu makan, badan terasa lemas, dan mudah lelah.

(32)

Hepatitis A merupakan jenis hepatitis yang paling ringan. Hal ini disebabkan infeksi

virus hepatitis A (VHA) umumnya tidak sampai menyebabkan kerusakan jaringan hati

(Wening, 2008). Mereka yang terinfeksi virus ini dapat pulih sepenuhnya. Hepatitis A ini

menular melalui makanan atau minuman yang telah terkontaminasi oleh virus VHA.

Hepatitis B merupakan jenis hepatitis yang paling berbahaya.Penyakit ini lebih sering

menular dibandingkan dengan jenis hepatitis lainnya. Hepatitis B menular melalui kontak

darah atau cairan tubuh yang mengandung virus hepatitis B (VHB) maupun material lain

yang terinfeksi, seperti jarum suntik, alat bedah, jarum akupuntur, dan alat – alat yang dapat menimbulkan luka lecet milik individu yang terinfeksi .Hepatitis B kronis memberikan gejala

yang lebih serius yaitu mudah lelah, cemas, tidak nafsu makan, mual, muntah dan merasa

lemas.Hepatitis B kronis dapat membuat penumpukan cairan dalam rongga perut sehingga

perut terlihat membuncit.Seseorang dapat mengidap virus ini tetapi tidak disertai dengan

gejala klinik atau tidak tampak adanya kelainan atau gangguan kesehatan. Orang tersebut

merupakan pembawa atau biasa disebut carrier.

Carrier dapat terjadi karena individu tersebut memiliki pertahanan tubuh yang baik

atau karena virus VHB mengalami perubahan sifat yang tidak aktif (Wening, 2008).Virus

yang tidak aktif ini akan membuat pertahanan tubuh tidak dapat mengenalinya sebagai

“musuh” sehingga sistem imun tidak mengadakan perlawanan, suatu saat ketika pertahanan

tubuh dalam kondisi lemah maka virus akan aktif dan akan muncul gejala hepatitis. Carrier

jumlahnya relatif banyak dan berpotensi menularkan.

Hepatitis C juga menyebabkan peradangan hati yang cukup berat. Hepatitis C menular

melalui darah, biasanya karena transfusi atau jarum suntik yang terkontaminasi virus hepatitis

C (VHC).Pada penderita hepatitis C keluhan yang dirasakan adalah merasalemas, mual,

muntah, hilang nafsu makan, demam, mual, dan nyeri ulu hati. Sebagian dari penderita

mengeluh bahwa urin berwarna gelap, feses berwarna putih, serta kulit, kuku dan bola mata

bagian putih berwarna kuning. Jika diraba, perut bagian atas kanan membesar karena terjadi

(33)

2.8 Contoh Penggunaan Fuzzy C-Means

Terdapat data gejala yang telah dirubah kedalam bentuk biner

Pegal NyeriSendi Normal Linu-linu

0 0 1 0

0 1 0 0

0 0 1 0

1 0 0 0

0 0 1 0

Data tersebut akan dibagi dalam tiga kelompok. Pertama tentukan :

banyaknya cluster c 3

Pembobot w 2

maksimum iterasi maxiter 5

error e 0.01

fungsi objektif P0 0

Iterasi awal iter 1

(34)

i k1 k2 k3

1 0.440986528 0.490279156 0.069

2 0.555826368 0.384816328 0.059

3 0.156206358 0.306739378 0.537

4 0.460986631 0.075301468 0.464

5 0.426768818 0.216412813 0.357

6 0.095909122 0.285092664 0.619

7 0.32906622 0.398552921 0.272

8 0.019634378 0.466853598 0.514

9 0.311402432 0.347649768 0.341

10 0.321789912 0.537765533 0.14

11 0.695747687 0.031368532 0.273

12 0.047758847 0.100471348 0.852

Langkah selanjutnya adalah menghitung pusat kluster Vij dan didapat hasil :

vij 1 2 3 4 5 6 7

1 0.00532574 0.001543791 0.712869 0.280262 0.934722 0 0.161594 2 0.05747037 0.161248551 0.780585 0.000696 0.738046 0 0.118575 3 0.1668799 0.430836171 0.369851 0.032433 0.824529 0 0.106082

8 9 10 11 12 13 14 15 16

0.883904 0.48318 0.933401 0.336406 0.756065 0.123037 0 0.1054 0.001321 0.710058 0.647889 0.730909 0.086154 0.889208 0.004009 0 0.0331 0.007138 0.94078 0.484568 0.508542 0.083062 0.409287 0.093653 0 0.0555 0.315987

17 18 19 20 21 22 23 24 25 26

(35)

Lalu hitung fungsi objektif pada iterasi ke-i

Kemudian setelah fungsi objektif diperoleh, yang dilakukan adalah memperbaiki

derajat keanggotaan dan diperoleh derajatkeanggotaan yang baru sebagai berikut :

(36)

8 0.39 0.31 0.30

9 0.33 0.30 0.37

10 0.39 0.23 0.38

11 0.21 0.39 0.40

12 0.42 0.39 0.19

Setelah dibentuk derajat keanggotaan yang baru kemudian cek kondisi berhenti

apakah (|Pi-Pi-1 |<e) atau (t>MaxIter) ? Jika tidak: t=t+1, ulangi langkah dari menghitung

pusat kluster.

Setelah mengalami 6 kali iterasi maka diperoleh fungsi objektif sebagai berikut :

Iterasi Fungsi Objektif

1 17.91338887

2 14.52300538

3 14.261227

4 14.23399458

5 14.22633765

(37)

Dan derajat keanggotaan yang diperoleh pada iterasi keenam adalah :

K1 K2 K3

0.35 0.33 0.32

0.35 0.32 0.33

0.35 0.33 0.32

0.33 0.34 0.33

0.34 0.33 0.32

0.32 0.34 0.34

0.31 0.35 0.34

0.34 0.33 0.33

0.32 0.34 0.34

0.34 0.33 0.33

(38)

dari matriks derajat keanggotaan diatas maka dapat disimpulkan pengelompokkan

data setelah iterasi keenam :

K1 K2 K3

X

X X

X

(39)

Setelah data dikelompokkan dengan menggunakan Fuzzy C-Means maka hasil

pengelompokkan tersebut dihitung dengan menggunkana confusion matrix sebagai berikut

Hepatitis\Kelompok a b c

K1 3 2 1

K2 1 2 2

K3 0 0 3

(40)

BAB III

ANALISIS dan DESAIN SISTEM

Bab ini berisi tentang desain dan analisis sistem meliputi perancangan antarmuka,

flowchartdan usecase.

3.1 Data

Penyakit hepatitis merupakan penyakit peradangan hati. Terdapat beberapa jenis

hepatitis yaitu hepatitis A, B, C, D, E. Hepatitis tipe A dan E masih dapat untuk di

sembuhkan, namun untuk hepatitis tipe B dan C biasanya menjadi penyakit yang

kronis.Dalam penelitian ini penyakit hepatitis yang akan digunakan adalah hepatitis A, B, dan

C karena tipe tersebut yang paling banyak ditemui dibandingkan dengan tipe yang lainnya.

Rumah sakit Panti Rapih Yogyakarta merupakan sebuah rumah sakit besar yang setiap

harinya didatangi pasien hepatitis untuk berobat. Data yang didapat dari Rumah sakit Panti

Rapih merupakan data set yang bertipe record, berupa data hasil laboratorium dan data dari

hasil pemeriksaan dari dokter(anamnesis).Semua keterangan tentang status data pasien

tersebut dikumpulkan dan didokumentasikan oleh pihak rekam medis.

Data anamnesis yang didapat sebanyak 130 data yang merupakan data pasien penyakit

hepatitis tahun 2000 hingga 2010 yang diambil tanggal 10 Januari 2011 oleh Estu

Karunianingtyas. Dari data anamnesis didapat lima gejala yaitu gejala otot, gejala perut,

gejala kulit, gejala mata, dan gejala mirip flu. Masing –masing gejala tersebut memiliki beberapa sub gejala.

Data laboratorium yang didapat sebanyak 66 data pasien hepatitis A, 48 pasien hepatitis

B, dan 30 pasien hepatitis C. Dari data laboratorium didapat lima gejala yaitu SGPT, SGOT,

antiHAV, HbsAg, dan antiHCV.

Gejala otot memiliki sub gejala pegal dan nyeri sendi. Gejala perut memiliki sub gejala

muntah, diare, kencing berwarna gelap, nafsu makan berkurang, mual,nyeri perut sebelah

kanan, Illeus obstructive,Haemotomesis. Gejala kulit memiliki sub gejala kulit berwarna

(41)

dan mata berwarna normal. Gejala mirip flu memiliki sub gejala demam, lesu, pusing,

mialgia, lelah, dan menggigil.

Data anamnesispasien yang telah didapat dilakukan binerisasi yaitu konversi sub gejala

menjadi 0 atau 1 dengan ketentuan 0 jika pasien tidak mengalami gejala tersebut dan 1 jika

pasien mengalami gejala tersebut.

3.2 Gambaran Umum Sistem

Sistem ini digunakan untuk melakukan pengelompokkan jenis penyakit hepatitis

berdasarkan dengan gejala anamnesis dan gejala laboratorium dengan menggunakan metode

Fuzzy C-Means.Sistem ini juga digunakan untuk menghitung keakuratan dari metode Fuzzy

C-Means dalam mengelompokkan penyakit hepatitis.Pengelompokkan dilakukan untuk

memberikaninformasi mengenai anggota masing-masing cluster/kelompok.

Flowchartsistem pengelompokkan penyakit hepatitis sebagai berikut :

1. User memasukkan data yang akan diproses

2. Usermenginputkan inisialisasi awal berupa bobot, maksimum iterasi, nilai error

minimal, iterasi awal, dan fungsi objektif awal.

3. Proses pengelompokkan data dengan FCM dan perhitungan akurasi

4. Output berupa hasil clustering dan besar nilai akurasi.

(42)

3.3 Use Case Diagram

Diagram use case digunakan untuk menggambarkan interaksi antara pengguna dengan

sistem. Pada system ini yang menjadi actor adalahuser. User dapat memilih data yang akan dikelompokkan dan dapat melakukan pengelompokkan data.Fungsi yang dapat dijalankan oleh pengguna sistem ini adalah fungsi memasukkan data dalam bentuk file .csv. Fungsi

berikutnya adalah fungsi memasukkan data inisialisasi awal.Fungsi terakhir yaitu fungsi

mengelompokkan data dengan metode FCM. Diagram use case dari sistem pengelompokkan

penyakit hepatitis dengan menggunakan metode Fuzzy C-Means ini dapat dilihat pada

gambar 3.2 di bawah ini

Gambar 3.2 : Use Case Diagram

3.4 Perancangan Antarmuka

Gambar 3.3 : Perancangan Antarmuka Cari data rekam medis

Proses Pengelompokkan dengan metode FCM

input inisialisasi awal

(43)

Desain Tampilan sistem pengelompokkan penyakit hepatitis dengan metode Fuzzy

C-Means ini hanya mempunyai satu tampilan utama. Pada tampilan ini terdapat fasilitas untuk

mencari data rekam medis yang akan dihitung dan data yang dipilih akan ditampilkan di tabel

“Data Awal” , selain itu juga user harus mengisikan inisialisasi awal pada tampilan ini

sebelum tombol “Hitung” ditekan. Nilai dari tabel “Derajat Keanggotaan” dan tabel “Akurasi” serta nilai akurasi akan otomatis terisi ketika tombol “Hitung” ditekan.

3.5 Spesifikasi Perangkat Lunak dan Perangkat Keras

Spesifikasi software dan hardware yang digunakan dalam implementasi sistem

diagnosa penyakit hepatitis menggunakan Fuzzy C-Meansadalah sebagai berikut:

1. Software :

XP SP 2

2. Hardware :

Processor : Intel(R) Core(TM) i3 CPU M370 @2.40GHz

Memory : 2 GB.

(44)

BAB IV

Implementasi dan Analisis Hasil

Pada bab ini dibahas mengenai hasil penelitian dan analisis hasil penelitian dari implementasi

system yang telah dibuat. Hasil penelitian yang terpenting berupa perbandingan akurasi yang

diperoleh dari pengujian metode Fuzzy C-Means. Pada bab ini juga dibahas mengenai user

interface yang dibangun berdasarkan algoritma yang telah dirancang.

4.1 Hasil Pengumpulan Data

Pada penelitian yang telah dilakukan di Rumah Sakit Panti Rapih Yogyakarta,

diperoleh 144 data laboratorium dari pasien yang mengidap penyakit hepatitis A, hepatitis B

dan hepatitis C yang masing – masing 66 data pasien hepatitis A, 48 data pasien hepatitis B, dan 30 data pasien hepatitis C. Dari 130 data anamnesis terdiri dari 50 data hepatitis A, 50

data hepatitis B dan 30 data hepatitis C dan merupakan data pasien penyakit hepatitis tahun

2000 hingga 2010 yang diambil tanggal 10 Januari 2011 oleh Estu Karunianingtyas. Untuk

masing – masing gejala anamnesis terdiri atas beberapa kriteria seperti pada tabel 4.1 dan untuk data laboratorium terdiri atas beberapa feature seperti pada tabel 4.2 dibawah ini :

Tabel 4.1 : Deskripsi data gejala anamnesis

NO Gejala Feature

1 Otot Pegal, nyeri sendi, normal dan linu -linu

2 Perut Muntah, diare, kencing berwarna gelap, mual, nyeri perut

sebelah kanan, nafsu makan berkurang dan perut acites(perut

membuncit)

(45)

4 Mata Normal, kuning

5 Mirip Flu Demam, pusing, lesu, mialgia, lelah, menggigil, batuk

Tabel 4.2 : Deskripsi data gejala Laboratorium

NO Feature

1 SGOT

2 SGPT

3 Igm

4 HbsAg

5 Anti HCV

Data anamnesis dan data laboratorium pasien hepatitis digabungkan menjadi satu

berupa teks yang disimpan dalam format excel (.xls), masing-masing disimpan secara

terpisah baik data hepatitis A, B maupun C. Terdiri 40 data hepatitis A, 40 data hepatitis B

dan 30 data hepatitis C.

4.2 Perancangan Fuzzy C- Means

Data yang digunakan dalam penelitian ini adalah data hasil diagnosa akhir dan data

laboratorium pasien hepatitis yang diperoleh dari Rekam Medis Rumah Sakit Panti

Rapih.Data diberikan dalam bentuk manual, yaitu berupa map yang berisi lembaran data

(46)

diagnosa keperawatan yang mana pasien telah dirawat inap.Peneliti melakukan pencatatan

data laboratorium pasien dalam format ekstensi xls.

4.2.1 Pembersihan Data

Pembersihan Data (data cleaning) merupakan tahap awal dalam proses

penambangan data. Pada data anamnesisdan data laboratorium yang diperoleh

terdapat beberapa data yang tidak lengkap, seperti misalnya ada beberapa pasien yang

tidak menjalani pemeriksaan laboratorium sehingga tidak didapat data

laborataoriumnya dan terdapat juga pasien yang menjalani pemeriksaan laboratorium

yang tidak menyeluruh sehingga menyebabkan data tidak lengkap.Data yang tidak

lengkap tersebut kemudian dibuang sehingga diperoleh 110 data laboratorium dan 110

data anamnesis.

4.2.2 Normalisasi data laboratorium

Pada data hasil pemeriksaan laboratorium didapat nilai hasil pemeriksaan yang

mempunyai satuan yang berbeda – beda. Hal ini disebabkan karena alat pemeriksaanyang digunakan untuk memeriksa penyakit hepatitis berbeda antara

pasien satu dengan pasien yang lain sehingga menyebabkan rentang nilai normal yang

berbeda.Perbedaan jenis kelamin juga berpengaruh pada rentang nilai normal

pemeriksaan laboratorium.Data pemeriksaan laboratorium dinormalisasi dengan

menggunakan nilai rentang normal dari pemeriksaan laboratorium sesuai dengan jenis

alat yang digunakan dan jenis kelamin pasien.

4.2.3 PCA ( Principal Component Analysis)

PCA merupakan salah satu dari metode dimensional reduction yang

digunakan untuk menyederhanakan variabel.Pada penelitian ini, data yang diolah

dengan menggunakan metode PCA adalah data anamnesa yang mempunyai 26

variabel.

Data anamnesa ini akan diolah dengan bantuan SPSS 17untuk mereduksi

variabel bebas yang berkorelasi tinggi sehingga dapat diketahui variabel mana saja

(47)

Langkah – langkah yang dilakukan dalam prosedur PCA dengan menggunakan SPSS 17 pada data anamnesa pasien penyakit hepatitis adalah sebagai

berikut :

a. Barlett Test

Tabel 4.3: KMO and Bartlett;s Test

.236

Barlett Test merupakan tes statistik untuk menguji apakah betul

variabel-variabel bebas yang dilibatkan berkorelasi.

Ho :Tidak ada korelasi antarvariabel bebas

H1 :Ada korelasi antarvariabel bebas

Kriteria uji dengan melihat p-value (signifikansi) : Terima Ho jika Sig. > 0,05

atau tolak Ho jika Sig. < 0,05. Pada tabel 4.3 di atas dapat dilihat bahwa nilai

Chi-Square adalah 1168.660, dengan derajat bebas sebesar 325, dan p-value (sig) sebesar

0,000. Karena p-value (0,000) < 0,05 maka Ho di tolak. Artinya, benar-benar terdapat

(48)

Communalities menunjukkan berapa varians yang dapat dijelaskan oleh factor

yang diekstrak (faktor yang terbentuk).Cara memperolehnya adalah dengan

mengkuadratkan nilai korelasi yang terdapat pada tabel 4.6Component Matrix.Setiap

variabel berkorelasi dengan faktor-faktor yang terbentuk.Misalkan untuk variabel

pegal diperoleh nilai sebesar 0.715. Hal ini berarti sekitar 71,5% variabel pegal dapat

dijelaskan oleh faktor yang terbentuk. Untuk variabel nyeri sendi, diperoleh nilai

sebesar 0,867. Hal ini berarti sekitar 86,7% variabel nyeri sendi dapat dijelaskan oleh

faktor yang terbentuk.

c. Total Variance Explained

Tabel 4.5: Total Variance Explained

Total

1 2.978 11.454 11.454 2.978 11.454 11.454

2 2.414 9.284 20.739 2.414 9.284 20.739

3 2.255 8.672 29.410 2.255 8.672 29.410

4 1.692 6.508 35.919 1.692 6.508 35.919

5 1.551 5.967 41.885 1.551 5.967 41.885

6 1.450 5.578 47.464 1.450 5.578 47.464

7 1.320 5.077 52.540 1.320 5.077 52.540

8 1.168 4.493 57.033 1.168 4.493 57.033

9 1.121 4.313 61.346 1.121 4.313 61.346

10 1.070 4.115 65.461 1.070 4.115 65.461

11 1.028 3.954 69.415 1.028 3.954 69.415

12 .987 3.796 73.211

13 .927 3.564 76.775

Compone nt

Initial Eigenvalues

Extraction Sums of Squared Loadings

Kemampuan setiap factor mewakili variabel-variabel yang dianalisis

ditunjukkan oleh besarnya varians yang dijelaskan, yang disebut dengan

eigenvalue.Varians yang dimaksud adalah varians variabel-variabel yang sudah

distandardisasi.Dengan standardisasi, nilai rata-rata setiap variabel menjadi nol dan

variansnya menjadi satu.Karena varians setiap variabel adalah satu, maka varians

totalnya ada 26 karena dalam kasus ini ada 26 variabel bebas.

Eigenvalues menunjukkan kepentingan relatif masing-masing factor dalam

menghitung varians ketiga variabel yang dianalisis. Susunan eigenvalues selalu

diurutkan dari yang terbesar sampai ke yang terkecil, dengan kriteria bahwa angka

eigenvalues di bawah 1 tidak digunakan dalam menghitung jumlah faktor yang

(49)

angka eigenvalues memiliki nilai di atas 1. Sehingga proses factoring seharusnya

berhenti pada 11 faktor saja. Faktor 1 memiliki eigenvalue sebesar 2,978 artinya

faktor 1 ini dapat menjelaskan 2,978 atau 11,454% dari total communalities

d. Component Matrix

Tabel 4.6: Conponent Matrix

1 2 3 4 5 6 7 8 9 10 11

Pegal -.144 .369 -.204 -.207 .430 .414 -.277 .022 .128 -.148 -.049

NyeriSendi .022 .724 .000 .022 -.174 -.292 .377 .212 .114 -.109 -.124

Normalotot -.037 -.834 .193 -.077 -.121 -.236 -.231 -.114 -.102 .112 .112 Linulinu .274 .087 -.131 .376 -.006 .507 .239 -.208 -.226 .237 -.057

Muntah .148 .102 .459 -.145 -.181 .076 .170 .156 .406 -.045 .422

Diare .080 .040 .112 -.727 -.254 .126 .037 -.074 -.101 .208 -.175

Kembung -.229 -.086 .042 -.225 .421 -.013 .317 -.246 .156 .061 .363

mual .065 -.226 .237 .423 -.093 .206 .262 .438 .042 .194 -.009

Component

Tabel ini berisikan factor loading (nilai korelasi) antara variabel-variabel

analisis dengan faktor yang terbentuk.Berdasarkan tabel 4.6 di atas, terlihat bahwa ada

11 faktor yang terbentuk dari 26 variabel.Hal ini menunjukkan bahwa 11 factor

adalah jumlah yang paling optimal untuk mereduksi ketiga variabel bebas tersebut.

e. Component Score Coefficient Matrix

Setelah mendapatkan faktor yang terbentuk melalui proses reduksi, maka perlu

dicari persamannya. Dengan persaman tersebut, dapat diperoleh skor setiap faktor

secara manual.Persamaan yang dibuat mirip dengan regresi linier berganda, hanya

dalam persamaan faktornya tidak terdapat konstanta.Skor-skor faktor yang dihasilkan

dapat digunakan untuk menggantikan skor-skor pada varibel bebas yang asli. Hasil

skor faktor yang diperoleh ditunjukkan pada tabel 4.7 dan hasilComponent Score

(50)

Tabel 4.7: Score Faktor

FC1 FC2 FC3 FC4 FC5 FC6 FC7 FC8 FC9 FC10 FC11

-0.0649 -0.11 1.665 0.12 0.4 0.1013 -0.13 0.183 1.005 0.48 -0

1.07655 0.051 1.419 0.55 -0.4 0.3197 -0.46 -0.21 0.129 0.51 0.22

-1.04707 -0.9 1.1 0.21 0.03 -1.239 1.115 -1.97 1.861 2.49 -0.5

-1.16246 -0.99 0.862 0.17 0.35 0.6079 0.022 1.279 0.035 -0.53 0.26

1.11325 0.918 0.687 0.71 0.04 -0.571 0.845 0.457 0.124 -1.12 0.35

0.83123 -0.55 0.624 0.09 0.65 -0.531 0.143 -0.76 0.512 -0 0.54

0.98196 -0.05 1.311 0.73 0.47 -0.469 -0.81 -0.63 -0.78 0.31 -0.5

-1.40938 -0.44 0.474 0.17 -0.8 -0.249 -0.57 0.108 -0.47 -0.18 -0.8

Tabel 4.8: Component Score Coefficient Matrix

1 2 3 4 5 6 7 8 9 10 11

Pegal -.048 .153 -.091 -.122 .277 .285 -.210 .018 .114 -.138 -.048

NyeriSendi .007 .300 .000 .013 -.112 -.201 .286 .181 .101 -.102 -.120

Normalotot -.012 -.345 .086 -.046 -.078 -.163 -.175 -.097 -.091 .105 .109

Linulinu .092 .036 -.058 .222 -.004 .350 .181 -.178 -.201 .222 -.056

Muntah .050 .042 .203 -.086 -.116 .052 .129 .134 .362 -.042 .410

Diare .027 .017 .050 -.430 -.164 .087 .028 -.063 -.090 .194 -.170

Kembung -.077 -.036 .018 -.133 .271 -.009 .240 -.210 .139 .057 .353

Component

4.2.4Membentuk derajat Keanggotaan ( Matriks Uik)

Langkah pertama dalam perhitungan Fuzzy C-Means (FCM) adalah

membentuk matriks derajat keanggotaan awal atau matriks partisi awal Uik.Matrik

partisi Uik mempunyai komponen i= banyaknya data, k = banyaknya cluster. Matrik

ini random dengan kisaran nilai 0 sampai 1. Pembentukan matrik Uik ini dilakukan

dengan menggunakan fungsi seperti tabel 4.9

Tabel 4.9: Fungsi FFCM_InitV

function V = FFCM_InitV (c, p)

V = rand(c, p);

col_sum = sum(V);

(51)

Matriks Uik yang terbentuk dari fungsi FFCM_initV disimpan ke dalam

hepatitis.mat.Jika dijumlahkan maka nilai perbaris dari matriks Uik yang terbentuk

tidak lebih dari 1. Setelah nilai matriks partisi awal disimpan maka proses FCM

dilakukan pertama kali dengan memilih data yang akan diolah, kemudian data

tersebut akan dihitung dengan menggunakan fungsi FFCM yang terdapat pada

halaman lampiran. Perhitungan FCM ini akan dilakukan berulang kali untuk

memperbaiki lokasi pusat cluster. Langkah iterative ini akan dilakukan berdasarkan

minimisasi fungsi objektif.

5.3 Implementasi User Interface

Implementasi sistem pengelompokkan penyakit hepatitis dengan menggunakan Fuzzy

C-Meansini dibangun dengan menggunakan program MATLAB R2010a. Source code

program terdapat pada halaman Lampiran.

Gambar 4.1 : Halaman Pengelompokkan Penyakit Hepatitis

Pada gambar 4.1 ditunjukkan halaman pengelompokkan penyakit hepatitis dengan

menggunakan metode FCM. Di halaman ini user memilih data rekam medis yang akan

dihitung dengan menekan tombol cari maka akan muncul dialog box seperti gambar 4.2

(52)

Gambar 4.2 :dialog box untuk memilih data

Kemudian user memilih nama file berformat .csv yang akan dihitung.setelah tombol

open ditekan maka data yang dipilih akan tampil pada tabel data awal seperti gambar 4.3

Gambar 4.3 :Data awal

Kemudian user memasukkan inisialisasi awal untuk bobot (w), maximum iterasi, nilai

error, iterasi awal dan fungsi objektif awal pada kolom inisialisasi awal seperti gambar 4.4.

Untuk nilai bobot (w) nilai yang diinputkan tidak boleh kurang dari 1 karena nilai

perhitungan akan menjadi 0 jika menginputkan bobot bernilai 1.

(53)

Setelah memasukkan nilai inisialisasi awal tekan tombol “Hitung” untuk menjalankan program. Selanjutnya akan ditampilkan derajat keanggotaan terakhir dan nilai akurasinya.

Ketika tombol “Hitung” ditekan maka secara otomatis nilai derajat keanggotaan terakhir dan nilai fungsi objektif akhir akan tersimpan pada uikAkhir.xls dan FungsiObjektif.xls. Hasil

nilai derajat keanggotaan pada iterasi terakhir yang didapat, nilai fungsi objektif akhir dan

hasil akurasi akan tampak seperti gambar 4.5, gambar 4.6 dan gambar 4.7 dibawah ini

Gambar 4.5 :Nilai derajat keanggotaan iterasi terakhir

1.258421 0.077375 0.030552 0.016056 0.010787 0.00726 0.004815 0.003175 0.002089 0.001373 0.000901 0.000592 0.000389 0.000255 0.000168 0.00011 7.22E-05

Gambar 4.6: Fungsi Objektif

(54)

Nilai derajat keanggotaan akhir pada gambar 4.6 merupakan hasil dari perhitungan

metode FCM.Nilai derajat keanggotaan akhir ini yang menentukan pengelompokkan dari

data pasien penyakit hepatitis.Cara mengelompokkan pasien berpenyakit hepatitis ini dengan

melihat nilai tertinggi dari derajat keanggotaan akhir yang didapat.

Fungsi objektif pada gambar 4.6 dapat memberitahu banyak iterasi yang dilakukan untuk mengolah data dengan menggunakan metode FCM dan nilai minimasi fungsi objektif yang didapat.Pada gambar 4.6 dilakukan 17 kali iterasi dengan nilai minimasi fungsi objektif sebesar -3.77768E-05.

Pada gambar 4.7 diatas ditunjukkan hasil pengelompokkan dengan menggunakan

metode FCM, akurasi yang diperoleh dari hasil percobaan tersebut sebesar 46.5517%. Nilai

akurasi tersebut didapatkan dengan cara :

Akurasi=

.

Jika dibandingkan dengan penelitian sebelumnya akurasi yang diperoleh dari

penelitian ini lebih buruk, karena penelitian sebelumnya akurasi yang diperoleh sebesar

51.11%.

5.4 Hasil Pengujian

Pengujian yang dilakukan pada sistem pengelompokkan penyakit hepatitis ini

dilakukan dengan menggunakan data anamnesisyang belum di PCA, data anamnesa sudah di

PCA, data anamnesa sudah di PCA digabungkan dengan data laboratorium dan percobaan

yang terakhir dilakukan pada data laboratorium. Data anamnesa yang digunakan memiliki

110 data dan 26 atribut berbentuk biner, sedangkan data laboratorium yang digunakan

memiliki 110 data dan 5 atribut. Data anamnesa yang sudah dilakukan proses PCA terdiri

dari 110 data dan 11 atribut dan pada data anamnesa yang sudah di PCA dan digabung

dengan data laboratorium terdiri dari 110 data dan 16 atribut.

Tabel 4.10 menunjukkan hasil percobaan pada data anamnesa dokter yang didalamnya

terdiri dari nilai inisialisasi awal yang diinputkan dan nilai akurasi yang didapat dari

percobaan tersebut.Sedangkan tabel 4.11 menunjukkan hasil percobaan pada data

laboratorium yang didalamnya terdiri dari nilai inisialisasi awal yang diinputkan dan nilai

akurasi serta perrcobaan dengan menggunakan data laboratorium yang sudah di normalisasi.

(55)

tabel 4.12 dan hasil percobaan pada data anamnesa yang sudah dilakukan proses PCA dan

digabung dengan data laboratorium ditunjukkan pada tabel 4.13

Tabel 4.10 Hasil Pengujian data anamnesa dokter

NO Nilai inisialisasi awal akurasi

1 Bobot(w)=2; maksimum iterasi =100; error = 1e-4;

iterasi awal =1; fungsi objektif awal = 0

46.5517%

45.6897%

3 Bobot(w)=6; maksimum iterasi =18; error = 0.002;

50%

43.1034%

5 Bobot(w)=8; maksimum iterasi =50; error =

0.000005; iterasi awal =1; fungsi objektif awal = 0

47.4138%

Tabel 4.11 Hasil Pengujian data laboratorium

82.3529%

(56)

78.1818%

83.871%

74.5455%

iterasi awal =1; fungsi objektif awal = 0 ( dengan

menggunakan data laboratorium yang sudah di

normalisasi ).

100%

Tabel 4.12Hasil Pengujian data anamnesa dokter(PCA)

38.2114%

39.0244%

40.6504%