Proposal skripsi dan diagnosa hepatitis

(1)

DEPARTEMEN PENDIDIKAN DAN KEBUDAYAAN NASIONAL UNIVERSITAS NEGERI SEMARANG

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

PROPOSAL SKRIPSI Diajukan oleh :

Nama : Jefry Latu Handarko

Nim : 4111410028

Prodi : Matematika, S1 Jurusan : Matematika

Implementasi Fuzzy Decision Tree untuk

mendiagnosa penyakit Hepatitis

A.

PENDAHULUAN

1. Latar Belakang

Suatu gejala penyakit dapat merupakan indikasi dari

suatu penyakit yang akan diderita. Setiap orang wajib

menjaga kesehatannya masing-masing, tetapi pada kenyataannya banyak sekali orang yang lupa atau bahkan meremehkan gejala penyakit yang

dideritanya. Maka dengan adanya kemajuan teknologi saat ini, suatu penyakit akan terdeteksi dengan lebih cepat melalui gejala-gejala tersebut.

Tidak hanya hal tersebut, dalam hal proses diagnosa dikenal dengan adanya

(2)

uji tes darah di laboratorium untuk mengetahui jenis penyakit yang diderita oleh pasien secara pasti.

Hepatitis adalah suatu penyakit peradangan hati yang umumnya disebabkan

oleh virus, yang dewasa ini banyak diderita baik orang dewasa mau pun anak-anak. Karena itu, diperlukan suatu penanganan dini sebelum penderita

penyakit tersebut bertambah parah. Salah satu cara penanganan dini dari penyakit hepatitis ini adalah melakukan pemeriksaan sejak awal, karena itu dibuatlah suatu sistem diagnosa penyakit hepatitis yang dapat membantu

penderita untuk melakukan pemeriksaan. Sistem ini sendiri dibangun menggunakan metode decision tree, dimana pada metode decision tree ini

dibutuhkan suatu data pembelajaran, sehingga nantinya sistem dapat mengambil suatu keputusan. Dengan menghitung nilai entropy dari data pembelajaran yang dimasukkan decision tree mampu memberikan

keputusan berdasarkan skala prioritas atribut data yang digunakan.

Klasifikasi hepatitis sebenarnya dapat dilakukan dengan menggunakan

logika tegas. Akan tetapi hal ini sangat kaku, karena dengan adanya perubahan yang kecil saja terhadap nilai dapat mengakibatkan perbedaan kategori. Logika fuzzy digunakan untuk mengantisipasi hal tersebut, karena

dapat memberikan toleransi terhadap nilai, sehingga dengan adanya perubahan sedikit pada nilai tidak akan memberikan perbedaan yang

signifikan. Dengan memanfaatkan kelebihan logika fuzzy dalam toleransi terhadap hal ambigu, diharapkan dapat menjadi pendukung keputusan dalam mengklasifikasikan data hepatitis.

(3)

Data mining merupakan proses ekstraksi informasi atau pola penting dalam

basis data berukuran besar. Data mining merupakan metode untuk menemukan suatu pengetahuan dalam suatu database yang cukup besar.

Data mining adalah proses menggali dan menganalisa sejumlah data yang sangat besar untuk memperoleh sesuatu yang benar, baru, sangat bermanfaat

dan akhirnya dapat menemukan suatu corak atau pola dalam data tersebut. Tujuan utama penerapan data mining adalah untuk prediksi (prediction) dan uraian (description). Klasifikasi adalah proses menemukan model (atau

fungsi) yang akan mengelompokkan kelas data sehingga dapat memprediksi kelas obyek yang tidak diketahui. Model yang diperoleh bisa diwakili

diberbagai bentuk, seperti klasifikasi berbentuk aturan IF-THEN, pohon keputusan (decision tree), rumus matematika, atau jaringan saraf tiruan Pada penelitian ini akan diterapkan salah satu teknik dalam data mining,

yaitu klasifikasi terhadap data hepatitis.

Klasifikasi merupakan salah satu metode dalam data mining untuk

memprediksi label kelas dari suatu record dalam data. Metode yang digunakan dalam penelitian ini yaitu metode klasifikasi dengan fuzzy decision tree. Penggunaan teknik fuzzy memungkinkan melakukan prediksi

suatu objek yang dimiliki oleh lebih dari satu kelas. Dengan menerapkan teknik data mining pada data hepatitis diharapkan dapat ditemukan aturan

klasifikasi yang dapat digunakan untuk memprediksi potensi seseorang terserang penyakit hepatitis.

(4)

Decision tree merupakan suatu pendekatan yang sangat populer dan praktis

dalam machine learning untuk menyelesaikan permasalahan klasifikasi. Konsep Decision tree adalah mengubah data menjadi pohon keputusan

(decision tree) dan aturan-aturan keputusan (rule). Decision tree membuat aturan rule yang dapat digunakan untuk menentukan apakah seseorang

mempunyai potensi untuk menderita Hepatitis atau tidak.

Pada penelitian ini, algoritma yang digunakan dalam fuzzy decision tree adalah ID3 (Iterative Dichotomiser 3). Algoritma ini menggunakan teori

informasi untuk menentukan atribut mana yang paling informatif. Namun ID3 (Iterative Dichotomiser 3) sangat tidak stabil dalam melakukan

klasifikasi yang berkenaan dengan gangguan kecil pada data pelatihan. Logika fuzzy dapat memberikan suatu peningkatan dalam melakukan klasifikasi pada saat pelatihan.

2. Rumusan Masalah

a. Bagaimana menerapkan Fuzzy ID3 terhadap data penyakit hepatitis?

b. Bagaimana tingkat akurasi diagnose penyakit hepatitis menggunakan decision tree?

3. Tujuan Penelitian

Tujuan dari penelitian ini adalah :

a. Menerapkan salah satu teknik klasifikasi yaitu Fuzzy ID3 (Iterative Dichotomiser 3) Decision Tree pada data hasil pemeriksaan lab pasien.

(5)

b.

Menemukan aturan klasifikasi pada data hepatitis yang menjelaskan dan

membedakan kelas-kelas atau konsep sehingga dapat digunakan untuk

memprediksi penyakit hepatitis berdasarkan nilai dari atribut lain yang diketahui.

4. Manfaat Penelitian

Model yang dihasilkan pada penelitian ini diharapkan dapat digunakan oleh

pihak yang berkepentingan untuk memprediksi potensi seseorang atau pasien terserang penyakit hepatitis, sehingga terjadinya penyakit ini pada seseorang dapat diprediksi sedini mungkin dan dapat dilakukan tindakan

antisipasi.

B. LANDASAN TEORI

1. Logika Fuzzy

Fuzzy secara bahasa diartikan sebagai kabur atau samar samar.

Suatu nilai dapat bernilai besar atau salah secara bersamaan. Dalam fuzzy

dikenal derajat keanggotaan yang memiliki rentang nilai 0 (nol) hingga 1(satu). Berbeda dengan himpunan tegas yang memiliki nilai 1 atau 0 (ya

atau tidak). Logika Fuzzy merupakan seuatu logika yang memiliki nilai kekaburan atau kesamaran (fuzzyness) antara benar atau salah. Dalam teori logika fuzzy suatu nilai bias bernilai benar atau salah secara bersama.

(6)

Namun berapa besar keberadaan dan kesalahan suatu tergantung pada bobot keanggotaan yang dimilikinya.

Himpunan adalah suatu kumpulan atau koleksi objek-objek yang

mempunyai kesamaan sifat tertentu (Frans Susilo, 2006). Himpunan fuzzy merupakan suatu pengembangan lebih lanjut tentang konsep himpunan

dalam matematika. Himpunan fuzzy adalah rentang nilai-nilai, masing-masing nilai mempunyai derajat keanggotaan antara 0 sampai dengan 1. Prinsip dasar dan persamaan matematika dari teori himpunan fuzzy adalah

sebuah teori pengelompokan objek dalam batas yang samar. Himpunan tersebut dikaitkan dengan suatu fungsi yang menyatakan derajat

kesesuaian unsur-unsur dalam semestanya dengan konsep yang merupakan syarat keanggotaan himpunan tersebut. Fungsi itu disebut fungsi keanggotaan dan nilai fungsi itu disebut derajat keanggotaan suatu unsur

dalam himpunan itu, yang selanjutnya disebut himpunan kabur (fuzzy set). Ada beberapa hal yang perlu diketahui dalam memahami himpunan

fuzzy, yaitu:

a) Variabel fuzzy

Variabel fuzzy merupakan suatu lambang atau kata yang menunjuk kepada suatu yang tidak tertentu dalam sistem fuzzy. Contoh:

permintaan, persediaan, produksi, dan sebagainya. b) Himpunan fuzzy

Himpunan fuzzy merupakan suatu kumpulan yang mewakili suatu

kondisi atau keadaan tertentu dalam suatu variabel fuzzy.

(7)

Himpunan fuzzy memiliki 2 atribut, yaitu :

1. Linguistik, yaitu penamaan suatu grup yang memiliki suatu keadaan atau kondisi tertentu dengan menggunakan bahasa, seperti:

muda, parobaya, tua.

2. Numeris, yaitu suatu nilai (angka) yang menunjukkan ukuran

dari suatu variabel seperti : 5, 10, 15, dan sebagainya. c) Semesta pembicaraan

Semesta pembicaraan adalah keseluruhan nilai yang diperbolehkan untuk dioperasikan dalam suatu variabel fuzzy.

d) Domain

Domain himpunan fuzzy adalah keseluruhan nilai yang diijinkan dalam semesta pembicaraan dan boleh dioperasikan dalam suatu

himpunan fuzzy.

2. Fungsi Keanggotaan

Fungsi Keanggotaan adalah suatu kurva yang menunjukkan pemetaan titik-titik input data ke dalam nilai/derajat keanggotaannya yang memiliki

interval antara 0 sampai 1. Salah satu cara untuk mendapatkan nilai keanggotaan adalah dengan melalui pendekatan fungsi.

Ada beberapa fungsi yang bisa digunakan:

a) Representasi Linear

Pada representasi linear, pemetaan input ke derajat keanggotaannya

dapat digambarkan sebagai suatu garis lurus. Bentuk ini paling

(8)

1

0

a b

µ(x)

domain

sederhana dan menjadi pilihan yang baik untuk mendekati suatu konsep yang kurang jelas. Ada 2 keadaan himpunan fuzzy yang linear.

Pertama, Representasi linear naik, yaitu kenaikan himpunan dimulai dari nilai domain yang memiliki nilai keanggotaan nol [0] bergerak

ke kanan menuju ke nilai domain yang memiliki derajat keanggotaan yang lebih tinggi (Gambar 2.1).

Fungsi keanggotaan :

μ(x)=

{

0; x ≤ a

(x−a)

(b−a);a<x ≤ b

Kedua, Representasi linear turun, yaitu garis lurus yang dimulai dari nilai domain dengan derajat keanggotaan tertinggi pada sisi kiri, kemudian bergerak turun ke nilai domain yang memiliki derajat

keanggotaan lebih rendah (Gambar 2.2).

8 Gambar 2.1 Representasi Linier

(9)

1

0

a b

µ(x)

domain

1

0

a c

µ(x)

b

μ(x)=

{

(b−x)

(b−a);a ≤ x<b 0; x ≥ b

b) Representasi Kurva Segitiga

Representasi kurva segitiga, pada dasarnya adalah gabungan antara

dua representasi linear (representasi linear naik dan representasi linear turun), seperti terlihat pada Gambar 2.3.

9 Gambar 2.2 Representasi Linier

(10)

c a

1

0

µ(x)

b domain d

μ[x]=

{

0;∧x ≤ a atau x ≥ a x−a

b−a ;∧a ≤ x ≤ b b−x

c−b ;∧b ≤ x ≤ c

c) Representasi Kurva Trapesium

Kurva Trapesium pada dasarnya seperti bentuk segitiga, hanya saja ada beberapa titik yang memiliki nilai keanggotaan 1

Fungsi keanggotaan:

10 Gambar 2.3 Representasi kurva

segitiga

(11)

μ[x]=

{

0;∧x ≤ a atau x ≥ a x−a

b−a ;∧a ≤ x ≤ b 1;∧b ≤ x ≤ c

d−x d−c ; x ≥ d

3. Operasi dasar himpunan fuzzy

Operasi dasar himpunan fuzzy (operator zadeh) digunakan untuk

mengkombinasi dan memodifikasi himpunan fuzzy. Nilai keanggotaan sebagai hasil dari operasi 2 himpunan disebut fire strength atau α predikat.

Berbagai macam operator zadeh:

a) Operator AND

Operator ini berhubungan dengan operasi interseksi pada himpunan. α-predikat sebagai hasil operasi dengan operator AND diperoleh dengan mengambil nilai keanggotaan terkecil antar elemen pada

himpunan-himpunan yang bersangkutan.

μA ∩ B=min ⁡(μA[x], μB[y])

b) Operator OR

Operator ini berhubungan dengan operasi union pada himpunan

α-predikat sebagai hasil operasi dengan operator AND diperoleh dengan mengambil nilai keanggotaan terkecil antar elemen pada

himpunan-himpunan yang bersangkutan.

μA∪B=max ⁡(μA[x], μB[y])

(12)

c) Operator NOT

Operator ini berhubungan dengan operasi komplemen himpunan. α-predikat sebagai hasil operasi dengan operator AND diperoleh dengan

mengambil nilai keanggotaan terkecil antar elemen pada himpunan-himpunan yang bersangkutan.

μ A'=1−μA[x]

Contoh :

Misal derajat keanggotaan 27 tahun pada himpunan MUDA adalah 0.6 (µMUDA[27] = 0.6),

Derajat keanggotaan Rp.2 juta pada himpunan penghasilan TINGGI adalah 0.8 (μGAJITINGGI[2juta] = 0.8),

maka α predikat untuk usia MUDA dan berpenghasilan TINGGI : μMUDA ∩ μGAJITINGGI = min (μMUDA[27], μGAJITINGGI[2juta]) = min (0.6 , 0.8) = 0.6.

4. ATURAN (RULE) IF-THEN FUZZY

Aturan IF-THEN fuzzy adalah penyataan IF-THEN dimana beberapa kata-kata dalam pernyataan tersebut ditentukan oleh fungsi keanggotaan.

Aturan produksi fuzzy adalah relasi fuzzy antara dua proposisi fuzzy.

Aturan tersebut dinyatakan dalam bentuk:

IF (Proporsi Fuzzy 1) THEN (Proporsi Fuzzy 2)

(13)

Proposisi fuzzy adalah memiliki derajat kebenaran yang dinyatakan dalam suatu bilangan dalam bentuk interval [0,1], dimana benar dinyatakan oleh nilai 1 dan salah dinyatakan oleh nilai 0.

Contoh :

IF permintaan turun AND persediaan banyak THEN produksi barang

berkurang.

IF permintaan naik AND persediaan sedikit THEN produksi barang bertambah.

5. Data Mining

Data mining merupakan solusi yang mampu menemukan kandungan informasi yang tersembunyi berupa pola dan aturan dari sekumpulan data yang besar agar mudah dipahami. Informasi yang tersembunyi ini sangat

menguntungkan dari sudut pandang penelitian, bisnis dan lainnya. Teknik-teknik data mining yang paling populer antara lain :

a. Association Rule Mining

Teknik data mining untuk menemukan aturan asosiasi antara suatu kombinasi item.

b. Classification

Proses untuk menemukan model atau fungsi yang menjelaskan atau

membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan kelas dari suatu obyek yang labelnya tidak diketahui. c. Clustering

(14)

Proses pengelompokkan data tanpa berdasarkan kelas data tertentu. Clustering dapat dipakai untuk memberikan label pada kelas data

yang belum diketahui.

Dalam penelitian ini, digunakan teknik data mining, yaitu klasifikasi.

6. Fuzzy Decision Tree (FDT)

Decision tree merupakan suatu pendekatan yang sangat populer dan

praktis dalam machine learning untuk menyelesaikan permasalahan

klasifikasi. Pada decision tree terdapat 3 jenis node, yaitu:

a. Root Node, merupakan node paling atas, pada node ini tidak ada input dan bisa tidak mempunyai output atau mempunyai output lebih dari

satu.

b. Internal Node, merupakan node percabangan, pada node ini hanya

terdapat satu input dan mempunyai output minimal dua.

c. Leaf node atau terminal node, merupakan node akhir, pada node ini hanya terdapat satu input dan tidak mempunyai output.

Konsep Decision tree adalah mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule).

Metode ini digunakan untuk memperkirakan nilai diskret dari fungsi target, yang mana fungsi pembelajaran direpresentasikan oleh sebuah decision tree. Decision tree merupakan himpunan aturan IF…THEN.

Setiap path dalam tree dihubungkan dengan sebuah aturan, di mana

(15)

premis terdiri atas sekumpulan node-node yang ditemui, dan kesimpulan dari aturan terdiri atas kelas yang terhubung dengan leaf dari path.

Fuzzy decision tree memungkinkan untuk menggunakan nilai-nilai

numeric-symbolic selama konstruksi atau saat mengklasifikasikan

kasus-kasus baru. Manfaat dari teori himpunan fuzzy dalam decision tree ialah

meningkatkan kemampuan dalam memahami decision tree ketika menggunakan atribut-atribut kuantitatif. Bahkan, dengan menggunakan teknik fuzzy dapat meningkatkan ketahanan saat melakukan klasifikasi

kasus-kasus baru.

7.

Fuzzy ID3 Decision Tree

ID3 (Iterative Dichotomiser 3) merupakan salah satu algoritme yang

banyak digunakan untuk membuat suatu decision tree. Algoritme ini pertama kali diperkenalkan oleh Quinlan, menggunakan teori informasi

untuk menentukan atribut mana yang paling informatif, namun ID3 (Iterative Dichotomiser 3) sangat tidak stabil dalam melakukan penggolongan berkenaan dengan gangguan kecil pada data pelatihan.

Logika fuzzy dapat memberikan suatu peningkatan untuk dalam melakukan penggolongan pada saat pelatihan.

Secara ringkas, cara kerja Algoritma ID3 dapat digambarkan sebagai berikut.

Pemilihan atribut dengan menggunakan Information Gain

(16)

a. Pilih atribut dimana nilai information gainnya terbesar b. Buat simpul yang berisi atribut tersebut

c. Proses perhitungan information gain akan terus dilaksanakan sampai

semua data telah termasuk dalam kelas yang sama. Atribut yang telah dipilih tidak diikutkan lagi dalam perhitungan nilai information gain.

Pemilihan atribut pada ID3 dilakukan dengan properti statistik, yang disebut dengan information gain. Gain mengukur seberapa baik suatu atribut memisahkan training example ke dalam kelas target.

8.

Fuzzy Entropy dan Information Gain

Information gain adalah suatu nilai statistik yang digunakan untuk

memilih atribut yang akan mengekspansi tree dan menghasilkan node baru pada algoritme ID3 (Iterative Dichotomiser 3). Suatu entropy dipergunakan untuk mendefinisikan nilai information gain. Entropy

dirumuskan sebagai berikut:

merupakan hasil pengurangan entropy dari himpunan.

(17)

Informasi gain didefinisikan sebagai berikut : Pada himpunan data fuzzy, terdapat penyesuaian rumus untuk menghitung

nilai entropy untuk atribut dan information gain karena adanya ekspresi data fuzzy. Berikut adalah persamaan untuk mencari nilai fuzzy entropy dari keseluruhan data :

Hf(s)=Hs(S)=

∑

i N

−Pi∗log2¿ ¿

Untuk menentukan fuzzy entropi dan information gain dari suatu atribut

pada algoritma fuzzy ID3(EID3) digunakan persamaan sebagai berikut :

Hf(S , A)=−

∑

menunjukkan entropy dari himpunan S dari data pelatihan pada node.

¿Sv∨¿adalahukuran dari subset Sv⊆S dari pelatihan xj dengan atribut v. | S| menunjukan ukuran dari himpunan S.

C. METODE PENELITIAN

Pada metode penelitian ini dapat mencapai tujuan penelitian yang telah

ditetapkan dan penelitian berjalan dengan lancar. Melalui metode penelitian,

(18)

masalah yang dihadapi dapat diatasi dan dipecahkan. Metode penelitian yang digunakan dalam penulisan skripsi ini adalah menentukan masalah, perumusan masalah, studi pustaka, penyelesaian masalah dan penarikan

kesimpulan.

1. Menentukan dan Perumusan Masalah

Menentukan masalah dimulai dari studi pustaka.Studi pustaka merupakan penelaahan dari beberapa sumber yang relevan untuk mengumpulkan informasi yang diperlukan dalam penulisan skripsi ini. Setelah beberapa

sumber pustaka terkumpul, maka akan dilanjutkan penelaahan isi dari sumber-sumber pustaka tersebut. Dari penelaahan tersebut akan

memunculkan ide-ide yang kemudian dijadikan landasan teori dari penulisan skripsi ini.

Masalah yang ditemukan kemudian dirumuskan kedalam pertanyaan yang

harus diselesaikan yakni:

(1) Bagaimana penggunaan Algoritme ID3 (Iterative Dichotomiser 3) pada Diagnosa Hepatitis?

(2) Bagaimana visualisasi penggambaran fuzzy decision tree pada sebuah program?

2. Studi Pustaka

Studi pustaka merupakan pencarian sumber pustaka yang relevan serta

nantinya akan digunakan untuk mengumpulkan data maupun informasi yang diperlukan pada penelitian. Studi pustaka dilakukan dengan

mengumpulkan sumber pustaka yang dapat berupa buku-buku referensi,

(19)

skripsi, makalah dan sebagainya.Sehingga didapat suatu ide mengenai bahan dasar pengembangan upaya pemecahan masalah.

3. Pemecahan masalah

Setelah permasalahan dirumuskan dan sumber pustaka terkumpul, langkah selanjutnya adalah pemecahan masalah melalui pengkajian secara

teoritis yang selanjutnya disusun secara rinci dalam bentuk pembahasan sebagai berikut:

(1) Menentukan fuzzy decision tree pada data hepatitis

(2) Menyelesaikan bentuk persamaan tersebut menggunakan algoritma ID3 (Iterative Dichotomiser 3).

(3) Memvisualisasikan penyelesaian tersebut menggunakan program. 4. Penarikan kesimpulan

Langkah ini merupakan langkah terakhir dari penelitan.Penarikan

kesimpulan didasarkan pada studi pustaka dan pembahasan permasalahan.Simpulan yang diperoleh merupakan hasil analisa dari

penelitian.

(20)

D.

DAFTAR PUSTAKA

de Mol, R.M. and W.E. Woldt. 2001. Application of fuzzy logic in automated cow status monitoring. Journal of Dairy Science 84(2)

Frans Susilo SJ. 2003. “Himpunan dan Logika Kabur Serta Aplikasinya”. Graha Ilmu. Yogyakarta.

F Romansyah, I. S. Sitanggang, S. Nurdiati. 2009. “Fuzzy Decision Tree dengan Algoritme ID3 pada Data Diabetes”. Internerworking Indonesia Jurnal.

Kusumadewi dan H. Purnomo. 2004. Aplikasi Logika Fuzzy untuk Pendukung Keputusan. Penerbit Graha Ilmu, Yogyakarta

Setiaji. 2009 “Himpunan dan Logika Samar serta Aplikasinya”. Graha Ilmu. Yoyakarta.

Sri Kusumadewi, Sri Haryati, Agus Harjoko, Retantyo Wardoyo. 2006.

“Fuzzy Multi-Attribute Decision Making (FUZZY MADM)”. Graha

Ilmu. Yogyakarta.

Yusuf Elmande, Prabowo Pudjo Widodo. 2012. “Pemilihan Criteria Splitting dalam Algoritma Iterative Dichotomiser 3 (ID3) untuk Penentuan Kualitas Beras : Studi Kasus Pada Perum Bulog Divre Lampung”.

Magister Ilmu Komputer Program Pascasarjana Universitas Budi Luhur