DEPARTEMEN PENDIDIKAN DAN KEBUDAYAAN NASIONAL UNIVERSITAS NEGERI SEMARANG
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PROPOSAL SKRIPSI Diajukan oleh :
Nama : Jefry Latu Handarko
Nim : 4111410028
Prodi : Matematika, S1 Jurusan : Matematika
Implementasi Fuzzy Decision Tree untuk
mendiagnosa penyakit Hepatitis
A.
PENDAHULUAN
1. Latar BelakangSuatu gejala penyakit dapat merupakan indikasi dari
suatu penyakit yang akan diderita. Setiap orang wajib
menjaga kesehatannya masing-masing, tetapi pada kenyataannya banyak sekali orang yang lupa atau bahkan meremehkan gejala penyakit yang
dideritanya. Maka dengan adanya kemajuan teknologi saat ini, suatu penyakit akan terdeteksi dengan lebih cepat melalui gejala-gejala tersebut.
Tidak hanya hal tersebut, dalam hal proses diagnosa dikenal dengan adanya
uji tes darah di laboratorium untuk mengetahui jenis penyakit yang diderita oleh pasien secara pasti.
Hepatitis adalah suatu penyakit peradangan hati yang umumnya disebabkan
oleh virus, yang dewasa ini banyak diderita baik orang dewasa mau pun anak-anak. Karena itu, diperlukan suatu penanganan dini sebelum penderita
penyakit tersebut bertambah parah. Salah satu cara penanganan dini dari penyakit hepatitis ini adalah melakukan pemeriksaan sejak awal, karena itu dibuatlah suatu sistem diagnosa penyakit hepatitis yang dapat membantu
penderita untuk melakukan pemeriksaan. Sistem ini sendiri dibangun menggunakan metode decision tree, dimana pada metode decision tree ini
dibutuhkan suatu data pembelajaran, sehingga nantinya sistem dapat mengambil suatu keputusan. Dengan menghitung nilai entropy dari data pembelajaran yang dimasukkan decision tree mampu memberikan
keputusan berdasarkan skala prioritas atribut data yang digunakan.
Klasifikasi hepatitis sebenarnya dapat dilakukan dengan menggunakan
logika tegas. Akan tetapi hal ini sangat kaku, karena dengan adanya perubahan yang kecil saja terhadap nilai dapat mengakibatkan perbedaan kategori. Logika fuzzy digunakan untuk mengantisipasi hal tersebut, karena
dapat memberikan toleransi terhadap nilai, sehingga dengan adanya perubahan sedikit pada nilai tidak akan memberikan perbedaan yang
signifikan. Dengan memanfaatkan kelebihan logika fuzzy dalam toleransi terhadap hal ambigu, diharapkan dapat menjadi pendukung keputusan dalam mengklasifikasikan data hepatitis.
Data mining merupakan proses ekstraksi informasi atau pola penting dalam
basis data berukuran besar. Data mining merupakan metode untuk menemukan suatu pengetahuan dalam suatu database yang cukup besar.
Data mining adalah proses menggali dan menganalisa sejumlah data yang sangat besar untuk memperoleh sesuatu yang benar, baru, sangat bermanfaat
dan akhirnya dapat menemukan suatu corak atau pola dalam data tersebut. Tujuan utama penerapan data mining adalah untuk prediksi (prediction) dan uraian (description). Klasifikasi adalah proses menemukan model (atau
fungsi) yang akan mengelompokkan kelas data sehingga dapat memprediksi kelas obyek yang tidak diketahui. Model yang diperoleh bisa diwakili
diberbagai bentuk, seperti klasifikasi berbentuk aturan IF-THEN, pohon keputusan (decision tree), rumus matematika, atau jaringan saraf tiruan Pada penelitian ini akan diterapkan salah satu teknik dalam data mining,
yaitu klasifikasi terhadap data hepatitis.
Klasifikasi merupakan salah satu metode dalam data mining untuk
memprediksi label kelas dari suatu record dalam data. Metode yang digunakan dalam penelitian ini yaitu metode klasifikasi dengan fuzzy decision tree. Penggunaan teknik fuzzy memungkinkan melakukan prediksi
suatu objek yang dimiliki oleh lebih dari satu kelas. Dengan menerapkan teknik data mining pada data hepatitis diharapkan dapat ditemukan aturan
klasifikasi yang dapat digunakan untuk memprediksi potensi seseorang terserang penyakit hepatitis.
Decision tree merupakan suatu pendekatan yang sangat populer dan praktis
dalam machine learning untuk menyelesaikan permasalahan klasifikasi. Konsep Decision tree adalah mengubah data menjadi pohon keputusan
(decision tree) dan aturan-aturan keputusan (rule). Decision tree membuat aturan rule yang dapat digunakan untuk menentukan apakah seseorang
mempunyai potensi untuk menderita Hepatitis atau tidak.
Pada penelitian ini, algoritma yang digunakan dalam fuzzy decision tree adalah ID3 (Iterative Dichotomiser 3). Algoritma ini menggunakan teori
informasi untuk menentukan atribut mana yang paling informatif. Namun ID3 (Iterative Dichotomiser 3) sangat tidak stabil dalam melakukan
klasifikasi yang berkenaan dengan gangguan kecil pada data pelatihan. Logika fuzzy dapat memberikan suatu peningkatan dalam melakukan klasifikasi pada saat pelatihan.
2. Rumusan Masalah
a. Bagaimana menerapkan Fuzzy ID3 terhadap data penyakit hepatitis?
b. Bagaimana tingkat akurasi diagnose penyakit hepatitis menggunakan decision tree?
3. Tujuan Penelitian
Tujuan dari penelitian ini adalah :
a. Menerapkan salah satu teknik klasifikasi yaitu Fuzzy ID3 (Iterative Dichotomiser 3) Decision Tree pada data hasil pemeriksaan lab pasien.
b.
Menemukan aturan klasifikasi pada data hepatitis yang menjelaskan danmembedakan kelas-kelas atau konsep sehingga dapat digunakan untuk
memprediksi penyakit hepatitis berdasarkan nilai dari atribut lain yang diketahui.
4. Manfaat Penelitian
Model yang dihasilkan pada penelitian ini diharapkan dapat digunakan oleh
pihak yang berkepentingan untuk memprediksi potensi seseorang atau pasien terserang penyakit hepatitis, sehingga terjadinya penyakit ini pada seseorang dapat diprediksi sedini mungkin dan dapat dilakukan tindakan
antisipasi.
B. LANDASAN TEORI
1. Logika Fuzzy
Fuzzy secara bahasa diartikan sebagai kabur atau samar samar.
Suatu nilai dapat bernilai besar atau salah secara bersamaan. Dalam fuzzy
dikenal derajat keanggotaan yang memiliki rentang nilai 0 (nol) hingga 1(satu). Berbeda dengan himpunan tegas yang memiliki nilai 1 atau 0 (ya
atau tidak). Logika Fuzzy merupakan seuatu logika yang memiliki nilai kekaburan atau kesamaran (fuzzyness) antara benar atau salah. Dalam teori logika fuzzy suatu nilai bias bernilai benar atau salah secara bersama.
Namun berapa besar keberadaan dan kesalahan suatu tergantung pada bobot keanggotaan yang dimilikinya.
Himpunan adalah suatu kumpulan atau koleksi objek-objek yang
mempunyai kesamaan sifat tertentu (Frans Susilo, 2006). Himpunan fuzzy merupakan suatu pengembangan lebih lanjut tentang konsep himpunan
dalam matematika. Himpunan fuzzy adalah rentang nilai-nilai, masing-masing nilai mempunyai derajat keanggotaan antara 0 sampai dengan 1. Prinsip dasar dan persamaan matematika dari teori himpunan fuzzy adalah
sebuah teori pengelompokan objek dalam batas yang samar. Himpunan tersebut dikaitkan dengan suatu fungsi yang menyatakan derajat
kesesuaian unsur-unsur dalam semestanya dengan konsep yang merupakan syarat keanggotaan himpunan tersebut. Fungsi itu disebut fungsi keanggotaan dan nilai fungsi itu disebut derajat keanggotaan suatu unsur
dalam himpunan itu, yang selanjutnya disebut himpunan kabur (fuzzy set). Ada beberapa hal yang perlu diketahui dalam memahami himpunan
fuzzy, yaitu:
a) Variabel fuzzy
Variabel fuzzy merupakan suatu lambang atau kata yang menunjuk kepada suatu yang tidak tertentu dalam sistem fuzzy. Contoh:
permintaan, persediaan, produksi, dan sebagainya. b) Himpunan fuzzy
Himpunan fuzzy merupakan suatu kumpulan yang mewakili suatu
kondisi atau keadaan tertentu dalam suatu variabel fuzzy.
Himpunan fuzzy memiliki 2 atribut, yaitu :
1. Linguistik, yaitu penamaan suatu grup yang memiliki suatu keadaan atau kondisi tertentu dengan menggunakan bahasa, seperti:
muda, parobaya, tua.
2. Numeris, yaitu suatu nilai (angka) yang menunjukkan ukuran
dari suatu variabel seperti : 5, 10, 15, dan sebagainya. c) Semesta pembicaraan
Semesta pembicaraan adalah keseluruhan nilai yang diperbolehkan untuk dioperasikan dalam suatu variabel fuzzy.
d) Domain
Domain himpunan fuzzy adalah keseluruhan nilai yang diijinkan dalam semesta pembicaraan dan boleh dioperasikan dalam suatu
himpunan fuzzy.
2. Fungsi Keanggotaan
Fungsi Keanggotaan adalah suatu kurva yang menunjukkan pemetaan titik-titik input data ke dalam nilai/derajat keanggotaannya yang memiliki
interval antara 0 sampai 1. Salah satu cara untuk mendapatkan nilai keanggotaan adalah dengan melalui pendekatan fungsi.
Ada beberapa fungsi yang bisa digunakan:
a) Representasi Linear
Pada representasi linear, pemetaan input ke derajat keanggotaannya
dapat digambarkan sebagai suatu garis lurus. Bentuk ini paling
1
0
a b
µ(x)
domain
sederhana dan menjadi pilihan yang baik untuk mendekati suatu konsep yang kurang jelas. Ada 2 keadaan himpunan fuzzy yang linear.
Pertama, Representasi linear naik, yaitu kenaikan himpunan dimulai dari nilai domain yang memiliki nilai keanggotaan nol [0] bergerak
ke kanan menuju ke nilai domain yang memiliki derajat keanggotaan yang lebih tinggi (Gambar 2.1).
Fungsi keanggotaan :
μ(x)=
{
0; x ≤ a
(x−a)
(b−a);a<x ≤ b
Kedua, Representasi linear turun, yaitu garis lurus yang dimulai dari nilai domain dengan derajat keanggotaan tertinggi pada sisi kiri, kemudian bergerak turun ke nilai domain yang memiliki derajat
keanggotaan lebih rendah (Gambar 2.2).
8 Gambar 2.1 Representasi Linier
1
0
a b
µ(x)
domain
1
0
a c
µ(x)
b
Fungsi keanggotaan :
μ(x)=
{
(b−x)
(b−a);a ≤ x<b 0; x ≥ b
b) Representasi Kurva Segitiga
Representasi kurva segitiga, pada dasarnya adalah gabungan antara
dua representasi linear (representasi linear naik dan representasi linear turun), seperti terlihat pada Gambar 2.3.
9 Gambar 2.2 Representasi Linier
c a
1
0
µ(x)
b domain d
Fungsi keanggotaan :
μ[x]=
{
0;∧x ≤ a atau x ≥ a x−a
b−a ;∧a ≤ x ≤ b b−x
c−b ;∧b ≤ x ≤ c
c) Representasi Kurva Trapesium
Kurva Trapesium pada dasarnya seperti bentuk segitiga, hanya saja ada beberapa titik yang memiliki nilai keanggotaan 1
Fungsi keanggotaan:
10 Gambar 2.3 Representasi kurva
segitiga
μ[x]=
{
0;∧x ≤ a atau x ≥ a x−a
b−a ;∧a ≤ x ≤ b 1;∧b ≤ x ≤ c
d−x d−c ; x ≥ d
3. Operasi dasar himpunan fuzzy
Operasi dasar himpunan fuzzy (operator zadeh) digunakan untuk
mengkombinasi dan memodifikasi himpunan fuzzy. Nilai keanggotaan sebagai hasil dari operasi 2 himpunan disebut fire strength atau α predikat.
Berbagai macam operator zadeh:
a) Operator AND
Operator ini berhubungan dengan operasi interseksi pada himpunan. α-predikat sebagai hasil operasi dengan operator AND diperoleh dengan mengambil nilai keanggotaan terkecil antar elemen pada
himpunan-himpunan yang bersangkutan.
μA ∩ B=min (μA[x], μB[y])
b) Operator OR
Operator ini berhubungan dengan operasi union pada himpunan
α-predikat sebagai hasil operasi dengan operator AND diperoleh dengan mengambil nilai keanggotaan terkecil antar elemen pada
himpunan-himpunan yang bersangkutan.
μA∪B=max (μA[x], μB[y])
c) Operator NOT
Operator ini berhubungan dengan operasi komplemen himpunan. α-predikat sebagai hasil operasi dengan operator AND diperoleh dengan
mengambil nilai keanggotaan terkecil antar elemen pada himpunan-himpunan yang bersangkutan.
μ A'=1−μA[x]
Contoh :
Misal derajat keanggotaan 27 tahun pada himpunan MUDA adalah 0.6 (µMUDA[27] = 0.6),
Derajat keanggotaan Rp.2 juta pada himpunan penghasilan TINGGI adalah 0.8 (μGAJITINGGI[2juta] = 0.8),
maka α predikat untuk usia MUDA dan berpenghasilan TINGGI : μMUDA ∩ μGAJITINGGI = min (μMUDA[27], μGAJITINGGI[2juta]) = min (0.6 , 0.8) = 0.6.
4. ATURAN (RULE) IF-THEN FUZZY
Aturan IF-THEN fuzzy adalah penyataan IF-THEN dimana beberapa kata-kata dalam pernyataan tersebut ditentukan oleh fungsi keanggotaan.
Aturan produksi fuzzy adalah relasi fuzzy antara dua proposisi fuzzy.
Aturan tersebut dinyatakan dalam bentuk:
IF (Proporsi Fuzzy 1) THEN (Proporsi Fuzzy 2)
Proposisi fuzzy adalah memiliki derajat kebenaran yang dinyatakan dalam suatu bilangan dalam bentuk interval [0,1], dimana benar dinyatakan oleh nilai 1 dan salah dinyatakan oleh nilai 0.
Contoh :
IF permintaan turun AND persediaan banyak THEN produksi barang
berkurang.
IF permintaan naik AND persediaan sedikit THEN produksi barang bertambah.
5. Data Mining
Data mining merupakan solusi yang mampu menemukan kandungan informasi yang tersembunyi berupa pola dan aturan dari sekumpulan data yang besar agar mudah dipahami. Informasi yang tersembunyi ini sangat
menguntungkan dari sudut pandang penelitian, bisnis dan lainnya. Teknik-teknik data mining yang paling populer antara lain :
a. Association Rule Mining
Teknik data mining untuk menemukan aturan asosiasi antara suatu kombinasi item.
b. Classification
Proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan kelas dari suatu obyek yang labelnya tidak diketahui. c. Clustering
Proses pengelompokkan data tanpa berdasarkan kelas data tertentu. Clustering dapat dipakai untuk memberikan label pada kelas data
yang belum diketahui.
Dalam penelitian ini, digunakan teknik data mining, yaitu klasifikasi.
6. Fuzzy Decision Tree (FDT)
Decision tree merupakan suatu pendekatan yang sangat populer dan
praktis dalam machine learning untuk menyelesaikan permasalahan
klasifikasi. Pada decision tree terdapat 3 jenis node, yaitu:
a. Root Node, merupakan node paling atas, pada node ini tidak ada input dan bisa tidak mempunyai output atau mempunyai output lebih dari
satu.
b. Internal Node, merupakan node percabangan, pada node ini hanya
terdapat satu input dan mempunyai output minimal dua.
c. Leaf node atau terminal node, merupakan node akhir, pada node ini hanya terdapat satu input dan tidak mempunyai output.
Konsep Decision tree adalah mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (rule).
Metode ini digunakan untuk memperkirakan nilai diskret dari fungsi target, yang mana fungsi pembelajaran direpresentasikan oleh sebuah decision tree. Decision tree merupakan himpunan aturan IF…THEN.
Setiap path dalam tree dihubungkan dengan sebuah aturan, di mana
premis terdiri atas sekumpulan node-node yang ditemui, dan kesimpulan dari aturan terdiri atas kelas yang terhubung dengan leaf dari path.
Fuzzy decision tree memungkinkan untuk menggunakan nilai-nilai
numeric-symbolic selama konstruksi atau saat mengklasifikasikan
kasus-kasus baru. Manfaat dari teori himpunan fuzzy dalam decision tree ialah
meningkatkan kemampuan dalam memahami decision tree ketika menggunakan atribut-atribut kuantitatif. Bahkan, dengan menggunakan teknik fuzzy dapat meningkatkan ketahanan saat melakukan klasifikasi
kasus-kasus baru.
7.
Fuzzy ID3 Decision TreeID3 (Iterative Dichotomiser 3) merupakan salah satu algoritme yang
banyak digunakan untuk membuat suatu decision tree. Algoritme ini pertama kali diperkenalkan oleh Quinlan, menggunakan teori informasi
untuk menentukan atribut mana yang paling informatif, namun ID3 (Iterative Dichotomiser 3) sangat tidak stabil dalam melakukan penggolongan berkenaan dengan gangguan kecil pada data pelatihan.
Logika fuzzy dapat memberikan suatu peningkatan untuk dalam melakukan penggolongan pada saat pelatihan.
Secara ringkas, cara kerja Algoritma ID3 dapat digambarkan sebagai berikut.
Pemilihan atribut dengan menggunakan Information Gain
a. Pilih atribut dimana nilai information gainnya terbesar b. Buat simpul yang berisi atribut tersebut
c. Proses perhitungan information gain akan terus dilaksanakan sampai
semua data telah termasuk dalam kelas yang sama. Atribut yang telah dipilih tidak diikutkan lagi dalam perhitungan nilai information gain.
Pemilihan atribut pada ID3 dilakukan dengan properti statistik, yang disebut dengan information gain. Gain mengukur seberapa baik suatu atribut memisahkan training example ke dalam kelas target.
8.
Fuzzy Entropy dan Information GainInformation gain adalah suatu nilai statistik yang digunakan untuk
memilih atribut yang akan mengekspansi tree dan menghasilkan node baru pada algoritme ID3 (Iterative Dichotomiser 3). Suatu entropy dipergunakan untuk mendefinisikan nilai information gain. Entropy
dirumuskan sebagai berikut:
merupakan hasil pengurangan entropy dari himpunan.
Informasi gain didefinisikan sebagai berikut : Pada himpunan data fuzzy, terdapat penyesuaian rumus untuk menghitung
nilai entropy untuk atribut dan information gain karena adanya ekspresi data fuzzy. Berikut adalah persamaan untuk mencari nilai fuzzy entropy dari keseluruhan data :
Hf(s)=Hs(S)=
∑
i N−Pi∗log2¿ ¿
Untuk menentukan fuzzy entropi dan information gain dari suatu atribut
pada algoritma fuzzy ID3(EID3) digunakan persamaan sebagai berikut :
Hf(S , A)=−
∑
menunjukkan entropy dari himpunan S dari data pelatihan pada node.
¿Sv∨¿adalahukuran dari subset Sv⊆S dari pelatihan xj dengan atribut v. | S| menunjukan ukuran dari himpunan S.
C. METODE PENELITIAN
Pada metode penelitian ini dapat mencapai tujuan penelitian yang telah
ditetapkan dan penelitian berjalan dengan lancar. Melalui metode penelitian,
masalah yang dihadapi dapat diatasi dan dipecahkan. Metode penelitian yang digunakan dalam penulisan skripsi ini adalah menentukan masalah, perumusan masalah, studi pustaka, penyelesaian masalah dan penarikan
kesimpulan.
1. Menentukan dan Perumusan Masalah
Menentukan masalah dimulai dari studi pustaka.Studi pustaka merupakan penelaahan dari beberapa sumber yang relevan untuk mengumpulkan informasi yang diperlukan dalam penulisan skripsi ini. Setelah beberapa
sumber pustaka terkumpul, maka akan dilanjutkan penelaahan isi dari sumber-sumber pustaka tersebut. Dari penelaahan tersebut akan
memunculkan ide-ide yang kemudian dijadikan landasan teori dari penulisan skripsi ini.
Masalah yang ditemukan kemudian dirumuskan kedalam pertanyaan yang
harus diselesaikan yakni:
(1) Bagaimana penggunaan Algoritme ID3 (Iterative Dichotomiser 3) pada Diagnosa Hepatitis?
(2) Bagaimana visualisasi penggambaran fuzzy decision tree pada sebuah program?
2. Studi Pustaka
Studi pustaka merupakan pencarian sumber pustaka yang relevan serta
nantinya akan digunakan untuk mengumpulkan data maupun informasi yang diperlukan pada penelitian. Studi pustaka dilakukan dengan
mengumpulkan sumber pustaka yang dapat berupa buku-buku referensi,
skripsi, makalah dan sebagainya.Sehingga didapat suatu ide mengenai bahan dasar pengembangan upaya pemecahan masalah.
3. Pemecahan masalah
Setelah permasalahan dirumuskan dan sumber pustaka terkumpul, langkah selanjutnya adalah pemecahan masalah melalui pengkajian secara
teoritis yang selanjutnya disusun secara rinci dalam bentuk pembahasan sebagai berikut:
(1) Menentukan fuzzy decision tree pada data hepatitis
(2) Menyelesaikan bentuk persamaan tersebut menggunakan algoritma ID3 (Iterative Dichotomiser 3).
(3) Memvisualisasikan penyelesaian tersebut menggunakan program. 4. Penarikan kesimpulan
Langkah ini merupakan langkah terakhir dari penelitan.Penarikan
kesimpulan didasarkan pada studi pustaka dan pembahasan permasalahan.Simpulan yang diperoleh merupakan hasil analisa dari
penelitian.
D.
DAFTAR PUSTAKAde Mol, R.M. and W.E. Woldt. 2001. Application of fuzzy logic in automated cow status monitoring. Journal of Dairy Science 84(2)
Frans Susilo SJ. 2003. “Himpunan dan Logika Kabur Serta Aplikasinya”. Graha Ilmu. Yogyakarta.
F Romansyah, I. S. Sitanggang, S. Nurdiati. 2009. “Fuzzy Decision Tree dengan Algoritme ID3 pada Data Diabetes”. Internerworking Indonesia Jurnal.
Kusumadewi dan H. Purnomo. 2004. Aplikasi Logika Fuzzy untuk Pendukung Keputusan. Penerbit Graha Ilmu, Yogyakarta
Setiaji. 2009 “Himpunan dan Logika Samar serta Aplikasinya”. Graha Ilmu. Yoyakarta.
Sri Kusumadewi, Sri Haryati, Agus Harjoko, Retantyo Wardoyo. 2006.
“Fuzzy Multi-Attribute Decision Making (FUZZY MADM)”. Graha
Ilmu. Yogyakarta.
Yusuf Elmande, Prabowo Pudjo Widodo. 2012. “Pemilihan Criteria Splitting dalam Algoritma Iterative Dichotomiser 3 (ID3) untuk Penentuan Kualitas Beras : Studi Kasus Pada Perum Bulog Divre Lampung”.
Magister Ilmu Komputer Program Pascasarjana Universitas Budi Luhur