STUDI ALGORITMA CART DENGAN INDUKSI FUZZY
DALAM MENGKLASIFIKASIKAN DATA
SKRIPSI
OKTAVIYANI DASWATI 1308230003
PROGRAM STUDI S-1 EKSTENSI MATEMATIKA DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
STUDI ALGORITMA CART DENGAN INDUKSI FUZZY
DALAM MENGKLASIFIKASIKAN DATA
SKRIPSI
Diajukan kepada tim penguji skripsi Departemen Matematika sebagai salah satu persyaratan guna memperoleh gelar Sarjana Sains
OKTAVIYANI DASWATI 1308230003
PROGRAM STUDI S-1 EKSTENSI MATEMATIKA DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
PERSETUJUAN
Judul : Studi Algoritma CART dengan Induksi Fuzzy dalam Mengklasifikasikan Data
Kategori : Skripsi
Nama : Oktaviyani Daswati Nomor Induk Mahasiswa : 130823003
Program Studi : Sarjana (S1) Matematika Departemen : Matematika
Fakultas : Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara
Disetujui di
Medan, Agustus 2016
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Drs. Pangarapen Bangun, M.Si Drs. Partano Siagian, M.Si NIP. 19530303 198303 1 002 NIP.19511227 198003 1 001
Diketahui / Disetujui oleh
Departemen Matematika FMIPA USU Ketua
Prof. Dr. Tulus, M.Si
PERNYATAAN
STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan, data dan ringkasan yang masing-masing disebut sumbernya.
Medan, Agustus 2016
PENGHARGAAN
Puji dan syukur ke hadirat Allah SWT yang senantiasa memberikan rahmat dan karunia-Nya, sehingga akhirnya penulis dapat menyelesaikan penulisan skripsi yang berjudul “Studi Algoritma CART dengan induksi Fuzzy dalam Mengklasifikasikan Data” ini. Salawat dan salam selalu terarah kepada junjungan kita Nabi besar Muhammad SAW.
Dengan rasa hormat, penulis mengucapkan terima kasih kepada Bapak Partano Siagian , M.Sc dan Bapak Pangarapen Bangun , M.Si, selaku pembimbing yang telah meluangkan waktu dan menyumbangkan pikiran, saran, nasehat, serta arahan sehingga penulis dapat menyelesaikan skripsi ini. Terimakasih juga kepada Bapak Prof. Dr. Tulus, M.Si dan Ibu Dr. Mardiningsih, M.Si selaku Ketua Departemen Matematika dan Sekretaris Departemen Matematika FMIPA USU, Dekan dan Pembantu Dekan FMIPA USU, seluruh dosen dan civitas akademika Matematika FMIPA USU.
Terima kasih kepada kedua orangtua yang sangat luar biasa, terima kasih buat segala dukungan doa, motivasi, harapan serta kesabarannya. Terima kasih juga buat dukungan kakak satu-satunya, yang tak lupa mengingatkan agar tetap semangat dan tak pernah menyerah. Tak lupa pula untuk sahabat yang bukan kerabat, Rahmyuti, terima kasih untuk dukungannya selalu.
Selanjutnya terima kasih untuk teman seperjuangan di Ekstensi Matematika 2013 dan 2014, terima kasih untuk semua waktu dan dukungannya. Akhir kata, atas perhatian pembaca yang budiman penulis ucapkan terima kasih.
Penulis
STUDI ALGORITMA CART DENGAN INDUKSI FUZZY
DALAM MENGKLASIFIKASIKAN DATA
ABSTRAK
Metode pohon keputusan digunakan untuk mengekstraksi informasi tentang himpunan data dalam masalah klasifikasi, meskipun tidak dapat menangani ketidakpastian yang tertanam dalam data terkait dengan pemikiran dan persepsi manusia. Makalah ini menjelaskan pengembangan algoritma induksi pohon yang meningkatkan akurasi klasifikasi induksi pohon keputusan. Penelitian ini dirancang dengan mengintegrasikan prinsip Algoritma CART (Classification and Regressin Tree) dan konsep himpunan Fuzzy, memungkinkan model untuk menangani data yang tidak pasti dan tidak tepat, serta untuk melunakkan batas keputusan tajam yang melekat dalam algoritma pohon keputusan tegas. CART adalah algoritma pohon keputusan dengan fitur utama pengujian Indeks Gini (indeks keragaman) pada setiap tingkat, yang mengarah ke pembentukan pohon dengan proses pemangkasan untuk menemukan pohon yang optimal. Penerapan logika fuzzy untuk pohon keputusan CART dapat memperlihatkan pengetahuan klasifikasi yang lebih alami dan sejalan dengan pemikiran manusia, serta lebih kuat ketika menangani informasi yang tidak tepat. Hasil penerapan logika fuzzy untuk pohon keputusan CART disajikan dalam makalah ini. Hasil penelitian ini diperoleh dari database nyata, dan menunjukkan bahwa algoritma inferensi fuzzy baru meningkatkan akurasi lebih dari pohon CART tegas.
STUDY OF CART ALGORITHM WITH FUZZY INDUCTION
IN CLASSIFYING DATA
ABSTRACT
Decision tree methods used for extracting information about dataset in classification problems, although unable to deal with uncertainties embedded within the data associated with human thinking and perception. This paper describes the development of a tree induction algorithm which improves the classification accuracy of decision tree induction. The research is designed by integrating the principles of CART (Classification and Regression Tree) algorithm and the fuzzy set-theoretic concepts, enabling the model to handle uncertain and imprecise data, and in order to soften the sharp decision boundaries which are inherent in crisp decision tree algorithms. CART is a decision tree algorithm with the main feature of Gini Index testing (homogenity index) at each level, leading to the production of trees with pruning process to find the optimal tree. The application of fuzzy logic to CART decision trees can represent classification knowledge more naturally and inline with human thinking, and are more robust when it comes to handling imprecise information. The results of applying fuzzy logic to CART decision trees are presented in this paper. These have been obtained from sets of real data, and show that the new fuzzy inference algorithm improves the accuracy over crisp CART trees.
DAFTAR ISI
1.4 Tujuan Penelitian... 4
1.5 Kontribusi Penelitian ... 4
1.6 Tinjauan Pustaka ... 5
1.7 Metodologi Penelitian ... 7
1.7.1 Jenis dan Data Penelitian ... 7
1.7.2 Teknik Penelitian ... 7
2.2 Data Mining... 13
2.3 Klasifikasi Data ... 14
2.4 Teori Graf ... 15
2.5 Struktur Pohon... 16
2.5.1 Pohon Berakar... 17
2.5.2 Terminologi Pohon Berakar... 18
2.5.3 Pohon Keputusan (Decision Tree) ... 20
2.6 Probabilitas ... 21
2.7 Algoritma CART ... 22
2.7.1 Partisi Berulang Biner (Binary Recursive Partitioning) ... 23
2.7.2 Langkah Kerja CART ... 24
2.8 Logika Fuzzy ... 29
2.8.1 Fungsi Keanggotaan ... 31
2.8.2 Operator Dasar Fuzzy ... 34
2.8.3 Fungsi Implikasi ... 35
2.9 Fuzzy Inference System ... 36
2.9.1 Komposisi Aturan ... 37
2.9.2 Metode Mamdani ... 38
2.9.3 Defuzzifikasi ... 38
2.10 Akurasi Klasifikasi ... 39
BAB III HASIL DAN PEMBAHASAN 3.1 Fuzzy CART ... 41
3.3 Pembahasan ... 62 BAB IV PENUTUP
4.1 Kesimpulan... 65 4.2 Saran ... 65 DAFTAR PUSTAKA
DAFTAR TABEL
Tabel Halaman
1. Confusion Matrix ... 40
2. Variabel Kategorik Pasien Kanker ... 44
3. Kombinasi Kategori Usia Pertama ... 46
4. Kombinasi Kategori Usia Kedua ... 46
5. Kombinasi Kategori Tsize Pertama ... 47
6. Decrease Impurity Variabel Data Pasien Kanker ... 47
7. Proses Penghentian Pemecahan Node ... 50
8. Variabel dalam Induksi Fuzzy Pasien Kanker ... 55
9. Prediksi Indikator Sensor berdasarkan FCART ... 62
DAFTAR GAMBAR
Gambar Halaman
1. Pohon Berakar ... 19
2. Terminologi Pohon Berakar ... 20
3. Subtree Pohon Berakar ... 20
4. Level dalam Pohon Berakar ... 21
5. Struktur Decision Tree... 23
6. Representasi Kurva Naik ... 31
7. Representasi Kurva Turun ... 32
8. Representasi Kurva Segitiga ... 32
9. Representasi Kurva Trapesium ... 33
10. Representasi Kurva Bahu ... 34
11. Pemecahan Root Node ... 49
12. Proses Pelabelan Node ... 50
13. Node 13 dan Kedua Child Node ... 51
14. Pohon Klasifikasi CART ... 52
15. Fungsi Keanggotaan Variabel Usia Pasien ... 55
16. Fungsi Keanggotaan Variabel Progesteron ... 56
17. Fungsi Keanggotaan Variabel Sensor... 57
18.Fungsi Keanggotaan Data Testing ... 57
DAFTAR LAMPIRAN
Lampiran
1. Tabulasi Silang Variabel Independen dan Dependen 2. Pohon Klasifikasi Maksimal Pasien Kanker