• Tidak ada hasil yang ditemukan

Studi Algoritma CART dengan Induksi Fuzzy dalam Mengklasifikasikan Data

N/A
N/A
Protected

Academic year: 2017

Membagikan "Studi Algoritma CART dengan Induksi Fuzzy dalam Mengklasifikasikan Data"

Copied!
13
0
0

Teks penuh

(1)

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY

DALAM MENGKLASIFIKASIKAN DATA

SKRIPSI

OKTAVIYANI DASWATI 1308230003

PROGRAM STUDI S-1 EKSTENSI MATEMATIKA DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

(2)

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY

DALAM MENGKLASIFIKASIKAN DATA

SKRIPSI

Diajukan kepada tim penguji skripsi Departemen Matematika sebagai salah satu persyaratan guna memperoleh gelar Sarjana Sains

OKTAVIYANI DASWATI 1308230003

PROGRAM STUDI S-1 EKSTENSI MATEMATIKA DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

(3)

PERSETUJUAN

Judul : Studi Algoritma CART dengan Induksi Fuzzy dalam Mengklasifikasikan Data

Kategori : Skripsi

Nama : Oktaviyani Daswati Nomor Induk Mahasiswa : 130823003

Program Studi : Sarjana (S1) Matematika Departemen : Matematika

Fakultas : Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara

Disetujui di

Medan, Agustus 2016

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Drs. Pangarapen Bangun, M.Si Drs. Partano Siagian, M.Si NIP. 19530303 198303 1 002 NIP.19511227 198003 1 001

Diketahui / Disetujui oleh

Departemen Matematika FMIPA USU Ketua

Prof. Dr. Tulus, M.Si

(4)

PERNYATAAN

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan, data dan ringkasan yang masing-masing disebut sumbernya.

Medan, Agustus 2016

(5)

PENGHARGAAN

Puji dan syukur ke hadirat Allah SWT yang senantiasa memberikan rahmat dan karunia-Nya, sehingga akhirnya penulis dapat menyelesaikan penulisan skripsi yang berjudul “Studi Algoritma CART dengan induksi Fuzzy dalam Mengklasifikasikan Data” ini. Salawat dan salam selalu terarah kepada junjungan kita Nabi besar Muhammad SAW.

Dengan rasa hormat, penulis mengucapkan terima kasih kepada Bapak Partano Siagian , M.Sc dan Bapak Pangarapen Bangun , M.Si, selaku pembimbing yang telah meluangkan waktu dan menyumbangkan pikiran, saran, nasehat, serta arahan sehingga penulis dapat menyelesaikan skripsi ini. Terimakasih juga kepada Bapak Prof. Dr. Tulus, M.Si dan Ibu Dr. Mardiningsih, M.Si selaku Ketua Departemen Matematika dan Sekretaris Departemen Matematika FMIPA USU, Dekan dan Pembantu Dekan FMIPA USU, seluruh dosen dan civitas akademika Matematika FMIPA USU.

Terima kasih kepada kedua orangtua yang sangat luar biasa, terima kasih buat segala dukungan doa, motivasi, harapan serta kesabarannya. Terima kasih juga buat dukungan kakak satu-satunya, yang tak lupa mengingatkan agar tetap semangat dan tak pernah menyerah. Tak lupa pula untuk sahabat yang bukan kerabat, Rahmyuti, terima kasih untuk dukungannya selalu.

Selanjutnya terima kasih untuk teman seperjuangan di Ekstensi Matematika 2013 dan 2014, terima kasih untuk semua waktu dan dukungannya. Akhir kata, atas perhatian pembaca yang budiman penulis ucapkan terima kasih.

Penulis

(6)

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY

DALAM MENGKLASIFIKASIKAN DATA

ABSTRAK

Metode pohon keputusan digunakan untuk mengekstraksi informasi tentang himpunan data dalam masalah klasifikasi, meskipun tidak dapat menangani ketidakpastian yang tertanam dalam data terkait dengan pemikiran dan persepsi manusia. Makalah ini menjelaskan pengembangan algoritma induksi pohon yang meningkatkan akurasi klasifikasi induksi pohon keputusan. Penelitian ini dirancang dengan mengintegrasikan prinsip Algoritma CART (Classification and Regressin Tree) dan konsep himpunan Fuzzy, memungkinkan model untuk menangani data yang tidak pasti dan tidak tepat, serta untuk melunakkan batas keputusan tajam yang melekat dalam algoritma pohon keputusan tegas. CART adalah algoritma pohon keputusan dengan fitur utama pengujian Indeks Gini (indeks keragaman) pada setiap tingkat, yang mengarah ke pembentukan pohon dengan proses pemangkasan untuk menemukan pohon yang optimal. Penerapan logika fuzzy untuk pohon keputusan CART dapat memperlihatkan pengetahuan klasifikasi yang lebih alami dan sejalan dengan pemikiran manusia, serta lebih kuat ketika menangani informasi yang tidak tepat. Hasil penerapan logika fuzzy untuk pohon keputusan CART disajikan dalam makalah ini. Hasil penelitian ini diperoleh dari database nyata, dan menunjukkan bahwa algoritma inferensi fuzzy baru meningkatkan akurasi lebih dari pohon CART tegas.

(7)

STUDY OF CART ALGORITHM WITH FUZZY INDUCTION

IN CLASSIFYING DATA

ABSTRACT

Decision tree methods used for extracting information about dataset in classification problems, although unable to deal with uncertainties embedded within the data associated with human thinking and perception. This paper describes the development of a tree induction algorithm which improves the classification accuracy of decision tree induction. The research is designed by integrating the principles of CART (Classification and Regression Tree) algorithm and the fuzzy set-theoretic concepts, enabling the model to handle uncertain and imprecise data, and in order to soften the sharp decision boundaries which are inherent in crisp decision tree algorithms. CART is a decision tree algorithm with the main feature of Gini Index testing (homogenity index) at each level, leading to the production of trees with pruning process to find the optimal tree. The application of fuzzy logic to CART decision trees can represent classification knowledge more naturally and inline with human thinking, and are more robust when it comes to handling imprecise information. The results of applying fuzzy logic to CART decision trees are presented in this paper. These have been obtained from sets of real data, and show that the new fuzzy inference algorithm improves the accuracy over crisp CART trees.

(8)

DAFTAR ISI

1.4 Tujuan Penelitian... 4

1.5 Kontribusi Penelitian ... 4

1.6 Tinjauan Pustaka ... 5

1.7 Metodologi Penelitian ... 7

1.7.1 Jenis dan Data Penelitian ... 7

1.7.2 Teknik Penelitian ... 7

(9)

2.2 Data Mining... 13

2.3 Klasifikasi Data ... 14

2.4 Teori Graf ... 15

2.5 Struktur Pohon... 16

2.5.1 Pohon Berakar... 17

2.5.2 Terminologi Pohon Berakar... 18

2.5.3 Pohon Keputusan (Decision Tree) ... 20

2.6 Probabilitas ... 21

2.7 Algoritma CART ... 22

2.7.1 Partisi Berulang Biner (Binary Recursive Partitioning) ... 23

2.7.2 Langkah Kerja CART ... 24

2.8 Logika Fuzzy ... 29

2.8.1 Fungsi Keanggotaan ... 31

2.8.2 Operator Dasar Fuzzy ... 34

2.8.3 Fungsi Implikasi ... 35

2.9 Fuzzy Inference System ... 36

2.9.1 Komposisi Aturan ... 37

2.9.2 Metode Mamdani ... 38

2.9.3 Defuzzifikasi ... 38

2.10 Akurasi Klasifikasi ... 39

BAB III HASIL DAN PEMBAHASAN 3.1 Fuzzy CART ... 41

(10)

3.3 Pembahasan ... 62 BAB IV PENUTUP

4.1 Kesimpulan... 65 4.2 Saran ... 65 DAFTAR PUSTAKA

(11)

DAFTAR TABEL

Tabel Halaman

1. Confusion Matrix ... 40

2. Variabel Kategorik Pasien Kanker ... 44

3. Kombinasi Kategori Usia Pertama ... 46

4. Kombinasi Kategori Usia Kedua ... 46

5. Kombinasi Kategori Tsize Pertama ... 47

6. Decrease Impurity Variabel Data Pasien Kanker ... 47

7. Proses Penghentian Pemecahan Node ... 50

8. Variabel dalam Induksi Fuzzy Pasien Kanker ... 55

9. Prediksi Indikator Sensor berdasarkan FCART ... 62

(12)

DAFTAR GAMBAR

Gambar Halaman

1. Pohon Berakar ... 19

2. Terminologi Pohon Berakar ... 20

3. Subtree Pohon Berakar ... 20

4. Level dalam Pohon Berakar ... 21

5. Struktur Decision Tree... 23

6. Representasi Kurva Naik ... 31

7. Representasi Kurva Turun ... 32

8. Representasi Kurva Segitiga ... 32

9. Representasi Kurva Trapesium ... 33

10. Representasi Kurva Bahu ... 34

11. Pemecahan Root Node ... 49

12. Proses Pelabelan Node ... 50

13. Node 13 dan Kedua Child Node ... 51

14. Pohon Klasifikasi CART ... 52

15. Fungsi Keanggotaan Variabel Usia Pasien ... 55

16. Fungsi Keanggotaan Variabel Progesteron ... 56

17. Fungsi Keanggotaan Variabel Sensor... 57

18.Fungsi Keanggotaan Data Testing ... 57

(13)

DAFTAR LAMPIRAN

Lampiran

1. Tabulasi Silang Variabel Independen dan Dependen 2. Pohon Klasifikasi Maksimal Pasien Kanker

Gambar

Tabel Halaman

Referensi

Dokumen terkait

Metode yang digunakan dalam penelitian ini adalah deskriptif kualitatif yaitu menguraikan data-data yang telah terkumpul.Dari hasil penelitian ini diharapkan dapat mengetahui

Pada Tabel 3 dan 4 diperoleh korelasi genotip dan fenotip yang tidak berpengaruh terhadap hasil bobot biji per tanaman yaitu karakter tinggi tanaman, lebar tanaman, jumlah ruas,

Mengingat pentingnya peran sumber daya manusia, maka manajemen perusahaan akan memberikan perhatiannya terhadap pengelolaan sumber daya manusia dan berupaya

Pelaksanaan CSR secara internal adalah dilaksakan langsung oleh PT.NNT kepada masyarakat, sedangkan pelaksanaan program CSR secara eksternal adalah dengan

1 Vania Rizky Juliana Wachid SMPN 1 Surabaya 78 Passing Grade 2.. 2 Aaron Alvarado

1) Untuk mengetahui tingkat kepuasan pelanggan terhadap layanan jasa yang diberikan ditinjau dari Service Quality dan analisis GAP. 2) Untuk mengukur dimensi mana yang

BAB III METODE PENELITIAN, yang berisi tentang penentuan jenis penelitian, lokasi dan waktu penelitian, subjek dan objek penelitian, sumber data, metode

Kehadiran umat disetiap Misa Kudus adalah melalui jemputan atau pembahagian kepada semua KKD di Kampung Katolik Komuniti untuk setiap Perayaan Misa dan kehadiran