ALGORITMA GENETIKA
Cindy Mayland N. S. Wiyono¹, Angelina Prima Kurniati², Intan Nurma Yulita³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
Abstrak
Metode klasifikasi Decision Tree, merupakan metode yang mudah diinterpretasikan, efisien dan cepat dengan fungsi-fungsi pendekatan yang bernilai diskrit. Metode Decision Tree khususnya dengan algoritma id3 memiliki kelemahan ketika atribut yang digunakan bertipe numerik maka harus dilakukan diskritisasi untuk membagi range domain tertentu. Pembagian range domain akan sulit dilakukan jika tidak ada pengetahuan tentang karakteristik data. Oleh karena itu digunakan pendekatan fuzzy pada algoritma fuzzy id3, dimana nilai-nilai fuzzy akan memudahkan dalam proses pembagian range menjadi nilai linguistik dengan derajat keanggotaan tertentu. Penggunaan fuzzy sendiri, mengalami kesulitan jika tidak dikatahui batas-batas dan bentuk keanggotaan yang tepat, untuk itu digunakan algoritma genetika, sehingga proses untuk menemukan tree dengan akurasi tinggi akan lebih mudah.
Dengan menggabungkan metode-metode tersebut menjadi fuzzy decision tree dengan algoritma genetika(AG-FDT), performansi terbaik sistem diukur berdasarkan nilai akurasinya diperoleh saat ukuran populasi sebesar 40, probabilitas crossover 0.75, fuzziness control threshold 80% dan leaf decision threshold 12%. Dan dengan membandingkan akurasi AG-FDT dengan id3 diketahui bahwa akurasi AG-FDT lebih tinggi dibandingkan klasifikasi dengan id3.
Kata Kunci : Klasifikasi, Fuzzy Decision Tree, Algoritma genetika
Abstract
Decision tree classification method, a method that is easily interpreted, efficient and fast with the functions of discrete-value approach. Methods especially Decision Tree with id3 algorithm has a weakness when the type attribute is used to do numerical discretization is to divide the certain domain range. Distribution of domain range would be difficult if there is no knowledge about the characteristics of data. Therefore used a fuzzy approach to fuzzy id3 algorithm, where the fuzzy values will facilitate the process of division into the linguistic range with a certain degree of membership. The use of fuzzy itself, had a difficult if not dikatahui boundaries and membership of appropriate forms, for the use of genetic algorithms, so the process to find a tree with higher accuracy will be easier.
By combining these methods into a fuzzy decision tree with genetic algorithm (GA-FDT), the best system performance is measured based on the value of accuracy is obtained when the population size of 40, crossover probability 0.75, fuzziness control threshold of 80% and 12% leaf decision threshold. And by comparing the accuracy of FDT with AG-id3-AG is known that the accuracy is higher than the classification of FDT with id3.
Keywords : Classification, Fuzzy Decision Tree, Genetic Algorithm
Powered by TCPDF (www.tcpdf.org)
1. Pendahuluan
1.1 Latar belakang
Dewasa ini tingkat pertumbuhan data tiap tahunnya semakin meningkat. Dengan pertumbuhan data tersebut akan disayangkan jika data yang diperoleh diabaikan dan tidak diolah. Oleh karena itu, diperlukan suatu tindakan pengelolaan data tersebut menjadi suatu informasi yang bermanfaat bagi manusia dan dapat digunakan sebagai suatu bahan pertimbangan dalam melaksanakan atau memutuskan sesuatu.
Salah satu metode yang umumnya digunakan adalah klasifikasi. Konsep klasifikasi adalah menggeneralisasi struktur yang dikenal untuk diterapkan ke data baru. Teknik klasifikasi yang menjadi fokus tugas akhir ini adalah Decision Tree.
Decision Tree merupakan teknik klasifikasi yang mudah diinterpretasikan, efisien
dan cepat dalam mengklasifikasikan suatu record yang belum diketahui kelasnya[6]. Metode Decision Tree merupakan metode yang berusaha menemukan fungsi-fungsi pendekatan yang bernilai diskrit [11].
Pada metode Decision Tree jika atribut yang digunakan bertipe continuous (numerik) maka harus dilakukan diskritisasi untuk membagi range domain pada atribut menggunakan titik potong dimana titik potong yang digunakan akan membedakan nilai suatu domain dengan batasan yang jelas sehingga bisa saja terjadi missclassification[6]. Penentuan titik potong menjadi sangat krusial dengan akibat yang ditumbulkan. Untuk itu diperlukan pendekatan fuzzy yang menangani masalah yang bersifat kebenaran parsial dan kurang presisi.
Pendekatan fuzzy sesuai dengan kebanyakan permasalahan dunia nyata yang bersifat non-linier, tetapi dalam penerapannya pendekatan fuzzy memiliki kelemahan dalam menentukan variabel-variabel lingustik dan aturan-aturan fuzzy yang digunakan karena diperlukan keahlian yang tinggi dalam menangani masalah ini dan akan lebih mudah ditangani oleh para ahli. Untuk itu diperlukan metode yang mempu melakukan proses learning untuk menentukan fungsi keanggotaan yang tepat.
Algoritma genetika merupakan salah satu jenis Evolutionary Algorithms. Konsep umum algoritma genetika adalah hereditas, dimana sifat-sifat individu
2
diturunkan kepada generasi berikutnya. Dalam algoritma genetika dilakukan proses evolusi, yang akan menyeleksi individu-individu pada suatu generasi hingga pada akhirnya tersisa/dihasilkan individu terpilih yang dapat bertahan hidup untuk menghasilkan dan mewariskan sifat-sifatnya pada generasi berikutnya. Dimana pada masalah ini menentukan fungsi keanggotaan yang tepat untuk menghasilkan klasifikasi yang optimum.
Dengan menggabungkan konsep-konsep tersebut, maka Tugas Akhir ini difokuskan pada “Analisis dan Implementasi Fuzzy Decision Tree(FDT) dengan Algoritma Genetika” dimana algoritma genetika membantu menentukan fungsi keanggotaan yang akan berpengaruh pada proses klasifikasi.
1.2 Perumusan masalah
Berdasarkan latar belakang tersebut, maka dapat dirumuskan permasalahan sebagai berikut:
1. Menganalisis dan mengimplementasikan penggunaan algoritma genetika dalam klasifikasi menggunakan fuzzy decision tree(FDT)
2. Menganalisis pengaruh ukuran populasi, probabilitas crossover, fuzziness
control threshold dan leaf decision threshold terhadap performansi fuzzy decision tree(FDT) dilihat dari nilai akurasi.
3. Membandingkan akurasi klasifikasi metode id3 dengan klasifikasi menggunakan fuzzy decision tree dengan algoritma genetika(AG-FDT)
1.3 Tujuan
Tujuan dari penelitian tugas akhir ini adalah:
1. Menerapkan algoritma genetika pada klasifikasi fuzzy Decision
Tree(FDT).
2. Mengevaluasi performansi klasifikasi fuzzy Decision Tree(FDT) menggunakan algoritma genetika berdasarkan akurasi klasifikasi.
3. Mengetahui metode terbaik untuk klasifikasi diantara id3 dan fuzzy
decision tree dengan algoritma genetika(AG-FDT).
1.4 Batasan masalah
Terdapat beberapa batasan dalam penelitian Tugas Akhir ini, antara lain: a. Tidak menangani pre-processing data.
b. Tipe data yang digunakan bersifat numerik.
c. Jumlah nilai linguistik untuk tiap variabel input fuzzy adalah 3 nilai. Hal ini dimaksudkan untuk memperkecil ruang pencarian solusi sekaligus merepresentasikan nilai linguistik “rendah”, “sedang”, dan “tinggi”.
d. Pengujian metode id3 dilakukan dengan tool WEKA3.6.2
1.5 Metodologi penyelesaian masalah
Metode yang digunakan untuk menyelesaikan Tugas Akhir ini adalah :
1. Studi Literatur, yakni dengan mempelajari referensi dan literatur yang relevan yang membahas tentang algoritma genetika, sistem fuzzy dan fuzzy
decision tree.
2. Pembangunan model, dengan menggunakan konsep analisis dan desain terstruktur yang divisualisasikan dengan diagram blok.
3. Implementasi, coding dengan menggunakan MATLAB R2010b untuk membangun perangkat lunak yang dimaksud berdasarkan model yang telah dibangun pada tahap sebelumnya.
4. Analisa hasil, melakukan pengujian dan analisa dari sistem yang telah dibangun pada tahap implementasi. Analisis dilakukan berdasarkan parameter pengujian.
5. Pembuatan laporan, melakukan pelaporan hasil pengerjaan Tugas Akhir berupa buku tugas akhir atau skripsi.
30
5. Kesimpulan dan Saran
5.1 Kesimpulan
Dari hasil pengujian dan analisa yang telah dilakukan, dapat diambil beberapa kesimpulan sebagai berikut:
1. Ukuran populasi terbaik yang diperoleh dalam penelitian ini yaitu 40 individu. Ruang solusi yang tidak terlalu luas lebih efektif dalam melakukan pencarian solusi, disamping individu yang ada lebih bervariasi serta proses pencarian juga lebih fokus.
2. Ukuran probabilitas crossover diperoleh yaitu 0.75. Dengan nilai probabilitas crossover yang terlalu tinggi akan menyebabkan akurasi menurun karena proses pencarian yang sangat eksploratif dan tidak fokus. Nilai probabilitas crossover yang terlalu rendah akan menyebabkan ruang solusi yang semakin sempit sehingga kemungkinan untuk memperoleh akurasi terbaik, lebih rendah.
3. Nilai fuzziness control threshold diperoleh 80%. Nilai fuzzy threshold yang terlalu besar akan menyebabkan akurasi akan menurun, dan apabila nilai
fuzzy threshold yang terlalu rendah tidak menjamin akan memperoleh
akurasi terbaik.
4. Nilai leaf decision threshold diperoleh dalam penelitian ini adalah 12%. Dengan nilai leaf threshold yang terlalu tinggi akan meyebabkan terjadinya proses pruning yang terlalu cepat sehingga dapat menurunkan akurasi. Sedangkan nilai leaf threshold yang terlalu rendah akan menyebabkan tree yang terbentuk terlalu mengikuti data latih.
5. Nilai akurasi klasifikasi pada metode AG-FDT lebih baik dari pada klasifikasi dengan menggunakan metode id3, karena soft partition pada AG-FDT mengkategorikan suatu nilai berdasarkan derajat keanggotaannya.
5.2 Saran
Beberapa saran yang bisa diberikan antara lain :
1. Melakukan variasi pada proses evolusi algoritma genetika, misalnya proses pindah silang dapat dilakukan percobaan dengan metode
multi-point crossover ataupun metode lainnya.
2. Bentuk fungsi keanggotaan sistem fuzzy dapat ditambah jenisnya seperti dengan fungsi keanggotaan gaussian, dan lain sebagainya.
3. Jumlah nilai linguistik yang digunakan sebaiknya didisain lebih dinamis serta menggunakan skema pengkodean yang lain untuk mendapatkan hasil yang lebih baik.
32
Daftar Pustaka
[1] Cha, Sung-Hyuk., Tappert, Charles., 2009, "A Genetic Algorithm for
Constructing Compact Binary Decision Trees", Journal Of Pattern
Recognition Reserch 1 (2009) 1-13, Computer Science Department, Pace University, New York
[2] E.Zio, P. Baraldi, L.Popescu, 2007, “Optimizing a fuzzy fault
classification tree by a single-objective genetic algorirthm”, Department
of Nuclear Engineering, Polytechnic of Milan, Milan, Italy.
[3] G. Liang., 2005, “A Comparative Study of Three Decisison Tree
algorithms: ID3, Fuzzy ID3, Probabilistic Fuzzy ID3”, Bachelor Thesis,
Informastics & Economics, Erasmus University Rotterdam, Rotterdam the Natherland.
[4] Han, Jiawei., Kamber M., 2006, “Data Mining: Concepts and
Techniques- Second edition”, Morgan Kaufmann Publisher, San
Fransisco, CA 94111, ISBN 978-1-55860-901-3.
[5] Janikow, C.Z., ”Fuzzy Decision Tree: Issues and Methods”, Department of Mathematics and Computer Science, University of Missouri, St Louis. [6] Puspita, Leny, “Analisis dan Implementasi Klasifikasi Data
Menggunakan SDT-ID3”, Skripsi, Departement Informatika, IT Telkom, Bandung, Indonesia.
[7] Rashid, H. K., 2005, “Classification of stock market index based on
predictive fuzzy Decision Tree”, University Teknologi Malaysia.
[8] Smith III, J. F., “Data Mining fo Multi-agent Fuzzy Decision Tree
Structure and Rules,” Naval Research Laboratory, Washington D.C.
20375-5000.
[9] Sulistiyo, Mahmud. Dwi, 2010, Analisis dan Implementasi Sistem Fuzzy dan Evolutionary Programming pada Pengaturan Lampu Lalu Lintas Cerdas, Skripsi, Fakultas Informatika, IT Telkom, Bandung, Indonesia. [10] Suyanto, 2005, "Algoritma Genetika dalam MATLAB", Penerbit ANDI,
Yogyakarta, Indonesia, ISBN: 979-731-727-7.
[11] Suyanto, 2007, “Artificial Intelligance: Searching, Reasoning, Planning and Learninig”, Indonesian version, Penerbit Informatika, Bandung, Indonesia, ISBN: 979-1153-05-1.
[12] Suyanto, 2008, “Evolutionary Computation: Komputasi berbasis “Evolusi” dan “Genetika”, Penerbit Informatika, Bandung, Indonesia, ISBN: 978-979-1153-38-6.
[13] Suyanto, 2008, “Soft Computing: Membangun Mesin Ber-IQ Tinggi”, Penerbit Informatika, Bandung, Indonesia, ISBN: 978-979-1153-49-2. [14] Uci Repository. Vertebral Column Data Set. Uci Machine Learning
Repository. http://archive.ics.uci.edu/ml/datasets/Vertebral+Column. Diunduh pada tanggal 18 Desember 2011.
[15] Umano, Motohide., Okamoto, H., Hatono, I., Tamura H., Kawachi, F., Umedzu, S., Kinoshita, J., 1994, “Fuzzy Decision Trees by Fuzzy ID3
algorithm and Its Application to Diagnosis Systems”, Department of