Membangun Rule Dengan Algoritma Iterative Dichotomiser 3 (Id3) Untuk Penjurusan Siswa SMA
1
Didik Kurniawan,
2Anie Rose Irawati,
3Hilman hudaya
1
Jurusan Ilmu Komputer FMIPA Unila
2
Jurusan Ilmu Komputer FMIPA Unila
3
Jurusan Ilmu Komputer FMIPA Unila
Abstract
Indonesian Senior High School has a policy to decide the majors for the student that match their interests, talents and abilities. By developing an auto learning decision support system with iterative dichotomiser 3 (ID3) algorithms help the teachers to make decision for student majoring. ID3 algorithms is a part of learning techniques of artificial intelligence. By using data sample from the past as training data, the system then will be able to give a decision support that can be used as a reference for teachers to majoring students. To get a good decision accuracy required training data with wide variation. The result showed the more vary of training data the higher accuracy of the decision result.
Keywords: Artificial intelligence, decide SHS students majors, Decision Support System (DSS), Iterative Dichotomiser (ID3) algorithms, rule.
1 Pendahuluan
Pada jenjang pendidikan SMA memiliki sistem khusus yaitu penjurusan yang dilaksanakan oleh siswa kelas X yang akan naik ke kelas XI, dimana siswa akan ditempatkan di jurusan yang sesuai dengan minat, bakat, dan kemampuan siswa itu sendiri. Pada umumnya SMA memiliki tiga jurusan yaitu jurusan IPA, IPS, dan bahasa. Penentuan jurusan bagi siswa dilakukan dengan penilaian terhadap kriteria-kriteria tertentu dan pada akhirnya guru yang akan memutuskan. Sering kali guru memutuskan berdasarkan perhitungan yang sederhana seperti hanya berdasarkan kemampuan dominan dari siswa atau hanya mengandalkan minat dari siswa itu sendiri. Kurangnya konsistensi dalam menentukan keputusan oleh guru (masih bersifat subyektif) serta perbedaan keputusan antar guru menjadi kelemahan dari sistem yang sedang berjalan. Hal ini berujung pada keputusan yang bersifat tidak adil.
Faktor utamanya adalah karena banyaknya siswa yang akan ditentukan jurusannya sehingga sulit untuk menganalisis jurusan yang sesuai dengan bakat, minat, dan kemampuanya.
Teknik learning dapat membuat komputer sanggup untuk belajar dari data-data yang telah diberikan.
Teknik learning juga dapat menjadikan data-data baru yang telah diujikan menjadi pengalaman (experience) dan akan membuat sistem semakin pakar sehingga dengan menerapkan teknik learning maka SPK dapat beradaptasi dengan kebutuhan pengguna secara otomatis. Algoritma Iterative Dichotomiser 3 (ID3) adalah algoritma bagian dari decision tree learning dimana ID3 membangkitkan decision tree dari sampel-sampel yang diberikan untuk dipelajari dan menghasilkan aturan (rule). Rule tersebut akan digunakan untuk menghasilkan suatu keputusan yang menjadi acuan oleh pengambil keputusan dalam menentukan keputusan.
Pada penelitian ini rule akan diimplementasikan pada sistem penjurusan SMA yang diharapkan akan
membantu guru dalam melakukan penjurusan siswa. ID3 pada decision tree learning menggunakan
data-data valid yang digunakan sebelumnya untuk mendapatkan rule dan mencari dukungan keputusan
jurusan yang diambil. SPK tersebut akan dibangun berbasiskan web sehingga dapat diakses atau
digunakan oleh komputer lain tanpa harrus meng-install aplikasinya.
2 Metode Penelitian
2.1 Decision Tree Learning
Decicion tree learning adalah suatu metode belajar yang sangat populer dan banyak digunakan secara praktis. Metode ini merupakan metode yang berusaha menemukan fungsi-fungsi pendekatan yang bernilai diskrit dan tahan terhadap data-data yang terdapat kesalahan (noise data) serta mampu mempelajari ekspresi-ekspresi disjungtive (ekspresi OR). Iterative Dichotomiser 3 (ID3), ASSISTANT, dan C4.5 merupakan jenis dari decision tree learning. Dalam membangun decision tree learning dibutuhkan evaluasi semua atribut yang ada menggunakan suatu ukuran statistik untuk mengukur efektifitas suatu atribut dalam mengklasifikasikan kumpulan sampel data. Dalam hal ini information gain adalah yang paling banyak digunakan [7]. Berikut adalah cara untuk mencari suatu informasi gain dari suatu atribut.
1. Entropy
Dalam mengitung information gain terlebih dahulu harus memahami suatu ukuran lain yang disebut entropy. Di dalam bidang information theory, entropy sering digunakan sebagai suatu parameter untuk mengukur heterogenitas (keberagaman) dari suatu sampel data. Entropy adalah ukuran ketidakpastian dimana semakin tinggi entropy, maka semakin tinggi ketidakpastian [6]. Dengan pohon keputusan, pengukuran ini digunakan untuk menentukan seberapa informatif sebuah simpul.
Jika kumpulan sampel semakin heterogen, maka nilai entropy-nya semakin besar. Secara matematis entropy dirumuskan sebagai berikut:
𝑒𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = ∑ −𝑝
𝑐𝑖 𝑖𝑙𝑜𝑔
2𝑝
𝑖... (1) 2. Information Gain
Setelah mendapatkan nilai entropy untuk suatu kumpulan sampel data, maka kita dapat mengukur efektivitas suatu atribut dalam menglasifikasikan data. Information Gain (juga dikenal sebagai hanya Gain) menggunakan entropy untuk menentukan atribut yang terbaik yang digunakan untuk menciptakan perbedaan [6]. Dengan menghitung Gain, kita menentukan tingkatan entropy dengan menggunakan atribut tersebut. Jadi, kolom dengan Gain yang lebih tinggi akan digunakan sebagai node dari pohon keputusan. Ukuran efektifitas ini disebut sebagai information gain. Secara matematis, intormation gain dari suatu atribut A, dituliskan sebagai berikut:
𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) − ∑
|𝑆𝑣||𝑆|
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆
𝑣)
𝑣∈𝑉𝑎𝑙𝑢𝑒𝑠(𝐴)