Membangun Rule Dengan Algoritma Iterative Dichotomiser 3 (Id3) Untuk Penjurusan Siswa SMA

(1)

Membangun Rule Dengan Algoritma Iterative Dichotomiser 3 (Id3) Untuk Penjurusan Siswa SMA

1

Didik Kurniawan,

²

Anie Rose Irawati,

³

Hilman hudaya

1

Jurusan Ilmu Komputer FMIPA Unila

2

Jurusan Ilmu Komputer FMIPA Unila

3

Jurusan Ilmu Komputer FMIPA Unila

Abstract

Indonesian Senior High School has a policy to decide the majors for the student that match their interests, talents and abilities. By developing an auto learning decision support system with iterative dichotomiser 3 (ID3) algorithms help the teachers to make decision for student majoring. ID3 algorithms is a part of learning techniques of artificial intelligence. By using data sample from the past as training data, the system then will be able to give a decision support that can be used as a reference for teachers to majoring students. To get a good decision accuracy required training data with wide variation. The result showed the more vary of training data the higher accuracy of the decision result.

Keywords: Artificial intelligence, decide SHS students majors, Decision Support System (DSS), Iterative Dichotomiser (ID3) algorithms, rule.

1 Pendahuluan

Pada jenjang pendidikan SMA memiliki sistem khusus yaitu penjurusan yang dilaksanakan oleh siswa kelas X yang akan naik ke kelas XI, dimana siswa akan ditempatkan di jurusan yang sesuai dengan minat, bakat, dan kemampuan siswa itu sendiri. Pada umumnya SMA memiliki tiga jurusan yaitu jurusan IPA, IPS, dan bahasa. Penentuan jurusan bagi siswa dilakukan dengan penilaian terhadap kriteria-kriteria tertentu dan pada akhirnya guru yang akan memutuskan. Sering kali guru memutuskan berdasarkan perhitungan yang sederhana seperti hanya berdasarkan kemampuan dominan dari siswa atau hanya mengandalkan minat dari siswa itu sendiri. Kurangnya konsistensi dalam menentukan keputusan oleh guru (masih bersifat subyektif) serta perbedaan keputusan antar guru menjadi kelemahan dari sistem yang sedang berjalan. Hal ini berujung pada keputusan yang bersifat tidak adil.

Faktor utamanya adalah karena banyaknya siswa yang akan ditentukan jurusannya sehingga sulit untuk menganalisis jurusan yang sesuai dengan bakat, minat, dan kemampuanya.

Teknik learning dapat membuat komputer sanggup untuk belajar dari data-data yang telah diberikan.

Teknik learning juga dapat menjadikan data-data baru yang telah diujikan menjadi pengalaman (experience) dan akan membuat sistem semakin pakar sehingga dengan menerapkan teknik learning maka SPK dapat beradaptasi dengan kebutuhan pengguna secara otomatis. Algoritma Iterative Dichotomiser 3 (ID3) adalah algoritma bagian dari decision tree learning dimana ID3 membangkitkan decision tree dari sampel-sampel yang diberikan untuk dipelajari dan menghasilkan aturan (rule). Rule tersebut akan digunakan untuk menghasilkan suatu keputusan yang menjadi acuan oleh pengambil keputusan dalam menentukan keputusan.

Pada penelitian ini rule akan diimplementasikan pada sistem penjurusan SMA yang diharapkan akan

membantu guru dalam melakukan penjurusan siswa. ID3 pada decision tree learning menggunakan

data-data valid yang digunakan sebelumnya untuk mendapatkan rule dan mencari dukungan keputusan

jurusan yang diambil. SPK tersebut akan dibangun berbasiskan web sehingga dapat diakses atau

digunakan oleh komputer lain tanpa harrus meng-install aplikasinya.

(2)

2 Metode Penelitian

2.1 Decision Tree Learning

Decicion tree learning adalah suatu metode belajar yang sangat populer dan banyak digunakan secara praktis. Metode ini merupakan metode yang berusaha menemukan fungsi-fungsi pendekatan yang bernilai diskrit dan tahan terhadap data-data yang terdapat kesalahan (noise data) serta mampu mempelajari ekspresi-ekspresi disjungtive (ekspresi OR). Iterative Dichotomiser 3 (ID3), ASSISTANT, dan C4.5 merupakan jenis dari decision tree learning. Dalam membangun decision tree learning dibutuhkan evaluasi semua atribut yang ada menggunakan suatu ukuran statistik untuk mengukur efektifitas suatu atribut dalam mengklasifikasikan kumpulan sampel data. Dalam hal ini information gain adalah yang paling banyak digunakan [7]. Berikut adalah cara untuk mencari suatu informasi gain dari suatu atribut.

1. Entropy

Dalam mengitung information gain terlebih dahulu harus memahami suatu ukuran lain yang disebut entropy. Di dalam bidang information theory, entropy sering digunakan sebagai suatu parameter untuk mengukur heterogenitas (keberagaman) dari suatu sampel data. Entropy adalah ukuran ketidakpastian dimana semakin tinggi entropy, maka semakin tinggi ketidakpastian [6]. Dengan pohon keputusan, pengukuran ini digunakan untuk menentukan seberapa informatif sebuah simpul.

Jika kumpulan sampel semakin heterogen, maka nilai entropy-nya semakin besar. Secara matematis entropy dirumuskan sebagai berikut:

𝑒𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = ∑ −𝑝

^𝑐_𝑖 _𝑖

𝑙𝑜𝑔

₂

𝑝

_𝑖

... (1) 2. Information Gain

Setelah mendapatkan nilai entropy untuk suatu kumpulan sampel data, maka kita dapat mengukur efektivitas suatu atribut dalam menglasifikasikan data. Information Gain (juga dikenal sebagai hanya Gain) menggunakan entropy untuk menentukan atribut yang terbaik yang digunakan untuk menciptakan perbedaan [6]. Dengan menghitung Gain, kita menentukan tingkatan entropy dengan menggunakan atribut tersebut. Jadi, kolom dengan Gain yang lebih tinggi akan digunakan sebagai node dari pohon keputusan. Ukuran efektifitas ini disebut sebagai information gain. Secara matematis, intormation gain dari suatu atribut A, dituliskan sebagai berikut:

𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) − ∑

^|𝑆^𝑣^|

|𝑆|

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆

_𝑣

)

𝑣∈𝑉𝑎𝑙𝑢𝑒𝑠(𝐴)

... (2) 2.2 Iterative Dichotomiser 3 (ID3)

ID3 adalah algoritma decision tree learning (algoritma pembelajaran pohon keputusan) yang

menggunakan strategu pencarian hill-climbing, yaitu dimulai dari pohon kosong, kemudian secara

progresif berusaha menemukan sebuah pohon keputusan yang mengklasifikasikan sampel-sampel data

secara akurat tanpa kesalahan. Pertumbuhan cabang-cabang pohon keputusan pada lgoritma ID3

dilakukan sampai pohon tersebut mampu mengklasisifikasikan sampel data secara akurat dengan

tingkat kebenaran 100 % sesuai dengan data latih [7].

(3)

Gambar 1. Algoritma ID3[7]

3 Pembahasan 3.1 Learning

Tahapan learning adalah proses pembelajaran data latih untuk mendapatkan suatu pohon keputusan.

Dengan mengimplementasikan algoritma Iterative Dichotomiser 3(ID3) terhadap data latih pada Tabel 1 yang memiliki keberagaman yang baik maka akan mendapatkan pohon keputusan pada Gambar 2.

Tabel 1. Sampel data / data latih A

No Nilai IPA Nilai IPS Nilai BHS Bakat Minat Keputusan

1 Baik Cukup Baik BHS IPS IPS

2 Cukup Cukup Baik IPS BHS BHS

3 Kurang Cukup Cukup IPA IPA IPS

4 Baik Baik Baik IPA IPA IPA

5 Cukup Baik Kurang IPS BHS IPS

6 Kurang Baik Kurang BHS IPS IPS

7 Baik Kurang Cukup BHS IPA IPA

8 Cukup Kurang Kurang IPS BHS IPA

9 Kurang Kurang Cukup IPA IPS BHS

(4)

Gambar 2. Pohon keputusan perhitugan otomatis / pohon keputusan A Dari pohon keputusan pada Gambar 2 makan dapat dibuat suatu rule pada gambar 3.

If ( (nIIPS==’baik’ and minat==’IPA’) or (nIPS==’kurang’ and minat=’IPA’) or (nIPS==’kurang’ and minat=’BHS’) )

Keputusan=’IPA’

Else if ( (nIIPS==’baik’ and minat==’IPS’) or (nIIPS==’baik’ and minat==’BHS’) or (nIIPS==’cukup’ and minat==’IPA’) or (nIIPS==’cukup’ and minat==’IPS’) )

Keputusan=’IPS’

Else if ( (nIIPS==’cukup’ and minat==’BHS’) or (nIIPS==’kurang’ and minat==’IPS’) ) Keputusan=’BHS’

Gambar 3. Rule 3.2 Pengujian Hasil Keputusan

Pengujian hasil keputusan ini adalah mengetahui seberapa besar tingkat akurasi dari hasil keputusan yang dikeluarkan. Pada pengujian ini peneliti dibantu oleh guru pelatih untuk memberitahu keputusan yang dihasilkan benar atau salah dengan menggunakan rule pada Gambar 3.

1. Pengujian petama

Pada pengujian pertama data latih akan diujikan dengan data latih itu sendiri untuk mengetahui seberapa baik algoritma ini mengidentifikasi dirinya sendiri. Hasil dari pengujian pertama terangkum pada Tabel 2.

Tabel 2 Hasil pengujian pertama terhadap data latih A Data Uji Keputusan tidak tepat Akurasi

Data Latih A - 100%

(5)

2. Pengujian kedua

Pada pengujian kedua data uji yang digunakan adalah data yang belum pernah diketahui atau dilatih sebelumnya untuk mengetahui tingkat akurasi dari setiap data latih terhadap data yang belum pernah diketahui. Jika diketahui data uji menghasilkan keputusan pada Gambar 4 dibandingkan dengan hasil pengujian dengan data latih A maka hasil dari pengujian keempat dapat dilihat pada Tabel 3.

Gambar 4 Data uji

Tabel 7 Hasil pengujian keempat dengan data uji belum pernah diketahui

Data Latih Keputusan Tidak Tepat Akurasi

A 8 (No: 1,5,6,7,8,10,14,15) 60%

4 Kesimpulan 4.1 Kesimpulan

Berdasarkan hasil penelitian yang telah dilakukan dapat disimpulkan beberapa hal sebagai berikut ; 1. Rule telah berhasil dibangun untuk membantu guru atau sekolah dalam menentukan jurusan siswa

SMA sesuai dengan kebutuhan.

2. Algoritma ID3 dapat diimplementasikan oleh sistem sehingga sistem dapat membuat pohon

keputusan secara otomatis.

(6)

3. Algoritma ID3 dapat mengidentifikasi dengan sempurna data latih yang diujikan kembali dengan catatan data latih tidak memiliki data ganda/noise.

4. Data latih yang baik adalah data latih dengan parameter yang beragam dan berimbang.

5. Jumlah data latih mempengaruhi rule yang diberikan dan semakin banyak data latih maka semakin baik dan kompleks rule yang didapatkan

4.2 Saran

Beberapa saran yang diberikan untuk pengembangan penelitian ini lebih lanjut adalah sebagai berikut ; 1. Perlunya dibuat suatu sistem yang memfasilitasi rule yang didapatkan menjadi suatu program yang

dapat langsung digunakan oleh guru dalam mencari keputusan.

2. Perlunya dibuat suatu sistem auto learning pada pengembangan berikutnya sehingga rule yang diperoleh semakin baik.

5 Daftar simbol

c = jumlah nilai yang ada pada atribut target (jumlah kelas klasifikasi) p

i

= menyatakan jumlah sampel untuk kelas i

A = atribut

V = menyatakan nilai yang mungkin untuk atribut A Values(A) = himpunan nilai-nilai yang mungkin untuk atribut A

|S

v

| = jumlah sampel untuk nilai v

|S| = jumlah sampel data

Entropy(S

v

) = entropy untuk sampel-sampel yang memiliki nilai v

6 Refference

[1] Ariani, Pepi Dwi. Sistem Pendukung Keputusan Pemilihan Jurusan SMK Menggunakan Neuro- Fuzzy. Undergraduate Thesis, Institut Teknologi Sepuluh Nopember: Surabaya (2010)

[2] Desiani, A. dan Muhammad Arhami. Konsep Kecerdasan Buatan. Palembang: ANDI (2006) [3] Fitriyani. Sistem Pendukung Keputusan Penjurusan Sma Menggunakan Metode AHP. Seminar

Nasional Teknologi Informasi & Komunikasi Terapan 2012 (Semantik 2012). ISBN 979 - 26 - 0255 – 0. Jurusan Sistem Informasi, STMIK Atma Luhur Pangkalpinang (2012)

[4] Setiawan, Bambang. Perancangan Sistem Pendukung Keputusan (Spk) Untuk Menentukan Kelaiklautan Kapal : Studi Kasus Di Kantor Administrasi Pelabuhan Klas Utama Tj. Perak Surabaya. Master Thesis, Institut Teknologi Sepuluh Nopember: Surabaya (2010)

[5] Siswoutomo, Wiwit. PHP Undercover Mengungkap Rahasia Pemrograman PHP. Jakarta: Elex Media Komputindo (2005)

[6] Slocum, Mary. Decision Making Using ID3 Algorithm. Rivier Academic Journal, Volume 8, Number 2, Fall. M.S. Program in Computer Science, Rivier University (2012)

[7] Suyanto. Artificial Intelegent (Cetakan kedua). Informatika: Bandung (2011)

[8] Sutojo. T, Edy Mulyanto, Vincent Suhartono. Kecerdasan Buatan. Semarang: ANDI (2011) [9] Rosa A. S dan Salahudin. Rekayasa Perangkat Lunak. Modula: Bandung (2011)

[10] Utami, Winda Pangesti. Penerapan Algoritma Iterative Dichotomiser Three untuk Pemilihan Dosen Pembimbing. Universitas Kristen Satya Wacana: Jawa Tengah (2012)

[11] Wahyudin. Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru. Jurnal Pendidikan Teknologi Informasi Dan Komunikasi (PTIK). ISSN 1979-9462.

Universitas Pendidikan Indonesia: Bandung (2009)

[12] Wibowo, Bagus Ari. Perancangan dan Implementasi Sistem Pendukung Keputusan untuk Jalan

Menggunakan Metode ID3 (Studi Kasus BAPPEDA Kota Salatiga). Universitas Kristen Satya

Wacana: Jawa Tengah (2011)