• Tidak ada hasil yang ditemukan

Penerapan Algoritma Klasifikasi Data Mining Decision Tree Untuk Menentukan Penjurusan Siswa SMA 6 Tasikmalaya

N/A
N/A
Protected

Academic year: 2021

Membagikan "Penerapan Algoritma Klasifikasi Data Mining Decision Tree Untuk Menentukan Penjurusan Siswa SMA 6 Tasikmalaya"

Copied!
5
0
0

Teks penuh

(1)

Penerapan Algoritma Klasifikasi Data Mining Decision Tree Untuk

Menentukan Penjurusan Siswa SMA 6 Tasikmalaya

Mira Kusmira1, Richardus Eko Indrajit2

1 AMIK BSI Tasikmalaya

Tasikmalaya, Indonesia Mira.kusmira45@gmail.com

2 ABFI Institute Perbanas

Jakarta, Indonesia indrajit@post.harvard.edu

Abstract – SMA Negri 6 Tasikamlaya is one of senior high schools in Tasikmalaya city which currently has 2

majors, SCIENCE and SOCIAL. This student majors can lead learners to focus on developing their own abilities and interests. The selection of improper majors can be very detrimental to students’ interests and careers in the future. These majors are expected to maximize the potential, talent or individual talents which could increase its academic value. Based on the background, by applying the data mining techniques, it is expected to help students to determine the appropriate majors according to the criteria appointed. As for the data mining techniques which is used in the determination of this major uses Decision Tree method. While the attributes used to determine the majors consisted of Average Mathematical Value, Average Score Value, Average SOCIAL Score.This research is based on business intelligence which focused on determining the majors in SMA Negeri 6 Tasikmalaya by using the Decision Tree method.

Kata Kunci: Kata Kunci: Data mining, Decision Tree, Klasifikasi, SMA

I. PENDAHULUAN

Kurikulum yang digunakan pada Sekolah Menegah Atas (SMA) saat ini adalah kurikulum 2013. Dalam perkembangan kurikulum yang baru ini terdapat beberapa perbedaan dengan kurikulum sebelumnya. Salah satunya yaitu perbedaan dalam menentukan jurusan pada siswa-siswi SMA. Penjurusan di sekolah SMA 6 Tasikmalaya dilihat dari nilai rata rata rapot, selain itu juga dilihat dari nilai Rata-rata IPA SMP, Nilai Rata-rata IPS SMP, Nilai rata rata matematika SMP.

Tujuan dari penjurusan itu sendiri adalah agar kelak dikemudian hari, pelajaran yang diberikan kepada siswa lebih terarah sesuai dengan minat dan bakat masing masing,. Karena tidak jarang juga siswa-siswi yang asal- asalan dalam menentukan jurusan yang mereka ambil. Atau hanya sekedar mengikuti teman temannya saja.

Mengacu pada penelitian yang telah dilakukan sebelumnya. Maka kali ini Metode Decision Tree akan di uji cobakan di lingkungan SMA Negeri 6 Tasikmalaya yang merupakan sebagai contoh yang mungkin terjadi, Tujuan dari penelitian ini adalah untuk mengetahui penjurusan di SMA Negeri 6 Tasikmalaya.

II. LANDASAN TEORI 2.1 Algoritma C4.5

Algoritma C4.5 merupakan pengembangan dari algoritma ID3. Algoritma C4.5 dan ID3 diciptakan oleh seorang peneliti dibidang kecerdassan buatan bernama J. Rose Quinlan pada

akhir tahun 1970-an. Algoritma C4.5 akan membuat pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun. Ada beberapa tahapan dalam membuat sebuah pohon keputusan dalam algoritma C4.5, yaitu [4]:

1. Mempersiapkan data training. Data training biasanya diambil dari kata histori yang pernah terjadi sebelumnya atau disebut data masa lalu dan sudah dikelompokkan dalam kelas-kelas tertentu. 2. Menghitung akar dari pohon. Akar akan diambil dari atribut yang akan terpilih, dengan cara menghitung nilai gain dari masing-masing atribut, nilai gain yang paling tinggi yang akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung dulu nilai entropy. Untuk menghitung nilai entropy digunakan rumus

Keterangan : S = Himpunan kasus n = jumlah partisi S Pᵢ= proporsi Sᵢ terhadap S

Kemudian Hitung nilai gain menggunakan rumus :

Keterangan : S = Himpunan kasus A = Fitur

(2)

n = jumlah partisi atribut A │Si│= proporsi Si terhadap S │S │= jumlah kasus dalam S

2.2 Decision Tree

Secara singkat bahwa Decision Tree merupakan salah satu metode klasifikasi pada Text Mining. Klasifikasi adalah “proses menemukan kumpulan pola atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk memprediksi data yang belum memiliki kelas data tertentu (Jianwei Han, 2001)”

Pohon Keputusan atau dikenal dengan Decision Tree adalah salah satu metode klasifikasi yang menggunkan representasi suatu struktur pohon yang yang berisi alternatif-alternatif untuk pemecahan suatu masalah. Pohon ini juga menunjukkan faktor-faktor yang mempengaruhi hasil alternatif dari keputusan tersebut disertai dengan estimasi hasil akhir bila kita mengambil keputusan tersebut. Peranan pohon keputusan ini adalah sebagai Decision Support Tool untuk membantu manusia dalam mengambil suatu keputusan[3].

Manfaat dari decision tree adalah melakukan break

down proses pengambilan keputusan yang kompleks

menjadi lebih simpel sehingga orang yang mengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. Konsep yang digunakan oleh decision tree adalah mengubah data menjadi suatu keputusan pohon dan aturan-aturan keputusan(rule).

Decision tree menggunakan struktur hierarki

untuk pembelajaran supervised. Proses dari decision tree dimulai dari root node hingga leaf node yang dilakukan secara rekursif[4]. Di mana setiap percabangan menyatakan suatu kondisi yang harus dipenuhi dan pada setiap ujung pohon menyatakan kelas dari suatu data. Pada decision tree terdiri dari tiga bagian yaitu[4]:

a. Root node

Node ini merupakan node yang terletak paling atas darisuatu pohon.

b. Internal node

Node ini merupakan node percabangan, hanya terdapat

satu input serta mempunyai minimal dua output.

c. Leaf node.

Node ini merupakan node akhir, hanya memiliki satu

input, dan tidak memiliki output.

Gambar 1. Decision Tree prediksi cuaca

2.3 Penjurusan SMA

Sekolah Menengah Atas (SMA), adalah jenjang pendidikan menengah pada pendidikan formal di Indonesia setelah lulus Sekolah menengah pertama (atau sederajat). Kurikulum yang digunakan pada Sekolah Menengah Atas (SMA) saat ini adalah kurikulum 2013. Dalam perkembangan kurikulum yang baru ini terdapat perbedaan dengan kurikulum sebelumnya. Salah satu perbedaannya yaitu dalam proses penentuan jurusan pada siswa SMA, karena penjurusan dilakukan pada kelas X.

2.4 Business Inteligence (BI)

Business Inteligence (BI) bukanlah sebuah

produk atau sistem, melainkan sebuah arsitektur dan koleksi operasional yang terintegrasi terhadap aplikasi pengambil keputusan dan database yang menyediakan pelaku bisnis kemudahan untuk akses ke data bisnis (Darudiato, Santoso, & Wiguna, 2002). Beberapa ahli menjelaskan mengenai pengertian business

intelligence sebagai berikut (Ljubljana, Turk, & Jaklič,

2010) :

a. Business intelligence merupakan proses mengumpulkan dan menganalisis informasi bisnis internal dan eksternal (Okkonen et al., 2002). b. Business intelligence adalah suatu arsitektur dan

koleksi terintegrasi operasional serta dukungan keputusan aplikasi dan database yang memberikan kemudahan akses ke data bisnis (Moss & Atre, 2003).

c. Business intelligence merupakan istilah umum untuk aplikasi, platform, alat-alat dan teknologi yang mendukung proses menjelajahi data bisnis, relasi data dan tren. BI menyediakan seorang eksekutif dengan informasi yang tepat waktu dan akurat untuk lebih memahami bisnis nya dan untuk membuat keputusan bisnis yang lebih banyak informasi, real-time (Raisinghani, 2004).

Definisi dasar dari business intelligence (Turban et al, 2011) mencirikan business intelligence sebagai istilah payung yang menggabungkan arsitektur, peralatan, database, alat analisis, aplikasi dan metodologi (Horakova et al., 2003).

Lingkungan business intelligence. meliputi semua pengembangan, pengolahan informasi, dan kegiatan pendukungan yang diperlukan untuk memberikan informasi bisnis yang sangat relevan dan memiliki kemampuan analisis bisnis (Ljubljana et al., 2010). Dalam lingkungan business intelligence, organisasi merancang dan menerapkan business intelligence

system. Ini dapat didefinisikan sebagai suatu sistem

informasi yang menyediakan kualitas informasi untuk pengambilan keputusan analisis sebagai sumber untuk membimbing bisnis untuk mencapai tujuan organisasi. Menurut (Negash,2004) business intelligence system biasanya menggabungkan alat-alat analisis dengan penyimpanan data, pengumpulan data danmanajemen pengetahuan untuk memberikan pengguna akhir dengan informasi yang kompleks dan kompetitif untuk perencana dan pengambil keputusan (Journal &

(3)

intelligence system yaitu interaktif akses ke data,

manipulasi data dan memungkinkan manajer bisnis dan analis untuk melakukan analisis yang tepat.

III. METODE PENELITIAN

Metode yang di usulkan pada penelitian ini adalah metode data mining dengan menggunakan pendekatan algoritma decisison tree, dan dapat diterapkan pada studi kasus Menentukan Penjurusan siswa SMA Negeri 6 tasikmalaya dan berikut model yang di usulkan.

Gambar 2. Model metode yang di usulkan untuk Menentukan Penjurusan siswa SMA Negeri 6

tasikmalaya

Gambar 2 adalah model yang dapat diusulkan pada studi kasus penelitian ini untuk memdapatkan hasil penentuan penjurusan di SMA Negeri 6 Tasikmalaya. Pertama menentukan data set yang akan dia ambil yaitu dari data siswa negeri 6 tasikmalaya khususnya data siswa kelas x . jumlah yang digunakan sebanyak 120 Data tersebut memiliki 4 atribut yang digunakan untuk proses penjurusan, diantaranya adalah rata raport matematika, rata-rata raport IPA, rata-rata-rata-rata raport IPS, Dimana atribut hasil sebagai target, dan pada atribut target ada dua kelas yang menjadi tujuan atau target yaitu IPA dan IPS. Berikut adalah klasifikasi penentuan jurusan berdasarkan grade Nilai.

Tabel 1. Acuan nilai penjurusan Nilai Klasifikasi 86-100 IPA

71-85 IPS

56-70 IPS

IV. PEMBAHASAN

Dalam bab ini akan dibahas mengenai data yang akan digunakan dalam penelitian, data tersebut akan di hitung mengguanakan algorita Decision

tree

4.1 Data yang digunakan

Data yang digunakan dalam penelitian ini adalah sebanyak 120 data siswa kelas x di SMA 6 Tasikmalaya data hasil penjurusan siswa dengan atribut nama, nilai matematika, nilai ipa, nilai ips, nilai rata-rata, kelas jurusan

Tabel 2. Data Master Penjurusan siswa

Tabel 2. Merupakan contoh data penjurusan siswa SMA 6 Tasikmalaya kelas x, yang diambil dari data master sekolah SMA 6 Tasikmalaya. Jumlah sample data yang digunakan pada penenlitian ini adalah sebanyak 120 data siswa.

Data Set

Split Data

Decision Tree

(4)

Tabel 3. Data master nilai siswa

Tabel 3 adalah tabel data nilai siswa yang diambil dari nilai akhir mata kuliah matematika, ipa, ips yang menjadi acuan untuk masuk jurusan IPA, maupun IPS di SMA 6 tasikmalaya.

Dari data – data diatas diolah dengan menggunakam algoritma decision tree sehingga menghasilkan model atau pola baru dan dapat mengetahui akurasi dari setiap penjurusan. Proses pengolahan data tersebut menggunakan Rapid Miner.

Berikut implementasinya menggunakan Decision Tree terhadap dataset menggunakan Rapidminer 7.3.

Gambar 4. Metode decision tree untuk menghasilkan menentukan penjurusan siswa SMA 6 tasikmalaya

Gambar 5. Pola yang di hasilkan decision tree Pola yang dihasilkan dari pengolahan data penentuan jurusan siswa SMS 6 Tasikmalaya dengan algoritma

decision tree yang di tunjukan oleh gambar 5. Model

pengatahuan berupa data prediksi penjurusan siswa SMS 6 tasikmalaya

Tabel 4. Prediksi jumlah siswa yang masuk jurusan kelas IPA atau IPS

Nilai rata-rata Kelas Jurusan Jumlah

< 86 IPS 54

> 86 IPA 66

Tabel 4. Menunjukan prediksi siswa masuk kelas jurusan IPA atau kelas juruan IPS, berdassarkan jumlah data sample sebanyak 120 siswa yang terdapat di SMA 6 tasikmalaya yang masuk jurusan kelas IPS adalah sebanyak 54 siswa dan yang masuk jurusan kelas IPA adalah sebanyak 66 siswa

Proses pengolahan data pada penelitian ini dengen algoritma decision tree telah di lakukan, selanjutnya akan dilakukan proses evaluasi efektifitas algoritma terhadap proses ekstraksi data berdasarkan tingkat akurasi, presisi, serta Area Under Curve(AUC).

Tabel 5. Confusion Matrix

True IPS True IPA class precisian

Pred IPS 54 2 96.43%

Pred IPA 0 64 100.00 %

Class Recall 100.00% 96.97%

Tabel 6. Evaluasi Algoritma

Evaluasi Nilai

Accurancy 98.33%

Precision 96.43%

AUC 0.980

Tabel 6 Confusion Matrix adalah table korelasi antara algoritma dengan atribut. Sedangkan table 7 menjabarkan nilai akurasi algoritma decision tree terhadap pengolahan data sebesar 98.33%, dengan presisi 96.43% nilai tersebut mengartikan algoritma memiliki korelasi yang baik dengan atribut yang telah di proses oleh algoritma.

Nilai AUC yang di dapatkan dari hasil klasifikasi algoritma terhadap data atribut sebesar 0.980, yang mengartikan proses klasifikasi yang dilakukan oleh

decision tree terhadap atribut sangat baik. V. KESIMPULAN

Dari hasil penelitian dengan menggunakan

Decision tree dapat disimpulkan bahwa metode Decision tree mempunyai akurasi kecocokan dari

hasil penjurusan yang sebenarnya terhadap prediksi. Hasil dari dari penelitian tersebut mendapatkan nilai akurasi 98.33%, dengan precision 96.43 dan memiliki nilai AUC 0.980

Sarannya dapat menggunakan data latih yang lebih banyak lagi dan memiliki atribut yang lebih beragam dan dapat mencoba dengan metode- metode yang lain lagi selain dengan Decision tree.

(5)

UCAPAN TERIMAKASIH

Penulis mengucapkan terimakasih kepada Prof.Dr.Ir.R. Eko Indrajit selaku dosen mata kuliah

Business Intelligence yang telah banyak membantu

dalam meneyelesaikan penyusunan penelitian tersebut, serta kepada orang tua, teman-teman seperjuangan yang telah bnayak mendukung dalam menyelesaikan penyususnan penelitian tersebut.

REFERENSI

Ayu Purwarianti, (2010). Sistem Informasi Inteligen. Magister Informatika STEI ITB.

Han, Jiawei, Micheline Kamber, (2006), Data Mining

Concept and Techniques (2nd edition), Morgan

Kaufmann Publish.

Ian H. Witten, Eibe Frank,(2005), Data Mining :

Practical Machine Learning Tools and Techniques, Second Edition, Morgan Kaufmann Publishers.

Jian Wang Bo Yuan Wenhuang Liu. (2008).

Application of Decision Trees in Mining High-Value Credit Card Customers. Proceedings of the 11th Joint

Conference on Information Sciences.

Q. Wang, Y. Wu, J. Xiao, and F. Guang, (2007). The

Applied Research Based on Decision Tree of Data Mining In Third-Party Logistics”, IEEE International

Conference on Logistics, pp. 1540-1544.

Tsang, Smith, Ben Kao, Kevin Y.Yipi, Wai shing Ho,and sau Dan Lee. Decision Tree for Uncertain Data. IEEE Computer Society. 2009

Eko Sudaryanto, “Pengaruh Minat Belajar dan Penjurusan Terhadap Prestasi Belajar Siswa di SMK Katolik ST Lois Randublatung”, Skripsi Fakultas Keguruan dan Ilmu Pendidikan, Universitas Muhammadia Surakarta, Surakarta, 2009.

Bahar, “Penentuan Jurusan Sekolah Menengah Atas Dengan Algoritma Fuzzy C-Means”, Tesis Magister Komputer, Universitas Dian Nuswantoro, Semarang, 2011.

Munawaroh Holisatul dkk, “ Perbandingan Algoritma ID3 Dan C5.0 Dalam Identifikasi Penjurusan Siswa SMA”, Jurnal Sarjana Teknik Informatika , Vol. 1, No. 1, pp. 1-12, Juni, 2013.

Kustiyaningsih Yeni dkk, “Sistem Pendukung

Keputusan Untuk Menentukan Jurusan Pada Siswa SMA Menggunakan Metode KNN Dan

SMART”, Fakutas Teknik Universitas

Trunojoyo, Bangkalan, 2010.

Herawati Rosita, “Rekomendasi Penjurusan di SMU YSKI dengan Algoritma K-Means”, Fakultas Ilmu Komputer Universitas Soegijapranata, Semarang, 2012.

Fathoni Muhammad dan Saniman, “Jurnal Pengantar Algoritma dan Pemrograman”, Jurnal Saintikom, Vol.4, No.1, pp.120-133,

Januari 2008.

Pressman Roger S., “Software Engineering : Practitioner’s Approach 7th Edition”. McGraw-Hill, Inc, New York, 2012.

PROFIL PENULIS

Mira Kusmira. Lahir pada tanggal 01 Oktober 1988

di Tasikmalaya. Memperoleh gelar Sarjana Teknik Informatika (S.T) dari Universitas Bina Sarana Informatika Bandung pada tahun 2011.

Richardhus Eko Indrajit. Guru besar Ilmu

Komputer di ABFI Institute Perbanas. Memperoleh Gelar Master of Science di bidang Applied

Computer Science dari Hardvad University

(Massachusetts, USA) dengan fokus bidang

Articial Intelligence. Gelar Doctor of Business Administration dari University of the City of

Gambar

Gambar 1. Decision Tree prediksi cuaca
Gambar 2. Model metode yang di usulkan untuk  Menentukan Penjurusan  siswa SMA Negeri 6

Referensi

Dokumen terkait

(2) Lurah Desa atau Camat sebagaimana dimaksud pada Pasal 7 Ayat (2) dapat menindaklanjuti penanganan pengaduan yang berupa sengketa lingkungan hidup untuk

Teruntuk pegawai yang terpaut dengan proses Sistem Informasi Akuntansi Keuangan Daerah pada Dinas Perumahan, Kawasan Pemukiman dan Pertanahan Provinsi Sulawesi

Investasi jangka pendek pemerintah daerah dalam bentuk portofolio deposito sampai dengan 12 bulan, SUN, SBI, SPN dan surat berharga lainnya dapat bersumber dari

Misalnya terkait dengan permasalahan etika dan komunikasi seorang Basuki Tjahaja Purnama, sangatlah tepat bagi tim Mata Najwa untuk menghadirkan Muhammad Sanusi

UIN) Sayarif Hidayatullah Jakarta. Pemikirannya tentang pembaruan hukum Islam dimunculkan untuk menyambut gagasan Munawir. Dasar pemikiran beliau adalah bahwasanya

tidak hanya dipengaruhi oleh metode atau media saja juga dipengaruhi oleh banyak faktor yang bisa datang dari dalam siswa (internal) ataupun dalam diri siswa (eksternal).

Suatu graf adalah himpunan benda-benda yang disebut titik ( vertex ) yang terhubung oleh sisi ( edge ) atau busur ( arc ).. Biasanya graf digambarkan sebagai kumpulan

Tujuan utama dari penelitian ini adalah untuk menemukan strategi guru Pendidikan Agama Islam dalam mengelola kelas untuk meningkatkan kualitas pembelajaran di SMPN 2