A PL I K A SI D A T A MI NI NG M E NG G UNA K A N
Salah satu faktor penyebab ketidaklulusan mahasiswa karena kurangnya kebijakan dan tindakan dari instansi pendidikan untuk menjaga mahasiswanya tidak lulus pada mata kuliah yang telah ditempuh. D engan memanfaatkan data induk mahasiswa dan data nilai akhir mahasiswa diharapkan dapat menghasilkan informasi tentang laporan hasil nilai akhir dengan data induk mahasiswa melalui teknik data mining. Studi kasus penelitian ini dilaksanakan pada F akultas Teknik UMSurabaya untuk interval waktu tahun akademik 2012/2013. Metode penelitian yang dipakai adalah metode D ecision T ree dengan algoritma C 4.5. Pada tahap akhir, penelitian dievaluasi dan validasi dengan cross validation. D ari penelitian dihasilkan, aplikasi laporan hasil nilai akhir dengan metode decision tree algoritma C 4.5 sebagai acuan dalam membuat kebijakan dan tindakan untuk mengurangi jumlah mahasiswa yang tidak lulus dengan akurasi 100E menggunakan evaluasi C ross V alidation.
K ata K unci: D ecision Tree, Algoritma C 4.5, Nilai Akhir, C ross V alidation
A bstr act
One of the causes of student failure due to the lack of policies and actions of educational institutions to keep students do not pass on the courses you have taken. By utilizing the student master data and data value end students are expected to generate information on the results of the final report by the student master data through data mining techniques. The case study research was conducted at the F aculty of E ngineering UMSurabaya for the 2012/2013 academic year intervals. The research method used is a method C 4.5 D ecision Tree algorithm. In the final stage, evaluation and validation studies with cross validation. F rom the resulting research, application of the results of the final report by the method of decision tree algorithm C 4.5 as a reference in making policies and measures to reduce the number of students who did not pass with 100E accuracy using the evaluation C ross V alidation
Ye yword : D ecision Tree, Algoritma C 4.5, Nilai Akhir, C ross V alidation
1. P E ND A H U L U A N
D i dalam peraturan akademik Universitas Muhammadiyah Surabaya bidang pendidikan tahun
2013 pada B A B X I pasal 35 ayat 3 butir a di sebutkan bahwa “Sistem penilaian yang digunakan
Universitas Muhammadiyah S urabaya adalah sistem penilaian komprehensif yang terdiri dari aktifitas
( A ) , tugas (T ), ujian tengah semester ( UT S) dan ujian akhir semester ( UA S) ” (Peraturan A kademik,
2013) .
B erdasarkan buku wisuda tahun 2013 menunjukkan nilai IPK mahasiswa pada F akultas T eknik
umumnya rendah. Hal ini menunjukkan bahwa masih ada mahasiswa Program S arjana ( S1) dan
Program D iploma (D 3) reguler di F akultas T eknik yang tidak lulus untuk beberapa mata kuliah. Oleh
karena itu, dengan memanfaatkan data induk mahasiswa dan data nilai mahasiswa, dapat diketahui
informasi hasil nilai akhir mahasiswa melalui teknik data mining.
Nilai akhir mahasiswa dapat dilihat dari komponen nilai aktifitas ( A ) , tugas (T ), ujian tengah
semester ( UT S) dan ujian akhir semester ( UA S). D ata mining diharapkan dapat membantu menyajikan
informasi tentang nilai akhir mahasiswa dengan menggunakan data nilai akhir mahasiswa dan data
untuk menghasilkan informasi yang berguna tentang hubungan nilai akhir dengan skala penilaian
dengan teknik data mining metode decision tree algoritma C 4.5. Informasi yang ditampilkan berupa
nilai support dan confidence hubungan antara nilai akhir mahasiswa dengan nilai aktifitas ( A ), tugas (T ) ,
ujian tengah semester ( UT S ) dan ujian akhir semester (UA S ) . Hasil klasifikasi dari algoritma C 4.5
dievaluasi dan divalidasi dengan cross validation untuk mengetahui tingkat akurasi A lgoritma C 4.5.
2.
M E T O DE P E NE L I T I A N
Metode dan tahapan penelitian yaitu meliputi; 1. Pembersihan data (data cleaning) .
Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten. D ata yang digunakan dalam penulisan penelitian ini terdiri dari dua sumber data, yaitu data induk mahasiswa ( Nama, NIM dan Program Studi) dan data nilai akhir yang didapatkan dari skala penilaian ( aktifitas ( A ), tugas (T ) , ujian tengah semester ( UT S) dan ujian akhir semester (UA S )). 2. Integrasi data (data integration) .
Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. 3. Seleksi Data ( D ata Selection)
D ata yang ada pada database sering kali tidak semua dipakai, hanya data yang sesuai untuk dianalisis yang diambil dari database. K arena tidak semua tabel digunakan maka perlu dilakukan pembersihan data agar data yang akan diolah benar-benar relevan dengan yang dibutuhkan.
4. T ransformasi data ( D ata Transformation).
D ata digabung ke dalam format yang sesuai untuk diproses dalam data mining. T ransformasi data merupakan proses pengubahan atau penggabungan data ke dalam format yang sesuai.
5. Proses mining
Merupakan proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dari data. Pohon keputusan ( decision tree) merupakan teknik yang digunakan pada proses mining. 6. Pengujian dan E valuasi Sistem
3.H A SI L D A N P E M B A H A SA N 3.1 Pohon K eputusan ( D ecision T ree)
D ata training yang digunakan yakni nilai aktifitas (A ), tugas (T ) , ujian tengah semester ( UT S) dan ujian akhir semester ( UA S). Nilai akhir yang digunakan yakni A , A B , B , C , D dan E .
T abel 1 D ata Nilai Akhir
NO. UT S T ugas A ktifitas UA S Nilai A khir
1 40 80 85 80 A B
2 50 80 78 90 A B
3 75 80 53 90 A B
4 45 79 66 53 B C
5 40 77 49 90 B C
6 65 80 77 90 A B
7 50 65 59 26 D D
8 40 77 65 62 B C
9 40 80 67 90 A B
10 50 80 72 26 B C
11 40 80 65 80 B B
12 50 80 65 90 A B
13 50 80 77 90 A B
14 40 77 51 90 B C
15 60 80 66 90 A B
16 50 60 65 62 B C
17 50 80 61 62 B C
18 85 80 77 80 A A
19 50 80 65 53 B C
20 70 80 70 90 A B
21 70 80 78 90 A B
22 50 65 40 26 D D
23 50 77 77 90 A B
24 30 80 62 90 B B
25 50 80 70 71.8 B B
26 50 79 75 80.9 A B
27 70 80 96 90 A A
28 50 80 66 80.9 B B
29 95 80 88 90 A A
30 75 77 65 90 A B
apakah nilai aktivitasnya kurang dari 66.9? K arena nilai aktivitas 90 lebih dari nilai tersebut, maka
masuk ke ranting kedua yang ditanya apakah nilai UA S kurang dari 52? K arena nilai UA S 80 maka
masuk ke ranting ketiga yang ditanya apakah UT S kurang dari 80? K arena UT S 75 maka masuk ke
rating selanjutnya yakni nilai akhir mahasiswa tersebut ‘ A B ’.
T abel 3. Hasil Training dan Testing T r aining T esting digunakan untuk menampilkan informasi yang berguna tentang nilai akhir mahasiswa dengan teknik data mining.
Informasi yang ditampilkan berupa hubungan antara nilai akhir mahasiswa dengan nilai aktifitas ( A ) , tugas (T ), ujian tengah semester ( UT S ) dan uj ian akhir semester ( UA S ) . Hal ini terlihat pada pohon keputusan (decision tree) dan rancangan aplikasi berbasis pohon keputusan. Hasil evaluasi dan validasi dengan C ross V alidation menunjukkan tingkat akurasi pada algoritma C 4.5 sebesar 100E.
5. D aftar P ustak a
[ 1]. A ndriani A nik. 2011. Penerapan A lgoritma C 4.5 Pada Program K lasifikasi Mahasiswa
D ropout . A MIK B S I J akarta
[ 2]. A nonim, 2013 “Peraturan Akademik Universitas Muhammadiyah Surabaya”, Surabaya.
[ 3]. B udi, 2007, “D ata Mining Teknik Pemanfaatan Data untuk K eperluan Bisnis”, Graha Ilmu,
Y ogyakarta.
[ 4]. B ramer, Max, 2007, “Principles of Data Mining”, Springer, L ondon.
[ 5]. C hintakayala, Padmini. 2005. “Beginners Guide for Software T esting : Symbiosys
Technologies”.
[ 6]. Guidici, P. & F igini, S . 2009. Applied D ata Mining for Business and Industry (2nd ed) . Italy.
J ohn W iley & S ons, L td. ISB N: 978-0-470-05886-2
[ 7]. Han, J . and K amber, M, 2006, “D ata Mining C oncepts and Techniques Second E dition”.
Morgan K auffman, San F rancisco.
[ 8]. Hermawati A F , 2013. Data Mining. Penerbit A ndi. Y ogj akarta
[ 9]. Huda MN. 2010. A plikasi D ata Mining Untuk Menampilkan Informasi T ingkat K elulusan
Mahasiswa (Studi K asus D i F akultas Mipa Universitas D iponegoro) . F MIPA UND IP
[ 10]. L arose, D. T . 2005. D iscovering K nowledge in Data. New J ersey: J ohn W illey & Sons, Inc.
ISB N 0-471-66657-2.
[ 11]. K usrini, dan E mha T aufik L uthfi, 2009, “Algoritma D ata Mining”, Penerbit A ndi,
Y ogyakarta.
[ 12]. Pramudiono, I. 2007. Pengantar D ata Mining : Menambang Permata Pengetahuan di Gunung
D ata.
[ 13]. R ainardi, V incent, 2008, “Building a Data Warehouse with E xamples in SQL Server”,
Springer, New Y ork.
[ 14]. Pressman, R oger S, 1997, “Software E ngineering: A Practitioner’s Approch.” T he
McGraw-Hill C ompanies, Inc., New Y ork Santosa,
[ 15]. Sommerville, Ian, 2003, “Software E ngineering (Rekayasa Perangkat L unak)/ E disi 6/J ilid 1”
E rlangga, J akarta.
[ 16]. W idodo Pudjo P, Handayanto T P. dan Herlawati, 2013. “Penerapan D ata Mining dengan