APLIKASI UNTUK MENGETAHUI TINGKAT KELULUSAN
MAHASISWA UMSIDA TAHUN 2008 MENGGUNAKAN
METODE DATA MINING C4.5 STUDI KASUS DI
UNIVERSITAS MUHAMMADIAYAH SIDOARJO
Evita
Teknik Informatika(S1), FakultasTeknik, Universitas Muhammadiyah Sidoarjo, Jl. Raya Gelam 250 CandiSidoarjo 61271
E-mail: evita@gmail.com
Abstrak - Data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data dalam jumlah besar yang diharap dapat mengatasi kondisi tersebut. Dengan memanfaatkan data induk mahasiswa dan data kelulusan mahasiswa diharapkan dapat menghasilkan informasi tentang tingkat kelulusan dengan data induk mahasiwa melaluli teknik data mining. Kategori tingkat kelulusan di ukur dari SKS dan IPK. Algoritma yang digunakan adalah algoritma C4.5. System bisa menampilkan informasi tentang tingkat kelulusan mahasiswa Teknik Informatika UMSIDA Sidoarjo dengan menggunakan metode C4.5.
Keywords – Pohon Keputusan, C4.5, Data mining, Kelulusan Mahasiswa.
I. PENDAHULUAN
Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga informasi akan menjadi suatu elemen penting dalam perkembangan masyarakat saat ini dan waktu mendatang. Namun kebutuhan informasi yang tinggi kadang tidak diimbangi dengan penyajian informasi yang memadai, sering kali informasi tersebut masih harus di gali ulang dari data yang jumlahnya sangat besar. Para pengambil keputusan berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi yang berguna membantu mengambil keputusan, hal ini mendorong munculnya cabang ilmu baru untuk mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data dalam jumlah besar, yang disebut dengan data mining.
II. KAJIAN PUSTAKA
Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar (Davies, 2004). Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Pramudiono, 2007). Data mining, sering juga disebut sebagai
hubungan dalam set data berukuran besar (Santoso, 2007). Dalam decision tree tidak menggunakan vector jarak untuk mengklasifikasikan obyek. Seringkali data observasi mempunyai atribut-atribut yang bernilai nominal. Misalkan obyeknya adalah sekumpulan buah-buahan yang bisa dibedakan berdasarkan atribut bentuk, warna, ukuran dan rasa. Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu bersifat kategoris dan tiap nilai tidak bis dijumlahkan atau dikurangkan. Dalam atribut warna ada beberapa nilai yang mungkin yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai besar, sedang dan kecil. Dengan nilai-nilai atribut ini, kemudian dibuat decision tree untuk menentukan suatu obyek termasuk jenis buah apa jika nilai tiap-tiap atribut diberikan (Santoso, 2007).
Algoritma Decision Tree
Pohon keputusan (Decision Tree) merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal.Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang mempresentasikan aturan.Aturan dapat dengan mudah dipahami dengan bahasa alami. Aturan ini juga dapat di ekspresikan dalm bentuk bahasa basisi data seperti SQL untuk mencari record pada kategori tertentu. Pohon keputusan juga berguna untuk mengesplorasi data, menemukan hubungan tersembunyi antara sejumblah calon variable input dengan variable target. Karena pohon keputusan memadukan antara explorasi data dan pemodelan, pohon keputusan ini sangat bagus sebagai langka awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain (J R Quinlan,1993).
Berikut algoritmanya:
Table Data Awal
Data yang digunakan dalam penulisan tugas akhir ini terdiri dari dua sumber data, yaitu data awal dan data kelulusan.
1. Data awal
Data yang akan di tunjukkan pada table 3.1 sebagai berikut :
Table 3.1Tabel data kelulusan
Atribut Keterangan
NIM Nomor induk mahasiswa (NIM) adalah kode yang dimiliki mahasiswa sebagai nomer unik identitas diperguruan tinggi. Terdiri dari 12 digit yang mempresentasikan fakultas, jurusan, dan angkatan masuk.
Nama mahasiswa Merupakan nama lengkap mahasiswa yang bersangkutan
Jenis Kelamin Merupakanjenis kelamin mahasiswa yang bersangkutan
Asal Sekolah Merupakan asal sekolah mahassiswa yang bersangkutan
SKS Merupakan sebagai ukuran tingkat kelulusan mahasiswa
IPK Merupakan indeks prestasi komulatif yang menentukan kelulusan mahasiswa
Kelulusan Merupakan outputan dari kelulusan. Apakah tepat waktu atau tidak
Transformasi Data
Transformasi data merupakan proses pengubahan atau penggabungan data kedalam format yang sesuai untuk diproses dalam data mining. Seringkali data yang akan digunakan dalam proses data mining mempunyai format yang belum langsung bisa digunakan, oleh karena itu perlu dirubah formatnya.
L Laki-Laki
P Perempuan
IV. HASIL DAN PEMBAHASAN
Hasil Penelitian
Hasil penelitian sebagai berikut :
1. System bisa menampilkan informasi tentang tingkat kelulusan
mahasiswa Teknik Informatika UMSIDA Sidoarjo dengan
menggunakan metode C4.5. metode ini digunakan untuk menentukan
keputusan ketepatan kelulusan mahasiswa tersebut.
2. System juga memproses perhitungan dengan menggunakan algoritma
yang sudah di jelaskan pada bab sebelumnya. Data yang digunakan
dalam tugas akhir ini merupakan data survey yang diperoleh dari
Universitas Muhammadiyah Sidoarjo. Data merupakan data
kategorikal dan tidak ada mising value pada data. Jumlah data yang
digunakan sebanyak 132 data Dalam implementasinya, data dipecah
menjadi beberapa bagian,yaituC4.5 akan memecah menjadi 3, yaitu:
a. Data training: digunakan untuk membentuk pohon
keputusan.
b. Data ujicoba: digunakan untuk uji coba pada pohon yang
telah dibentuk guna menghitung nilai error rate.
Menu Home
Pada menu home berisikan sekilas tentang apa itu data mining beserta
metodenya yaitu metode c4.5. Metode ini merupakan metode yang menggunakan
pohon keputusan untuk mengetahui hasil akhir keputusannya. Metode ini juga
sangat familiyar dalam data mining.
Menu Perhitungan
Gambar 4.2 Form Data Perhitungan C4.5
Pada form perhitungan C4.5 ini system menghitung secara otomatis
inputan data training yang ada dan system juga menghitung sesuai dengan
algoritma C4.5. pada form ini berisikan perhitungan yang real. Perhitungan
dilakukan system untuk mengetahui hasil keputusan.
Gambar 4.3 Form Pohon keputusan
Pengujian Mengenai Kinerja Aplikasi
Gambar 4.12Hasil Ujicoba
V. KESIMPULAN
Kesimpulan
Bahwadalam penilaian kelulusan untuk menentukanya atau tidaknya mahasiswa lulus tepat atau tidaknya bisa ditentukan dengan tepat dan akurat dengan metrode data mining c4.5.Telah terbukti keakuratannya dengan metode ini.
Saran
Setelah selesainya penulisan dan pembuatan aplikasi ini, mulai dari tahap-tahap awal hingga akhir, maka penulis ingin mengungkapkan dan memberikan saran-saran untuk menunjang kemajuan sekolah sesuai dengan kemampuan penulis dari apa yang telah dialamiselama penyelesaian Skripsi ini. Adapun saran-saran tersebut adalah :
1.
Untuk pengembangan aplikasi selanjutnya diharapkan dilakukan ujicoba dengan data training dan data testing yang lebih banyak, dengan begitu maka klasifikasi data akan semakin besar tingkat kebenarannya.2.
Disarankan aplikasi ini dapat diimplementasikan walaupun belum sempurna, sehingga dapat membantu proses dalam mencari tingkat kelulusan mahasiswa umsida.Demikian kesimpulan dan saran-saran yang dapat diberikan, semoga bermanfaat bagisemua, sekian dan terima kasih.
DAFTAR PUSTAKA
[1] Santosa, Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, GrahaIlmu, Yogyakarta.
[2] NurIsani, M.sc (2003), Analisis Proses Data Mining Data mining
[3] Han, J. and Kamber, M, 2006, “Data Mining Concepts and Techniques SecondEdition”. Morgan Kauffman, San Francisco.
[4] Pramudiono, I. 2007. Pengantar Data Mining :MenambangPermataPengetahuan di Gunung Data.
[5] http://www.ilmukomputer.org/wp-content/uploads/2006/08/iko-datamining.zip, Diakses pada 15 Maret 2009jam 08.54
[6] Davies, and Paul Beynon, 2004, “Database Systems Third Edition”,Palgrave Macmillan, New York.
[7] Elmasri, Ramez and Shamkant B. Navathe, 2000, “Fundamentals of Database