• Tidak ada hasil yang ditemukan

APLIKASI UNTUK MENGETAHUI TINGKAT KELULU

N/A
N/A
Protected

Academic year: 2018

Membagikan "APLIKASI UNTUK MENGETAHUI TINGKAT KELULU"

Copied!
7
0
0

Teks penuh

(1)

APLIKASI UNTUK MENGETAHUI TINGKAT KELULUSAN

MAHASISWA UMSIDA TAHUN 2008 MENGGUNAKAN

METODE DATA MINING C4.5 STUDI KASUS DI

UNIVERSITAS MUHAMMADIAYAH SIDOARJO

Evita

Teknik Informatika(S1), FakultasTeknik, Universitas Muhammadiyah Sidoarjo, Jl. Raya Gelam 250 CandiSidoarjo 61271

E-mail: evita@gmail.com

Abstrak - Data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data dalam jumlah besar yang diharap dapat mengatasi kondisi tersebut. Dengan memanfaatkan data induk mahasiswa dan data kelulusan mahasiswa diharapkan dapat menghasilkan informasi tentang tingkat kelulusan dengan data induk mahasiwa melaluli teknik data mining. Kategori tingkat kelulusan di ukur dari SKS dan IPK. Algoritma yang digunakan adalah algoritma C4.5. System bisa menampilkan informasi tentang tingkat kelulusan mahasiswa Teknik Informatika UMSIDA Sidoarjo dengan menggunakan metode C4.5.

Keywords – Pohon Keputusan, C4.5, Data mining, Kelulusan Mahasiswa.

I. PENDAHULUAN

Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga informasi akan menjadi suatu elemen penting dalam perkembangan masyarakat saat ini dan waktu mendatang. Namun kebutuhan informasi yang tinggi kadang tidak diimbangi dengan penyajian informasi yang memadai, sering kali informasi tersebut masih harus di gali ulang dari data yang jumlahnya sangat besar. Para pengambil keputusan berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi yang berguna membantu mengambil keputusan, hal ini mendorong munculnya cabang ilmu baru untuk mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data dalam jumlah besar, yang disebut dengan data mining.

II. KAJIAN PUSTAKA

Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar (Davies, 2004). Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Pramudiono, 2007). Data mining, sering juga disebut sebagai

(2)

hubungan dalam set data berukuran besar (Santoso, 2007). Dalam decision tree tidak menggunakan vector jarak untuk mengklasifikasikan obyek. Seringkali data observasi mempunyai atribut-atribut yang bernilai nominal. Misalkan obyeknya adalah sekumpulan buah-buahan yang bisa dibedakan berdasarkan atribut bentuk, warna, ukuran dan rasa. Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu bersifat kategoris dan tiap nilai tidak bis dijumlahkan atau dikurangkan. Dalam atribut warna ada beberapa nilai yang mungkin yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai besar, sedang dan kecil. Dengan nilai-nilai atribut ini, kemudian dibuat decision tree untuk menentukan suatu obyek termasuk jenis buah apa jika nilai tiap-tiap atribut diberikan (Santoso, 2007).

Algoritma Decision Tree

Pohon keputusan (Decision Tree) merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal.Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang mempresentasikan aturan.Aturan dapat dengan mudah dipahami dengan bahasa alami. Aturan ini juga dapat di ekspresikan dalm bentuk bahasa basisi data seperti SQL untuk mencari record pada kategori tertentu. Pohon keputusan juga berguna untuk mengesplorasi data, menemukan hubungan tersembunyi antara sejumblah calon variable input dengan variable target. Karena pohon keputusan memadukan antara explorasi data dan pemodelan, pohon keputusan ini sangat bagus sebagai langka awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain (J R Quinlan,1993).

Berikut algoritmanya:

(3)

Table Data Awal

Data yang digunakan dalam penulisan tugas akhir ini terdiri dari dua sumber data, yaitu data awal dan data kelulusan.

1. Data awal

Data yang akan di tunjukkan pada table 3.1 sebagai berikut :

Table 3.1Tabel data kelulusan

Atribut Keterangan

NIM Nomor induk mahasiswa (NIM) adalah kode yang dimiliki mahasiswa sebagai nomer unik identitas diperguruan tinggi. Terdiri dari 12 digit yang mempresentasikan fakultas, jurusan, dan angkatan masuk.

Nama mahasiswa Merupakan nama lengkap mahasiswa yang bersangkutan

Jenis Kelamin Merupakanjenis kelamin mahasiswa yang bersangkutan

Asal Sekolah Merupakan asal sekolah mahassiswa yang bersangkutan

SKS Merupakan sebagai ukuran tingkat kelulusan mahasiswa

IPK Merupakan indeks prestasi komulatif yang menentukan kelulusan mahasiswa

Kelulusan Merupakan outputan dari kelulusan. Apakah tepat waktu atau tidak

Transformasi Data

Transformasi data merupakan proses pengubahan atau penggabungan data kedalam format yang sesuai untuk diproses dalam data mining. Seringkali data yang akan digunakan dalam proses data mining mempunyai format yang belum langsung bisa digunakan, oleh karena itu perlu dirubah formatnya.

(4)

L Laki-Laki

P Perempuan

IV. HASIL DAN PEMBAHASAN

Hasil Penelitian

Hasil penelitian sebagai berikut :

1. System bisa menampilkan informasi tentang tingkat kelulusan

mahasiswa Teknik Informatika UMSIDA Sidoarjo dengan

menggunakan metode C4.5. metode ini digunakan untuk menentukan

keputusan ketepatan kelulusan mahasiswa tersebut.

2. System juga memproses perhitungan dengan menggunakan algoritma

yang sudah di jelaskan pada bab sebelumnya. Data yang digunakan

dalam tugas akhir ini merupakan data survey yang diperoleh dari

Universitas Muhammadiyah Sidoarjo. Data merupakan data

kategorikal dan tidak ada mising value pada data. Jumlah data yang

digunakan sebanyak 132 data Dalam implementasinya, data dipecah

menjadi beberapa bagian,yaituC4.5 akan memecah menjadi 3, yaitu:

a. Data training: digunakan untuk membentuk pohon

keputusan.

b. Data ujicoba: digunakan untuk uji coba pada pohon yang

telah dibentuk guna menghitung nilai error rate.

Menu Home

(5)

Pada menu home berisikan sekilas tentang apa itu data mining beserta

metodenya yaitu metode c4.5. Metode ini merupakan metode yang menggunakan

pohon keputusan untuk mengetahui hasil akhir keputusannya. Metode ini juga

sangat familiyar dalam data mining.

Menu Perhitungan

Gambar 4.2 Form Data Perhitungan C4.5

Pada form perhitungan C4.5 ini system menghitung secara otomatis

inputan data training yang ada dan system juga menghitung sesuai dengan

algoritma C4.5. pada form ini berisikan perhitungan yang real. Perhitungan

dilakukan system untuk mengetahui hasil keputusan.

(6)

Gambar 4.3 Form Pohon keputusan

Pengujian Mengenai Kinerja Aplikasi

Gambar 4.12Hasil Ujicoba

V. KESIMPULAN

Kesimpulan

(7)

Bahwadalam penilaian kelulusan untuk menentukanya atau tidaknya mahasiswa lulus tepat atau tidaknya bisa ditentukan dengan tepat dan akurat dengan metrode data mining c4.5.Telah terbukti keakuratannya dengan metode ini.

Saran

Setelah selesainya penulisan dan pembuatan aplikasi ini, mulai dari tahap-tahap awal hingga akhir, maka penulis ingin mengungkapkan dan memberikan saran-saran untuk menunjang kemajuan sekolah sesuai dengan kemampuan penulis dari apa yang telah dialamiselama penyelesaian Skripsi ini. Adapun saran-saran tersebut adalah :

1.

Untuk pengembangan aplikasi selanjutnya diharapkan dilakukan ujicoba dengan data training dan data testing yang lebih banyak, dengan begitu maka klasifikasi data akan semakin besar tingkat kebenarannya.

2.

Disarankan aplikasi ini dapat diimplementasikan walaupun belum sempurna, sehingga dapat membantu proses dalam mencari tingkat kelulusan mahasiswa umsida.

Demikian kesimpulan dan saran-saran yang dapat diberikan, semoga bermanfaat bagisemua, sekian dan terima kasih.

DAFTAR PUSTAKA

[1] Santosa, Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, GrahaIlmu, Yogyakarta.

[2] NurIsani, M.sc (2003), Analisis Proses Data Mining Data mining

[3] Han, J. and Kamber, M, 2006, “Data Mining Concepts and Techniques SecondEdition”. Morgan Kauffman, San Francisco.

[4] Pramudiono, I. 2007. Pengantar Data Mining :MenambangPermataPengetahuan di Gunung Data.

[5] http://www.ilmukomputer.org/wp-content/uploads/2006/08/iko-datamining.zip, Diakses pada 15 Maret 2009jam 08.54

[6] Davies, and Paul Beynon, 2004, “Database Systems Third Edition”,Palgrave Macmillan, New York.

[7] Elmasri, Ramez and Shamkant B. Navathe, 2000, “Fundamentals of Database

Gambar

Table 3.1Tabel data kelulusan
Gambar 4.1 Menu Home
Gambar 4.2 Form Data Perhitungan C4.5
Gambar 4.3 Form Pohon keputusan

Referensi

Dokumen terkait

Berdasarkan perumusan masalah yang dikemukakan oleh peneliti maka data yang diperlukan adalah data kekuatan dan kelemahan internal perusahaan khususnya yang berhubungan dengan

Uji heterokedastisitas dilakukan untuk mengetahui apakah dalam sebuah model regresi terjadi ketidaksamaan varians dari residual satu pengamatan ke pengamatan yang lain

Penerapan analisis liner berganda dalam penelitian ini dilakukan dengan tujuan untuk mengetahui pengaruh tiga variabel bebas yakni kualitas produk, harga dan

Sebagai pertimbangan untuk membentuk indikator pekerja terancam selain pemberian kontrak perkhidmatan adalah memadai di peringkat awal ini untuk mengambil kira dua terma

Hal ini sesuai dengan penelitian sebelumnya Persepsi dukungan atasan mengacu kepada tingkat yang memandang karyawan bahwa atasan mereka peduli tentang mereka dan

Berdasarkan kenyataan itu, melalui pelaksanaan program Ipteks bagi Wilayah (IbW) dilakukan kegiatan alih teknologi fermentasi Bio-Mol dalam pengolahan eceng

Perangkat keras pada Tabel 4.1 digunakan untuk melakukan pengujian terhadap sistem ekstraksi informasi berdasarkan spesifikasi minimum yang telah

Gambar 7 memperlihatkan aktivitas enzim ALT pada anjing penelitian, yang sebagian besar (10 ekor) berada dalam kisaran nilai interval normal menurut Morgan