i
IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN
MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS
MENGGUNAKAN METODE NAIVE BAYES
SKRIPSI
Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I
pada Program Studi Teknik Informatika Fakultas Komunikasi dan Informatika
Universitas Muhammadiyah Surakarta
Oleh :
AHMAD FIKRI MAURIZA L200100123
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA
iv
DAFTAR KONTRIBUSI
Dengan ini saya menyatakan bahwa skripsi ini tidak terdapat karya yang
pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi,
dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang
pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu
dalam naskah ini dan disebutkan dalam daftar pustaka.
Berikut saya sampaikan daftar kontribusi dalam penyusunan skripsi:
1. Mas Setiawan sebagai rekan untuk pencarian data sebagai bahan olah data
mining.
2. Saya sendiri yang mengolah data dan penghitungan metode naive bayes
berdasarkan sumber-sumber pada buku, literatur dan internet..
3. Aplikasi yang saya gunakan untuk membantu skripsi ini yaitu.
a. WEKA 3.7.10.
b. Microsoft Excel 2007.
c. Excel2Arrf Converter V.1.0-Beta.
d. Notepad ++
4. Laptop yang digunakan memiliki spesifikasi Processor Intel Dual-Core
2,30 GHz, Ram 3,00 GB, Hardisk 250 GB, VGA mobile Intel (R) 45
Express Chipset Family dengan ukuran memori 1341 MB.
5. Laporan diketik menggunakan software Microsoft Office 2007.
6. Yusuf Sulistyo Nugroho, S.T., M.Eng, selaku dosen pembimbing yang
v
Demikian pernyataan dan daftar kontribusi ini saya buat dengan sejujurnya.
Saya bertanggungjawab atas isi dan kebenaran daftar diatas.
Surakarta, Desember 2013
Ahmad Fikri Mauriza
Mengetahui : Pembimbing
Yusuf Sulistyo Nugroho, S.T,. M.Eng
vi
MOTTO DAN PERSEMBAHAN
MOTTO :
“
Manfaatkan waktu dan kesempatan mu dengan sebaik-baiknya sebelum
p y
”
-Ibu-
“
Bismillah, semua hal itu pasti dapat kita taklukan dengan tangan kita
bermodal
”
-Penulis-
“H p
y
”
vii PERSEMBAHAN :
Dengan mengucap syukur Alhamdulillah atas rahmad dan hidayah
Allah SWT, akan kupersembahkan karya ini kepada orang-orang saya sayangi:
1. Bapak - Ibuku tercinta yang tak pernah lelah dalam memotifasiku dan
mendoakan untuk meraih kesuksesan di dunia dan akhirat.
2. Nada dan Irsya sebagai adik, penghibur dan teman saat dirumah.
3. Keluarga besar H. Abdullah Syafii (mbah kakung) yang telah mendukung
dan mendoakan di setiap langkahku agar dapat menyelesaikan kuliah lebih
cepat dan menuju kesuksesan setiap lulus.
4. Devi, Asri, Nurul dan Lukman yang telah bersedia menjadi teman,
sahabat, dan keluarga yang menemani hari-hari dengan keceriaan dan
kebahagiaan.
5. Pak Nursito (Pak kost) dan teman-teman kost AL-FIKR yang sudah
menemani mulai awal kuliah sampai lulus.
6. Teman-teman Teknik Informatika angkatan 2010 terutama teman-teman
gembel dan kepompong yang telah menemaniku mulai semester 1 sampai
semester 7 dan berjuang menempuh gelar sarjana bersama-sama.
7. Keluarga besar Teknik Informatika UMS yang telah banyak memberikan
ilmu dan pengalamannya.
8. Semua pihak yang tidak dapat saya sebutkan satu persatu atas semua hal
viii
KATA PENGANTAR
Assalamu’alaikum warohmatullohi Wabarakatuh
Puji syukur kehadirat Allah SWT, yang telah melimpahkan nikmat dan
anugerah yang sangat luar biasa sehingga saya dapat menyelesaikan skripsi
dengan baik yang berjudul “Implementasi Data Mining Untuk Memprediksi
Kelulusan Mahasiswa Fakultas Komunikasi Dan Informatika Ums
Menggunakan Metode Naive Bayes”.
Skripsi ini disusun sebagai syarat wajib untuk menyelesaikan pendidikan
jenjang Strata 1 pada Program Studi Teknik Informatika Universitas
Muhammadiyah Surakarta. Atas selesainya skripsi ini tidak lepas dari dukungan
dan bantuan dari berbagai pihak sehingga dapat berjalan dengan lancar dan sesuai
harapan, oleh karena itu pada kesempatan ini penulis ingin menyampaikan banyak
terima kasih kepada :
1. Allah SWT yang telah memberikan nikmat dan hidayahnya kepada
penulis sehingga diizinkan untuk menyelesaikan skripsi ini.
2. Orang tua dan keluarga besar penulis yang telah memberikan segala
dukungan berupa doa, moral dan materi.
3. Bapak Husni Thamrin, S.T, M.T., Ph.D selaku dekan Fakultas Komunikasi
Dan Informatika Universitas Muhammadiyah Surakarta.
4. Bapak Dr. Heru Supriyono, M.Sc selaku ketua Program Studi Teknik
ix
5. Bapak Yusuf Sulistyo Nugroho, S.T, M.Eng selaku pembimbing skripsi
yang telah banyak membantu dalam memberikan petunjuk dan saran-saran
dalam penyusunan skripsi ini.
6. Mas Setiawan sebagai partner dalam kolaborasi skripsi ini yang telah
menemani mengerjakan skripsi dan membantu dalam pencarian data-data
yang diperlukan dalam penyusunan skripsi.
7. Bapak dan ibu dosen pengampu mata kuliah pada Program studi teknik
informatika yang telah memberikan ilmu serta pengalamannya kepada
penulis.
8. Teman-teman Teknik Informatika khususnya angkatan 2010 kelas E yang
telah mendukung dan menjadi teman yang sama-sama berjuang meraih
gelar sarjana.
9. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang berperan
dan membantu dalam penyelesaian skripsi ini.
Semoga Allah SWT selalu melimpahkan nikmat dan hidayahnya kepada
orang-orang yang telah membantu dalam kelacaran penyusunan ini. Penulis
berharap semoga skripsi ini dapat bermanfaat bagi penulis dan orang lain untuk
dikembangkan sehingga akan dapat menghasilkan penelitian-penelitan yang lebih
baik lagi dari sebelum-sebelumnya.
Wassalamu’alaikum Warohmatullohi Wabarokatuh.
Surakarta, 20 Desember 2013
xi
3. Kelengkapan Data Dan Kebutuhan ... 24
xii
2. Penentuan Sampel ... 29
3. Pengolahan Data ... 30
4. Pengubahan Data Dalam Arff ... 31
5. Implementasi Dengan Naive Bayes ... 32
6. Implementasi Dalam Weka 3.7.10 ... 36
7. Membandingkan Metode Naive Bayes ... 57
BAB V PENUTUP ... 61
A. Kesimpulan ... 61
B. Saran ... 61
1. Bagi Peneliti Berikutnya ... 61
2. Bagi Fakultas ... 62
DAFTAR PUSTAKA ... 63
xiii
DAFTAR TABEL
Tabel 3.1 Daftar Atribut ... 22 Tabel 3.2 Daftar Atribut Beserta Isinya ... 24 Tabel 4.1 Perbandingan dari Naive Bayes, J48 dan OneR ... 55
DAFTAR PERSAMAAN
xiv
DAFTAR GAMBAR
Gambar 2.1 Tahap-Tahap Data Mining ... 13
Gambar 3.1 Diagram Alir Penelitian ... 19
Gambar 3.2 Diagram Ven ... 27
Gambar 4.1 Data Asal Sebelum Dikelompokkan ... 30
Gambar 4.2 Hasil Data Yang Sudah Dikodekan ... 30
Gambar 4.3 Jendela Excel2Arrf Converter V.1.0-Beta ... 31
Gambar 4.4 Cara Upload .Xls Pada Converter ... 31
Gambar 4.5 Hasil Converter ... 32
Gambar 4.15 Penyebaran Jurusan dan Gender ... 44
Gambar 4.16 Penyebaran Jurusan dan Daerah ... 45
Gambar 4.17 Penyebaran Gender dan Daerah ... 46
xv
Gambar 4.19 Penyebaran Jurusan dan MK ... 48
Gambar 4.20 Penyebaran Jurusan dan Gender ... 49
Gambar 4.21 Penyebaran Gender dan SKS ... 44
Gambar 4.22 Hasil Klasifikasi Naive Bayes ... 47
Gambar 4.23 Hasil Evaluasi ... 48
Gambar 4.24 Detail Akurasi Dan Confusion Matrix ... 49
Gambar 4.25 Memasukkan Data Uji ... 50
Gambar 4.26 Pencarian File Data Uji ... 50
Gambar 4.27 Hasil Evaluasi Akurasi Data Uji ... 51
Gambar 4.28 Visualiza Classifier Errors ... 51
Gambar 4.29 Hasil Prediksi Data Uji ... 52
Gambar 4.30 Evaluasi J48 ... 53
xvi ABSTRAKSI
Fakultas Komunikasi dan Informatika Universitas Muhammadiyah Surakarta memiliki jumlah 2358 mahasiswa dengan jumlah lulusan 388 mahasiswa, Dengan bertambah pesatnya jumlah mahasiswa baru setiap tahunnya dengan demikian secara otomatis akan terciptanya data-data yang sangat banyak dan akan menambah melimpahnya data yang tersimpan tapi minim informasi. Agar data yang awalnya tidak terpakai tersebut dapat diubah menjadi suatu informasi data yang sangat bermanfaat dengan menggunakan teknik data mining. Salah satunya dapat untuk memprediksi lama studi mahasiswa apakah dapat lulus kurang dari 4 tahun atau lebih dari 4 tahun dengan berdasarkan atribut-atribut yang digunakan.
Metode Naive Bayes digunakan untuk menganalisis data dala m pengenalan pola dan memprediksi kelulusan mahasiswa. Data yang diperlukan yaitu data-data mahasiswa yang sudah lulus sebagai data training sedangkan data-data mahasiswa yang masih menempuh studi kuliah sebagai data uji.
Dengan adanya penelitian ini dapat memberikan informasi yang berguna sehingga dapat meningkatkan kualitas atau dijadikan suatu acuan bagi mahasiswa untuk memprediksi kelulusan dengan tepat waktu. Berdasarkan hasil prediksi dari jumlah 342 data sampel yang diuji hanya 86 mahasiswa yang akan lulus tepat waktu atau hanya sekitar 25,15 %, sedangkan mahasiswa yang akan lulus terlambat berjumlah 256 mahasiswa mencapai 74,85% dari jumlah data sampel.