Kode/Nama Rumpun Ilmu: 458/Teknik Informatika
USULAN
PENELITIAN DOSEN PEMULA
JUDUL PENELITIAN
PREDIKSI MASA STUDI SARJANA MENGGUNAKAN ALGORITMA
BACK-PROPAGATION NEURAL NETWORK
BERDASARKAN
KINERJA TAHUN PERTAMA
TIM PENGUSUL
Purowono Prasetyawan, M.T.
Imam Ahmad, M.Kom.
NIDN. 0425058502
NIDN. 0202088702
ii DAFTAR ISI
DAFTAR ISI ... ii
RINGKASAN ... iii
PENDAHULUAN ... 4
1.1 Latar Belakang Masalah ... 4
1.2 Rumusan Masalah ... 5
1.3 Tujuan Penelitian ... 5
1.4 Urgensi dan Manfaat Penelitian ... 5
1.5 Luaran Penelitian ... Error! Bookmark not defined. TINJAUAN PUSTAKA ... 6
2.1 Penelitian Terkait ... 6
2.2 Algoritma Propagasi Balik (Backpropagation) ... 7
METODE PENELITIAN ... 10
3.1 Tahapan Penelitian ... 10
3.2 Lokasi Penelitian ... 12
3.3 Lingkungan Implementasi ... 12
iii RINGKASAN
Akreditasi perguran tinggi merupakan acuan penting dalam menentukan kualitas suatu perguruan tinggi. Masa studi S1 adalah salah satu elemen dalam penilian akreditasi tersebut. Idealnya mahasiswa menyelesaikan perkuliahan di perguruan tinggi dalam kurun waktu 3,5 hingga 4 tahun. Beberapa faktor yang mempengaruhi masa studi tidak tepat waktu antara lain IPK, jurusan, asal dan jenis sekolah menengah, nilai ujian nasional, jenis kelamin, dan penghasilan orang tua. Saat ini pemanfaatan data yang cukup besar (big data) sebagai penemuan pengetahuan telah banyak dilakukan oleh peneliti. Metode data mining digunakan dalam menggali (menambang) informasi apa saja yang didapatkan dari sekumpulan basis data berukuran besar. Metode neural network dengan algoritma pelatihan
back-propagtion adalah salah satu metode data mining yang banyak digunakan dalam
memprediksi suatu kejadian berdasarkan pola data yang dimiliki. Penelitian ini bertujuan untuk menganalisis pengaruh kinerja tahun pertama mahasiswa terhadap masa studi berdasarkan data akademik yang tersedia, dengan menggunakan metode
back-propagation neural network (BpNN).
Metode penelitian ini terdiri atas beberapa proses yaitu studi pengambilan data, pengenalan pola data dengan BpNN, dan analisis serta evaluasi. Data yang digunakan pada penelitian ini adalah data induk dan akademik mahasiswa yang telah lulus pada tahun pertama. Data terdiri dari 10 atribut yaitu NPM, hasil tes penerimaan, keaktifan dalam UKM, jenis kelamin, asal sekolah menengan, jenis sekolah menengah, nilai UN, penghasilan orang tua, IPK semester 1-2, dan lama masa studi dengan 1318 jumlah mahasiswa angkatan 2007-2011. Praproses data dilakukan dengan cara transformasi dan normalisasi. Hasil yang diperoleh selanjutnya dibagi menjadi dua bagian yaitu data latih dan data uji. Data latih digunakan untuk membuat model arsitektur jaringan, model yang dihasilkan akan diuji dengan menggunakan data uji. Hasil pengujian kemudian dianalisis dan dievaluasi sehingga nantinya bisa disimpulkan faktor apa sajakan yang paling berpengaruh terhadap masa studi mahasiswa. Dengan menggunakan model arsitektur jaringan ini diharapkan mahasiswa aktif yang sedang berjalan dapat memprediksi masa studinya sehingga dapat menjadi peringatan dini untuk memperbaiki kinerja pada tahun-tahun berikutnya.
Target luaran dari penelitian ini yaitu jurnal ilmiah nasional ber-ISSN, prosiding pada seminar ilmiah nasional, dan menghasilkan produk bahan ajar pada materi data mining dan data warehouse.
BAB I PENDAHULUAN
1.1 Latar Belakang Masalah
Masa studi mahasiswa merupakan salah satu indikator acuan penentu kualitas suatu perguruan tinggi. Berdasarkan standar peniliaian akreditasi perguruan tinggi oleh BAN PT, masa studi menjadi salah satu elemen penilaian borang akreditasi (BAN PT, 2008). Perguruan tinggi memiliki peranan penting untuk memantau perkembangan studi mahasiswanya. Untuk itu, perguruan tinggi dituntut selalu melakukan evaluasi terhadap kinerja mahasiswa. Salah satu cara evaluasi yang dapat dilakukan adalah dengan menggali pengetahuan dari data bidang akademik yang akan mempengaruhi kinerja mahasiswa (Baradwaj & Pal, 2011). Dengan memanfaatkan data mining pada data akademik mahasiswa, perguruan tinggi dapat memperoleh informasi yang berguna. Informasi ini yang nantinya dapat dijadikan acuan dalam melakukan perbaikan terhadap kinerja studi mahasiswa (Tair & El-Halees, 2012; Ahmed & Elaraby, 2014).
Beberapa penelitian terdahulu menggunakan teknik data mining untuk memprediksi masa studi mahasiswa. Meinanda, et al. (2009) menggunakan artificial
neural network (ANN) dengan arsitektur multilayer perceptron untuk memprediksi
masa studi sarjana. Hasil penelitian tersebut menyimpulkan bahwa lama studi dipengaruhi oleh Indeks Prestasi Kumulatif (IPK), jumlah mata kuliah yang diambil, jumlah mata kuliah mengulang, dan jumlah pengambilan mata kuliah tertentu. Penelitian lain oleh Damanik et al. (2015) menyatakan bahwa masa studi sarjana dipengaruhi oleh IPK dan jurusan. Penelitian tersebut mengklasifikasikan lama masa studi menjadi dua kategori yaitu lebih dari empat tahun dan kurang dari sama dengan empat tahun. Teknik klasifikasi yang digunakan adalah support vector machine
(SVM) dan Regresi Logistik Biner. Kedua teknik klasifikasi tersebut menghasilkan persentase ketepatan klasifikasi yang berbeda.
model ANN dengan algoritma training back-propagation untuk memprediksi masa studi. ANN merupakan salah satu teknik pengenalan pola yang banyak digunakan untuk melakukan prediksi atau peramalan (Williams & Yan, 2008). Model prediksi tersebut nantinya digunakan sebagai penentu kebijakan terhadap mahasiswa yang memiliki masa studi melebihi batas. Pembaruan penelitian ini adalah terletak pada penggunaan data akademis aktual pada perguruan tinggi tertentu, variabel predictor
dan paramater jaringan saraf (arsitektur), sehingga didapatkan model prediksi yang tepat dan akurat.
1.2 Rumusan Masalah
Dari latar belakang masalah yang telah dipaparkan sebelumnya, maka rumusan masalah penelitian ini adalah sebagai berikut:
1. Bagaimanakah kesesuaian antara kinerja tahun pertama mahasiswa terhadap masa studi sarjana?
2. Bagaimana merancang arsitektur neural network untuk memprediksi masa studi sarjana?
1.3 Tujuan Penelitian
Adapun tujuan khusus yang diharapkan dari penelitian ini adalah untuk: 1. Mengetahui faktor-faktor yang mempengaruhi lama masa studi mahasiswa. 2. Mengimplementasikan metode back-propagation neural network dalam
memprediksi masa studi mahasiswa.
3. Menguji efektifitas dan keakuratan metode back-propagation neural
network dalam memprediksi masa studi mahasiswa.
1.4 Urgensi dan Manfaat Penelitian
1. Sebagai pengembangan ilmu pengetahuan khususnya memberikan alternatif
metode yang dapat digunakan untuk memprediksi masa studi sarjana. 2. Memberikan efisiensi pada perguruan tinggi dalam memantau kinerja
mahasiswa.
3. Menambah wawasan aplikasi ANN untuk perosalan-persoalan dunia nyata.
TINJAUAN PUSTAKA
2.1 Penelitian Terkait
Penelitian pendahulu yang terkait dengan penelitian ini adalah penelitian tentang prediksi kinerja akademik mahasiswa oleh Oladokun, et al. (2008) menggunakan model ANN dengan 10 variabel input yaitu ujian matrikulasi; nilai Matematika, Fisika, Kimia, dan Bahasa Inggris; nilai Matematika lanjut, usia saat pendaftaran, waktu tunggu antara lulus SMA dengan masuk kuliah; pendidikan orang tua; lokasi SMA; jenis SMA; lokasi kampus dan tempat tinggal; dan jenis kelamin. Selanjutnya Rahmani & Aprilianto (2013) mengembangkan model prediksi lama masa studi mahasiswa berbasis ANN dengan 3 variabel input yaitu IPK Semester 1, 2, dan 3.
Ridwan, et al., (2013) meneliti tetang penerapan data mining untuk mengevaluasi kinerja akademik mahasiswa pada tahun ke-2. Penelitian tersebut menggunakan algoritma Naïve Bayes Classifier (NBC) dengan kategori klasifikasi yaitu lulus tepat waktu atau tidak. Kabakchieva (2013) membandingkan beberapa metode data mining antara lain decision tree (pohon keputusan), bayesian, the
k-nearest neighbour, dan rule learners untuk memprediksi kinerja mahasiswa. Ahmed
& Elaraby (2014) menggunakan teknik pohon keputusan ID3 untuk memprediksi kinerja mahasiswa. Teknik pohon keputusan C4.5 digunakan oleh Kamagi & Hansun (2014) untuk mengelompokan (klasifikasi) tingkat kualitas mahasiswa berdasarkan jalur masuk kuliah.
satunya adalah penelitian yang dilakukan Lee, et al. (2015) untuk memprediksi banyaknya nyamuk di daerah perkotaan. Menurut Agrawal & Agrawal (2015), ANN adalah teknik yang efektif untuk mendeteksi kanker, hasil penelitian yang mereka lakukan menyimpulkan ANN memiliki tingkat akurasi yang tinggi dengan rincian 97,1% menggunakan MLP (multi layer perceptron) dan 96% menggunakan PNN
(probabilistic neural network). Model ANN juga digunakan Mislan, et al. (2015),
dalam penelitiannya mereka menggunakan BPNN (back-propagation neural
network) untuk memprediksi curah hujan di Tenggarong, Kalimantan Timur. Hasil
penelitian tersebut menyimpulkan algoritma BPNN yang diterapkan untuk memprediksi memiliki nilai MSE (mean square error) sebesar 0,00096341.
Berdasarakan penelitian yang telah dilakukan sebelumnya, penelitian tentang prediksi masa studi mahasiswa menggunakan algoritma BPNN diharapkan dapat menghasilkan pengetahuan yang berharga di bidang data mining dan kecerdasan komputasi, baik disisi teori maupun disisi penerapan aplikasi pada dunia nyata.
2.2 Algoritma Propagasi Balik (Backpropagation)
Algoritma propagasi balik merupakan salah satu teknik pelatihan pada jaringan saraf tiruan (JST) yang terdiri atas dua langkah, yaitu perambatan maju dan perambatan mundur. Kedua langkah tersebut dilakukan secara iteratif dengan tujuan merubah nilai bobot dan nilai bias untuk mengurangi perbedaan antara output layer
dengan target output. Algoritma ini sangat baik dalam menangani masalah pengenalan pola-pola kompleks dan biasanya digunakan oleh jaringan multilayer
Input layer Hidden layer Output layer
Gambar 2. 1 Arsitektur JST tipe backpropagation
Berikut adalah algoritma pelatihan pada jaringan saraf tiruan propagasi balik: 1. Inisialisasi nilai awal: bobot-bobot, angka pembelajaran (), toleransi
error (nilai ambang), atau set maksimal epoch
2. While kondisi berhenti tidak terpenuhi do langkah 3 – 10
3. Untuk setiap pasangan pola pelatihan, lakukan langkah 4 – 9 Tahapan umpan maju (feedforward)
4. Untuk setiap unit input (i,i1,,n) mengirimkan sinyal input ke semua unit pada layer berikutnya (hidden layer)
5. Untuk setiap unit hidden (j,j 1,,p) sinyal output lapisan hidden
dihitung dengan fungsi aktivasi terhadap penjumlahan sinyal-sinyal input
bebobot i pada lapisan ini:
semua unit pada lapisan berikutnya
6. Untuk setiap unit output (k,k1,,m) dihitung sinyal output-nya dengan menerapkan fungsi aktivasi terhadap penjumlahan sinyal-sinyal
input berbobot Zi bagi lapisan ini:
Tahap pemropagasibalikan kesalahan (backpropagation error)
7. Untuk setiap unit output (k,k 1,,m) menerima pola target Tk yang
dihitung koreksi nilai bobot yang kemudian akan digunakan untuk
memperbaharui nilai bobot wjk menggunakan persamaan:
j k jk
w
. Hitung koreksi nilai bias yang kemudian akan digunakan untuk memperbaharui nilai w0k dengan persamaan: w0k kdan kemudian nilai dikirim ke unit pada lapisan sebelumnya
8. Untuk setiap unit hidden (j,j 1,,p) hitung nilai delta masukan yang
Hitung koreksi nilai bobot yang kemudian digunakan untuk memperbaharui nilai: vij j Xi dan hitung nilai koreksi bias yang digunakan untuk memperbaharui nilai: v0j j
9. Memperbaharui nilai bobot dan bias, dengan persamaan:
jk jk
jk w w
w (new) (old) dan vij(new)vij(old)vij
BAB III
METODE PENELITIAN
3.1 Tahapan Penelitian
Metode ini memiliki beberapa tahap yaitu pengambilan data, pengolahan data menggunakan backpropagation neural network (BpNN), analisis dan evaluasi model, dan dokumentasi, pembuatan laporan, dan publikasi. Diagram alur penelitian dapat dilihat pada Gambar 3.1.
Mulai
Pengenalan pola data dengan BpNN Pengambilan data
Analisis dan evaluasi
Dokumentasi, Pelaporan, dan Publikasi
Selesai
Gambar 3. 1. Diagram alur penelitian
Pengambilan Data
Data yang digunakan sebagai proses mining dan pengujian adalah data primer, berupa sampel data induk dan data akademik mahasiswa aktual di suatu perguruan tinggi angkatan 2007-2011 yang telah lulus. Data tersebut terdiri dari catatan akademis 1318 mahasiswa yang terdiri dari 10 atribut, yaitu:
1. Nomor Pokok Mahasiswa (NPM), 2. Hasil tes penerimaan mahasiswa,
4. Jenis kelamin,
5. Asal sekolah menengah, 6. Jenis sekolah menengah, 7. Nilai ujian nasional, 8. Penghasilan orang tua,
9. Indeks Prestasi Kumulatif (IPK) semester 1-2, dan 10. Lama masa studi.
Sebelum data input dan target yang diimplementasikan ke dalam jaringan saraf tiruan data tersebut harus dipraproses terlebih dahulu, karena data masih bersifat kotor, tidak lengkap, dan tidak konsisten.
Praproses yang dilakukan terdiri dari transformasi dan pembersihan data. Data transformasi bertujuan agar konvergensi lebih cepat dan tercapai, apabila nilai rata-rata dari input data training mendekati nol.
Pemetaan ini dilakukan untuk menyiapkan input dan target dengan menggunakan min-max normalization. Normalisasi ini dipilih agar data berada pada interval 0-1, hal ini disebabkan fungsi aktivasi yang nanti akan digunakan yaitu fungsi sigmoid.
Pengenalan Pola Data dengan BpNN
Proses prediksi masa studi mahasiswa dilakukan terhadap data yang telah dipraproses dan dinormalisasi. Data dibagi menjadi data latih (training) dan data uji
(testing). Proses pembagian data menggunakan teknik cross validationK-fold.
Selama proses pelatihan arsitektur jaringan yang dikembangkan menggunakan parameter-parameter jaringan saraf tiruan (JST) yang telah ditentukan. Proses pelatihan dilakukan beberapa kali sampai menemukan galat terkecil. Tabel 3.s1 memaparkan parameter JST yang akan digunakan pada proses pelatihan.
Tabel 3. 1. Parameter JST propagasi balik
Karakteristik Spesifikasi
Arsitektur 1 hidden layer
Neuron input 8, 16
Hidden layer 3, 5, 8, 10, 20
Karakteristik Spesifikasi
Fungsi aktivasi Sigmoid bipolar, Sigmoid biner
Toleransi galat 10-3
Maksimum epoch 100, 500
Proses pengujian dilakukan dengan menguji data uji terhadap model arsitektur pelatihan. Pengujian dilakukan berdasarkan kelas masa studi menggunakan tabel
confusion matrix. Untuk menghitung akurasi klasifikasi dengan menggunakan
persamaan berikut:
% 100 uji
data total
i klasifikas benar
uji data
akurasi
Analisis dan Evaluasi
Tahap selanjutnya adalah evaluasi kinerja klasifikasi. Agar dapat dengan mudah dipahami dan dianalisis, hasil akurasi dibuat dalam bentuk grafik. Proses analisis dengan melakukan pengamatan terhadap parameter JST yang digunakan terhadap tingkat akurasi klasifikasi.
3.2 Lokasi Penelitian
Penelitian ini dilaksanakan di Laboratorium Riset STMIK Teknokrat.
3.3 Lingkungan Implementasi
Perangkat lunak yang digunakan dalam penelitian ini antara lain sistem operasi Windows® 7, Ms. Office Word 2007, NetBeans IDE 8.0.1, Java (JDK) 8.
Sedangkan untuk perangkat keras yang digunakan adalah Intel® Core™ i3 processor
BAB IV
DAFTAR PUSTAKA
Agrawal, S. & Agrawal, J., 2015. Neural Network Techniques for Cancer Prediction: A Survey. Procedia Computer Science, 60(Elsevier), pp. 769-774.
Ahmed, A. B. E. D. & Elaraby, I. S., 2014. Data Mining: A prediction for Student's Performance Using Classification Method. World Journal of Computer
Application and Technology, 2(2), pp. 43-47.
Ahmed, A. B. E. D. & Elaraby, I. S., 2014. Data Mining: A prediction for Student's Performance Using Classification Method. World Journal of Computer
Application and Technology, 2(2), pp. 43-47.
PT, 2008. Akreditasi Program Studi Sarjana: Buku II Standar dan Prosedur
Akreditasi Program Studi Sarjana. Jakarta: BAN PT
Baradwaj, B. K. & Pal, S., 2011. Mining Educational Data to Analyze Students Performance. International Journal of Advanced Computer Science and
Applications, 2(6), pp. 63-69.
Damanik, S. M. S., Ispriyanti, D. & Sugito, 2015. Klasifikasi Lama Studi Mahasiswa FSM Universitas Diponegoro Menggunakan Regresi Logistik Biner dan Support Vector Machine (SVM). Jurnal Gaussian, 4(1), pp. 123-132.
Fausett, L., 1994. Fundamentals of Neural Networks. New Jersey: John Wiley & Sons.
Gurney, K., 2004. An Introduction to Neural Networks. London: Taylor & Francis e-Library.
Han & Kamber, 2006. Data Mining Concepts and Techniques. 2nd ed. San Fransisco: Morgan Kaufmann Publisher.
Heikki, M., 1996. Data mining: machine learning, statistics, and database.
s.l.:IEEE.
Kabakchieva, D., 2013. Predicting Student Performance by Using Data Mining Methods for Classification. Cybernetics and Information Technologies,
13(1), pp. 61-72.
Kamagi, D. H. & Hansun, S., 2014. Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa. Ultimatics, 6(1), pp. 15-20.
Lee, K. Y., Chung, N. & Hwang, S., 2015. Application of an Artificial Neural
Network (ANN) Model for Predicting Mosquito Abundances in Urban Areas.
Meinanda, M. H., Annisa, M., Muhandri, N. & Suryadi, K., 2009. Prediksi Masa Studi Sarjana dengan Artificial Neural Network. Internetworking Indonesia
Journal, 1(2), pp. 31-35.
Mislan, et al., 2015. Rainfall Monthly Prediction Based on Artificial Neural Network: A Case Study in Tenggarong Station, East Kalimantan - Indonesia.
Procedia Computer Science, 59(Elsevier), pp. 142-151.
Oladokun, V., Adebanjo, A. & Charles-Owaba, O., 2008. Predicting Students’ Academic Performance using Artificial Neural Network: A Case Study of an Engineering Course. The Pacific Journal of Science and Technology, 9(1), pp. 72-79.
Rahmani, B. & Aprilianto, H., 2013. Pengembangan Model Prediksi Lama Masa
Studi Mahasiswa Berbasis Jaringan Syaraf Tiruan. Yogyakarta, Seminar
Nasional 2013 Menuju Masyarakat Madani dan Lestari.
Ridwan, M., Suyono, H. & Sarosa, M., 2013. Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier. Electrics Electronics Communications Controls Informatics
Systems, 7(1), pp. 59-64.
Tair, M. M. A. & El-Halees, A. M., 2012. Mining Educational Data to Improve
Students’ Performance: A Case Study. International Journal of Information
and Communication Technology Research, 2(2), pp. 140-146.
Walpole, R. E., 1995. Pengantar Statistika. 3rd ed. Jakarta: Gramedia Pustaka Utama.
Williams, J. & Yan, L., 2008. A Case Study Using Neural Network Algorithms:
horse racing prediction in Jamaica. Las Vegas, International Conf. on