Contoh Proposal untuk pengajuan peneliti

(1)



Kode/Nama Rumpun Ilmu: 458/Teknik Informatika

USULAN

PENELITIAN DOSEN PEMULA

JUDUL PENELITIAN

PREDIKSI MASA STUDI SARJANA MENGGUNAKAN ALGORITMA

BACK-PROPAGATION NEURAL NETWORK

BERDASARKAN

KINERJA TAHUN PERTAMA

TIM PENGUSUL

Purowono Prasetyawan, M.T.

Imam Ahmad, M.Kom.

NIDN. 0425058502

NIDN. 0202088702

(2)

ii DAFTAR ISI



DAFTAR ISI ... ii

RINGKASAN ... iii

PENDAHULUAN ... 4

1.1 Latar Belakang Masalah ... 4

1.2 Rumusan Masalah ... 5

1.3 Tujuan Penelitian ... 5

1.4 Urgensi dan Manfaat Penelitian ... 5

1.5 Luaran Penelitian ... Error! Bookmark not defined. TINJAUAN PUSTAKA ... 6

2.1 Penelitian Terkait ... 6

2.2 Algoritma Propagasi Balik (Backpropagation) ... 7

METODE PENELITIAN ... 10

3.1 Tahapan Penelitian ... 10

3.2 Lokasi Penelitian ... 12

3.3 Lingkungan Implementasi ... 12

(3)

iii RINGKASAN

Akreditasi perguran tinggi merupakan acuan penting dalam menentukan kualitas suatu perguruan tinggi. Masa studi S1 adalah salah satu elemen dalam penilian akreditasi tersebut. Idealnya mahasiswa menyelesaikan perkuliahan di perguruan tinggi dalam kurun waktu 3,5 hingga 4 tahun. Beberapa faktor yang mempengaruhi masa studi tidak tepat waktu antara lain IPK, jurusan, asal dan jenis sekolah menengah, nilai ujian nasional, jenis kelamin, dan penghasilan orang tua. Saat ini pemanfaatan data yang cukup besar (big data) sebagai penemuan pengetahuan telah banyak dilakukan oleh peneliti. Metode data mining digunakan dalam menggali (menambang) informasi apa saja yang didapatkan dari sekumpulan basis data berukuran besar. Metode neural network dengan algoritma pelatihan

back-propagtion adalah salah satu metode data mining yang banyak digunakan dalam

memprediksi suatu kejadian berdasarkan pola data yang dimiliki. Penelitian ini bertujuan untuk menganalisis pengaruh kinerja tahun pertama mahasiswa terhadap masa studi berdasarkan data akademik yang tersedia, dengan menggunakan metode

back-propagation neural network (BpNN).

Metode penelitian ini terdiri atas beberapa proses yaitu studi pengambilan data, pengenalan pola data dengan BpNN, dan analisis serta evaluasi. Data yang digunakan pada penelitian ini adalah data induk dan akademik mahasiswa yang telah lulus pada tahun pertama. Data terdiri dari 10 atribut yaitu NPM, hasil tes penerimaan, keaktifan dalam UKM, jenis kelamin, asal sekolah menengan, jenis sekolah menengah, nilai UN, penghasilan orang tua, IPK semester 1-2, dan lama masa studi dengan 1318 jumlah mahasiswa angkatan 2007-2011. Praproses data dilakukan dengan cara transformasi dan normalisasi. Hasil yang diperoleh selanjutnya dibagi menjadi dua bagian yaitu data latih dan data uji. Data latih digunakan untuk membuat model arsitektur jaringan, model yang dihasilkan akan diuji dengan menggunakan data uji. Hasil pengujian kemudian dianalisis dan dievaluasi sehingga nantinya bisa disimpulkan faktor apa sajakan yang paling berpengaruh terhadap masa studi mahasiswa. Dengan menggunakan model arsitektur jaringan ini diharapkan mahasiswa aktif yang sedang berjalan dapat memprediksi masa studinya sehingga dapat menjadi peringatan dini untuk memperbaiki kinerja pada tahun-tahun berikutnya.

Target luaran dari penelitian ini yaitu jurnal ilmiah nasional ber-ISSN, prosiding pada seminar ilmiah nasional, dan menghasilkan produk bahan ajar pada materi data mining dan data warehouse.

(4)

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

Masa studi mahasiswa merupakan salah satu indikator acuan penentu kualitas suatu perguruan tinggi. Berdasarkan standar peniliaian akreditasi perguruan tinggi oleh BAN PT, masa studi menjadi salah satu elemen penilaian borang akreditasi (BAN PT, 2008). Perguruan tinggi memiliki peranan penting untuk memantau perkembangan studi mahasiswanya. Untuk itu, perguruan tinggi dituntut selalu melakukan evaluasi terhadap kinerja mahasiswa. Salah satu cara evaluasi yang dapat dilakukan adalah dengan menggali pengetahuan dari data bidang akademik yang akan mempengaruhi kinerja mahasiswa (Baradwaj & Pal, 2011). Dengan memanfaatkan data mining pada data akademik mahasiswa, perguruan tinggi dapat memperoleh informasi yang berguna. Informasi ini yang nantinya dapat dijadikan acuan dalam melakukan perbaikan terhadap kinerja studi mahasiswa (Tair & El-Halees, 2012; Ahmed & Elaraby, 2014).

Beberapa penelitian terdahulu menggunakan teknik data mining untuk memprediksi masa studi mahasiswa. Meinanda, et al. (2009) menggunakan artificial

neural network (ANN) dengan arsitektur multilayer perceptron untuk memprediksi

masa studi sarjana. Hasil penelitian tersebut menyimpulkan bahwa lama studi dipengaruhi oleh Indeks Prestasi Kumulatif (IPK), jumlah mata kuliah yang diambil, jumlah mata kuliah mengulang, dan jumlah pengambilan mata kuliah tertentu. Penelitian lain oleh Damanik et al. (2015) menyatakan bahwa masa studi sarjana dipengaruhi oleh IPK dan jurusan. Penelitian tersebut mengklasifikasikan lama masa studi menjadi dua kategori yaitu lebih dari empat tahun dan kurang dari sama dengan empat tahun. Teknik klasifikasi yang digunakan adalah support vector machine

(SVM) dan Regresi Logistik Biner. Kedua teknik klasifikasi tersebut menghasilkan persentase ketepatan klasifikasi yang berbeda.

(5)

 model ANN dengan algoritma training back-propagation untuk memprediksi masa studi. ANN merupakan salah satu teknik pengenalan pola yang banyak digunakan untuk melakukan prediksi atau peramalan (Williams & Yan, 2008). Model prediksi tersebut nantinya digunakan sebagai penentu kebijakan terhadap mahasiswa yang memiliki masa studi melebihi batas. Pembaruan penelitian ini adalah terletak pada penggunaan data akademis aktual pada perguruan tinggi tertentu, variabel predictor

dan paramater jaringan saraf (arsitektur), sehingga didapatkan model prediksi yang tepat dan akurat.

1.2 Rumusan Masalah

Dari latar belakang masalah yang telah dipaparkan sebelumnya, maka rumusan masalah penelitian ini adalah sebagai berikut:

1. Bagaimanakah kesesuaian antara kinerja tahun pertama mahasiswa terhadap masa studi sarjana?

2. Bagaimana merancang arsitektur neural network untuk memprediksi masa studi sarjana?

1.3 Tujuan Penelitian

Adapun tujuan khusus yang diharapkan dari penelitian ini adalah untuk: 1. Mengetahui faktor-faktor yang mempengaruhi lama masa studi mahasiswa. 2. Mengimplementasikan metode back-propagation neural network dalam

memprediksi masa studi mahasiswa.

3. Menguji efektifitas dan keakuratan metode back-propagation neural

network dalam memprediksi masa studi mahasiswa.

1.4 Urgensi dan Manfaat Penelitian

(6)

 1. Sebagai pengembangan ilmu pengetahuan khususnya memberikan alternatif

metode yang dapat digunakan untuk memprediksi masa studi sarjana. 2. Memberikan efisiensi pada perguruan tinggi dalam memantau kinerja

mahasiswa.

3. Menambah wawasan aplikasi ANN untuk perosalan-persoalan dunia nyata.

TINJAUAN PUSTAKA

2.1 Penelitian Terkait

Penelitian pendahulu yang terkait dengan penelitian ini adalah penelitian tentang prediksi kinerja akademik mahasiswa oleh Oladokun, et al. (2008) menggunakan model ANN dengan 10 variabel input yaitu ujian matrikulasi; nilai Matematika, Fisika, Kimia, dan Bahasa Inggris; nilai Matematika lanjut, usia saat pendaftaran, waktu tunggu antara lulus SMA dengan masuk kuliah; pendidikan orang tua; lokasi SMA; jenis SMA; lokasi kampus dan tempat tinggal; dan jenis kelamin. Selanjutnya Rahmani & Aprilianto (2013) mengembangkan model prediksi lama masa studi mahasiswa berbasis ANN dengan 3 variabel input yaitu IPK Semester 1, 2, dan 3.

Ridwan, et al., (2013) meneliti tetang penerapan data mining untuk mengevaluasi kinerja akademik mahasiswa pada tahun ke-2. Penelitian tersebut menggunakan algoritma Naïve Bayes Classifier (NBC) dengan kategori klasifikasi yaitu lulus tepat waktu atau tidak. Kabakchieva (2013) membandingkan beberapa metode data mining antara lain decision tree (pohon keputusan), bayesian, the

k-nearest neighbour, dan rule learners untuk memprediksi kinerja mahasiswa. Ahmed

& Elaraby (2014) menggunakan teknik pohon keputusan ID3 untuk memprediksi kinerja mahasiswa. Teknik pohon keputusan C4.5 digunakan oleh Kamagi & Hansun (2014) untuk mengelompokan (klasifikasi) tingkat kualitas mahasiswa berdasarkan jalur masuk kuliah.

(7)

 satunya adalah penelitian yang dilakukan Lee, et al. (2015) untuk memprediksi banyaknya nyamuk di daerah perkotaan. Menurut Agrawal & Agrawal (2015), ANN adalah teknik yang efektif untuk mendeteksi kanker, hasil penelitian yang mereka lakukan menyimpulkan ANN memiliki tingkat akurasi yang tinggi dengan rincian 97,1% menggunakan MLP (multi layer perceptron) dan 96% menggunakan PNN

(probabilistic neural network). Model ANN juga digunakan Mislan, et al. (2015),

dalam penelitiannya mereka menggunakan BPNN (back-propagation neural

network) untuk memprediksi curah hujan di Tenggarong, Kalimantan Timur. Hasil

penelitian tersebut menyimpulkan algoritma BPNN yang diterapkan untuk memprediksi memiliki nilai MSE (mean square error) sebesar 0,00096341.

Berdasarakan penelitian yang telah dilakukan sebelumnya, penelitian tentang prediksi masa studi mahasiswa menggunakan algoritma BPNN diharapkan dapat menghasilkan pengetahuan yang berharga di bidang data mining dan kecerdasan komputasi, baik disisi teori maupun disisi penerapan aplikasi pada dunia nyata.

2.2 Algoritma Propagasi Balik (Backpropagation)

Algoritma propagasi balik merupakan salah satu teknik pelatihan pada jaringan saraf tiruan (JST) yang terdiri atas dua langkah, yaitu perambatan maju dan perambatan mundur. Kedua langkah tersebut dilakukan secara iteratif dengan tujuan merubah nilai bobot dan nilai bias untuk mengurangi perbedaan antara output layer

dengan target output. Algoritma ini sangat baik dalam menangani masalah pengenalan pola-pola kompleks dan biasanya digunakan oleh jaringan multilayer

(8)



Input layer Hidden layer Output layer

Gambar 2. 1 Arsitektur JST tipe backpropagation

Berikut adalah algoritma pelatihan pada jaringan saraf tiruan propagasi balik: 1. Inisialisasi nilai awal: bobot-bobot, angka pembelajaran (), toleransi

error (nilai ambang), atau set maksimal epoch

2. While kondisi berhenti tidak terpenuhi do langkah 3 – 10

3. Untuk setiap pasangan pola pelatihan, lakukan langkah 4 – 9 Tahapan umpan maju (feedforward)

4. Untuk setiap unit input (_i,i1,,n) mengirimkan sinyal input ke semua unit pada layer berikutnya (hidden layer)

5. Untuk setiap unit hidden (_j,j 1,,p) sinyal output lapisan hidden

dihitung dengan fungsi aktivasi terhadap penjumlahan sinyal-sinyal input

bebobot _i pada lapisan ini:      

semua unit pada lapisan berikutnya

6. Untuk setiap unit output (_k,k1,,m) dihitung sinyal output-nya dengan menerapkan fungsi aktivasi terhadap penjumlahan sinyal-sinyal

input berbobot Z_i bagi lapisan ini: 

Tahap pemropagasibalikan kesalahan (backpropagation error)

7. Untuk setiap unit output (k,k 1,,m) menerima pola target Tk yang

(9)



dihitung koreksi nilai bobot yang kemudian akan digunakan untuk

memperbaharui nilai bobot w_jk menggunakan persamaan:

j k jk

w  

  . Hitung koreksi nilai bias yang kemudian akan digunakan untuk memperbaharui nilai w0k dengan persamaan: w₀_k _kdan kemudian nilai dikirim ke unit pada lapisan sebelumnya

8. Untuk setiap unit hidden (j,j 1,,p) hitung nilai delta masukan yang

Hitung koreksi nilai bobot yang kemudian digunakan untuk memperbaharui nilai: v_ij _j X_i dan hitung nilai koreksi bias yang digunakan untuk memperbaharui nilai: v₀_j _j

9. Memperbaharui nilai bobot dan bias, dengan persamaan:

jk jk

jk w w

w (new) (old) dan v_ij(new)v_ij(old)v_ij

(10)

BAB III

METODE PENELITIAN

3.1 Tahapan Penelitian

Metode ini memiliki beberapa tahap yaitu pengambilan data, pengolahan data menggunakan backpropagation neural network (BpNN), analisis dan evaluasi model, dan dokumentasi, pembuatan laporan, dan publikasi. Diagram alur penelitian dapat dilihat pada Gambar 3.1.

Mulai

Pengenalan pola data dengan BpNN Pengambilan data

Analisis dan evaluasi

Dokumentasi, Pelaporan, dan Publikasi

Selesai

Gambar 3. 1. Diagram alur penelitian

Pengambilan Data

Data yang digunakan sebagai proses mining dan pengujian adalah data primer, berupa sampel data induk dan data akademik mahasiswa aktual di suatu perguruan tinggi angkatan 2007-2011 yang telah lulus. Data tersebut terdiri dari catatan akademis 1318 mahasiswa yang terdiri dari 10 atribut, yaitu:

1. Nomor Pokok Mahasiswa (NPM), 2. Hasil tes penerimaan mahasiswa,

(11)

 4. Jenis kelamin,

5. Asal sekolah menengah, 6. Jenis sekolah menengah, 7. Nilai ujian nasional, 8. Penghasilan orang tua,

9. Indeks Prestasi Kumulatif (IPK) semester 1-2, dan 10. Lama masa studi.

Sebelum data input dan target yang diimplementasikan ke dalam jaringan saraf tiruan data tersebut harus dipraproses terlebih dahulu, karena data masih bersifat kotor, tidak lengkap, dan tidak konsisten.

Praproses yang dilakukan terdiri dari transformasi dan pembersihan data. Data transformasi bertujuan agar konvergensi lebih cepat dan tercapai, apabila nilai rata-rata dari input data training mendekati nol.

Pemetaan ini dilakukan untuk menyiapkan input dan target dengan menggunakan min-max normalization. Normalisasi ini dipilih agar data berada pada interval 0-1, hal ini disebabkan fungsi aktivasi yang nanti akan digunakan yaitu fungsi sigmoid.

Pengenalan Pola Data dengan BpNN

Proses prediksi masa studi mahasiswa dilakukan terhadap data yang telah dipraproses dan dinormalisasi. Data dibagi menjadi data latih (training) dan data uji

(testing). Proses pembagian data menggunakan teknik cross validationK-fold.

Selama proses pelatihan arsitektur jaringan yang dikembangkan menggunakan parameter-parameter jaringan saraf tiruan (JST) yang telah ditentukan. Proses pelatihan dilakukan beberapa kali sampai menemukan galat terkecil. Tabel 3.s1 memaparkan parameter JST yang akan digunakan pada proses pelatihan.

Tabel 3. 1. Parameter JST propagasi balik

Karakteristik Spesifikasi

Arsitektur 1 hidden layer

Neuron input 8, 16

Hidden layer 3, 5, 8, 10, 20

(12)

 Karakteristik Spesifikasi

Fungsi aktivasi Sigmoid bipolar, Sigmoid biner

Toleransi galat 10-3

Maksimum epoch 100, 500

Proses pengujian dilakukan dengan menguji data uji terhadap model arsitektur pelatihan. Pengujian dilakukan berdasarkan kelas masa studi menggunakan tabel

confusion matrix. Untuk menghitung akurasi klasifikasi dengan menggunakan

persamaan berikut:

% 100 uji

data total

i klasifikas benar

uji data

 

 

akurasi

Analisis dan Evaluasi

Tahap selanjutnya adalah evaluasi kinerja klasifikasi. Agar dapat dengan mudah dipahami dan dianalisis, hasil akurasi dibuat dalam bentuk grafik. Proses analisis dengan melakukan pengamatan terhadap parameter JST yang digunakan terhadap tingkat akurasi klasifikasi.

3.2 Lokasi Penelitian

Penelitian ini dilaksanakan di Laboratorium Riset STMIK Teknokrat.

3.3 Lingkungan Implementasi

Perangkat lunak yang digunakan dalam penelitian ini antara lain sistem operasi Windows® 7, Ms. Office Word 2007, NetBeans IDE 8.0.1, Java (JDK) 8.

Sedangkan untuk perangkat keras yang digunakan adalah Intel® Core™ i3 processor

(13)

 BAB IV

DAFTAR PUSTAKA

Agrawal, S. & Agrawal, J., 2015. Neural Network Techniques for Cancer Prediction: A Survey. Procedia Computer Science, 60(Elsevier), pp. 769-774.

Ahmed, A. B. E. D. & Elaraby, I. S., 2014. Data Mining: A prediction for Student's Performance Using Classification Method. World Journal of Computer

Application and Technology, 2(2), pp. 43-47.

Ahmed, A. B. E. D. & Elaraby, I. S., 2014. Data Mining: A prediction for Student's Performance Using Classification Method. World Journal of Computer

Application and Technology, 2(2), pp. 43-47.

 PT, 2008. Akreditasi Program Studi Sarjana: Buku II Standar dan Prosedur

Akreditasi Program Studi Sarjana. Jakarta: BAN PT

Baradwaj, B. K. & Pal, S., 2011. Mining Educational Data to Analyze Students Performance. International Journal of Advanced Computer Science and

Applications, 2(6), pp. 63-69.

Damanik, S. M. S., Ispriyanti, D. & Sugito, 2015. Klasifikasi Lama Studi Mahasiswa FSM Universitas Diponegoro Menggunakan Regresi Logistik Biner dan Support Vector Machine (SVM). Jurnal Gaussian, 4(1), pp. 123-132.

Fausett, L., 1994. Fundamentals of Neural Networks. New Jersey: John Wiley & Sons.

Gurney, K., 2004. An Introduction to Neural Networks. London: Taylor & Francis e-Library.

Han & Kamber, 2006. Data Mining Concepts and Techniques. 2nd ed. San Fransisco: Morgan Kaufmann Publisher.

Heikki, M., 1996. Data mining: machine learning, statistics, and database.

s.l.:IEEE.

Kabakchieva, D., 2013. Predicting Student Performance by Using Data Mining Methods for Classification. Cybernetics and Information Technologies,

13(1), pp. 61-72.

Kamagi, D. H. & Hansun, S., 2014. Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa. Ultimatics, 6(1), pp. 15-20.

Lee, K. Y., Chung, N. & Hwang, S., 2015. Application of an Artiﬁcial Neural

Network (ANN) Model for Predicting Mosquito Abundances in Urban Areas.

(14)

 Meinanda, M. H., Annisa, M., Muhandri, N. & Suryadi, K., 2009. Prediksi Masa Studi Sarjana dengan Artificial Neural Network. Internetworking Indonesia

Journal, 1(2), pp. 31-35.

Mislan, et al., 2015. Rainfall Monthly Prediction Based on Artificial Neural Network: A Case Study in Tenggarong Station, East Kalimantan - Indonesia.

Procedia Computer Science, 59(Elsevier), pp. 142-151.

Oladokun, V., Adebanjo, A. & Charles-Owaba, O., 2008. Predicting Students’ Academic Performance using Artificial Neural Network: A Case Study of an Engineering Course. The Pacific Journal of Science and Technology, 9(1), pp. 72-79.

Rahmani, B. & Aprilianto, H., 2013. Pengembangan Model Prediksi Lama Masa

Studi Mahasiswa Berbasis Jaringan Syaraf Tiruan. Yogyakarta, Seminar

Nasional 2013 Menuju Masyarakat Madani dan Lestari.

Ridwan, M., Suyono, H. & Sarosa, M., 2013. Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier. Electrics Electronics Communications Controls Informatics

Systems, 7(1), pp. 59-64.

Tair, M. M. A. & El-Halees, A. M., 2012. Mining Educational Data to Improve

Students’ Performance: A Case Study. International Journal of Information

and Communication Technology Research, 2(2), pp. 140-146.

Walpole, R. E., 1995. Pengantar Statistika. 3rd ed. Jakarta: Gramedia Pustaka Utama.

Williams, J. & Yan, L., 2008. A Case Study Using Neural Network Algorithms:

horse racing prediction in Jamaica. Las Vegas, International Conf. on

(15)