Diagram Alir Penelitian - METODE PENELITIAN

3. METODE PENELITIAN

3.1 Diagram Alir Penelitian

Kerangka pemikiran pada penelitian ini dapat digambarkan dalam suatu bagan alir seperti pada Gambar 8.

Pengumpulan Data

Penelitian dimulai dengan pengumpulan data yang berasal dari basis data

„Transkrip Nilai‟ dan „Evaluasi Studi‟ yang bersumber dari Sistem Informasi

Akademik Terpadu Universitas Negeri Gorontalo (SIATUNG) yang menyimpan Gambar 8 Diagram Alir Penelitian

informasi mahasiswa berupa nilai mutu mata kuliah, lama studi dan IPK. Mata kuliah yang dipilih sebagai data input dalam penelitian ini berjumlah 16 (enam belas) buah mata kuliah dasar yang wajib diprogramkan pada 2 (dua) semester tahun pertama program perkuliahan sebelum mengambil program peminatan. Pada penelitian ini, data mata kuliah digunakan sebagai data input. Sedangkan data lama studi dan IPK digunakan sebagai data target. Data nilai mata kuliah yang diperoleh berupa Huruf Mutu (HM) dan dikonversi ke Angka Mutu (AM) dengan kisaran nilai 0 hingga 4. Data target lama studi dikategorikan menjadi 2 (dua), yaitu kategori mahasiwa yang lulus dengan melewati masa studi program diploma (> 3 tahun) dan kategori mahasiswa yang lulus tepat waktu (3 tahun). Data target IPK dikategorikan menjadi 3 (tiga), yaitu kategori mahasiswa yang lulus dengan predikat terpuji (IPK >3.5), kategori predikat sangat memuaskan

(IPK ≥ 2.75 hingga IPK ≤3.5) dan kategori predikat memuaskan (IPK<2.75). Data mahasiswa yang digunakan dalam penelitian ini adalah data mahasiswa D3 (Diploma Tiga) Manajemen Informatika UNG angkatan 2005 hingga 2010. Pembelajaran dan pengujian JST menggunakan data mahasiwa angkatan 2005, 2006 dan 2007 (Lampiran 1), yang dibagi ke dalam 3 (tiga) komposisi data dan dibedakan ke dalam 2 (dua) kelompok data. Total jumlah data pada kelompok data pertama dan kelompok data kedua adalah sama, yakni 216 data. Pengelompokkan data dibedakan berdasarkan cara pembagian komposisi data dimana pada kelompok data pertama, setelah data mahasiswa angkatan 2005, 2006 dan 2007 diurutkan, kemudian dibagi ke dalam 3 (tiga) komposisi data. Sedangkan pada kelompok data kedua, komposisi data dibagi berdasarkan angkatan, sehingga data mahasiswa pada masing-masing angkatan dibagi ke dalam 3 (tiga) komposisi data.

Komposisi data terbagi menjadi data pelatihan, data validasi dan data pengujian. Data pelatihan digunakan oleh jaringan untuk membentuk model melalui proses pembelajaran JST. Data validasi untuk melihat apakah jaringan telah memiliki kemampuan yang baik dalam mengenali data baru yang diberikan kepadanya. Data validasi digunakan juga untuk menghentikan iterasi jika error yang terjadi tidak rasional. Data pengujian digunakan untuk menguji ketepatan klasifikasi dari model yang terbentuk. Penelitian ini menetapkan besarnya

komposisi data adalah 70% data pelatihan, 15% data validasi dan 15% data pengujian. Prediksi tingkat kelulusan menggunakan data mahasiswa angkatan 2008, 2009 dan 2010 9 (Lampiran 2). Pembagian data mahasiswa untuk pembelajaran JST dan prediksi ditunjukkan oleh Tabel 3.

Tabel 3 Pengelompokkan dan Komposisi Data Penelitian

DATA PEMBELAJARAN & PENGUJIAN

Komposisi Data ^{Data Pelatihan}

(70%)

Data Validasi (15%)

Data Testing

(15%) ^Total

Kelompok Data Pertama 150 33 33 216

Kelompok Data Kedua

2005 60 ₁₃ 12 8 13 12 8 86 79 51 2006 55 2007 35 Total 150 33 33 216 DATA PREDIKSI Angkatan 2008 2009 2010 Total Jumlah 41 52 37 130 Praproses Data

Sebelum data digunakan dilakukan praproses untuk meningkatkan efisiensi dan skalabilitas dari sebuah sistem prediksi. Pada penelitian ini, dilakukan beberapa praproses data, yakni pembersihan data, analisa relevansi dan tranformasi data (Han & Kember 2001). Proses transformasi data dilakukan untuk data target yang bersifat kategorikal, dengan menggunakan metode Unary Encoding, dimana data target dipresentasikan dengan kombinasi angka 0 dan 1 (numerical binary variable). Berdasarkan data kategori targetnya maka dalam penelitian ini, seluruh proses pembelajaran, pengujian hingga prediksi akan dibedakan ke dalam 2 (dua) model, yaitu Model Prediksi Lama Studi (MPLS) dan Model Prediksi Indeks Prestasi Kumulatif (MPIPK).

Praproses ini dilakukan dengan menggunakan perangkat lunak Microsoft Excel 2007, sedangkan untuk proses transformasi dilakukan dengan menggunakan perangkat lunak Matlab versi 6.5.

Pembentukan Model JST

Pembentukan model prekdiksi dimaksudkan untuk menentukan parameter dari arsitektur jaringan yang akan digunakan untuk pembelajaran. Pembentukan model prediksi dilakukan dengan menggunakan JST Propagasi Balik (Backpropagation) dengan 1 (satu) lapisan tersembunyi. Jumlah variabel input yang digunakan dalam penelitian ini sebanyak 16 buah variabel. Jumlah node

untuk lapisan input sama dengan jumlah variabel input, karena data input sudah berbentuk data numerik sehingga tidak mengalami praproses data. Jumlah node

pada lapisan output sama dengan jumlah kategori yang akan diklasifikasi dan hal ini berbeda untuk setiap model prediksi. Model prediksi lama studi (MPLS) memiliki 2 (dua) kategori output, sehingga jumlah node pada model prediksi ini sebanyak 2 (dua) node dan Model prediksi IPK (MPIPK) memiliki 3 (tiga) kategori output, sehingga jumlah node pada model prediksi ini menjadi 3 (tiga)

node. Adapun untuk jumlah node pada lapisan tersembunyi (hidden-node), pada penelitian ini akan divariasikan untuk mendapatkan hasil yang lebih optimal. Karena diduga jumlah node pada lapisan tersembunyi berpengaruh terhadap tingkat generalisasi atau pengenalan pola. Variasi jumlah hidden-node yang digunakan adalah 5, 10 dan 15.

Selain jumlah node pada tiap lapisan arsitektur JST, ditetapkan beberapa parameter yang akan diberikan pada proses pembelajaran dan diuji untuk membentuk model prediksi, antara lain adalah fungsi aktivasi, toleransi galat, jumlah epoch maksimal, laju pembelajaran (learning rate) dan fungsi pelatihan (training function). Untuk inisialisasi bobot awal digunakan inisialisasi secara random. Fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah

tansigmoid, sedangkan pada lapisan output menggunakan fungsi aktivasi pure linear. Toleransi kesalahan minimum (galat) ditentukan pada 0.001. Toleransi galat yang cukup kecil diharapkan akan memberikan hasil yang cukup baik. Jumlah epoch maksimal yang ditetapkan dalam penelitian ini adalah 1000. Hal ini diperlukan sebagai kriteria henti jaringan disamping tolerasin galat untuk membatasi waktu yang disediakan bagi jaringan dalam melakukan pembelajaran.

Adapun parameter yang divariasikan dalam proses pembelajaran adalah laju pembelajaran (learning rate) dan fungsi pelatihan (training function). Variasi nilai

laju pembelajaran yang digunakan adalah 0.01, 0.05, 0.1 dan 0.5. Laju pembelajaran dapat mempengaruhi konvergensi kecepatan pada proses pembelajaran, sehingga perlu dilakukan percobaan pada laju pembelajaran yang berbeda untuk mendapatkan nilai rentang data yang sesuai. Hasil penelitian Purnomo (2001) menyatakan bahwa semakin kecil nilai laju pembelajarannya maka semakin kecil pula nilai dan rentang data matriks vektor hasil pelatihan, dan sebaliknya. Fungsi pelatihan yang divariasikan adalah algoritma pelatihan dengan perbaikan teknik heuristik resilent backpropagation dan perbaikan dengan teknik optimasi scaled conjugate gradient dan levenberg-marquardt.

Tabel 4 Karakteristik dan Struktur JST yang digunakan

KARAKTERISTIK SPESIFIKASI

Arsitektur jaringan Algoritma Pembelajaran

Multi-layer dengan 1 lapisan tersembunyi

Propagasi balik

Jumlah node input 16

Jumlah node lapisan tersembunyi 5, 10, 15

Fungsi aktivasi lapisan tersembunyi Sigmoid bipolar Jumlah node lapisan ouput :

Model Prediksi Lama Studi (MPLS) 2 Model Prediksi IPK (MPIPK) 3

Fungsi aktivasi lapisan output Fungsi linier

Toleransi galat 0.001

Laju Pembelajaran 0.01, 0.05, 0.1, 0.5

Maksimum epoch 1000

Pembelajaran Model

Setelah model terbentuk selanjutnya dilakukan proses pembelajaran atau pelatihan, dimana pada proses ini menggunakan data pelatihan, data validasi dan data testing. Pembelajaran atau pelatihan dilakukan bertujuan untuk mengenali pola-pola dari data masukan pada data pelatihan untuk dilatih pada jaringan yang akan menghasilkan keluaran untuk dibandingan dengan data target. Selama proses pelatihan dilakukan pula proses validasi untuk menguji apakah jaringan sudah memiliki kemampuan yang baik dalam mengenali data baru yang diberikan kepadanya, yang ditunjukkan dengan nilai Mean Square Error (MSE). Pembelajaran model JST propagasi balik bersifat iterative dan didesain untuk meminimalkan MSE antara output yang dihasilkan dan output yang diinginkan (target).

Algoritma pembelajaran propagasi balik meliputi 3 (tiga) tahap, yaitu : prosedur umpan maju (feedforward), perhitungan serta perambatan balik kesalahan (backpropagation) dan penyesuaian bobot. Sebelum proses pelatihan terlebih dahulu ditentukan bobot-bobot awal secara random dan toleransi kesalahan minimum. Bobot-bobot awal ini nantinya akan diinisialisasi dan digunakan pada proses umpan maju awal, sedangkan proses umpan maju selanjutnya menggunakan bobot-bobot yang telah mengalami perbaikan. Toleransi kesalahan minimum berfungsi sebagai pembatas berulangnya proses iterasi dalam suatu pelatihan. Proses pelatihan akan terus berulang hingga diperoleh koreksi kesalahan yang sama atau lebih kecil dari tolerasi kesalahan minimum.

Pengujian dan Generalisasi

Pengujian jaringan bertujuan untuk mengetahui apakah jaringan dapat melakukan generalisasi terhadap data baru yang dimasukkan ke dalamnya yaitu ditunjukkan dengan persentase akurasi jaringan dalam mengenali data pengujian, sehingga arsitektur jaringan yang digunakan untuk pengujian adalah arsitektur terbaik yang diperoleh dari hasil pelatihan jaringan. Dalam penelitian ini digunakan parameter yang disebut generalisasi untuk mengukur tingkat pengenalan jaringan pada pola yang diberikan. Dimana pola yang diberikan adalah data validasi maupun data testing. Generalisasi yang digunakan dalam Agustini (2006) adalah sebagai berikut :

100 _ _ _ x pola jum test numkenal test si Generalisa (6)

dengan numkel_test adalah jumlah pola yang dikenal dan jum_pola adalah jumlah pola keseluruhan. Jumlah numkel_test dan jum_pola yang ditunjukkan akan berbeda pada setiap model prediksi.

Analisis Sensitivitas

Analisis sensitivitas bertujuan untuk mengetahui variabel yang lebih atau paling berpengaruh diantara variabel-variabel masukan. Metode analisa sensitivitas yang digunakan adalah metode yang digunakan oleh Engelbrecht

(2001). Analisis sensitivitas ini dilakukan pada percobaan dengan arsitektur dan parameter terbaik yang diperoleh setelah proses pelatihan dan pengujian. Hasil analisis sensitivitas dibedakan berdasarkan model prediksi.

Dalam dokumen Jaringan saraf tiruan untuk prediksi tingkat kelulusan mahasiswa diploma Program Studi Manajemen Informatika Universitas Negeri Gorontalo (Halaman 37-43)