Pada bab ini akan dibahas metode-metode yang akan digunakan dalam penelitian ini, yang dimulai dari proses identifikasi masalah sampai pada kesimpulan hasil penelitian. Alur metodologi penelitian ini secara umum dapat dilihat pada Gambar 3.1.
Gambar 3.1 Alur metodologi penelitian
Mulai
Identifikasi Masalah
Studi Literatur
Pengumpulan Data
Analisis dan Perancangan Sistem
Implementasi Teknik Data Mining
Implementasi Dashboard
Pengujian dan Hasil Analisis
20
3.1 Identifikasi Masalah
Identifikasi masalah merupakan proses menggali permasalahan dalam organisasi hingga mendapatkan masalah yang dapat diselesaikan melalui teknik
Data Mining. Identifikasi masalah juga berguna untuk memahami tujuan dan
kebutuhan bisnis organisasi. Proses identifikasi masalah dilakukan dengan melakukan observasi dan wawancara pada bagian akademik dan sekretaris jurusan Teknik Informatika dan Sistem Informasi Fakultas Ilmu Komputer Universitas Brawijaya.
3.2 Studi Literatur
Studi literatur diperlukan sebagai dasar teori yang digunakan untuk membantu penulisan penelitian skripsi dan berkaitan dengan metode yang digunakan dalam penelitian tentang prediksi dengan algoritme Naive Bayes. Sumber yang biasa digunakan untuk mendapatkan keterangan serta penjelasan mengenai teori-teori yang relevan dengan penelitian yang dilakukan antara lain mengenai Data Mining,
Naive Bayes, database, pengukuran hasil klasifikasi, dan pengujian Usability. Dari
pengumpulan literatur, didapatkan beberapa literatur yang mendukung penelitian ini, antara lain :
1. Paper penelitian yang berasal dari jurnal-jurnal yang berkaitan dengan penelitian yang akan dilakukan. Paper yang dijadikan sebagai referensi adalah yang berkaitan tentang proses data mining menggunakan algoritme
Naive Bayes dan proses mining dengan studi kasus yang hampir serupa
dengan peneltian yang akan dilakukan.
2. E-book yang membahas tentang basis data dan data mining.
3. Skripsi dan tesis yang berkaitan dengan metode yang digunakan dan studi kasus yang serupa.
3.3 Pengumpulan Data
Pada skripsi ini data primer yang didapatkan berasal dari bagian akademik Fakultas Ilmu Komputer Universitas Brawijaya. Dalam tahap ini selain pengumpulan data juga akan dilakukan proses pemahaman data untuk mendapatkan pemahaman yang mendalam tentang data. Data yang diambil berupa data mengenai aktifitas akademik mahasiswa yaitu data Kartu Hasil Studi (KHS) dan nilai mahasiswa dari semester ganjil tahun 2014 sampai semester genap tahun 2016 sebanyak 162.734 records.
Setelah data terkumpul maka akan dilakukan proses pre-processing data dengan melakukan integrasi data sehingga menjadi dataset berdasarkan prasyarat mata kuliah yang akan diprediksi. Proses pre-processing akan dilakukan melalui
stored procedure pada database. Pre-processing juga digunakan untuk mengambil
atribut-atribut data yang diperlukan untuk proses mining. Adapun atribut yang digunakan adalah Nilai, IP, IP Kumulatif, SKS, SKS Kumulatif, dan Semester
21
mahasiswa. Dataset yang terbentuk kemudian akan dibagi menjadi 2, yaitu dataset untuk training adalah data semester ganjil tahun 2014 sampai semester genap tahun 2015 dan dataset untuk testing adalah data semester ganjil tahun 2016.
3.4 Perancangan Sistem
Dalam membangun sebuah sistem maka diperlukan tahap analisis dan perancangan sistem yang akan dibangun. Tahap analisis dilakukan dengan mengidentifikasi aktor beserta kebutuhannya. Selain itu juga dilakukan proses identifikasi kebutuhan data terkait dengan atribut-atribut yang akan digunakan dalam proses Data Mining.
Rancangan sistem yang dibangun adalah berasal dari proses identifikasi masalah dan studi literatur untuk menyesuaikan sistem yang akan dibangun dengan kebutuhan pengguna/proses Data Mining. Rancangan sistem termasuk didalamnya adalah membuat arsitektur sistem, memodelkan sistem, merancang basis data, merancang proses pre-processing data, merancang algoritme yang akan digunakan dalam sistem, melakukan perhitungan manual dan merancang antarmuka sistem.
3.5 Implementasi Teknik Data Mining
Pada tahap ini proses pengolahan data dengan teknik Data Mining dilakukan untuk melakukan prediksi jumlah mahasiswa yang mengambil mata kuliah tertentu. Implementasi dilakukan berdasarkan rancangan dari tahapan sebelumnya. Tujuan dari tahap ini adalah untuk menerapkan hasil rancangan yang telah dilakukan pada tahap sebelumnya sehingga dihasilkan sistem yang mampu melakukan klasifikasi menggunakan algoritme Naive Bayes.
Adapun proses implementasi yang dilakukan adalah Pre Processing Data, dan implementasi algoritme Naive Bayes Classifier (NBC). Pre-processing Data dilakukan melalui stored procedure database. Pre-processing data dilakukan untuk mengintegrasikan data khs dan ipk mahasiswa sehingga menjadi sebuah dataset yang memiliki atribut-atribut yang dibutuhkan dalam proses Data Mining dalam proses training dan testing yaitu Nilai, IP, IP Kumulatif, SKS, SKS Kumultif dan Semester. Selain itu akan dilakukan proses transformasi data untuk mengubah nilai dari atribut Nilai dan Semester menjadi kategori berupa numerik.
Sedangkan implementasi dari algoritme Naive Bayes dilakukan menggunakan
web service Java yang menyediakan fungsi-fungsi dalam melakukan klasifikasi
menggunakan algoritme Naive Bayes Classifier (NBC) yaitu proses training dan
testing. Proses training akan menghasilkan nilai model probabilitas berdasarkan dataset training yang langsung dinputkan ke dalam database. Sementara proses testing akan mengembalikan nilai hasil klasifikasi yaitu nilai 0 jika diklasifikasikan
22
3.6 Implementasi Dashboard
Pada tahap ini akan mengimplementasikan sebuah dashboard berbasis web untuk memberikan informasi mengenai hasil prediksi mata kuliah berdasarkan hasil rancangan sebelumnya. Implementasi dashboard dilakukan menggunakan PHP Codeigniter. Tujuannya pembuatan dashboard adalah sebagai antarmuka dari sistem sehingga pengguna dapat berinterkasi dengan sistem yang telah dibangun. Dashboard yang dibuat menampilkan hasil prediksi mata kuliah untuk setiap tahun dan semester mata kuliah termasuk didalamnya dataset yang digunakan untuk training dan testing, hasil dari proses training yaitu tabel probabilitas dan
testing yaitu hasil prediksi mata kuliah yang terdapat pada semester dan tahun
prediksi. Selain itu akan ditampilkan juga hasil pengujian implementasi Naive
Bayes untuk mengetahui unjuk kerja dari algoritme tersebut dalam melakukan
klasifikasi data untuk setiap mata kuliah.
3.7 Pengujian dan Hasil Analisis
Pengujian diperlukan untuk mengetahui unjuk kerja algoritme Naive Bayes dalam mengklasifikasikan data pada kelas tertentu sebagai hasil prediksi. Oleh karena itu sebelum benar-benar digunakan untuk melakukan prediksi maka diperlukan pengujian dengan data latih (training set) untuk membentuk tabel probabilitas dimana akan digunakan data dari tahun 2014 semester ganjil sampai 2015 semester genap. Tabel probabilitas yang terbentuk akan menjadi acuan dalam proses testing menggunakan data uji. Selain itu juga akan dilakukan analisis
usability terhadap dashboard menggunakan System Usability Scale (SUS).
Analisis akan dilakukan terhadap hasil klasifikasi yang dihasilkan menggunakan Confusion Matrix untuk mengetahui nilai accuracy, precision, recall dan F-measurenya. Nilai akurasi digunakan untuk mengetahui persentase data yang dengan tepat diklasifikasikan oleh sistem. Nilai precision digunakan untuk mengetahui ketepatan antara kelas dari data uji dengan hasil klasifikasi yang dilakukan oleh sistem. Nilai recall digunakan untuk mengetahui sensitifitas hasil klasifikasi atau kinerja sistem dalam mendapatkan data relevan yang dilakukan oleh sistem. Sedangkan nilai F-measure digunakan untuk mengetahui kinerja sistem dengan mengkombinasikan tingkat presisi dan sensitifitas.
3.8 Kesimpulan dan Saran
Tahap terakhir dari penelitian skripsi ini adalah pengambilan kesimpulan dan saran. Kesimpulan diambil setelah semua tahap-tahap mulai dari perancangan sistem dan database, implementasi Data Mining dengan Naive Bayes, dan sampai pada pengujian sistem dan dashboard telah selesai dilakukan. Saran berguna untuk memperbaiki kesalahan dan diharapkan dapat menyempurnakan penulisan serta untuk memberikan pertimbangan untuk penelitian selanjutnya.
23