Implementasi Perbandingan Metode Knn Dan Naive Bayes Dalam Prediksi Tingkat Kegagalan Mahasiswa Teknik Informatika
Sahat Roni S*, Fadlina, Siti Nurhabibah Hutagalung
Fakultas Ilmu Komputer Dan Teknologi Informasi, Prodi Teknik Informatika, Universitas Budi Darma, Medan, Indonesia Email : [email protected]
Abstrak-Sebuah perguruan tinggi tentu saja ingin memiliki mahasiswa yang berhasil dalam pendidikannya tapi sangat banyak kegagalan mahasiswa yang berdampak cukup buruk terhadap citra nama kampus universitas budidarma, mahasiswa yang gagal tentu membuat banyak pihak yang merasa prihatin dan dampak lainnya terjadi penumpukan data pada mahasiswa yang gagal dan dapat menurunkann eksistensi sebuah perguruan tinggi. Perlu dilakukan prediksi tingkat kegagalan mahasiswa pada universitas budi darma untuk memungkinkan kampus tersebut melakukan startegi dan antisipasi terhadap terjadinya kegagalan mahasiswa yang lebih besar lagi, pada penelitian ini dilakukan prediksi menggunakan metode perbandingan yaitu metode KNN dan nearest neighbor sebagai alat pertimbangan terbaik dalam proses prediksi. Data mining merupakan cabang ilmu komputer yang dapat membatu melakukan proses prediksi terhadap kecenderungan data mahasiswa terhadap penyebab tingkat kegagalan untuk mempermudah melakukan perancangan dan antisapsi terhadap mahasiswa agar tingkat kegagalan dimasa yang akan mendatang tidak semakin bertambah. Dengan adanya penggunaan prediksi menggunakan komputer dalam bentuk aplikasi RapidMiner dengan algortima K-Nearest Neighbor dan Naïve Bayes dapat mempermudah mempercepat proses penyelesaian permasalahan dengan tepat.
Kata kunci: Data Mining; Tingkat Kegagalan Mahasiswa; KNN; Naïve Bayes
Abstract-A tertiary institution certainly wants to have students who are successful in their education but there are very many student failures which have quite a bad impact on the image of the name of the Budidarma University campus, students who fail certainly make many parties feel concerned and other impacts occur in the accumulation of data on students who fail and can reduce the existence of a university. It is necessary to predict the failure rate of students at Budi Darma University to enable the campus to carry out strategies and anticipate even greater student failures. Data mining is a branch of computer science that can help predict the tendency of student data to cause failure rates to make it easier to design and anticipate students so that failure rates in the future do not increase. With the use of predictions using a computer in the form of the RapidMiner application with th e K- Nearest Neighbor and Naïve Bayes algorithms, it can make it easier to speed up the process of solving problems correctly.
Keywords: Data Mining;Student Failure Rate;KNN;Naïve Bayes
1. PENDAHULUAN
Kegagalan mahasiswa jurusan teknik informatika merupakan ketakutan terbesar seorang peserta didik dikarenakan jurusan tersebut merupakan jurusan yang cukup sulit dalam bidang ilmu komputer selain itu jika mahasiswa mengalami kegagalan dalam proses pembelajaran berarti mahasiswa tersebut harus mengulangi materi pembelajaran, menambah waktu dalam menempuh jenjang pendidikan serta menambah biaya dalam mengurus admisitrasi untuk dapat melanjutkan pendidikan hal tersebut sangat berdampak merugikan bagi banyak mahasiswa sehingga hal tersebut harus dihindari sebisa mungkin. Kerugian bagi sebuah perguruan tinggi yang memiliki mahasiswa yang gagal yaitu dapat merusak citra perguruan tinggi itu sendiri baik dalam proses pembelajaran yang tidak tercapai dan atau perguruan tinggi tersebut dianggap tidak mampu dalam mengemban tugas dalam menyiapkan dan menghantarkan peserta didik yang unggul dan berkualitas[1]-[2].
Kegagalan mahasiswa dalam sebuah pendidikan membuat banyak dampak negatif lainya yang akan dihadapi sebuah perguruan tinggi sehingga penting dilakukan prediksi dalam melihat potensi kegagalan mahasiswa untuk membantu sebuah perguruan tinggi dapat meningkatkan strategi dalam proses belajar dan mengajar. Universitas Budi Darma yang merupakan salah satu perguruan tinggi yang bergerak dalam bidang studi teknik informatika memiliki jumlah mahasiswa yang sangat banyak mengakibatkan dalam proses prediksi kegagalan mahasiswa yang masih manual menjadi lambat, penuh tumpukan data mahasiswa baik yang lulus maupun gagal dan penilaian dengan minimnya tangkat akurasi. Permasalahan yang ada saat ini adalah kurang diketahuinya penyebab pasti mahasiswa mendapatkan kegagalan pada saat kuliah dan pada akhirnya merugikan banyak pihak. Hal tersebut membuat perlunya dilakukan prediksi menggunakan sebuah sistem penggalian data agar mendapatkan informasi yang tepat cepat dan akurat sehingga penerapan strategi baru kampus untuk mengurangi jumlah tingkat kegagalan mahasiswa Universitas Budi Darma menjadi lebih sedikit.
Adapun prediksi yang dilakukan menggunakan sistem komputer dengan melakukan penggalian informasi terhadap tumpukan data adalah bagian dari tahapan implementasi data mining yang merupakan salah satu cabang ilmu penerapan teknologi komputer. Dalam proses penggalian data dibutuhkan algoritma prediksi yang tepat seperti algoritma K-Nearest Neighbor, algortima C4.5, algoritma Naïve Bayes dan banyak lainya. Proses prediksi akan mendapatkan hasil yang lebih baik apabila dilakukan perbandingan terhadap beberapa algoritma prediksi dilakukan secara bersamaan, hal tersebut dapat terlihat berdasarkan beberapa penelitian terdahulu[3]-[4].
Penelitian terdahulu terhadap prediksi tepat waktu kelulusan menggunakan beberapa algortima perbandingan untuk mendapatkan hasil prediksi terbaik dan didapatkan hasil uji coba menunjukkan bahwa “metode k-Nearest Neighbor menghasilkan akurasi lebih tinggi dibandingkan dengan Naïve Bayes Classifier. Akurasi tertinggi diperoleh
dengan menggunakan metode k-Nearest Neighbor yaitu sebesar 98.7%”. Penelitian terdahulu menjelaskan terhadap perbandingan antara metode KNN dengan Decision Tree, Naïve Bayes dalam menemukan sentimen masyarakat terhadap pelayanan penggunaan layanan BPJS dan hasil yang ditemukan dalam 1000 sampel data KNN mencapai 94%, Decision tree sebesar 96% dan naïve bayes mendapatkan hasil 89,14%. Penelitian terdahulu dalam menjelaskan tingkat sentiment transportasi KRL Commuter Line dengan perbandingan metode prediksi sehingga hasil yang ditemui
“Naive Bayes akurasi sebesar 80%, precision 66,67%, sensitivity 100%, specificity 66,67%. Pada metode KNN akurasi sebesar 80%, precision 100%, sensitivity 50%, specificity 100% dan pada metode Decision Tree akurasi sebesar 100%, precision 100%, sensitivity 100%, specificity 100%” [5]-[6]-[7].
2. METODOLOGI PENELITAN
Kerangka kerja penelitian dilakukan untuk menjabarkan tiap tahapan-tahapan yang akan dilakukan oleh penulis.
Kerangka kerja penelitian itu sendiri merupakan bagian dari metodologi penelitian dimana dari beberapa tahapan yang terkait secara sistematis, tahapan ini dilakukan bertujuan untuk mempermudah penulis dalam melakukan penelitian. Pada tahapan ini menjelaskan bagaimana proses dalam mengetahui permasalahan yang terjadi, pengambilan sempel data yang diperlukan dalam melakukan penelitian, memberikan solusi penyelesaian permasalahan berdasarkan literasi review dari beberapa jurnal, buku dan penelitian terdahulu, menyimpulkan pengguaan metode, menghasilkan jawaban dari permasalahan hingga membentuk kesimpulan dan saran terhadap penelitian yang dilakukan.
Pada metode pengumpulan data dilakukan dengan cara melakukan wawanara dan observasi pada pihak bagian kemahasiswaan Universitas Budi Darma untuk mendapatkan sample data, kriteria, dan record data yang ada pada kelulusan mahasiswa untuk melihat data dan penyebab kegagalan mahasiswa yang diperlukan pada penelitian.
Untuk menyelesaikan masalah tersebut dalam maka dalam penelitian ini penulis melakukan sebuah pengujian dengan melakukan prediksi terhadap tingkat kegagalan mahasiswa Universitas Budi Darma khusus jurusan teknik informatika, prediksi yang dilakukan dengan membandingkan dua metode klasifikasi yang sangat baik dalam akurasi dan hasil penelitian yaitu metode K-Nearest Neighbor dan metode Naïve Bayes dengan menggunakan bantuan aplikasi statistika dan probabilitas yaitu aplikasi RapidMiner versi 9.8.1 untuk mempercepat hasil dalam penelitian dengan sampel data yang cukup banyak. Hasil yang ditemukan akan memberikan solusi terhadap penanggulangan atau pembentukan strategi Universitas Budi Darma terhadap tingkat kegagalan mahasiswa teknik informatika. Adapun tahapan dapat terlihat pada kerangka berikut ini:
Gambar 1. Flowchart Tahapan Penelitian Berikut ini merupakan keterangan dari gambar tahapan penelitian :
1. Langkah awal dari penelitian ini adalah identifikasi ruang lingkup masalah, ditentukan terlebih dulu sebelum sampai pada tahap pembahasan selanjutnya agar pembahasan suatu masalah dapat terarah atau fokus pada suatu tujuan.
2. Langkah kedua adalah pengumpulan data proses mengumpulkan dan mengukur informasi tentang variabel yang ditargetkan dalam sistem yang mapan, yang kemudian memungkinkan seseorang untuk menjawab pertanyaan yang relavan dan mengevaluasi hasil.
3. Langkah ketiga adalah mempelajari literatur, untuk mencapai tujuan yang telah ditentukan, maka dipelajari beberapa literatur yang digunakan. Kemudian literatur-literatur yang dipelajari diseleksi untuk dapat menentukan literatur yang akan digunakan dalam penelitian.
4. Langkah keempat adalah analisa metode K-Nearest Neighbor dan metode Naïve Bayes, proses penelitian dimana data diproses untuk menanggapi perumusan masalah.
5. Langkah kelima adalah perancangan, penggambaran beberapa elemen yang terpisah dalam satu kesatuan yang utuh dan berfungsi. Perancangan sistem dapat dirancang dalam bentuk bagan alir.
6. Langkah keenam adalah pengujian, untuk dapat menganalisis tingkat keberhasilan metode K-Nearest Neighbor dan metode Naïve Bayes menggunakan aplikasi RapidMiner versi 9.8.1.
3. HASIL DAN PEMBAHASAN
3.1 Analisa
Analisa dilakukan untuk mengetahui suatu proses menyelidiki terhadap peristiwa yang telah terjadi di masa lalu dan akan terjadi di masa yang akan mendatang, dirancang untuk mendapatkan suatu fakta dari masalah dengan jelas dan tepat. Dalam melakukan prediksi terhadap tangkat kegagalan mahasiswa teknik informatika pada Universitas Budi Darma akan dilakukan dengan membaca pola terhadap data yang telah tersedia sebelumnya atau data mahasiswa tahun lalu yang menerima kelulusan maupun kegagalan [8]-[9]-[10].
Adapun fungsi data lama akan menjadi data pembelajaran yang digunakan oleh metode yang diterapkan dalam penyelsaian permasalahan pada penelitian ini.metode yang digunakan merupakan metode K-Nearest Neighbor dan metode Naïve Bayes. Perlunya dilakukan sebuah prediksi untuk mempermudah pihak kampus Universitas Budi Darma mengambil langkah dalam mengatisipasi peningkatan kegagalan mahasiswa jurusan teknik informatika pada masa yang akan mendatang dan dilakukan perbandingan dua metode klasifikasi dari data mining untuk mengetahui kualitas dan hasil terbaik dari masing-masing penggunaan metode klasifikasi dalam memprediksi tingkat kegagalan mahasiswa jurusan teknik informatika [11]-[12].
Hasil penelitian juga akan dilakukan menggunakan penerapan tools untuk mempermudah menganalisa data dalam jumlah yang sangat banyak dalam waktu yang singkat, adapun Pada tahapan akhir menggunakan penerapan aplikasi RapidMiner versi 9.8.1 yaitu berfungsi sebagai analisa secara cepat dan akurat penggunaan metode.
3.2 Penerapan Metode Metode K-Nearest Neighbor
Dalam melakukan prediksi tangkat kegagalan mahasiswa teknik informatika digunakan penerapan dua metode yang berbeda untuk mengetahui hasil prediksi yang lebih akurat diantara kedua metode tersebut, dilakukan perbandingan antara keduanya. Pada penggunaan metode k-nearest neighbor yang merupakan metode klasifikasi yang menggunakan angka pada data yang digunakan sehingga data yang awalnya merupakan data huruf atau keterangan harus dirubah menjadi data angka. Adapun parameter krtiteria sebagai berikut ini:
Tabel 1. Parameter Data Kriteria
Kriteria Keterangan Bobot Status Pekerjaan Bekerja 1
Tidak 5
Keaktifan Organisasi Ya 1
Tidak 5
Etika Sangat Baik 1
Baik 2
Cukup Baik 3
Buruk 4
Sangat Buruk 5 Pembayaran Uang Kuliah Lancar 3 Tidak Lancar 4
Parameter berdasarkan pengelihatan hasil menggunakan metode K-Nearest Neighbor dimana nilai terbaik yang merupakan angka terendah atau jarak terdekar dengan nilai terkecil, sehingga pada proses preprocessing data yaitu melakukan transformasi dari data keterangan huruf menjadi angka ditentukan bahwa angka 1 merupakan nilai terbaik dan nilai tertinggi dibuat menjadi angka 5 merupakan nilai terburuk. Pemberian range 1-5 berdasarkan saran dari pengambilan data kampus Universitas Budi Darma. Selanjutnya dilakukan perubahan data keterangan menjadi angka, sehingga data sampel pengujian sebagai berikut ini:
Tabel 1. Data Training Baru
No. Nama IPK Status
Pekerjaan
Keaktifan
Organisasi Etika Pembayaran
Uang Kuliah Keputusan
1 Indra Kurniawan 3,80 5 5 2 1 Lulus
2 Ikram Hamdani 2,00 1 1 3 1 Tidak
3 Julia Astri 3,50 1 1 2 5 Lulus
4 Ikhsan Bukhari 3,75 1 1 2 1 Lulus
5 Jonas Tambunan 2,00 5 1 2 1 Tidak
6 Dian Hajri 3,00 1 5 2 5 Tidak
7 Putri Mayang Sari 2,30 1 5 4 5 Tidak
8 Zainal Harap 3,4 5 5 3 1 Lulus
9 Fitria Karmila 2,06 1 5 2 1 Tidak
10 Gilang Pernanda 4,00 1 5 2 5 Lulus
11 Fahrul Roji 1,34 5 1 2 5 Tidak
No. Nama IPK Status Pekerjaan
Keaktifan
Organisasi Etika Pembayaran
Uang Kuliah Keputusan
12 Abdullah 3,7 1 1 2 1 Lulus
13 Dwi Andriyani 2,01 1 1 4 1 Tidak
14 Dicky Pratama 3,4 5 5 3 5 Lulus
selanjutnya dilakukan perhitungan menggunakan metode K-Nearest Neighbor dengan menggunakan perbandingan nilai data lama dengan data uji baru dimana nilai dipasangkan dan diakar kuadratkan dengan keseluruhan nilai variabel atau kriteria. Adapun nilai uji sebagai berikut ini:
Tabel 2. Nilai Data Uji Baru
No. Nama IPK Status
Pekerjaan
Keaktifan
Organisasi Etika Pembayaran
Uang Kuliah Keputusan
15 Yulia Agustina 3,4 5 5 2 1 ??
Mencari nilai dari jarak terdekat menggunakan metode k-nearest neighbor sebagai berikut ini:
1. Penentuan nilai K. nilai ini digunakan untuk melihat bagaimana perbandingan antara seluruh nilai terdekat, pada penggunaan penentuan nilai K belum memiliki aturan yang baku. Nilai K yang digunakan pada penelitian ini adalah K = 3. (aturan umum).
2. Hitung jarak Eucidean Distance antara data training dan data uji baru, adapun cara penyelesaian sebagai berikut ini:
𝑑1 = √(3,8 − 3,4)2+ (5 − 5)2+ (5 − 5)2+ (2 − 2)2+ (1 − 1)2
= 0,4
𝑑2 = √(2 − 3,4)2+ (1 − 5)2+ (1 − 5)2+ (3 − 2)2+ (1 − 1)2
= 5,912698
𝑑3 = √(3,5 − 3,4)2+ (1 − 5)2+ (1 − 5)2+ (2 − 2)2+ (5 − 1)2
= 6,928925
𝑑4 = √(3,75 − 3,4)2+ (1 − 5)2+ (1 − 5)2+ (2 − 2)2+ (1 − 1)2
= 5,667671
𝑑5 = √(2 − 3,4)2+ (5 − 5)2+ (1 − 5)2+ (2 − 2)2+ (1 − 1)2
= 4,237924
𝑑6 = √(3 − 3,4)2+ (1 − 5)2+ (5 − 5)2+ (2 − 2)2+ (5 − 1)2
= 5,670979
𝑑7 = √(2,3 − 3,4)2+ (1 − 5)2+ (5 − 5)2+ (4 − 2)2+ (5 − 1)2
= 6,1
𝑑8 = √(3 − 3,4)2+ (5 − 5)2+ (5 − 5)2+ (3 − 2)2+ (1 − 1)2
= 1,077033
𝑑9 = √(2,06 − 3,4)2+ (1 − 5)2+ (5 − 5)2+ (2 − 2)2+ (1 − 1)2
= 4,218483
𝑑10 = √(4 − 3,4)2+ (1 − 5)2+ (5 − 5)2+ (2 − 2)2+ (5 − 1)2
= 5,688585
𝑑11 = √(1,34 − 3,4)2+ (5 − 5)2+ (1 − 5)2+ (2 − 2)2+ (5 − 1)2
= 6,020266
𝑑1 2 = √(3,7 − 3,4)2+ (1 − 5)2+ (1 − 5)2+ (2 − 2)2+ (1 − 1)2
= 5,664804
𝑑1 3 = √(2,01 − 3,4)2+ (1 − 5)2+ (1 − 5)2+ (4 − 2)2+ (1 − 1)2
= 6,158904
𝑑1 4 = √(3,5 − 3,4)2+ (5 − 5)2+ (5 − 5)2+ (3 − 2)2+ (5 − 1)2
= 4,12431
Hasil yang diperoleh dalam perhitungan ini sebagai berikut:
Tabel 3. Hasil perhitungan Jarak
Nama Hasil Rank Keterangan Indra Kurniawan 0,4 1 Lulus
Ikram Hamdani 5,912698 10 Tidak Julia Astri 6,928925 14 Lulus Ikhsan Bukhari 5,667671 7 Lulus
Jonas Tambunan 4,237924 5 Tidak
Dian Hajri 5,670979 8 Tidak
Putri Mayang Sari 6,1 12 Tidak Zainal Harap 1,077033 2 Lulus Fitria Karmila 4,218483 4 Tidak Gilang Pernanda 5,688585 9 Lulus Fahrul Roji 6,020266 11 Tidak
Abdullah 5,664804 6 Lulus
Dwi Andriyani 6,158904 13 Tidak Dicky Pratama 4,124318 3 Lulus
Pada hasil table 4 di atas, diambil 3 parameter dengan 3 nilai terdekat, terlihat dari 3 parameter tersebut mendapatkan keterangan “lulus” sehingga data baru dengan nama “Yulia Agustina” mendapakan keterangan nilai terhadap prediksi kegagalan mahasiswa teknik informatika akan mendapatkan nilai “LULUS”.
3.3 Penerapan Metode Metode Naïve Bayes
Pada penerapan metode Naïve Bayes dilakukan pencarian data yang hanya ada pada kasus baru dengan menggali data kasus lama yang pernah terjadi sebelumnya, berikut merupakan proses penyelesaian penggunaan metode Naïve Bayes, pada penggunaan metode ini tetap menggunakan data awal yang berupakan data keterangan pada tabel : 1. Menghitung Nilai P(Xkriteria | Ci) untuk setiap kelas
Pada tahapan ini nilai yang dimiliki oleh data baru saja yang diproses dengan dilihat jumlah keterangan lulus atau tidak.
-
P(IPK = 3,4 | keterangan =“Lulus”-
P (IPK = 3,4 = 2/7 =0,28571-
P(IPK = 3,4 | keterangan =“Tidak”)-
P (IPK = 3,4 = 0/7 = 0-
P(Status Pekerjaan = Tidak | keterangan =“Lulus”)-
P (Status Pekerjaan = 3/7 = 0,428571-
P(Status Pekerjaan = Tidak | keterangan =“Tidak”)-
P (Status Pekerjaan = 2/7 = 0,28571-
P(Keaktifan Organisasi= Tidak | keterangan =“Lulus”)-
P (Keaktifan Organisasi = 5/7 = 0,714286-
P(Keaktifan Organisasi= Tidak | keterangan =“Tidak”)-
P (Keaktifan Organisasi = 3/7 = 0,428571-
P(Etika= Baik | keterangan =“Lulus”)-
P (Etika= 5/7 = 0,714286-
P(Etika= Baik | keterangan =“Tidak”)-
P (Etika= 4/7 = 0,571429-
P(Pembayaran Uang Kuliah= Lancar| keterangan =“Lulus”)-
P (Pembayaran Uang Kuliah= 5/7 = 0,714286-
P(Pembayaran Uang Kuliah= Lancar | keterangan =“Tidak”)-
P (Pembayaran Uang Kuliah= 3/7 = 0,428571 2. Perhitungan Nilai P(X|Ci) Untuk Kelas atau Label-
P(X| Keterangan “Lulus”)= 0,28571× 0,428571 × 0,714286 × 0,714286 × 0,714286
= 0,0446236
-
P(X| Keterangan “Tidak”)= 0 × 0,28571× 0,428571× =,571429× 0,428571
= 0
3. Perhitungan Nilai P(X|Ci ) × P (Ci)
-
(P(X| Keterangan “Lulus”) × P (Keterangan “Lulus”)= (7 /14) × 0,0446236
= 0,022312
-
(P(X| Keterangan “Tidak”) × P (Keterangan “Tidak”)= (7 /14) × 0
= 0
Berdasrkan perhitungan menggunakan metode Naïve Bayes maka hasil dari data baru terhadap data baru dengan nama “Yulia Agustina” mendapakan keterangan nilai terhadap prediksi kegagalan mahasiswa teknik informatika akan mendapatkan nilai “LULUS”.
3.4 Implementasi
Implementasi pada penelitian ini adalah menunjukan cara kerja sistem dimasing-masing penerapan perbandingan kedua metode dalam melakukan prediksi tingkat kelulusan mahasiswa jurusan teknik informatika pada Universitas Budi Darma menggunakan perbandingan hasil dari penggunaan metode K-Nearest Neighbor dan Naïve Bayes menggunakan RapidMiner Versi 9.8.1 .
3.4.1 Implementasi Pengujian Metode K-Nearest Neighbor
Proses yang dilakukan dalam menggunakan aplikasi RapidMiner Versi 9.8.1 adalah membentuk rangkaian pengujian dengan tujuan melihat tingkat akurasi yang terdapat dalam sampel data training dan data uji ketika menggunakan penerapan metode K-nearest Neighbor. Pada pengujian menggunakan K-nearest Neighbor harus ditentukan terlebih dahulu parameter yang diingikan dalam melihat jarak tetangga terdekat, penggunaan parameter pada penelitian ini adalah K-3. Adapun tampilan yang dibangun sebagai berikut ini:
Gambar 2. Urutan Rangkaian Pengujian K-Nearest Neigbhor
Adapun rangkaian dalam pengujian menggunakan metode K-Nearest Neighbor adalah sebagai berikut ini:
1. Siapkan terlebih dahulu data dalam bentuk excel dan lakukan import data dengan membedakan antara kelas dan variable, kelas disebut dengan keputusan akhir terhadap mahasiswa sebelumnya berdasarkan sampel data yang ada, kelas tersebut diberi tanda pengaturan role menjadi “label”, lalu Tarik data yang sudah di import ke dalam
“Blank Process”.
2. Pilih pada operator split data dimana split data berfungsi sebagai penyaring data dimana ditentukan banyaknya jumlah data training dan data uji.
3. Tarik model yang dibutuhkan yaitu model K-NN dapat ditemukan pada kolom operator.
4. Apply model yang digunakan untuk membantu model atau algoritma yang digunakan dapat berjalan dan menghasilkan keputusan
5. Performance classification yang digunakan untuk melihat tingkat akurasi yang dihasilkan oleh metode atau model algoritma yang digunakan, selanjutnya setelah dilakukan sambung semua kabel antara masing-masing item pada blank process
6. Klik tombol proses atau run untuk mendapatkan hasil dari penggunaan metode.
3.4.2 Implementasi Pengujian Metode Naïve Bayes
Pada implemetasi penggunaan naïve bayes dilakukan dengan cara yang sama pada penerapan pembuatan rangkaian sistem metode K-Nearest Neighbor hanya saja pada proses penambahan model metode yang digunakan, pada pengujian menggunakan metode naïve bayes tidak perlu melakukan penyetelan atau menentukan parameternya, karena sistem model berjalan otomatis. Adapun tampilan implementasi perangkaian sistem dengan metode naïve bayes dapat dilihat pada gambar 3 berikut ini:
Gambar 3. Urutan Rangkaian Pengujian Menggunakan Metode Naïve Bayes
3.5 Hasil Pengujian
Hasil pengujian pada penelitian ini merupakan hasil dari penggunaan aplikasi RapidMiner Versi 9.8.1 dalam menyelesaikan permasalahan terhadap prediksi tingkat kelulusan mahasiswa jurusan teknik informatika pada Universitas Budi Darma menggunakan perbandingan hasil dari penggunaan metode K-Nearest Neighbor dan Naïve Bayes.
3.5.1 Hasil Pengujian Metode K-Nearest Neighbor
Hasil yang didapatkan pada penggunaan metode K-Nearest Neighbor dari penggunaan aplikasi RapidMiner Versi 9.8.1 dalam menyelesaikan permasalahan terhadap prediksi tingkat kelulusan mahasiswa jurusan teknik informatika pada Universitas Budi Darma dengan rasio atau split data Training 0,9 dan data Uji sebesar 0,1 sebagai berikut ini:
1. Hasil Dari Applay Model
Applay model menjelaska hasil dari perbadingan pola terhadap data training dan data uji, adapun sebagai berikit ini:
Gambar 4. Hasil Apply Model Metode K-Nearest Neighbor
Hasil keputusan merupakan data awal danprediksi merupakan data yang dihasilkan dari pengujian, pada penujian menyatakan data baru akan memungkinkan mendapatkan keterangan “LULUS” karena kata lulus muncul lebih banyak dari kata tidak pada kolom prediksi, hal tersebut sesuai dengan hasil perhitungan manual menggunakan metode K-Nearest Neighbor.
2. Hasil Performance Metode K-Nearest Neighbor
Pada penggunaan alat performance classification akan menampilkan tingkat akurasi penggunaan metode terhadap sampel data yang telah diuji sebelumnya, adapun tingkat akurasi metode K-Nearest Neighbor dapat dilihat pada gambar 4.4. berikut ini:
Gambar 5. Hasil Tingkat Akurasi Metode K-Nearest Neighbor 3.5.2 Hasil Pengujian Metode Naïve Bayes
Hasil yang didapatkan pada penggunaan metode Naïve Bayes dari penggunaan aplikasi RapidMiner Versi 9.8.1 dalam menyelesaikan permasalahan terhadap prediksi tingkat kelulusan mahasiswa jurusan teknik informatika pada Universitas Budi Darma dengan rasio atau split data Training 0,9 dan data Uji sebesar 0,1 sebagai berikut ini:
1. Hasil Dari Applay Model
Applay model Naïve Bayes menjelaska hasil dari perbadingan pola terhadap data training dan data uji, adapun sebagai berikit ini:
Gambar 6. Hasil Apply Model Metode Naïve Bayes
Hasil keputusan merupakan data awal dan prediksi merupakan data yang dihasilkan dari pengujian, pada penujian menyatakan data baru akan memungkinkan mendapatkan keterangan “LULUS” karena kata lulus muncul lebih banyak dari kata tidak pada kolom prediksi, hal tersebut sesuai dengan hasil perhitungan manual menggunakan metode Naïve Bayes.
2. Hasil Performance Metode K- Naïve Bayes
Pada penggunaan alat performance classification akan menampilkan tingkat akurasi penggunaan metode terhadap sampel data yang telah diuji sebelumnya, adapun tingkat akurasi metode K-Nearest Neighbor dapat dilihat pada gambar 4.4. berikut ini:
Gambar 7. Hasil Tingkat Akurasi Metode Naïve Bayes
4. KESIMPULAN
Berdasarkan penelitian yang dilakukan, maka penulis menarik beberapa kesimpulan dalam memprediksi tingkat kegagalan mahasiswa jurusan teknik informatika pada Universitas Budi Darma sebagai bahwa Prosedur dalam prediksi penyebab tingkat meningkatnya kegagalan mahasiswa jurusan teknik informatika dapat diketahui dengan mudah. Dengan dilakukanya prediski tingkat kegagalan mahasiswa, pihak kampus dapat mengetahui beberapa penyebab dari terjadinya meningkatnya kegagalan mahasiswa jurusan teknik informatik, sehingga kampus dapat melakukan ppembangunan strategi dikemudian harinya untuk mencegah kegagalan yang lebih banyak lagi. Ddalam Penggunaan RapidMiner versi 9.8.1 mempermudah dalam mengakses data dalam waktu yang singkat dan hasil yang sangat akurat.
REFERENCES
[1] A. S. Albahri et al., “Role of biological Data Mining and Machine Learning Techniques in Detecting and Diagnosing the Novel Coronavirus (COVID-19): A Systematic Review,” J. Med. Syst., vol. 44, no. 7, 2020, doi: 10.1007/s10916-020-01582- x.
[2] E. Prasetyo, Data Mining Mengolah Data menjadi Informasi Menggunakan Matlab. Yogyakarta: Andi, 2014.
[3] F. A. Hermawati, Data Mining. Yogyakarta: CV Andi Offset, 2018.
[4] E. Buulolo, Buku Data Mining Untuk Perguruan Tinggi, I. 2020.
[5] M. R. Islam, A. R. M. Kamal, N. Sultana, R. Islam, M. A. Moni, and A. Ulhaq, “Detecting Depression Using K-Nearest Neighbors (KNN) Classification Technique,” Int. Conf. Comput. Commun. Chem. Mater. Electron. Eng. IC4ME2 2018, no.
February, pp. 1–4, 2018, doi: 10.1109/IC4ME2.2018.8465641.
[6] S. Defiyanti, “Integrasi Metode Clustering dan Klasifikasi untuk Data Numerik,” Citee, no. July, pp. 256–261, 2017.
[7] Y. Zhang, G. Cao, B. Wang, and X. Li, “A novel ensemble method for k-nearest neighbor,” Pattern Recognit., vol. 85, pp.
13–25, 2019, doi: 10.1016/j.patcog.2018.08.003.
[8] Z. Wang, Y. Li, D. Li, Z. Zhu, and W. Du, “Entropy and gravitation based dynamic radius nearest neighbor classification for imbalanced problem,” Knowledge-Based Syst., vol. 193, no. xxxx, p. 105474, 2020, doi: 10.1016/j.knosys.2020.105474.
[9] A. E. Woerner et al., “Forensic human identification with targeted microbiome markers using nearest neighbor classification,” Forensic Sci. Int. Genet., vol. 38, pp. 130–139, 2019, doi: 10.1016/j.fsigen.2018.10.003.
[10] M. K. Nasution, R. R. Saedudin, and V. P. Widartha, “Perbandingan Akurasi Algoritma Naïve Bayes Dan Algoritma,” e- Proceeding Eng., vol. 8, no. 5, pp. 9765–9772, 2021.
[11] J. Enterprise, Rahasia Manajemen File. Jakarta: PT. Elex Media Komputindo, 2010.
[12] A. Nugroho, Rekayasa Perangkat Lunak Berorientasi Objek denganMetode USDP. Andi, 2010.