• Tidak ada hasil yang ditemukan

Perbandingan Metode K-Nearest Neighbor dan Support Vector Machine Untuk Memprediksi Penerima Beasiswa Keringanan UKT

N/A
N/A
Protected

Academic year: 2024

Membagikan "Perbandingan Metode K-Nearest Neighbor dan Support Vector Machine Untuk Memprediksi Penerima Beasiswa Keringanan UKT"

Copied!
9
0
0

Teks penuh

(1)

Perbandingan Metode K-Nearest Neighbor dan Support Vector Machine Untuk Memprediksi Penerima Beasiswa Keringanan UKT

Enggar Novianto1,*, Arief Hermawan1, Donny Avianto2

1Magister Teknologi Informasi, Universitas Teknologi Yogyakarta, Sleman, Indonesia

2Fakultas Sains dan Teknologi, Program Studi Informatika, Universitas Teknologi Yogyakarta, Sleman, Indonesia Email: 1,*[email protected], 2[email protected], 3[email protected]

Email Penulis Korespondensi: [email protected]

Abstrak−Beasiswa adalah bantuan finansial yang diberikan kepada individu, pelajar, atau pelajar untuk memperpanjang pendidikan mereka. Ini dapat diberikan oleh lembaga pemerintah atau perguruan tinggi itu sendiri kepada siswa. Salah satu komponen yang memastikan sumber daya manusia yang berkualitas adalah pendidikan formal. Tujuan dari beasiswa adalah untuk membantu mahasiswa yang kurang beruntung atau kurang mampu. Pemberi beasiswa biasanya memberikan beberapa pertimbangan tentang tingkat kesulitan mahasiswa, seperti gaji orang tua dan jumlah saudara. Karena banyaknya permohonan untuk beasiswa keringanan dan kriteria penilaian yang ketat, tidak semua mahasiswa yang mengajukan permohonan dapat diterima. Petugas seleksi pengajuan beasiswa sering mengalami kesulitan dalam menentukan mahasiswa yang layak untuk mendapatkan beasiswa. Sementara kouta penerima beasiswa program studi ini selalu terbatas, pengajuan beasiswa keringanan UKT Mahasiswa terus meningkat setiap semesternya. Pengajuan ini berasal dari mahasiswa dengan kondisi ekonomi yang kurang mampu. Untuk memilih berkas pengajuan beasiswa keringanan UKT harus mempertimbangkan berbagai kriteria dan menggunakan metode manual yang kurang efektif dan membutuhkan waktu yang lebih lama untuk menentukan hasilnya.

Penelitian ini bertujuan untuk melakukan perbandingan antara algoritma klasifikasi K-Nearest Neighbor dan Support Vector Machine dalam menentukan penerima beasiswa keringanan UKT Mahasiswa Program Studi S1 Ilmu Hukum Fakultas Hukum Universitas Sebelas Maret dengan menggunakan aplikasi RapidMiner. Hasil akurasi yang didapat menggunakan aplikasi RapidMiner yang telah dilakukan, metode K-NN menghasilkan akurasi sebesar 92.92%, sedangkan metode SVM menghasilkan akurasi sebesar 85.84%, sehingga metode K-NN menjadi metode yang terbaik dalam klasifikasi untuk memprediksi penerima beasiswa keringanan UKT mahasiswa di program studi S1 Ilmu Hukum.

Kata Kunci: Klasifikasi; SVM; K-NN; Mahasiswa; Beasiswa

Abstract−Scholarships are financial assistance provided to individuals, pupils, or scholars to extend their education. These may be provided by government agencies or the colleges themselves to students. One component that ensures quality human resources is formal education. The purpose of scholarships is to help disadvantaged or underprivileged students. Scholarship providers usually give some consideration to the student's level of difficulty, such as parents' salary and number of siblings.

Due to the large number of applications for relief scholarships and strict assessment criteria, not all students who apply can be accepted. Scholarship application selection officers often have difficulty determining which students are worthy of receiving a scholarship. While the quota for scholarship recipients for this study program is always limited, applications for student UKT relief scholarships continue to increase every semester. This application came from students with poor economic conditions.

To select UKT relief scholarship application documents, you have to consider various criteria and use manual methods which are less effective and require more time to determine the results. This research aims to make a comparison between the K- Nearest Neighbor and Support Vector Machine classification algorithms in determining recipients of UKT relief scholarships for undergraduate students in the Legal Sciences Study Program, Faculty of Law, Sebelas Maret University using the RapidMiner application. The accuracy results obtained using the RapidMiner application that have been carried out, the K-NN method produces an accuracy of 92.92%, while the SVM method produces an accuracy of 85.84%, so the K-NN method is the best method in classification for predicting recipients of UKT relief scholarships for students in the program. Bachelor of Law studies.

Keywords: Classification; SVM; K-NN; Student; Scholarship

1. PENDAHULUAN

Beasiswa adalah bantuan finansial yang diberikan kepada individu, pelajar, atau pelajar untuk memperpanjang pendidikan mereka. Ini dapat diberikan oleh lembaga pemerintah atau perguruan tinggi itu sendiri kepada siswa.

Salah satu komponen yang memastikan sumber daya manusia yang berkualitas adalah pendidikan formal.

Pendidikan harus mendorong peningkatan kualitas sumber daya manusia yang terampil, cerdas, sehat, dan berdaya saing serta memperluas kesempatan bagi mereka yang tidak mampu dan berprestasi akademik di bidang pendidikan. Untuk mencapai tujuan ini, pendidikan harus memfasilitasi pengembangan kecerdasan dan kemampuan berpikir yang diperlukan untuk memanfaatkan dan memanfaatkan sumber daya yang tersedia [1].

Tujuan dari beasiswa adalah untuk membantu mahasiswa yang kurang beruntung atau kurang mampu. Pemberi beasiswa biasanya memberikan beberapa pertimbangan tentang tingkat kesulitan siswa, seperti gaji orang tua dan jumlah saudara. Biaya pendidikan perguruan tinggi dapat menjadi pandangan khusus bagi pemerintah karena mengembangkan sumber daya manusia di Indonesia nyatanya memerlukan biaya yang besar [2]. Mahasiswa yang orang tuanya tidak mampu membayar biaya pendidikan mereka menerima bantuan biaya pendidikan [3].

Selain prestasi akademik mahasiswa, faktor ekonomi juga memainkan peran penting dalam keberhasilan pendidikan mereka di perguruan tinggi. Di Indonesia, salah satu hambatan terbesar bagi siswa untuk menyelesaikan pendidikan mereka, terutama di perguruan tinggi swasta yang tidak dikelola pemerintah. Oleh

(2)

karena itu, untuk membantu para pelajar, lembaga seperti pemerintah, perusahaan, atau yayasan harus memberikan beasiswa [4]. Universitas, sebagai institusi pendidikan tinggi, memberikan informasi tentang beasiswa kepada siswanya untuk membantu pemerintah menjalankan tujuan Undang-Undang Dasar Negara Indonesia, yaitu untuk mencerdaskan kehidupan bangsa dan mengurangi jumlah mahasiswa yang gagal sekolah atau putus sekolah karena masalah ekonomi [5]. Pendidikan sangat penting untuk menciptakan sumber daya manusia yang berkualitas, karena tanpanya pembangunan dapat terhambat. Oleh karena itu, pendidikan harus berkualitas dan dapat menyesuaikan diri dengan zaman [6].

Program studi S1 Ilmu Hukum merupakan salah satu program studi yang terdapat di lingkungan kampus Universitas Sebelas Maret. Sampai saat ini jumlah mahasiswa aktif program studi S1 Ilmu Hukum mencapai kurang lebih 2000 mahasiswa aktif. Dalam setiap semester tidak sedikit mahasiswa yang mengajukan beasiswa keringanan UKT (Uang Kuliah Tunggal). Bagian kemahasiswaan dan alumni Fakultas Hukum Universitas Sebelas Maret kesulitan dalam menentukan data mahasiswa yang mengajukan keringanan beasiswa keringanan UKT.

Karena banyaknya permohonan untuk beasiswa keringanan dan kriteria penilaian yang ketat, tidak semua mahasiswa yang mengajukan permohonan dapat diterima [7]. Petugas seleksi pengajuan beasiswa sering mengalami kesulitan dalam menentukan mahasiswa yang layak untuk mendapatkan beasiswa [8].

Sementara kouta penerima beasiswa program studi ini selalu terbatas, pengajuan beasiswa keringanan UKT Mahasiswa terus meningkat setiap semesternya. Pengajuan ini berasal dari mahasiswa dengan kondisi ekonomi yang kurang mampu. Untuk memilih berkas pengajuan beasiswa keringanan UKT, harus mempertimbangkan berbagai kriteria dan menggunakan metode manual yang kurang efektif dan membutuhkan waktu yang lebih lama untuk menentukan hasilnya [9].

Dari permasalahan yang ada, penelitian ini melakukan perbandingan dua metode klasifikasi untuk mendapatkan hasil akurasi yang terbaik dalam memprediksi penerima beasiswa keringanan UKT Mahasiswa. Data bantuan beasiswa harus diklasifikasikan untuk mengetahui hasil seleksi bantuan beasiswa ini [10]. Teknik klasifikasi dalam data mining adalah proses menempatkan atau memilih fitur dan parameter yang tepat untuk dataset yang akan diklasifikasikan untuk meningkatkan akurasi proses perhitungan [11].

Algoritma K-NN digunakan untuk klasifikasi data mining berdasarkan kedekatan terhadap objek baru atau tetangga terdekat. K-NN adalah salah satu algoritma yang dapat menyelesaikan masalah data mining. Dalam algoritma K-NN, banyaknya tetangga terdekat (K) memengaruhi proses pengambilan keputusan. K-NN sendiri merupakan bagian dari algoritma terpelajar (supervised learning) di mana dataset harus memiliki target atau kelas.

Penentuan nilai K pada algoritma K-NN didasarkan pada perhitungan nilai euclidean distance [12]. Algoritma SVM pertama kali dibuat pada tahun 1992 dan masih banyak digunakan saat ini untuk melakukan klasifikasi. Ini adalah algoritma pembelajaran supervised yang digunakan untuk melakukan klasifikasi dengan membedakan antara kelas positif, negative, dan netral [13]. Proses klasifikasi penerimaan beasiswa keringanan UKT Mahasiswa dengan menggunakan algoritma K-NN dan SVM diharapkan menjadi solusi dalam mengklasifikasikan status penerima beasiswa keringanan UKT.

Penelitian sebelumnya tentang klasifikasi penerima beasiswa pernah dilakukan. Penelitian yang dilakukan [4] Tujuan dari penelitian ini adalah untuk menggunakan model algoritma k-Nearest Neighbor (kNN) untuk menganalisis, memprediksi, dan mengklasifikasikan siswa yang berpotensi menerima beasiswa perguruan tinggi.

Hasil simulasi model prediksi menunjukkan bahwa faktor penentu data latih dari berbagai variasi nilai dan jumlah dapat meningkatkan kinerja algoritma k-NN sebesar 95,83 persen dalam memprediksi.

Penelitian lainnya [1] Penelitian ini menggunakan metode eksperimen yang didasarkan pada kerangka kerja. Hasil penelitian menunjukkan bahwa nilai akurasi K-Nearest Neighbor sebesar 85,78% dengan jumlah parameter K sebanyak 6, yaitu 1, 3, 5, 7, 9, 10 dan jumlah data sebanyak 254 data dengan 14 atribut. K-Nearest Neighbor yang menggunakan metode seleksi atribut Chi Square lebih akurat dan efektif dalam klasifikasi penerima beasiswa daripada K-Nearest Neighbor yang menggunakan metode seleksi atribut Chi Square.

Penelitian selanjutnya menggunakan algoritma klasifikasi penerima beasiswa K-Nearest Neighbor (KNN).

Tujuan dari penelitian ini adalah untuk membantu proses seleksi beasiswa di SMA dengan membuat penerima beasiswa tepat sasaran. Algoritma KNN dapat memberikan informasi dan data yang diperlukan untuk memilih penerima beasiswa. Hasil penelitian menunjukkan bahwa 30 individu dipilih dari 89 data klasifikasi. Sistem diuji dengan pengujian akurasi metode confusion matrix dengan hasil 90.5%. Ini menunjukkan bahwa algoritma KNN dapat digunakan untuk mengklasifikasikan seleksi penerimaan beasiswa [14].

Algoritma klasifikasi perbandingan tida digunakan dalam penelitian tambahan. Penelitian ini membandingkan tiga atau tiga algoritma klasifikasi untuk membantu menentukan prediksi siswa yang akan menerima beasiswa, sehingga sekolah dapat dengan mudah menentukan data siswa mana yang akan diajukan.

Tujuan dari membandingkan algoritma Naive Bayes, Random Forest, dan SVM adalah untuk menentukan algoritma mana yang memiliki akurasi yang paling tinggi. Berdasarkan penelitian sebelumnya, tiga algoritma ini adalah yang paling sering digunakan dalam penelitian jenis ini. Dari tiga algoritma tersebut, algoritma Random Forest memiliki nilai akurasi tertinggi, sebesar 75%; algoritma K-NN memiliki nilai akurasi sebesar 59%, dan algoritma Naive Bayes memiliki nilai akurasi terendah, sebesar 55% [7].

Penelitian yang dilakukan oleh [15] Penelitian ini bertujuan untuk mengetahui hasil klasifikasi keakuratan pemberian beasiswa mahasiswa melalui penggunaan data mining algoritma KNN. Hasil penelitian mengklasifikasikan beasiswa: 19 siswa yang layak dan 49 siswa yang tidak layak.

(3)

Pada penelitian ini mencoba melakukan klasifikasi data pengajuan beasiswa keringanan dengan menggunakan perbandingan algoritma antara K-NN dan SVM. Tujuan penelitian ini adalah untuk membandingkan nilai akurasi yang terbaik pada algoritma K-Nearest Neighbor dengan menggunakan nilai K-3 dan Support Vector Machine dalam mengklasifikasi pengajuan beasiswa keringanan. Penelitian ini dapat berkontribusi untuk membantu staff bagian akademik dan kemahasiswaan dalam melakukan seleksi bagi mahasiswa yang mengajukan beasiswa keringanan mahasiswa di Program Studi S1 Ilmu Hukum Fakultas Hukum Universitas Sebelas Maret Surakarta.

Hasil penelitian ini juga diharapkan dapat memberikan rekomendasi kepada bagian staff akademik dan kemahasiswaan dalam menentukan dan memprediksi mahasiswa yang layak mendapatkan disetujui atau ditolak dalam proses pengajuan beasiswa keringanan UKT mahasiswa dengan menggunakan algoritma K-NN dengan nilai K= 3 dan dibandingkan dengan metode SVM berdasarkan hasil kinerja akurasi yang terbaik.

2. METODOLOGI PENELITIAN

2.1 Tahapan Penelitian

Penelitian ini memasukkan jenis penelitian kuantitatif, yang merupakan proses menemukan pengetahuan dengan menggunakan data angka untuk menganalisis detail tentang apa yang ingin diketahui [16]. Dalam melakukan penelitian, diperlukan beberapa tahapan yang harus dilakukan. Tahapan-tahapan ini dilakukan untuk membuat penelitian lebih terstruktur dan terlaksana dengan baik. Adapun tahapan-tahapan pada penelitian ini dapat dilihat pada Gambar 1

Gambar 1. Alur Penelitian

Tahapan penelitian ini dapat dilihat pada Gambar 1 yang diawali dengan melakukan studi literatur dengan mencari referensi pada jurnal nasional dan internasional. Selanjutnya melakukan pengumpulan data dengan cara melakukan wawancara pada staff akademik dan kemahasiswaan. Pengambilan data menggunakan sistem informasi akademik. Tahapan selanjutnya melakukan pemrosesan data untuk menyeleksi atribut serta menghapus data yang kosong, selanjutnya melakukan pemodelan klasifikasi dengan metode algoritma K-NN dan SVM. Tahap akhir pada alur penelitian ini adalah mengetahui hasil akurasi yang terbaik dan membandingkan kedua hasil akurasi tersebut.

2.2 Studi Literatur

Studi literatur pada penelitian ini dilakukan dengan mencari referensi di berbagai jurnal dan prosiding. Referensi yang dipilih merupakan untuk mendukung penelitian ini yang berkaitan dengan teori bidang data mining dengan menggunakan algoritma perbandingan klasifikasi K-Nearest Neighbor dan Support Vector Machine.

2.3 Pengumpulan Data

Metodologi pengumpulan data yang digunakan pada penelitian ini adalah dengan observasi secara langsung serta melakukan wawancara dengan bagian staff kemahasiswaan dan alumni. Penelitian ini menggunakan data dari Bagian Kemahasiswaan dan Alumni program studi S1 Ilmu Hukum yang mengajukan keringanan UKT pada tahun 2022 – 2023.

2.4 Klasifikasi

Klasifikasi adalah proses mensurvei objek informasi untuk memasukkannya ke dalam kelas tertentu dari jumlah kelas yang dapat diakses. Tugas klasifikasi adalah merencanakan dan mengajar kemampuan tertentu dengan menghubungkan setiap set fitur atau tanda ke nomor tanda kelas yang dapat diakses. Struktur klasifikasi harus dapat menggambarkan secara efektif semua indeks informasi; namun, eksekusi struktur tidak dapat 100% akurat, sehingga situasi klasifikasi juga harus mengukur presentasinya. Estimasi eksekusi klasifikasi biasanya dibuat

(4)

dengan kisi-kisi yang tidak teratur. [17]. Setelah analisis relevansi, klasifikasi dapat dilakukan. Tujuan dari analisis ini adalah untuk menemukan fitur yang terkait dengan proses. Tabel 1 menunjukkan tingkat ketepatan prediksi pengklasifikasi [18].

Tabel 1. Confusion Matrix

Prediksi (+) Prediksi (-) Aktual (+) TP (True Positives) FN (False Negatives) Aktual (-) FP (False Positives) TN (True Negatives) Keterangan :

TP : Jumlah data positif yang telah terklasifikasi dengan benar oleh sistem FP : Jumlah data positif telah diklasifikasikan secara salah oleh sistem TN : Jumlah data negatif yang terklasifikasi dengan benar oleh sistem FN : Jumlah data negative yang telah diklasifikasikan secara salah oleh sistem

Kinerja klasifikasi bisa di evaluasi dengan memperhatikan ukuran-ukuran sebagai berikut : 1. Accuracy

Akurasi adalah ukuran untuk mengukur ketepatan prediksi pengklasifikasi pada kelas tertentu. Rumus untuk menghitung akurasi klasifikasi sesuai persamaan sebagai berikut :

Accuracy : TP+TN

TP+TN+FP+FN (1)

2. Precision

Precision adalah ukuran untuk mengukur ketepatan prediksi pengklasifikasi pada kelas tertentu. Rumus untuk menghitung precision klasifikasi sesuai persamaan sebagai berikut :

Precision : TP+FPTP (2)

3. Recall

Recall adalah ukuran mengukur berapa banyak data dari kelas tertentu yang dapat diprediksikan secara benar.

Rumus untuk menghitung recall klasifikasi sebagai berikut :

Recall : TP

TP+FN (3)

2.5 Klasifikasi Dengan K-Nearest Neighbor

Dalam penelitian ini, data diklasifikasikan menggunakan algoritma K-Nearest Neighbor, algoritma k-NN yang bertujuan untuk mengklasifikasikan objek baru berdasarkan karakteristiknya dan menentukan nilai jarak pengujian data dengan data pelatihan berdasarkan nilai terkecil dari nilai ketetanggaan terdekat. Klasifikasi ketetanggaan digunakan untuk menghitung nilai prediksi sampel uji baru. [19]. Ide dasar K-NN adalah menemukan jarak terpendek antara data yang perlu dievaluasi dengan terdekatnya. Nilai jarak data pengujian dan pelatihan diurutkan sesuai dengan nilai terendah [20]. Algoritma K-NN selalu dimulai dengan mencari nilai K. Kemudian, penghitungan dilakukan pada data eksperimen dan data uji. Metode Pencarian Kasus Terdekat (Nearest Neighbor Method) menghitung jarak antara kasus baru dan kasus lama dengan menggunakan pencocokan bobot dari sejumlah fitur yang mungkin dari K-Nearest Neighbor (K-NN). Metode ini mencakup kelompok pembelajaran berbasis kasus. [12]. Kelas yang paling sering ditampilkan adalah kelas yang diperoleh dari hasil klasifikasi.

Kedekatan didefinisikan dalam jarak metrik, seperti jarak Euclidean [21].

Dx,y = √∑𝑛𝑖=1(𝑥𝑖− 𝑦𝑖)2 (4)

Keterangan : D = Jarak kedekata X = data training y = data testing

n = jumlah atribut individu antara 1 s.d n I = atribut individu antara 1 s.d n

2.6 Klasifikasi Dengan Support Vector Machine

Pada penelitian ini mengklasifikasikan dengan perbandingan algoritma pada data mining yaitu Support Vector Machine. Sistem pembelajaran Support Vector Machine (SVM) dilatih dengan algoritma pembelajaran yang didasarkan pada teori optimasi dan menerapkan learning biasa yang berasal dari teori pembelajaran statistik. Ruang hipotesis, yang terdiri dari fungsi-fungsi linear dalam ruang fitur yang luas, digunakan untuk mengklasifikasikannya [21]. SVM dapat digunakan untuk klasifikasi. Kernelisasi adalah proses mengubah data dari bentuk non-linier menjadi linier. Fungsi kernel mendefinisikan fitur data dari sudut pandang terendah hingga sudut pandang yang lebih luas. Dalam Support Vector Machine (SVM), ada banyak kernel, termasuk kernel linear,

(5)

kernel polynomial, kernel Gaussian Radial Basis Function (RBF), dan kernel sigmoid [22]. Konsep klasifikasi SVM adalah mencari hyperlane terbaik yang memiliki fungsi sebagai pemisah dari dua kelas data, opini positif dan opini negative. Persamaan SVM seperti pada rumus [23] :

w.x + b = 0 (5)

dengan :

w = parameter hyperlane yang dicari (garis yang tegak lurus antara garis hyper plane dan titik support vector) x = titik data masukan Support Vector Machine

b = parameter hyperlane yang dicari (nilai bias)

3. HASIL DAN PEMBAHASAN

3.1 Data Beasiswa Keringanan UKT

Penelitian ini menggunakan data dari Bagian Kemahasiswaan dan Alumni Fakultas Hukum Universitas Sebelas Maret. Data yang digunakan yaitu data mahasiswa yang mengajukan beasiswa keringanan UKT pada program studi S1 Ilmu Hukum pada tahun 2022 dan 2023 yang berjumlah 162 data. Atribut yang digunakan yaitu NIM, Tahun Pengajuan, Tarif UKT, Pekerjaan Orang Tua, Penghasilan, Tanggungan, dan Status Keringanan. Data yang digunakan dengan format xls Microsoft Excel. Data yang digunakan dapat dilihat pada Tabel 2.

Tabel 2. Data Ajuan Keringanan UKT No NIM Tahun

Pengajuan

Tarif UKT

Pekerjaan

orang Tua Penghasilan Tanggungan Status Keringanan

1 21199 2023 3.725.500 PNS Sedang 2 Ditolak

2 22140 2023 3.725.500 Karyawan

Swasta Sedang 2 Disetujui

3 22296 2023 3.725.500 Karyawan

swasta Sedang 4 Disetujui

4 22443 2023 3.725.500 Karyawan

swasta Tinggi 2 Ditolak

5 22376 2023 3.725.500 Karyawan

swata Sedang 2 Disetujui

6 22295 2023 3.725.500 Karyawan

Swasta Rendah 3 Disetujui

….. ….. ….. ….. ….. ….. ….. …..

….. ….. ….. ….. ….. ….. ….. …..

159 16148 2022 4.000.000 Wiraswasta Rendah 3 Disetujui

160 20118 2022 4.975.500 Wiraswasta Sedang 3 Ditolak

161 19327 2022 5.000.000 Wiraswasta Rendah 3 Disetujui

162 19036 2022 6.250.000 Wirasawasta Tinggi 1 Ditolak

Pada data yang digunakan dalam penelitian ini, memiliki jumlah 162 data secara keseluruhan yang terbagi menjadi 70% data latih dan 30% data uji. Data ajuan keringanan UKT memiliki 7 atribut yang digunakan sebagai variabel dan label kelas. Adapun setiap variabel data memiliki tipe data yang berbeda. Variabel NIM merupakan nomor identtitas setiap mahasiswa yang memiliki tipe data integer, variabel tahun pengajuan merupakan tahun ajuan yang diajukan oleh mahasiswa yang memiliki data memiliki tipe data integer, variabel tarif ukt merupakan besaran ukt yang dimiliki oleh setiap mahasiswa dan memiliki tipe data polynominal, variabel penghasilan merupakan kategori penghasilan yang dimiliki oleh kedua orang tua mahasiswa yang memiliki tipe polynominal, variabel tanggungan yang merupakan jumlah tanggungan dalam keluarga serta memiliki tipe data integer dan status yang berisikan kelas ditolak dan disetujui dengan tipe data polynominal. Adapaun variabel dan atribut data dapat dilihat pada Tabel 3.

Tabel 3. Variabel dan Tipe Data No Variabel Tipe Data

1 NIM Integer

2 Tahun Pengajuan Integer

3 Tarif UKT Polynominal

4 Pekerjaan Orang Tua Polynominal 5 Penghasilan Polynominal

6 Tanggungan Integer

7 Status Keringanan Polynominal

(6)

3.2 Model Proses Klasifikasi K-NN

Untuk mengetahui seorang mahasiswa S1 akan mendapatkan persetujuan atau ditolak dalam mengajukan beasiswa keringanan UKT, penelitian ini membandingkan algoritma klasifikasi dengan menggunakan aplikasi RapidMiner.

Proses model K-NN dapat dilihat pada Gambar 3.

Gambar 2. Model Proses K-NN

Pada Gambar 2 proses model K-NN. Retrieve data beasiswa keringanan UKT digunakan untuk membuat data yang berupa format xlxs Microsoft Excel. K-NN algoritma yang akan dilakukan pengujian nilai akurasi.

Apply Model digunakan untuk menghubungkan algoritma K-NN, sedangkan Performance digunakan untuk mendapatkan nilai akurasi dari model K-NN dan Split Data untuk membagi data latih dan data uji.

3.3 Hasil Model K-NN Dengan Confusion Matrix

Setelah dilakukan pembuataan model proses K-NN dengan menggunakan RapidMiner, maka didapatkan hasil akurasi dengan confusion matrix algoritma K-NN yang dapat dilihat pada Tabel 4.

Tabel 4. Confusion Matrix K-NN

Prediksi Aktual

Positif Negatif

Positif 51 8

Negatif 0 54

Akurasi : 92.92%, Klasifikasi Error : 7.08%

Perhitungan nilai hasil akurasi dengan menggunakan Confusion Matrix adalah sebagai berikut ini [24].

Accuracy = TP+TN

TP+TN+FP+FN+ 51+54

51+8+0+54+ 105

113= 0,9292 = 92.92%.

Sedangkan untuk contoh hasil klasifikasi dengan metode K-NN dapat dilihat pada Tabel 5.

Tabel 5. Hasil Klasifikasi K-NN

NIM Tahun

Pengajuan Tarif UKT Pekerjaan Orang

Tua Penghasilan Tanggungan Status Keringanan

Confidence Ditolak

Confidence

Disetujui Prediction

22443 2023 3.725.500 Karyawan

Swasta Tinggi 2 Ditolak 0.916 0.084 Ditolak 18266 2023 6.250.000 PNS Tinggi 1 Ditolak 0.566 0.434 Ditolak 20359 2023 6.250.000 Karyawan

Swasta Sedang 3 Dsietujui 0 1 Disetujui

20424 2023 6.250.000 Petani Rendah 2 Disetujui 0.500 0.500 Ditolak 20459 2023 6.250.000 Karyawan

Swasta Sedang 1 Disetujui 0.219 0.781 Disetujui 20011 2023 6.225.500 Petani Rendah 2 Disetujui 0.129 0.871 Disetujui 20406 2023 6.225.500 Petani Rendah 2 Disetujui 0.500 0.500 Disetujui 20051 2023 6.225.500 Pedagang Rendah 2 Disetujui 0 1 Disetujui 20394 2023 5.600.500 Wiraswasta Sedang 2 Disetujui 0 1 Disetujui 3.4 Model Proses Klasifikasi SVM

Untuk mengetahui seorang mahasiswa S1 akan mendapatkan persetujuan atau ditolak dalam mengajukan beasiswa keringanan UKT, penelitian ini membandingkan algoritma klasifikasi dengan menggunakan aplikasi RapidMiner.

Proses model SVM dapat dilihat pada Gambar 3.

Gambar 3. Model Proses SVM

(7)

Pada Gambar 3 proses model SVM. Retrieve data beasiswa keringanan UKT digunakan untuk membuat data yang berupa format xlxs Microsoft Excel. SVM algoritma yang akan dilakukan pengujian nilai akurasi. Apply Model digunakan untuk menghubungkan algoritma SVM, sedangkan Performance digunakan untuk mendapatkan nilai akurasi dari model K-NN, Nominal to Numerical digunakan untuk mengubah tipe atribut nonnumerik menjadi numerik dan Split Data untuk membagi data latih dan data uji.

3.5 Hasil Model SVM Dengan Confusion Matrix

Setelah dilakukan pembuataan model proses K-NN dengan menggunakan RapidMiner, maka didapatkan hasil akurasi dengan confusion matrix algoritma K-NN yang dapat dilihat pada Tabel 6.

Tabel 6. Confusion Matrix SVM

Prediksi Aktual

Positif Negatif

Positif 40 5

Negatif 11 57

Akurasi : 85.84%, Klasifikasi Error : 14.16%

Perhitungan nilai hasil akurasi dengan menggunakan Confusion Matrix adalah sebagai berikut ini [24].

Accuracy = TP+TN

TP+TN+FP+FN+ 40+57

40+5+11+57+ 97

113= 0,8584 = 85.84%.

Sedangkan untuk contoh hasil klasifikasi dengan metode SVM dapat dilihat pada Tabel 7.

Tabel 7. Hasil Klasifikasi SVM

NIM Tahun

Pengajuan Tarif UKT Pekerjaan Orang

Tua Penghasilan Tanggungan Status Keringanan

Confidence Ditolak

Confidence

Disetujui Prediction

22443 2023 3.725.500 Karyawan

Swasta Tinggi 2 Ditolak 0.731 0.269 Ditolak 18266 2023 6.250.000 PNS Tinggi 1 Ditolak 0.687 0.313 Ditolak 20359 2023 6.250.000 Karyawan

Swasta Sedang 3 Dsietujui 0.269 0.731 Disetujui 20424 2023 6.250.000 Petani Rendah 2 Disetujui 0.269 3.731 Disetujui 20459 2023 6.250.000 Karyawan

Swasta Sedang 1 Disetujui 0.269 0.731 Disetujui 20011 2023 6.225.500 Petani Rendah 2 Disetujui 0.269 0.731 Disetujui 20406 2023 6.225.500 Petani Rendah 2 Disetujui 0.394 0.606 Disetujui 20051 2023 6.225.500 Pedagang Rendah 2 Disetujui 0.263 0.737 Disetujui 20394 2023 5.600.500 Wiraswasta Sedang 2 Disetujui 0.262 0.738 Disetujui 3.6 Hasil Perbandingan Algoritma K-NN Dan SVM

Berdasarkan hasil pengujian perbandingan akurasi kedua algoritma yaitu K-Nearest Neighbor dan Support Vector Machine, maka didapatkan perbandingan akurasi yang dapa dilihat pada Tabel 8 dan Gambar 4.

Tabel 8. Perbandingan Akurasi No Algoritma Akurasi

1 K-NN 92.92%

2 SVM 85.84%

Gambar 4. Perbandingan Akurasi 82,00%

84,00%

86,00%

88,00%

90,00%

92,00%

94,00%

Hasil Akurasi K-NN SVM

(8)

4. KESIMPULAN

Penelitian ini untuk mengklasifikasi prediksi penerima beasiswa keringanan Uang Kuliah Tunggal (UKT) mahasiswa dengan membandingkan 2 metode yaitu K-NN dan SVM. Variabel data yang digunakan untuk klasifikasi terdiri dari NIM, Tahun Pengajuan, Tarif UKT, Pekerjaan Orang Tua, Penghasilan, Jumlah Tanggungan dan Status Keringanan. Hasil akurasi yang didapat menggunakan aplikasi RapidMiner yang telah dilakukan, metode K-NN menghasilkan akurasi sebesar 92.92%, sedangkan metode SVM menghasilkan akurasi sebesar 85.84%. sehingga metode K-NN menjadi metode yang terbaik dalam klasifikasi memprediksi penerima beasiswa keringanan UKT mahasiswa di program studi S1 Ilmu Hukum. Penelitian yang dilakukan ini hanya sebatas pada data yang tidak terlalu besar, sehingga untuk penelitian yang akan dikembangkan selanjutnya dapat menggunakan data dan variabel dengan jumlah yang besar untuk menghasilkan nilai akurasi yang lebih tinggi dan akurat dengan menggunakan algoritma klasifikasi lainnya dan dengan menggunakan teknik SMOTE untuk menyimbangkan dataset.

REFERENCES

[1] H. Hamsir Saleh, "K-Nearest Neighbor Berbasis Seleksi Atribut Chi Square Untuk Klasifikasi Penerima Beasiswa Kurang Mampu," Jurnal SIMETRIS, pp. 1-10, 2023.

[2] H. F. Muhamamd Riyyan, "Perbandingan Algoritme Naive Bayes Dan KNN Terhadap Data Penerimaan Beasiswa (Studi Kasus Lembaga Beasiswa Baznas Jabar)," JIRE (Jurnal Informatika & Rekayasa Elektronika), vol. 5, no. 1, pp. 1-9, 2022.

[3] W. B. P. A. Fakhriyani, "Perbandingan Algoritma Naive Bayes Dan Support Vector Machine Dalam Seleksi Kelulusan Pemberkasan Beasiswa BPP-PPA Fakultas Teknik Universitas Negeri Jakarta," JURNAL PINTER, vol. 2, no. 2, pp. 108- 115, 2018.

[4] E. A. H. L. H. W. a. W. S. D Kurniadi, "The Prediction of Scholarship recipients in higher education using k-Nearest neighbor algorithm," in IOP Conference Series: Materials Science and Engineering, Bandung, Indonesia, 2018.

[5] A. K. Putri, "Perilaku Pencarian Informasi Beasiswa Mahasiswa Fakultas Ilmu Budaya Universitas Diponegoro Melalui Media Online," JIPI (Jurnal Ilmu Perpustakaan dan Informasi), vol. 6, no. 2, pp. 259-273, 2021.

[6] S. N. H. S. Okta Misro'i, "Pengaruh Beasiswa KIP Kuliah terhadap Motivasi Beprestasi Mahasiswa Jurusan PIPS FKIP Universitas Riau," Jurnal Pendidikan dan Konseling, vol. 4, no. 6, pp. 6666-6672, 2022.

[7] E. S. N. T. B. K. Nanda Tri Haryati, "Klasifikasi Pemberian Beasiswa Beprestasi Menggunakan Perbandingan Tiga Algoritma," Jurnal TEKNO KOMPAK, vol. 17, no. 1, pp. 54-66, 2023.

[8] N. H. E. S. Caesaradi Rama Raharya, "Penentuan Penerimaan Beasiswa Menggunakan Metode Modified K-Nearest Neighbor," Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 11, pp. 4984-4990, 2018.

[9] J. S. and T. R. T. P. Nugraha, "Prediksi Penerima Beasiswa Menggunakan Algoritma C4.5 (Studi Kasus : Universitas Peradaban)," Indonesian Journal of Informatics and Research, vol. 1, no. 1, pp. 36-42, 2020.

[10] R. U. M. D. Ikrimatul Wilda Lorenza, "Klasifikasi Penerima Bantuan Beasiswa Menggunakan Algoritma K-Nearest Neighbour Dengan Seleksi Fitur Backward Elimination," JASIE "Jurnal Aplikasi Sistem Informasi dan Elektronika", vol. 3, no. 1, pp. 26-31, 2021.

[11] I. B. Ari Sudrajat, "Analisis Kinerja Algoritma Support Vector Machine (SVM) Pada Data Seleksi Penerima Beasiswa Menggunakan Particle Swarm Optimization (PSO) (Studi Kasus : Politeknik TEDC Bandung)," Jurnal TEDC, vol. 13, no. 1, pp. 1-11, 2019.

[12] K. H. Pajar Pahrudin, "Penerapan Algoritma K-Nearest Neighbor Uuntuk Klasifikasi Warga Penerima Bantuan Sosial,"

Building of Informatics, Technology and Science (BITS), vol. 4, no. 3, pp. 1241-1245, 2022.

[13] R. N. Ikhsani and F. F. Abdulloh, "Optimasi SVM dan Decision Tree Menggunakan SMOTE Untuk Mengklasifikasi Sentimen Masyarakat Mengenai Pinjaman Online," Jurnal Media Informatika Budidarma, vol. 7, no. 4, pp. 1667-1677, 2023.

[14] T. H. R. P. T. A. Saifur Rohman Cholil, "Implementasi Algoritma Klasifikasi K-Nearest Neighbor (KNN) Untuk Klasifikasi Seleksi Penerima Beasiswa," IJCIT (Indonesian Journal on Computer and Information Technology), vol. 6, no. 2, pp. 118-127, 2021.

[15] M. M. M. T. B. B. E. L. Bosker Sinaga, "Classification Of Student Scholarship Accurate Classification Using The K Nearest Neighbor Algorithm," JURNAL INFOKUM, vol. 10, no. 5, pp. 999-1005, 2022.

[16] N. M. D. R. Mohammad Mastur Alfitri, "Evaluasi Performa Algoritma Naive Bayes Dalam Mengklasifikasi Penerimaan Bantuan Pangan Non Tunai," Jurnal Media Informatika Budidarma, vol. 7, no. 3, pp. 1433-1445, 2023.

[17] S. L. S. R. Baskoro, "Prediksi Penerima Beasiswa dengan Menggunakan Teknik Data Mining di Universitas Muhammadiyah Pringsewu," in Seminar Nasional Hasil Penelitian dan Pengabdian Masyarakat, Lampung, 2021.

[18] A. H. Yunial, "Analisa Perbandingan Algoritma Klasifikasi Support Vector Machine, Decession Tree Dan Naive Bayes,"

in Prosiding Seminar Nasional Informatika dan Sistem Informasi, Tangerang, Indonesia, 2020.

[19] I. S. E. Z. Hilda Nur Zerlinda, "Klasifikasi Calon Penerima Bidikmisi Dengan Menggunakan Algoritma K-Nearest Neighbor," in Seminar Nasional Penelitian Pendidikan Matematika (SNP2M) 2019 UMT, Tangerang, 2019.

[20] S. S. H. F. N. Dinda Safitri, "Analisis Penggunaan Algoritma Klasifikasi Dalam Prediksi Kelulusan Menggunakan Orange Data Mining," RABIT : Jurnal Teknologi dan Sistem Informasi Univrab, vol. 8, no. 1, pp. 75-81, 2023.

[21] R. A. S. A. R. A. W. E. P. M. N. W. Safitri Linawati, "Perbandingan Algoritma Klasifikasi Naive Bayes Dan SVM Pada Studi Kasus Pemberian Penerima Beasiswa PPA," JURNAL SWABUMI, vol. 8, no. 1, pp. 71-75, 2020.

[22] R. Rian Oktafiani, "Perbandingan Algoritma Support Vector Machine (SVM) dan Decision Tree Untuk Sistem Rekomendasi Tempat Wisata," Jurnal Nasional Teknologi dan Sistem Informasi, vol. 9, no. 2, pp. 113-121, 2023.

[23] S. Y. Pangestu, Y. Astuti and L. D. Farida, "Algoritma Support Vector Machine Untuk Klasifikasi Sikap Politik Terhadap Partai Politik Indonesia," Jurnal Mantik Penusa, vol. 3, no. 1, pp. 236-241, 2019.

(9)

[24] I. E. P. P. A. P. N. W. Agus Budiyantara, "Komparasi Algoritma Decision Tree, Naive Bayes Dan K-Nearest Neighbor Untuk Memprediksi Mahasiswa Lulus Tepat Waktu," Jurnal Ilmu Pengetahuan Dan Teknologi Komputer, vol. 5, no. 2, pp. 265-270, 2020.

Referensi

Dokumen terkait

Disamping itu ada menu Hybrid SVM-KNN yang akan digunakan end-user untuk menentukan layak atau tidaknya nasabah dengan jumlah data test yang banyak (lebih dari satu)

Puji syukur saya panjatkan kehadirat Allah SWT, yang telah memberikan rahmat dan hidayah-Nya serta segala sesuatunya dalam hidup, sehingga saya dapat menyelesaikan

Hasil database digunakan untuk melakukan pengujian sistem pada tahap proses data uji yang kemudian diklasifikasikan menggunakan K-NN dengan mencari parameter terbaik pada jenis

Penelitian ini akan melakukan perbandingan dua algoritma yaitu Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN) pada sentimen analisis opini masyarakat

Peneropongan telur atau disebut juga dengan istilah candling adalah kegiatan penyortiran telur dengan cara memberikan cahaya pada telur dalam ruangan gelap untuk

Dari semua hasil data testing dengan periode 6 bulan bahwa algoritma yang memiliki accuracy, precision, dan recall dengan jumlah paling tinggi adalah algoritma Support

Simpulan Hasil penelitian klasifikasi citra daun herbal menggunakan perbandingan metode KNN dan SVM dengan ekstraksi fitur fourier descriptor, metode KNN menghasilkan akurasi 96%,

5 Kesimpulan Berdasarkan hasil penelitian dan pengujian yang dilakukan pada penerapan algoritma optimasi Binary Dragonfly Algorthm BDA, algoritma klasifikasi K-Nearest Neighbor KNN