JURNAL DATA SCIENCE & INFORMATIKA (JDSI)
Vol. 1 No. 1 (Juli 2021) p.11-15 ISSN Media Elektronik: xxx-xxxx
Klasifikasi Penerima Beasiswa Dengan Menggunakan Algoritma K Nearest Neighbor
Aria Pratama1, Farid Ali Ma’ruf2 Iin3 Ade Rizki Rinaldi4 Faturrhohman5
1Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon
2Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon
3Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon
4Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon
5Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon
1[email protected]*, 2[email protected]
Abstract
Scholarships are tuition assistance that greatly helps the achievement of students and students. Scholarships include, among other things, scholarships to increase the value of subjects given to outstanding students.
Plandakan 2 Elementary School has many students with the existence of an educational scholarship program, the interest of students to get a scholarship is very high. This can affect the principal's decision in determining the recipient of the scholarship. The data will be used 383 Students and Elementary School Students of Duplicate 2 with parameters: Student Name, Address, Transportation Equipment, Parents' Name, Occupation, Income, Mother's Name, Mother's Occupation, Mother's Income. the classification method approach that can help determine who is eligible to get a KNN scholarship is a classification method by finding the closest distance between the data to be evaluated with its nearest neighbor K in the data. The results of the research using the KNN method make it easier to find students and students who are entitled to receive scholarships in accordance with specified parameters, so that scholarships given by schools can be right on target for students and students who have met the requirements in getting scholarships. Datamining response test about receiving accuracy in awarding scholarships using KNN algorithm PerformanceVector accuracy: 78.45% precision: 25.00% (positive class: Yes) recall: 9.52% (positive class: Yes) AUC (optimistic): 0.558 (positive class: Yes) AUC : 0.454 (positive class: Yes) AUC (pessimistic): 0.349 (positive class: Yes)
Keywords: KNN Algorithm, Scholarship, Achievement Abstrak
Beasiswa merupakan bantuan biaya pendidikan yang sangat membantu prestasi Siswa dan Siswi. Beasiswa yang diberikan antara lain beasiswa Peningkatan nilai mata Pelajaran yang diberikan kepada siswa siswi berprestasi.
Sekolah dasar Plandakan 2 memiliki banyak Siswa/i dengan adanya program beasiswa pendidikan minat siswa untuk mendapat beasiswa sangat tinggi. Hal tersebut dapat berpengaruh pada keputusan kepala sekolah dalam menentukan penerima beasiswa. Data yang akan digunakan 383 Siswa dan Siswi Sekola Dasar Pelandakan 2 dengan parameter Nama Siswa, Alamat, Alat Transportasi, nama orang tua, Pekerjaan, Penghasilan, Nama Ibu, Pekerjaan Ibu, Penghasilan Ibu. Dengan pendekatan metode klasifikasi yang dapat membantu pengambilan keputusan dalam menentukan siapa yang layak mendapatkan beasiswa KNN adalah metode klasifikasi dengan mencari jarak terdekat antara data yang akan dievaluasi dengan K tetangga (neighbor) terdekatnya dalam data tersebut. Hasil Penelitian dengan metode KNN mempermudah dalam mencari siswa dan siswi yang berhak mendapat beasiswa sesuai dengan parameter yang ditentukan, sehingga beasiswa yang diberikan sekolah dapat tepat sasaran kepada siswa dan siswa yang telah memenuhi syarat dalam mendapatkan beasiswa. Hasil uji penerapan datamining tentang penerimaan ketepatan dalam pemberian beasiswa menggunakan algoritma KNN PerformanceVector accuracy: 78.45% precision: 25.00% (positive class: Ya) recall: 9.52% (positive class: Ya) AUC (optimistic): 0.558 (positive class: Ya) AUC: 0.454 (positive class: Ya) AUC (pessimistic): 0.349 (positive class: Ya)
Kata kunci : Algoritma KNN, Beasiswa, Prestasi
1. Pendahuluan
Perkembangan teknologi khususnya komputer beberapa tahun terakhir ini sangat pesat. Dahulu, orang menulis menggunakan alat tulis seperti pena atau pun pensil. Sekarang ini, menulis manual dapat digantikan dengan menggunakan komputer. Cukup dengan menekan papan ketik, huruf atau angka yang diinginkan akan muncul di layar. Adapun disetiap lembaga pendidikan khususnya sekolah, komputer menjadi alat untuk mempermudah kinerja untuk setiap guru dan staf yang bertugas, dan khususnya dalam penerimaan beasiswa. Beasiswa (Bantuan Siswa Miskin) merupakan pemberian berupa bantuan keuangan yang diberikan kepada perorangan yang bertujuan untuk keberlangsungan pendidikan yang ditempuh. Disetiap lembaga pendidikan khususnya Sekolah Dasar ada dana bantuan sekolah yang ditawarkan kepada siswa-siswanya khususnya yang kurang mampu.
Lembaga pendidikan khususnya Sekolah Dasar ada beasiswa sekolah yang ditawarkan kepada siswa- siswanya khususnya yang kurang mampu namun memiliki prestasi. Untuk mendapatkan beasiswa tersebut maka harus sesuai dengan aturan-aturan yang telah ditetapkan. Parameter yang Nama Siswa, Alamat, Alat Transportasi, nama orang tua, Pekerjaan, Penghasilan, Nama Ibu, Pekerjaan Ibu, Penghasilan Ibu.
Sekolah dasar negeri 2 plandakan adalah sekolah dasar yang terletak di alamat : jl. Situganggga dusun : karyamulya desa / kelurahan : karya mulya kecamatan : kec. Kesambi kabupaten : kota cirebon provinsi : prov.
Jawa barat kode pos : 45135
Menurut Sumarlin klasifikasi beasiswa peningkatan prestasi akademik (PPA) dan bantuan belajar mahasiswa (BBM) berdasarkan variabel-variabel yang telah ditentukan dengan menerapkan algoritma k- nearest neighbor. Hasil testing untuk mengukur performa algoritma knearest neighbor menggunakan metode cross validation, Confusion Matrix dan kurva Receiver Operating Characteristic(ROC), akurasi yang diperoleh untuk beasiswa peningkatan prestasi akademik mencapai 88,33% dengan nilai Area Under Curva(AUC) 0,925 dari 227 record dataset, sedangkan akurasi yang diperoleh untuk beasiswa Bantuan belajar mahasiswa mencapai 90% dengan nilai AUC 0,937 dari 183 record dataset, akurasi yang diperoleh untuk gabuangan beasiswa peningkatan prestasi akademik dan bantuan belajar mahasiswa mencapai 85,56% dan nilai AUC 0,958. Karena nilai AUC berada dalam rentang 0,9 sampai 1,0 maka metode tersebut masuk dalam kategori sangat baik (excellent)
Sedangkan menurut dita noviana dkk Beasiswa yang diberikan antara lain beasiswa peningkatan prestasi akademik (ppa) yang diberikan kepada mahasiswa berprestasi. Seiring dengan meningkatnya jumlah mahasiswa yang mengajukan beasiswa, maka dibutuhkan suatu metode klasifikasi yang dapat
beasiswa ppa dari universitas sebelas maret. Hasil penelitian juga menunjukkan akurasi dan eror algoritma k-nn sebesar 90.7% dan 9.3%, sedangkan pada algoritma c4.5 memiliki akurasi dan eror sebesar 88.3% dan 11.7%.
Tujuan penelitian untuk dapat mengklasifikasi pemberiaan beasiswa pendidikan untuk tingkat sekolah dasar.
2. Metode Penelitian
Alur penelitian ini mengacu pada Knowladge Discovery Data, alur tersebut dapat dilihat pada gambar berikut ini :
Gambar 1 Alur Penelitian
Berdasarkan Gambar 1 tentang Alur Penelitian dapat dijelasakan sebagai berikut :
1. Database
Data siswa yang digunakan pada penelitian ini ialah sebanyak 383 data set
2. Data Cleaning
Pada umumnya, data yang diperoleh, baik dari database SD Plandakan Kota Cirebon maupun survey, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau hanya sekedar salah ketik. Data yang tidak relevan itu juga lebih baik dibuang karena keberadaanya bisa mengurangi mutu atau akurasi dari hasil data mining nantinya. Pembersihan data juga akan mempengaruhi performasi dari system data mining karena data yang akan ditangani akan berkurang jumlah dan kompleksitasnya.
3. Data transformation
adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining.
4. Data mining
Data mining adalah proses mengeksplorasi dan menganalisa data dalam jumlah yang besar yang bertujuan untuk menemukan suatu pola atau informasi yang menarik dari data yang tersimpan dalam jumlah yang besar dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma yang tepat sangat bergantung pada tujuan dan proses knowledge discovery in databases (KDD) secara keseluruhan. Tahap ini merupakan inti dari tahapan knowledge discovery in databases (KDD)
yang dilakukan untuk menganalisis data yang telah dibersihkan.
3. Hasil dan Pembahasan 1. Populasi dan Sample
Populasi adalah wilayah generalisasi yang terdiri atas obyek atau subyek yang mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya [13].
Penelitian yang akan digunakan menggunakan data sekolah
Teknik pengambilan sampel yang tidak memberikan peluang/kesempatan sama bagi setiap unsur atau anggota populasi untuk dipilih menjadi sampel. Penelitian ini menggunakan teknik sampling jenuh adalah teknik penentuan sampel bila semua anggota populasi digunakan sebagai sampel. Sample yang digunakan ialah data 383
2. Preprocessing
Tahap ini adalah melakukan penghapusan data yang tidak digunakan pada proses data mining algoritma knn dan juga memperbaiki data yang terdapat kesalahan data setelah dilakukan preprocessing yaitu sebagai berikut :
Tabel 1 Nama Atribut
No Nama Atribut Keterangan 1 Nama Lengkap
2 Jenis Kelamin 3 NISN 4 Jenis Tinggal 5 Transportasi 6 Nama Bapak 7 Pekerjaan Bapak 8 Pengahasilan Bapak 9 Nama Ibu
10 Pekerjaan Ibu 11 Penghasilan Ibu 12 Layak Beasiswa 3. Model Algoritma KNN
Penerapan Algoritma dengan menggunakan Software Rapidminer, penerapan tersebut dapat dilihat pada gambar berikut ini
Gambar 3 Model Cros Validation
Berdasarkan gambar 3 tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada tahap kedua, melakukan drag dan drop operator validasi
Gambar 4 KNN
Berdasarkan gambar 4 tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada tahap kelima menggunakan operator performance dengan cara drag dan drop pada proses
Pembahasaan Hasil Akurasi
Gambar 5 Hasil Akurasi
Berdasarkan gambar 5 tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada hasil accuracy menghasilkan 78.45%
Hasil Precision
Gambar 6 Hasil Precision
Berdasarkan gambar diatas tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada hasil precision menghasilkan 25.00%
Hasil Performance
PerformanceVector:
accuracy: 78.45%
ConfusionMatrix:
True: Tidak Ya Tidak: 89 19
Ya: 6 2
precision: 25.00% (positive class: Ya) ConfusionMatrix:
True: Tidak Ya Tidak: 89 19
Ya: 6 2
recall: 9.52% (positive class: Ya) ConfusionMatrix:
True: Tidak Ya Tidak: 89 19
Ya: 6 2
AUC (optimistic): 0.558 (positive class: Ya) AUC: 0.454 (positive class: Ya)
AUC (pessimistic): 0.349 (positive class: Ya) Kesimpulan
Hasil penelitian dan pembahasan yang telah diuraikan pada bab-bab sebelumnya, maka dapat ditarik Kesimpulan Ialah penerpan datamining tentang penerimaan ketepatan dalam pemberian beasiswa menggunakan algoritma KNN PerformanceVector accuracy: 78.45% precision: 25.00% (positive class: Ya) recall: 9.52% (positive class: Ya) AUC (optimistic):
0.558 (positive class: Ya) AUC: 0.454 (positive class:
Ya) AUC (pessimistic): 0.349 (positive class: Ya) Daftar Pustaka
[1] M. Muqorobin, k. Kusrini, and e. T. Luthfi,
“optimasi metode naive bayes dengan feature selection iinformation gain untuk prediksi keterlambatan pembayaran spp sekolah,” j. Ilm.
Sinus, vol. 17, no. 1, p. 1, 2019, doi:
10.30646/sinus.v17i1.378.
[2] O. Nurdiawan, f. A. Pratama, d. A. Kurnia, kaslani, and n. Rahaningsih, “optimization of traveling salesman problem on scheduling tour packages using genetic algorithms,” j. Phys. Conf. Ser., vol. 1477, no. 5, pp. 0–6, 2020, doi: 10.1088/1742- 6596/1477/5/052037.
[3] O. Nurdiawan and noval salim, “penerapan data mining pada penjualan barang menggunakan metode metode naive bayes classifier untuk optimasi strategi
pemasaran,” teknol. Inf. Dan komun., no. April, pp.
1–19, 2018.
[4] rukmana, rahmat, 1995,, kanisius, yogyakarta.
Sunyoto, andi, 2007, pemograman database dengan visual basic dan microsoft sql, andi offset, yogyakarta.
[5] a. Sijabat, “penerapan data mining untuk pengolahan data siswa dengan menggunakan metode decision tree ( studi kasus : yayasan perguruan kristen andreas),” maj. Ilm. Inf. Dan teknol. Ilm., vol. 5, no. 3, pp. 7–12, 2015.
[6] c. A. Sugianto, “penerapan teknik data mining untuk menentukan hasil seleksi masuk sman 1 gibeber untuk siswa baru menggunakan decision tree,” j.
Tedc, vol. 9, no. 1, pp. 39–43, 2015.
[7] r. H. Pambudi, “penerapan algoritma c4.5 untuk memprediksi nilai kelulusan siswa sekolah menengah berdasarkan faktor eksternal,”
universitas brawijaya, 2017.
[8] a. Rohman, “model algoritma k-nearest eighbor (k- nn) untuk prediksi kelulusan mahasiswa,” neo tek., vol. 1, no. 1, pp. 1–9, 2015.
[9] s. S. Nikam, “a comparative study of classification techniques in data mining algorithms,” int. J. Mod.
Trends eng. Res., vol. 4, no. 7, pp. 58–63, 2017.
[10] s. Maslahah, “prediksi kelulusan mahasiswa menggunakan metode decision tree dengan penerapan algoritma c4.5,” universitas islam negeri maulana malik ibrahim, 2013.
[11] o. Nurdiawan, “seleksi penerima bantuan sosial berdasarkan sistem pendukung keputusan dalam upaya mengurangi siswa rawan putus sekolah,”
j. Teknol. Inf., vol. Xiii, no. 2, pp. 32–40, 2018.
[12] o. Nurdiawan and noval salim, “penerapan data mining pada penjualan barang menggunakan metode metode naive bayes classifier untuk optimasi strategi pemasaran,” teknol. Inf. Dan komun., no. April, pp. 1–19, 2018.
[13] o. Nurdiawan, f. A. Pratama, and n. Nurhadiansyah,
“implementasi expert system untuk mengetahui penyakit hiv aids menggunakan algoritma best- first search,” infotekmesin, vol. 10, no. 2, pp. 33–
37, 2019, doi: 10.35970/infotekmesin.v10i2.34.
[14] o. Nurdiawan, “pengenalan sandi morse dengan
menggunakan jaringan syaraf tiruan metode backpropagation,” kopertip j. Ilm. Manaj.
Inform. Dan komput., vol. 2, no. 2, pp. 50–61, 2018, doi: 10.32485/kopertip.v2i2.43.
[15] d. K. Pane, "implementasi data mining pada penjualan produk elektronik dengan algoritma apriori (study kasus kreditplus)," issn, vol. Iv, pp.
1-5, .