• Tidak ada hasil yang ditemukan

JURNAL DATA SCIENCE & INFORMATIKA (JDSI) Vol. 1 No. 1 (Juli 2021) p ISSN Media Elektronik: xxx-xxxx

N/A
N/A
Protected

Academic year: 2022

Membagikan "JURNAL DATA SCIENCE & INFORMATIKA (JDSI) Vol. 1 No. 1 (Juli 2021) p ISSN Media Elektronik: xxx-xxxx"

Copied!
5
0
0

Teks penuh

(1)

JURNAL DATA SCIENCE & INFORMATIKA (JDSI)

Vol. 1 No. 1 (Juli 2021) p.11-15 ISSN Media Elektronik: xxx-xxxx

Klasifikasi Penerima Beasiswa Dengan Menggunakan Algoritma K Nearest Neighbor

Aria Pratama1, Farid Ali Ma’ruf2 Iin3 Ade Rizki Rinaldi4 Faturrhohman5

1Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon

2Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon

3Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon

4Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon

5Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon

1[email protected]*, 2[email protected]

Abstract

Scholarships are tuition assistance that greatly helps the achievement of students and students. Scholarships include, among other things, scholarships to increase the value of subjects given to outstanding students.

Plandakan 2 Elementary School has many students with the existence of an educational scholarship program, the interest of students to get a scholarship is very high. This can affect the principal's decision in determining the recipient of the scholarship. The data will be used 383 Students and Elementary School Students of Duplicate 2 with parameters: Student Name, Address, Transportation Equipment, Parents' Name, Occupation, Income, Mother's Name, Mother's Occupation, Mother's Income. the classification method approach that can help determine who is eligible to get a KNN scholarship is a classification method by finding the closest distance between the data to be evaluated with its nearest neighbor K in the data. The results of the research using the KNN method make it easier to find students and students who are entitled to receive scholarships in accordance with specified parameters, so that scholarships given by schools can be right on target for students and students who have met the requirements in getting scholarships. Datamining response test about receiving accuracy in awarding scholarships using KNN algorithm PerformanceVector accuracy: 78.45% precision: 25.00% (positive class: Yes) recall: 9.52% (positive class: Yes) AUC (optimistic): 0.558 (positive class: Yes) AUC : 0.454 (positive class: Yes) AUC (pessimistic): 0.349 (positive class: Yes)

Keywords: KNN Algorithm, Scholarship, Achievement Abstrak

Beasiswa merupakan bantuan biaya pendidikan yang sangat membantu prestasi Siswa dan Siswi. Beasiswa yang diberikan antara lain beasiswa Peningkatan nilai mata Pelajaran yang diberikan kepada siswa siswi berprestasi.

Sekolah dasar Plandakan 2 memiliki banyak Siswa/i dengan adanya program beasiswa pendidikan minat siswa untuk mendapat beasiswa sangat tinggi. Hal tersebut dapat berpengaruh pada keputusan kepala sekolah dalam menentukan penerima beasiswa. Data yang akan digunakan 383 Siswa dan Siswi Sekola Dasar Pelandakan 2 dengan parameter Nama Siswa, Alamat, Alat Transportasi, nama orang tua, Pekerjaan, Penghasilan, Nama Ibu, Pekerjaan Ibu, Penghasilan Ibu. Dengan pendekatan metode klasifikasi yang dapat membantu pengambilan keputusan dalam menentukan siapa yang layak mendapatkan beasiswa KNN adalah metode klasifikasi dengan mencari jarak terdekat antara data yang akan dievaluasi dengan K tetangga (neighbor) terdekatnya dalam data tersebut. Hasil Penelitian dengan metode KNN mempermudah dalam mencari siswa dan siswi yang berhak mendapat beasiswa sesuai dengan parameter yang ditentukan, sehingga beasiswa yang diberikan sekolah dapat tepat sasaran kepada siswa dan siswa yang telah memenuhi syarat dalam mendapatkan beasiswa. Hasil uji penerapan datamining tentang penerimaan ketepatan dalam pemberian beasiswa menggunakan algoritma KNN PerformanceVector accuracy: 78.45% precision: 25.00% (positive class: Ya) recall: 9.52% (positive class: Ya) AUC (optimistic): 0.558 (positive class: Ya) AUC: 0.454 (positive class: Ya) AUC (pessimistic): 0.349 (positive class: Ya)

Kata kunci : Algoritma KNN, Beasiswa, Prestasi

(2)

1. Pendahuluan

Perkembangan teknologi khususnya komputer beberapa tahun terakhir ini sangat pesat. Dahulu, orang menulis menggunakan alat tulis seperti pena atau pun pensil. Sekarang ini, menulis manual dapat digantikan dengan menggunakan komputer. Cukup dengan menekan papan ketik, huruf atau angka yang diinginkan akan muncul di layar. Adapun disetiap lembaga pendidikan khususnya sekolah, komputer menjadi alat untuk mempermudah kinerja untuk setiap guru dan staf yang bertugas, dan khususnya dalam penerimaan beasiswa. Beasiswa (Bantuan Siswa Miskin) merupakan pemberian berupa bantuan keuangan yang diberikan kepada perorangan yang bertujuan untuk keberlangsungan pendidikan yang ditempuh. Disetiap lembaga pendidikan khususnya Sekolah Dasar ada dana bantuan sekolah yang ditawarkan kepada siswa-siswanya khususnya yang kurang mampu.

Lembaga pendidikan khususnya Sekolah Dasar ada beasiswa sekolah yang ditawarkan kepada siswa- siswanya khususnya yang kurang mampu namun memiliki prestasi. Untuk mendapatkan beasiswa tersebut maka harus sesuai dengan aturan-aturan yang telah ditetapkan. Parameter yang Nama Siswa, Alamat, Alat Transportasi, nama orang tua, Pekerjaan, Penghasilan, Nama Ibu, Pekerjaan Ibu, Penghasilan Ibu.

Sekolah dasar negeri 2 plandakan adalah sekolah dasar yang terletak di alamat : jl. Situganggga dusun : karyamulya desa / kelurahan : karya mulya kecamatan : kec. Kesambi kabupaten : kota cirebon provinsi : prov.

Jawa barat kode pos : 45135

Menurut Sumarlin klasifikasi beasiswa peningkatan prestasi akademik (PPA) dan bantuan belajar mahasiswa (BBM) berdasarkan variabel-variabel yang telah ditentukan dengan menerapkan algoritma k- nearest neighbor. Hasil testing untuk mengukur performa algoritma knearest neighbor menggunakan metode cross validation, Confusion Matrix dan kurva Receiver Operating Characteristic(ROC), akurasi yang diperoleh untuk beasiswa peningkatan prestasi akademik mencapai 88,33% dengan nilai Area Under Curva(AUC) 0,925 dari 227 record dataset, sedangkan akurasi yang diperoleh untuk beasiswa Bantuan belajar mahasiswa mencapai 90% dengan nilai AUC 0,937 dari 183 record dataset, akurasi yang diperoleh untuk gabuangan beasiswa peningkatan prestasi akademik dan bantuan belajar mahasiswa mencapai 85,56% dan nilai AUC 0,958. Karena nilai AUC berada dalam rentang 0,9 sampai 1,0 maka metode tersebut masuk dalam kategori sangat baik (excellent)

Sedangkan menurut dita noviana dkk Beasiswa yang diberikan antara lain beasiswa peningkatan prestasi akademik (ppa) yang diberikan kepada mahasiswa berprestasi. Seiring dengan meningkatnya jumlah mahasiswa yang mengajukan beasiswa, maka dibutuhkan suatu metode klasifikasi yang dapat

beasiswa ppa dari universitas sebelas maret. Hasil penelitian juga menunjukkan akurasi dan eror algoritma k-nn sebesar 90.7% dan 9.3%, sedangkan pada algoritma c4.5 memiliki akurasi dan eror sebesar 88.3% dan 11.7%.

Tujuan penelitian untuk dapat mengklasifikasi pemberiaan beasiswa pendidikan untuk tingkat sekolah dasar.

2. Metode Penelitian

Alur penelitian ini mengacu pada Knowladge Discovery Data, alur tersebut dapat dilihat pada gambar berikut ini :

Gambar 1 Alur Penelitian

Berdasarkan Gambar 1 tentang Alur Penelitian dapat dijelasakan sebagai berikut :

1. Database

Data siswa yang digunakan pada penelitian ini ialah sebanyak 383 data set

2. Data Cleaning

Pada umumnya, data yang diperoleh, baik dari database SD Plandakan Kota Cirebon maupun survey, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau hanya sekedar salah ketik. Data yang tidak relevan itu juga lebih baik dibuang karena keberadaanya bisa mengurangi mutu atau akurasi dari hasil data mining nantinya. Pembersihan data juga akan mempengaruhi performasi dari system data mining karena data yang akan ditangani akan berkurang jumlah dan kompleksitasnya.

3. Data transformation

adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining.

4. Data mining

Data mining adalah proses mengeksplorasi dan menganalisa data dalam jumlah yang besar yang bertujuan untuk menemukan suatu pola atau informasi yang menarik dari data yang tersimpan dalam jumlah yang besar dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma yang tepat sangat bergantung pada tujuan dan proses knowledge discovery in databases (KDD) secara keseluruhan. Tahap ini merupakan inti dari tahapan knowledge discovery in databases (KDD)

(3)

yang dilakukan untuk menganalisis data yang telah dibersihkan.

3. Hasil dan Pembahasan 1. Populasi dan Sample

Populasi adalah wilayah generalisasi yang terdiri atas obyek atau subyek yang mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya [13].

Penelitian yang akan digunakan menggunakan data sekolah

Teknik pengambilan sampel yang tidak memberikan peluang/kesempatan sama bagi setiap unsur atau anggota populasi untuk dipilih menjadi sampel. Penelitian ini menggunakan teknik sampling jenuh adalah teknik penentuan sampel bila semua anggota populasi digunakan sebagai sampel. Sample yang digunakan ialah data 383

2. Preprocessing

Tahap ini adalah melakukan penghapusan data yang tidak digunakan pada proses data mining algoritma knn dan juga memperbaiki data yang terdapat kesalahan data setelah dilakukan preprocessing yaitu sebagai berikut :

Tabel 1 Nama Atribut

No Nama Atribut Keterangan 1 Nama Lengkap

2 Jenis Kelamin 3 NISN 4 Jenis Tinggal 5 Transportasi 6 Nama Bapak 7 Pekerjaan Bapak 8 Pengahasilan Bapak 9 Nama Ibu

10 Pekerjaan Ibu 11 Penghasilan Ibu 12 Layak Beasiswa 3. Model Algoritma KNN

Penerapan Algoritma dengan menggunakan Software Rapidminer, penerapan tersebut dapat dilihat pada gambar berikut ini

Gambar 3 Model Cros Validation

Berdasarkan gambar 3 tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada tahap kedua, melakukan drag dan drop operator validasi

Gambar 4 KNN

Berdasarkan gambar 4 tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada tahap kelima menggunakan operator performance dengan cara drag dan drop pada proses

Pembahasaan Hasil Akurasi

Gambar 5 Hasil Akurasi

Berdasarkan gambar 5 tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada hasil accuracy menghasilkan 78.45%

Hasil Precision

Gambar 6 Hasil Precision

(4)

Berdasarkan gambar diatas tentang penelitian penerima beasiswa di Sekolah Dasar Plandakan kota cirebon pada hasil precision menghasilkan 25.00%

Hasil Performance

PerformanceVector:

accuracy: 78.45%

ConfusionMatrix:

True: Tidak Ya Tidak: 89 19

Ya: 6 2

precision: 25.00% (positive class: Ya) ConfusionMatrix:

True: Tidak Ya Tidak: 89 19

Ya: 6 2

recall: 9.52% (positive class: Ya) ConfusionMatrix:

True: Tidak Ya Tidak: 89 19

Ya: 6 2

AUC (optimistic): 0.558 (positive class: Ya) AUC: 0.454 (positive class: Ya)

AUC (pessimistic): 0.349 (positive class: Ya) Kesimpulan

Hasil penelitian dan pembahasan yang telah diuraikan pada bab-bab sebelumnya, maka dapat ditarik Kesimpulan Ialah penerpan datamining tentang penerimaan ketepatan dalam pemberian beasiswa menggunakan algoritma KNN PerformanceVector accuracy: 78.45% precision: 25.00% (positive class: Ya) recall: 9.52% (positive class: Ya) AUC (optimistic):

0.558 (positive class: Ya) AUC: 0.454 (positive class:

Ya) AUC (pessimistic): 0.349 (positive class: Ya) Daftar Pustaka

[1] M. Muqorobin, k. Kusrini, and e. T. Luthfi,

“optimasi metode naive bayes dengan feature selection iinformation gain untuk prediksi keterlambatan pembayaran spp sekolah,” j. Ilm.

Sinus, vol. 17, no. 1, p. 1, 2019, doi:

10.30646/sinus.v17i1.378.

[2] O. Nurdiawan, f. A. Pratama, d. A. Kurnia, kaslani, and n. Rahaningsih, “optimization of traveling salesman problem on scheduling tour packages using genetic algorithms,” j. Phys. Conf. Ser., vol. 1477, no. 5, pp. 0–6, 2020, doi: 10.1088/1742- 6596/1477/5/052037.

[3] O. Nurdiawan and noval salim, “penerapan data mining pada penjualan barang menggunakan metode metode naive bayes classifier untuk optimasi strategi

pemasaran,” teknol. Inf. Dan komun., no. April, pp.

1–19, 2018.

[4] rukmana, rahmat, 1995,, kanisius, yogyakarta.

Sunyoto, andi, 2007, pemograman database dengan visual basic dan microsoft sql, andi offset, yogyakarta.

[5] a. Sijabat, “penerapan data mining untuk pengolahan data siswa dengan menggunakan metode decision tree ( studi kasus : yayasan perguruan kristen andreas),” maj. Ilm. Inf. Dan teknol. Ilm., vol. 5, no. 3, pp. 7–12, 2015.

[6] c. A. Sugianto, “penerapan teknik data mining untuk menentukan hasil seleksi masuk sman 1 gibeber untuk siswa baru menggunakan decision tree,” j.

Tedc, vol. 9, no. 1, pp. 39–43, 2015.

[7] r. H. Pambudi, “penerapan algoritma c4.5 untuk memprediksi nilai kelulusan siswa sekolah menengah berdasarkan faktor eksternal,”

universitas brawijaya, 2017.

[8] a. Rohman, “model algoritma k-nearest eighbor (k- nn) untuk prediksi kelulusan mahasiswa,” neo tek., vol. 1, no. 1, pp. 1–9, 2015.

[9] s. S. Nikam, “a comparative study of classification techniques in data mining algorithms,” int. J. Mod.

Trends eng. Res., vol. 4, no. 7, pp. 58–63, 2017.

[10] s. Maslahah, “prediksi kelulusan mahasiswa menggunakan metode decision tree dengan penerapan algoritma c4.5,” universitas islam negeri maulana malik ibrahim, 2013.

[11] o. Nurdiawan, “seleksi penerima bantuan sosial berdasarkan sistem pendukung keputusan dalam upaya mengurangi siswa rawan putus sekolah,”

j. Teknol. Inf., vol. Xiii, no. 2, pp. 32–40, 2018.

[12] o. Nurdiawan and noval salim, “penerapan data mining pada penjualan barang menggunakan metode metode naive bayes classifier untuk optimasi strategi pemasaran,” teknol. Inf. Dan komun., no. April, pp. 1–19, 2018.

[13] o. Nurdiawan, f. A. Pratama, and n. Nurhadiansyah,

“implementasi expert system untuk mengetahui penyakit hiv aids menggunakan algoritma best- first search,” infotekmesin, vol. 10, no. 2, pp. 33–

37, 2019, doi: 10.35970/infotekmesin.v10i2.34.

[14] o. Nurdiawan, “pengenalan sandi morse dengan

(5)

menggunakan jaringan syaraf tiruan metode backpropagation,” kopertip j. Ilm. Manaj.

Inform. Dan komput., vol. 2, no. 2, pp. 50–61, 2018, doi: 10.32485/kopertip.v2i2.43.

[15] d. K. Pane, "implementasi data mining pada penjualan produk elektronik dengan algoritma apriori (study kasus kreditplus)," issn, vol. Iv, pp.

1-5, .

Referensi

Dokumen terkait

Dari nilai tersebut dapat dilihat bahwa waiting time untuk proses jahit hijab pashmina square adalah proses yang memiliki waiting time paling tertinggi, hal

Data yang diambil dari Transaksi pembelian persediaan barang Alat tulis kantor pada Kantor Bbws Cimanuk Cisanggarung menggunakan model Naïve bayes mengasilkan nilai

Hasil penelitian dapat disimpulkan bahwa brand exposure berpengaruh terhadap brand recall (positioning) pada iklan rokok Sampoerna A Mild di kalangan perokok mahasiswa

Penelitian ini bertujuan untuk mengetahui efektivitas pembelajaran fisika dengan strategi pengajaran menggunakan media Audio Visual terhadapa motivasi dan daya serap

Kinerja sistem antrean Outlet Kober Mie Setan Gresik cukup baik, karena jumlah waktu rata- rata pelanggan menunggu dalam sistem antrean adalah 1,25 menit dimana sebelum

Peran Manajemen operasional BRI syariah di banjarmasin sudah berjalan dengan cukup optimal. Dilihat dari eksistensinya BRI syariah di Indonesia termasuk dalam salah satu

Jumlah Masyarakat Miskin yang mendapat Jaminan Kesehatan Karawang Sehat Puskesmas terakreditasi Pelayanan Kesehatan Ibu Hamil Pelayanan Kesehatan Ibu Bersalin Pelayanan Kesehatan

Peneliti kemudian merinci menjadi empat sub tujuan penelitianya yaitu, untuk mengetahui Implementasi nilai-nilai nasionalisme melalui pembelajaran Pendidikan