• Tidak ada hasil yang ditemukan

Penerapan Algoritma NaḮve Bayes Untuk Penentuan Calon Penerima Beasiswa PIP Pada SDN 023 Penajam

N/A
N/A
Protected

Academic year: 2021

Membagikan "Penerapan Algoritma NaḮve Bayes Untuk Penentuan Calon Penerima Beasiswa PIP Pada SDN 023 Penajam"

Copied!
7
0
0

Teks penuh

(1)

11

Penerapan Algoritma NaḮve Bayes Untuk Penentuan Calon

Penerima Beasiswa PIP Pada SDN 023 Penajam

Joy Nashar Utamajaya1, Andi Mentari A.P2, Siti Masnunah3

STMIK Borneo Internasional 1

joy@stmik-borneo.ac.id, 2andi_mentari.17@stmik-borneo.ac.id 3

siti_massnunah.17@stmik-borneo.ac.id Abstrak

Pemerintah terus berupaya untuk meningkatkan taraf pendidikan, salah satunya melalui Program Indonesia Pintar (PIP), program bantuan dana dalam bentuk Kartu Indonesia Pintar (KIP). Tujuan dari program Indonesia Pintar (PIP) adalah untuk membantu biaya personal pendidikan bagi peserta didik miskin atau rentan miskin yang masih terdaftar sebagai peserta didik pada jenjang pendidikan dasar dan menengah.PIP dirancang untuk membantu anak-anak usia sekolah agar tetap mendapatkan layanan pendidikan sampai tamat pendidikan menengah, baik melalui jalur pendidikan formal maupun non formal.Penentuan penerima beasiswa menggunakan beberapa kriteria antara lain: pekerjaan orang tua, penghasilan orang tua, jumlah tanggungan, nilai raport, peringkat, jarak dari rumah ke sekolah serta restasi akademik dan nono akademik. Kelayakan calon penerima beasiswa bidikmisi ditentukan dengan menerapkan metode Naïve Bayes. Metode ini dipilih karena mampu mempelajari data kasus sebelumnya yag digunakan sebagai data uji. Penelitian ini telah menghasilkan sebuah aplikasi sistem pendukung keputusan dengan tingkat akurasi sebesar 97,2%.

Kata Kunci: Confusion Matrix,Program Indonesia Pintar, Naïve Bayes,.

1. PENDAHULUAN

Program Indonesia Pintar merupakan pemberian bantuan tunai pendidikan kepada anak usia sekolah yang berasal dari keluarga kurang mampu sebagai bagian dari penyempurnaan Program Bantuan Siswa Miskin (BSM), yang ditandai dengan pemberian Kartu Indonesia Pintar (KIP) kepada anak usia sekolah yang berasal dari keluarga kurang mampu, dengan maksud untuk menjamin agar seluruh anak usia sekolah dari keluarga kurang mampu terdaftar sebagai penerima bantuan sampai anak lulus jenjang pendidikan menengah[1].Program kerja sama antara Kementerian Pendidikan dan Kebudayaan, Kementerian Sosial dan Kementerian Agama ini juga memprioritaskan bagi anak usia sekolah yang termasuk yatim piatu, penyandang disabilitas, serta korban bencana/musibah. PIP dirancang untuk membantu anak-anak usia sekolah agar tetap mendapatkan layanan pendidikan sampai tamat pendidikan menengah, baik melalui jalur pendidikan formal maupun non formal. Bantuan yang akan diterima yakni berupa dana dengan besaran yang telah ditentukan sesuai tingkatan pendidikan sebagai berikut.

 Peserta didik SD/MI/Paket A mendapatkan Rp450.000,-/tahun;  Peserta didik SMP/MTs/Paket B mendapatkan Rp750.000,-/tahun;

 Peserta didik SMA/SMK/MA/Paket C mendapatkan Rp1.000.000,-/tahun[2].

Naive Bayes merupakan salah satu metode yang memiliki tingkat keefektifan dan keefisienan yang cukup tinggi untuk diterapkan dalam pembelajaran mesin dan data mining [3]. Metode Naive Bayes ini, sangat cocok digunakan untuk menyelesaikan berbagai kasus klasifikasi. Berbagai problem masalah klasifikasi dalam kehidupan nyata, telah terbukti dapat terselesaikan dengan baik menggunakan Naive Bayes. Hal tersebut dikarenakan metode Naive Bayes ini memiliki performa klasifikasi yang tinggi [4].

(2)

12

2. METODE PENELITIAN A. Jenis Penelitian

Di dalam penelitian ini digunakan penelitian dengan metode eksperimen dengan menggunakan data siswa yang mengajukan beasiswa PIP di “SDN 023 Penajam” sejumlah 70 orang, yang terdiri dari 33 siswa yang dinyatakan layak menerima beasiswa dan 37 diantaranya yang dinyatakan tidak layak menerima beasiswa.

B. Metode Pengumpulan Data

Dalam penelitian ini metode pengumpulan data yang digunakanadalah metode pengumpulan data sekunder. Data utama diperoleh dari data siswa yang lulus seleksi beasiswa dan yang tidak lulus seleksi beasiswa, sedangkan data pendukung lainnya didapat dari buku, jurnal danpublikasilainnya. Instrumentpenelitian yaitu sebagai berikut:

 Penelitian ini menggunakan Data sekunder berupa data siswa yang lulus seleksi dan tidak lulus yang akan digunakan sebagai instrumen guna memperoleh data dalam proses menentukan calon penerima beasiswa,didalam data tersebut dapat diketahui status siswa yang lulus seleksi dan tidak lulus seleksi yang terdiri dari 8 atribut predictor dan 1 atribut hasil. Atribut-atribut yang menjadi parameter terlihat pada Tabel 1.

 Perangkat lunak yang digunakan untuk menganalisis adalah Rapidminer Tabel 1 Atribut dan Nilai Kategori Seleksi

C. Metode Analisis dan Pengujian Data

Teknik Analisis data menggunakan data Kuantitatif berupa matematika terhadap angka atau numerik dan nominal. Pada penelitian ini, analisa data dilakukan melalui data siswa SD dengan nilai rata-rata siswa lulus seleksi dan tidak lulus seleksi, data diolah dan di uji dalam pengujian pada algoritma Naïve Bayes. Naïve Bayes merupakan metode probabilistik pengklasifikasian sederhana berdasarkan Teorema Bayes dimana pengklasifikasian dilakukan melalui training set sejumlah data secara efisien [5]. Naïve bayes mengasumsikan bahwa nilai dari sebuah input atribut pada kelas yang diberikan tidak tergantung dengan nilai atribut yang lain [6]. Teorema Bayes sendiri dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. Dimana persamaan Teori Bayes tersebut adalah:

Kategori Atribut Pekerjaan Orang Tua Nelayan Petani Buruh Wiraswasta Penghasilan <1.000.000 1.000.000-2.000.000 >2.000.000

Jumlah Tanggungan < 2 Orang >2 orang Rata-rata Nilai Raport <80 > 80 Peringkat 1-5 6-15 Jarak Rumah KeSekolah < 1Km >1Km Prestasi Akademik Ya Tidak Prestasi Non Akademik Ya Tidak

(3)

13 (1) Dimana :

X : Data dengan kelas yang belum diketahui

C : Hipotesis data X merupakan suatu kelas spesifik

P (C|X) : Probabilitas hipotesis C berdasar kondisi X (probabilitas posterior) P(C) : Probabailitas hipotesis C (probabilitasprior)

P(X|C) : Probablitas X berdasarkan kondisi padahipotesis C P(X) : Probabilitas X

3. PEMBAHASAN A. Perhitungan Probabilitas Prior

Dari 70 data latih yang digunakan, diketahui kelas C0 (Tidak Lulus) sebanyak 37 data, dan kelas C1(Lulus) sebanyak 33 data. Perhitungan probabilitas prior untuk kemungkinan kelas tidaklayak menerima beasiswa berdasarkan persamaan (1):

P(C0) = = 0,53

Sedangkan perhitungan probabilitas prior untuk kemungkinan kelas layak menerima beasiswa P(C1) berdasarkan persamaan (7) :

P(C1) = = 0,47

B. Perhitungan Probabilitas Posterior X bersyarat C (P(X|Ci))

Dalam membuat model Naive Bayes terlebih dahulu kita mencari probabilitas hipotesis untuk masing-masing Kelas P(H). Hipotesis yang ada yaitu siswa yang lulus seleksi beasiswa dan siswa yang tidak lulus seleksi beasiswa. Data yang digunakan adalah data utama yang diperoleh dari data yang telah didownload pada website monitoring PIP, dengan total data yaitu 70 data. 33 siswa yang lulus seleksi dan 37 siswa yang tidak lulus seleksi, perhitungan probabilitas yaitu pada Tabel 2 sampai Tabel9.

Tabel 2 Probabilitas Pekerjaan

ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Pekerjaan Orang Tua Nelayan 25 12 13 0.36 0.351 Petani 15 8 7 0.24 0.190 Buruh 20 10 10 0.30 0.210 Wiraswasta 10 3 7 0.09 0.190 JUMLAH 1 1

Tabel 3 Probabilitas Penghasilan

ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Penghasilan <1.000.000 25 15 10 0.45 0.270

(4)

14

1.000.000-2.000.000 25 12 13 0.36 0.351

>2.000.000 20 6 14 0.18 0.378

JUMLAH 1 1

Tabel 4 Probabilitas Jumlah Tanggungan

ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Jumlah Tanggungan < 2 Orang 32 15 17 0.45 0.459 >2 orang 38 18 20 0.55 0.540 JUMLAH 1 1

Tabel 5 Probabilitas Rata-rata Nilai Raport ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Rata-rata Nilai Raport <80 32 28 4 0.85 0.108 > 80 38 5 33 0.15 0.891 JUMLAH 1 1

Tabel 6 Probabilitas Peringkat

ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Peringkat 1-5 37 33 4 1 0.108 6-15 33 0 33 0 0.891 JUMLAH 1 1

Tabel 7 Probabilitas Jarak Rumah

ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Jarak Rumah KeSekolah < 1Km 33 15 18 0.45 0.486 >1Km 37 18 19 0.55 0.573 JUMLAH 1 1

Tabel 8 Probabilitas Prestasi Akademik

ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Prestasi Akademik Ya 27 25 2 0.76 0.054 Tidak 43 8 35 0.24 0.945 JUMLAH 1 1

(5)

15 Tabel 9 Probabilias Non Akamedik

ATRIBUT JUMLAH KASUS (S) LULUS (Si) TIDAK LULUS (Si) P(X|Ci) LULUS TIDAK LULUS Total 70 33 37 Prestasi Non Akademik Ya 12 12 0 0.36 0 Tidak 58 21 37 0.64 1 JUMLAH 1 1

Perhitungan probabilitas posterior dilakukan pada data latih sejumlah 70 data dengan menggunakan X yang merupakan vektor untuk kriteria pemilihan penerima PIP yaitu XPekerjaan, Xpenghasilan orangtua, Xjumlahtanggungan, Xnilairatarataraport, Xperingkat,Xjarakrumah, Xprestasiakademik dan Xprestasinonakademik sehingga P(X|Ci) yang dijabarkan menjadi P(XXPekerjaan orangtua, XXPenghasilan orangtua, XXTanggungan, XXNilairataratraport, XXPeringkat, XXJarakrumah, XXPrestasiakademik dan XXPrestasinonakademik |Ci) dan untuk setiap X dihitung kemungkinannya terhadap Ci. C. Evaluasi Model Confusion Matrix Untuk Algoritma Naive Bayes

Pada pengukuran kinerja menggunakan confusion matrix, terdapat 4 (empat) istilah sebagai representasi hasil proses klasifikasi. Keempat istilah tersebut adalah True Positive (TP), True Negative (TN), False Positive (FP) dan False Negative (FN). Nilai True Negative (TN) merupakan jumlah data negatif yang terdeteksi dengan benar, sedangkan False Positive (FP) merupakan data negatif namun terdeteksi sebagai data positif. Sementara itu, True Positive (TP) merupakan data positif yang terdeteksi benar. False Negative (FN) merupakan kebalikan dari True Positive, sehingga data posifit, namun terdeteksi sebagai data negatif. Pada jenis klasifikasi binary yang hanya memiliki 2 keluaran kelas, confusion matrix dapat disajikan seperti pada Tabel 10.

Tabel 10 Confusion Matrix Kelas Terklasifikasi Positif Terklasifikasi Negatif Positif TP (33) FN (3) Negatif FP (0) TN (37)

Tabel 10 adalah perhitungan berdasarkan data training , diketahui dari 70 data, 33 diklasifikasikanYA (layak) sesuai dengan prediksi yang dilakukan dengan metode Algoritma Naïve Bayes, 3 data diprediksi YA tetapi ternyata hasilnya TIDAK, 37 data class TIDAK(tidak layak) diprediksi sesuai.

Berdasarkan nilai True Negative (TN), False Positive (FP), False Negative (FN), dan True Positive (TP) dapat diperoleh nilai akurasi, presisi dan recall. Nilai akurasi menggambarkan seberapa akurat sistem dapat mengklasifikasikan data secara benar. Dengan kata lain, nilai akurasi merupakan perbandingan antara data yang terklasifikasi benar dengan keseluruhan data. Nilai akurasi dapat diperoleh dengan Persamaan 1. Nilai presisi menggambarkan jumlah data kategori positif yang diklasifikasikan secara benar dibagi dengan total data yang diklasifikasi positif. Presisi dapat diperoleh dengan Persamaan 2. Sementara itu, recall menunjukkan berapa persen data kategori positif yang terklasifikasikan dengan benar oleh sistem. Nilai recall diperoleh dengan Persamaan 3.

Akurasi : TP+TN

X 100% = TP+FN+FP+TN

(6)

16 33+37 X 100% = 97,2% 33+3+0+37 Presisi : TP X 100% = FP+TP 33 X 100% = 100% 0+33 Recall : TP X 100% = FN+TP 33 X 100% = 91,67% 3+33

Nilai accuracy, precision dan recall dari data tranning dapat dihitung dengan menggunakan Rapid Miner. Setelah diuji coba dengan metode cross validation, didapat hasil pengukuran terhadap data training yaitu accuracy= 97,2% precisio n= 100% dan recall = 91,67%. D. Dibawah ini adalah perhitungan manual untuk mencari nilai accuracy, sensitivity, specificity,

PPV, NPV : Accuracy : TP+TN = 33+37 = 0,959 TP+TN+FP+FN 33+37+0+3 Sensitivity : TP = 33 = 0,917 TP+FN 33+3 Specifity : TN = 37 = 1 TN+FP 37+0 PPV : TP = 33 = 1 TP+FP 33+0 NPV : TN = 37 = 0,925 TN+FN 37+3 4. KESIMPULAN

Dari penelitian yang telah dilakukan, dapat diambil kesimpulan sebagai berikut:

1. Telah dibuat Seleksi Penerima Beasiswa Program Indonesia Pintar SDN 023 Penajam dengan menggunakan metode Naïve Bayes.

2. Penelitian ini berhasil menerapkan metode Naïve Bayes untuk membantu menyeleksi penerima beasiswa Program Indonesia Pintar , dengan tingkat akurasi sebesar 97,2%.

(7)

17 Penulis menyarankan untuk penambahan variabel dalam perhitungan untuk menambah tingkat akurasi dari hasil.

DAFTAR PUSTAKA

[1] Wibowo, (2019). Besaran Dana PIP. Kepulauan Riau: Kamenag.

[2] Adrian, S. (2019) Cara dan Syarat Mencairkan Dana PIP. Surabaya: Tirto.id

[3] M.A. Shadiq, “Keoptimalan Naive Bayes dalam Klasifikasi.,” presented at the Universitas Pendidikan Indonesia, Bandung, 2017.

[4] Al Riza, Romi, “Penerapan Naive Bayes Untuk Mengurangi Data Noise pada Klasifikasi Multi Kelas dengan Decision Tree.,” J. Intell. Syst., 2015.

[5] Dika, H. (2015). Kajian Perancangan Rule Kenaikan Gaji Pada PT. ABC . Simetris, 219. [6] Saputra, R. A (2014). Peneraan Algoritma Naive Bayes Untuk Prediksi Penyakit Tuberculosis.

Gambar

Tabel 3 Probabilitas Penghasilan
Tabel 6 Probabilitas Peringkat
Tabel 10 Confusion Matrix  Kelas  Terklasifikasi  Positif  Terklasifikasi Negatif  Positif  TP (33)  FN (3)  Negatif  FP (0)  TN (37)

Referensi

Dokumen terkait

Pengalaman menarik dari Inbis juga dapat dilihat di Lousiana University , yang dikenal dengan Lousiana Business &amp; Technology Center (LBTC) , sejak tahun 1988 mampu meluluskan

Untuk mengevaluasi kinerja dosen dalam pembelajaran pada setiap mata kuliah, maka dilakukan penyebaran kuesioner yang harus diisi mahasiswa serta pemberian kritik dan saran

Pada teks tersebut, bisa dilihat dengan gamblang bagaimana proses pergeseran struktur yang mengacu kepada bahasa sasaran. Faktor komunikasi yang efektif terhadap bahasa

Orang Kelantan, walau pun yang berkelulusan PhD dari universiti di Eropah (dengan biasiswa Kerajaan Persekutuan) dan menjawat jawatan tinggi di Kementerian atau di Institusi

kesesuaian tindakan aktor yang terlibat. • Yang menunjukkan bahwa lebih berpengaruh dibandingkan variabel lainnya, yang mana menunjukkan besarnya kekuatan masyarakat dalam

Penelitian ini bertujuan untuk menganalisis pengaruh variabel independen yang merupakan komponen fraud triangle terhadap kecurangan laporan keuangan (financial statement

Berfungsi mengatur dan mengendalikan kegiatan bagian pelayanan keperawatan sesuai dengan visi dan misi Rumah Sakit Roemani menuju terwujudnya pelayanan keperawatan yang prima.

- Pengalaman kerja diutamakan dibidangnya - Familiar dengan bidang pemasaran property - Memiliki kemampuan negosiasi/presentasi - Networking luas, berpenampilan menarik,