• Tidak ada hasil yang ditemukan

Penerapan Metode Naïve Bayes untuk Prediksi Penerima Beasiswa di SMK Al-Falah Tanjungjaya

N/A
N/A
Protected

Academic year: 2024

Membagikan "Penerapan Metode Naïve Bayes untuk Prediksi Penerima Beasiswa di SMK Al-Falah Tanjungjaya"

Copied!
8
0
0

Teks penuh

(1)

PENERAPAN METODE NAÏVE BAYES UNTUK MEMPREDIKSI PENERIMA BEASISWA PADA SMK

AL - FALAH TANJUNGJAYA

Ai Rani Maryani Universitas BSI Bandung

Abstrak

Setiap sekolah tentu memiliki siswa-siswi berprestasi dalam berbagai bidang pelajaran akademik bahkan non akademik yang mampu membawa pengaruh baik serta mengharumkan nama sekolah itu sendiri. SMK Al – Falah Tanjungjaya setiap tahunnya memberikan beasiswa kepada siswanya yang berprestasi. Kesulitan yang dihadapi SMK Al - Falah Tanjungjaya dalam menentukan siswa yang menerima beasiswa adalah karena setiap tahun dipilih siswa yang menerima beasiswa dengan ketentuan memiliki nilai rata-rata yang tinggi, memiliki absensi yang baik, mengikuti ektrakulikuler, dan menyertakan surat keterangan tidak mampu dari kelurahan setempat. Dalam memprediksi siswa yang menerima beasiswa berdasarkan prestasi dengan menggunakan metode naïve bayes. Atribut yang digunakan terdiri dari nilai rata-rata, absensi, ektrakulikuler, jurusan, surat keterangan tidak mampu dan keputusan. Untuk melakukan proses data mining dengan tools pembantu yaitu Rapidminer. Penerapan data mining menggunakan metode naïve bayes dapat diketahui bahwa dari jumlah 926 data penerima beasiswa SMK AL-Falah Tanjungjaya, sebanyak 94 siswa mendapatkan beasiswa dan memperoleh nilai akurasi yang telah dilakukan dalam rapidminer dengan menggunakan split validation sebesar 89,93%, sedangkan menggunakan cross valdation sebesar 89,85%.

Kata kunci : Naïve Bayes, Prediksi, Beasiswa

Abstrack

Each school certainly has outstanding students in various academic and non academic subjects that are able to bring good influence and the name of the school itself. SMK Al - Falah Tanjungjaya annually provides scholarships to students who excel. The difficulty faced by SMK Al - Falah Tanjungjaya in determining the students who receive the scholarship is because every year selected students who receive the scholarship with the provisions have a high average value, have a good absence, follow extracurricular, and include a certificate of inability from the local residence. In predicting students who receive scholarship based on merit by using naïve bayes method. The attributes that are used consist of the average value, absenteeism, extracurricular, majors, incapacity and decisions. To process data mining with help tools, namely Rapidminer. Implementation of data mining using naïve bayes method can be seen that from the number of 926 data recipients of SMK AL-Falah Tanjungjaya scholarship, as many as 94 students get scholarships and get accuracy value that has been done in rapidminer by using split validation of 89.93%, while using cross validation of 89,85%.

Keywords: Naïve Bayes, Predictions, Scholarships

1. Pendahuluan

Setiap sekolah tentu memiliki siswa-siswi berprestasi dalam berbagai bidang pelajaran bahkan non akademik yang mampu mengharumkan nama sekolah itu sendiri.

Menjadi siswa berprestasi tentu menjadi impian setiap anak di sekolah karena menjadi berprestasi mampu menjadi kebanggaan untuk diri sendiri, orang tua dan sekolah itu sendiri.

Prestasi yang dimiliki siswa pastilah beragam sesuai kemampuan siswa itu masing-masing.

Prestasi bisa terus diasah dengan keinginan

yang gigih dan dukungan serta bantuan dengan berbagai aspek.

Setiap anak memiliki spesialisasi tersendiri dalam prestasi, sesuatu yang dapat dikuasai melampaui kemampuan siswa lainnya.

Dukungan dari sekolah sangatlah diperlukan untuk meningkatkan prestasi setiap anak, agar bakat tersebut dapat terus berkembang dan bermanfaat nantinya sekolah harus memberikan penghargaan kepada anak berprestasi tersebut. Dalam penelitian ini yang ditekankan adalah bagaimana menentukan siswa-siswi yang termasuk berprestasi, untuk

(2)

menjadi pertimbangan sekolah memberikan penghargaan yang ditentukan sesuai kebijakan sekolah.

Ada beberapa anak yang memang sejak dini sudah memiliki bakat baik dalam akademis maupun bidang positif lainnya, beberapa ada yang harus lebih sering diasah agar bias lebih baik. Sekolah mencoba untuk memilih beberapa anak yang berprestasi berdasarkan nilai akademik dari rapot 2 semester terakhir dan kegiatan ekstrakulikuler yang mereka minati. Bahkan pihak sekolah mempertimbangkan data absensi siswanya untuk menjadi bahan pertimbangan. Sekolah berencana memberikan penghargaan berupa pembebasan pembayaran pada semester yang akan datang selama siswa dan siswi tersebut berada di sekolah tersebut.

Menurut (Andriyana, 2015) “Tujuan dari adanya beasiswa untuk siswa berprestasi tersebut yaitu memotivasi siswa untuk selalu meningkatkan prestasi akademik maupun non akademik, membantu siswa yang kurang mampu tetapi berprestasi, dan menumbuhkan rasa percaya diri siswa untuk berkompetitif dalam mengembangkan potensinya.

Menurut (Rahman & Suryanto, 2017) metode pengambilan keputusan berbasis logika fuzzy untuk memilih keputusan terbaik hanya dari berbagai alternatif berdasarkan kriteria yang ada, sehingga hasil seleksi belum teruji keakuratannya. Oleh karena itu perlu pengembangan sistem menggunakan metode naïve bayes untuk memperoleh prosentase tingket keakuratan hasil seleksi. Dengan itu maka metode yang dipilih adalah dengan naïve bayes.

2. Metode Penelitian

Tahapan Penelitian yang dilakukan oleh penulis yaitu, sebagai berikut :

Gambar 1 Tahapan Penelitian

Untuk lebih memahami tahapan-tahapan yang digambarkan diatas, maka dijelaskan rincian tahapan yang dilakukan yaitu :

a. Mengidentifikasi dan Merumuskan Masalah Penulis mengindentifikasi dan merumuskan permasalahan dengan bentuk pertanyaan yang dijawab pada maksud penelitian. Hal- hal yang dipermasalahkan dalam penelitian, pemilihan metode yang digunakan, dan alasan pemilihan metode.

b. Studi Kepustakaan

Penulis melakukan studi kepustkaan berdasarkan teori-teori yang ada. Penulis mendapatkan teori dari berbagai buku dan jurnal yang terkait dengan penelitian penulis.

c. Menentukan Sampel Peneltian

Penulis menentukan sampel penelitian berdasarkan populasi data pengajuan beasiswa yang digunakan untuk mewakili dari keseluruahan populasi yang ada. Dari banyaknya data pengajuan beasiswa memperoleh 926 data pengajuan sebagai sampel penelitian.

d. Mengumpulkan Data

Penulis mengumpulkan data sebagai bahan baku informasi yang harus dicari. Dalam hal ini penulis melakukan pengumpulan data dengan cara mewawancarai bagian tata usaha, juga melakukan observasi langsung ke tempat penelitian. Data yang digunakan adalah data private dari SMK Al – Falah Tanjungjaya.

e. Data Preprocessing

Pada tahap ini penulis melakukan penghilangan atribut. Data awal yaitu terdiri dari 11 atribut, antara lain nomor, nama siswa, tempat tanggal lahir, nis, bidang studi, program studi, jurusan, rata - rata rapot, absensi, ekstrakulikuler, sktm dan keputusan. Sedangkan atribut yang dihilangkan antara lain atribut tempat tanggal lahir, nis, bidang studi dan program studi.

1) Data Integration

Pada tahap ini penulis menggabungkan beberapa data dari berbagai dataset ke dalam dataset baru.

2) Data Reduction

Pada tahap ini penulis menghilangkan data yang tidak dibutuhkan.

3) Data Transformation

Pada tahap ini penulis mengubah data kedalam format yang sesuai.

f. Pengolahan Data Menggunakkan Rapidminer

Pada tahapan ini penulis akan mengolah data menggunakan mining tools yaitu rapidminer.

(3)

g. Pengujian Data Mining Klasifikasi

Pada tahap ini penulis akan menguji penelitiannya menggunakan penlilaian performance klasifikasi yang akan di hasilkan dalam bentuk akurasi dalam confusion matrix.

h. Kesimpulan Dan Saran

Pada tahap ini penulis membuat kesimpulan berdasarkan hipotesis yang diajukan, serta saran karena penelitian ini memiliki keterbatasan.

3.

Hasil dan Pembahasan

Berdasarkan penelitian yang telah dilakukan di SMK Al-Falah Tanjungjaya terdapat 926 data siswa dengan 12 atribut.

Adapun sampel atribut dari data penerima beasiswa yang diperoleh adalah :

Tabel 1

Atribut Penerima Beasiswa

A. Data Preprocessing dan Seleksi Fitur Sebelum melakukan pengolahan data dilakukannya seleksi fitur untuk memperoleh data yang relevan dalam proses data preprocessing sehingga data bisa menjadi input yang baik untuk mining tools. Dalam data preprocessing terdapat 3 tahap antara lain:

1. Data Integration

Pada tahap ini penulis menggabungkan data kedalam data baru. Dimana data siswa perkelas digabungkan menjadi data keseluruhan.

2. Data Reduction

Pada tahap ini penulis menghilangkan data yang tidak dibutuhkan. Adapun atribut yang dihilangkan adalah atribut tempat tanggal lahir, NIS, bidang studi, dan program studi.

3. Data Transformation

Pada tahap ini penulis mengubah data kedalam format yang sesuai pada atribut rata-rata. Berikut data transfromation untuk atribut rata-rata dapat dilihat pada tabel 2:

Tabel 2

Data Transformation Atribut Rata-rata

Berikut data transfromation untuk atribut absensi dapat dilihat pada tabel 3:

Tabel 3

Data Transformation Atribut Absensi

Berikut data transfromation untuk atribut Ektrakulikuler dapat dilihat pada tabel 4:

Tabel 4

Data Transformation Atribut Ektrakulikuler

B. Perhitungan Naïve Bayes 1) Perhitungan Prediksi

Dari 385 data, setelah dihitung terdapat 327 siswa yang memiliki rata-rata nilai tinggi, 58 siswa rata-rata nilai sedang dan 0 siswa rata-rata nilai rendah. Siswa dengan absensi baik 321 siswa, absensi cukup 58 siswa dan absensi kurang 6 siswa. Siswa yang mengikuti ekstrakurikuler 111 siswa dan yang tidak mengikuti ekstrakurikuler 274 siswa. Siswa yang menyertakan surat keterangan tidak mampu 220 siswa dan yang tidak menyertakan surat keterangan tidak mampu 165 siswa.

Dari 220 data siswa yang menyertakan surat keterangan tidak mampu, itu terdiri dari data siswa yang memiliki rata-rata nilai tinggi 189 data, rata-rata nilai sedang 31 data dan rata-rata nilai rendah 0 data. Data siswa dengan absensi baik 184 data, absensi cukup 33 data dan absensi kurang 3 data. Data siswa yang mengikuti ekstrakulikuler 72 data dan yang tidak mengikuti ekstrakulikuler 148 data.

Dari 165 data siswa yang tidak menyertakan surat keterangan tidak mampu, itu terdiri dari data siswa yang memiliki rata- rata nilai tinggi 138 data, rata-rata nilai sedang 27 data dan rata-rata nilai rendah 0 data. Data siswa dengan absensi baik 137 data, absensi cukup 25 data dan absensi kurang 0 data. Data siswa yang mengikuti ekstrakulikuler 39 data No Nama Atribut

1 Nomor 2 Nama Siswa

3 Tempat Tanggal Lahir 4 NIS

5 Bidang Studi 6 Program Studi 7 Jurusan

8 Rata-rata Rapot 9 Absensi

10 Ektrakulikuler 11 SKTM 12 Keputusan

Rata-rata Hasil Transformasi

50,01-65,00 Rendah

65,01-79,00 Sedang

79,01-100,00 Tinggi

Absensi Hasil

Transformasi

Baik B

Cukup C

Kurang K

Ektrakurikuler Hasil Transformasi

Mengikuti Ya

Tidak Mengikuti Tidak

(4)

dan yang tidak mengikuti ekstrakulikuler 126 data.

Setelah itu lakukan perbandingan antar rincian data menyertakan surat keterangan tidak mampu dengan seluruh data menyertakan surat keterangan tidak mampu dan data keseluruhan, begitu juga data yang tidak menyertakan surat keterangan tidak mampu dan lakukan perbandingan antar rincian data tidak menyertakan surat keterangan tidak mampu dengan seluruh data tidak menyertakan surat keterangan tidak mampu dan data keseluruhan.

Diambil contoh :

Rata-rata : Tinggi

Absensi : Cukup

Ekstrakulikuler : Tidak

SKTM : Menyertakan

Fakta menunjukan:

P ( Y = Menyertakan ) = 220 / 385 = 0,57143 P ( Y = Tidak Menyertakan ) = 165 / 385 =

0,42857

P ( X1 = rata-rata = Tinggi | Y = Menyertakan )

= 189 / 220 = 0,85909 P ( X1 = rata-rata = Tinggi | Y = Tidak

Menyertakan ) = 138 / 165 = 0,83636 P ( X2 = Absensi = C | Y = Menyertakan ) = 33

/ 220 = 0,15

P ( X2 = Absensi = C| Y = Tidak Menyertakan )

= 25 / 165 = 0,15152

P ( X3 = Ekstrakulikuler = Tidak | Y =

Menyertakan ) = 148 / 220 = 0,67273 P ( X3 = Ekstrakulikuler = Tidak|Y = Tidak

Menyertakan ) = 126 / 165 = 0,76364 ( ) 0,0495375

Kemudian bandingkan dengan Jumlah rata-rata tinggi, absensi baik, ekstrakulikuler ya dan SKTM menyertakan keputusannya tidak menerima beasiswa, maka ( )

0,0414738

Lalu bandingkan antara hasil perhitungannya jika Dm > Dtm maka untuk keputusan selanjutnya adalah menerima. Akan tetapi jika Dm < Dtm maka keputusan selanjutnya adalah tidak menerima. Dari hasil perhitungan diatas di peroleh :

Dm(1) = 0,0495375 Dtm (1) = 0,0414738

Setelah dibandingkan dari data tersebut diperoleh Dm (1) > Dtm (1), maka untuk keputusan selanjutnya dengan memiliki nilai rata-rata tinggi, absensi cukup, ektrakulikuler tidak dan sktm menyertakan diprediksi menerima beasiswa.

2). Perhitungan Manual

Berikut data setelah di transformasi dapat dilihat pada tabel 5:

Tabel 5

Sample Data Setelah di Transformasi

Dari 926 data, setelah dihitung terdapat 94 siswa yang menerima beasiswa dan 832 siswa yang tidak menerima beasiswa. Siswa yang memiliki rata-rata nilai tinggi 576 siswa, rata-rata nilai sedang 345 siswa dan rata-rata nilai rendah 5 siswa. Siswa dengan absensi baik 718 siswa, absensi cukup 196 siswa dan absensi kurang 12 siswa. Siswa yang mengikuti ekstrakurikuler 311 siswa dan yang tidak mengikuti ekstrakurikuler 615 siswa.

Siswa yang menyertakan surat keterangan tidak mampu 580 siswa dan yang tidak menyertakan surat keterangan tidak mampu 346 siswa.

Dari 94 data siswa yang menerima beasiswa, itu terdiri dari data siswa yang memiliki rata-rata nilai tinggi 80 data, rata-rata nilai sedang 14 data dan rata-rata nilai rendah 0 data. Data siswa dengan absensi baik 82 data, absensi cukup 11 data dan absensi kurang 1 data. Data siswa yang mengikuti ekstrakulikuler 39 data dan yang tidak mengikuti ekstrakulikuler 55 data. Data siswa yang menyertakan surat keterangan tidak mampu 92 dan yang tidak menyertakan surat keterangan tidak mampu 2 data.

Dari 832 data siswa yang tidak menerima beasiswa. Itu Terdiri dari data siswa yang memiliki rata-rata nilai tinggi 496 data, rata-rata nilai sedang 331 data dan rata-rata nilai rendah 5 data. Data siswa dengan absensi baik 636 data, absensi cukup 185 data dan absensi kurang 11 data. Data siswa yang mengikuti ekstrakurikuler 272 data dan yang tidak mengikuti ekstrakurikuler 560 data.

Data siswa yang menyertakan surat keterangan tidak mampu 488 dan yang tidak menyertakan surat keterangan tidak mampu 344 data.

Setelah itu lakukan perbandingan antar rincian data menerima dengan seluruh data menerima dan data keseluruhan, begitu juga data yang tidak menerima dan lakukan perbandingan antar rincian data tidak menerima dengan seluruh data tidak menerima dan data keseluruhan.

(5)

P(H|X) = P(X|H)P(H) P(X) Keterangan : X adalah bukti H adalah hipotesis

P(H|X) adalah probabilitas bahwa hipotesis H benar untuk bukti X atau dengan kata lain P(H|X) merupakan probabilitas posterior H dengan syarat X

P(H|X) adalah probabilitas bahwa bukti X benar untuk hipotesis H atau probabilitas posterior X dengan syarat H

P(H) adalah probabilitas prior hipotesis H P(X) adalah probabilitas prior bukti X.

Diambil contoh :

Rata-rata : Tinggi

Absensi : Baik

Ekstrakulikuler : Ya

SKTM : Menyertakan

Keputusan : Menerima Beasiswa Fakta menunjukan:

P ( Y = Menerima ) = 94 / 926 = 0,10151 P ( Y = Tidak Menerima ) = 832 / 926 = 0,89849

P ( X1 = rata-rata = Tinggi | Y = Menerima ) = 80 / 94 = 0,85106383

P ( X1 = rata-rata = Tinggi | Y = Tidak Menerima ) = 496 / 926 = 0,596154

P ( X2 = Absensi = B | Y = Menerima ) = 82 / 94 = 0,87234

P ( X2 = Absensi = B| Y = Tidak Menerima ) = 636 / 926 = 0,764423

P ( X3 = Ekstrakulikuler = Ya | Y = Menerima )

= 39 / 94 = 0,414894

P ( X3 = Ekstrakulikuler = Ya| Y = Tidak Menerima ) = 272 / 926 = 0,326923

P ( X4 = SKTM = Menyertakan | Y = Menerima ) = 92 / 94 = 0,978723

P ( X4 = SKTM = Menyertakan | Y = Tidak Menerima ) = 488 / 926 = 0,586538

( ) 0,03060284 Kemudian bandingkan dengan Jumlah rata-rata tinggi, absensi baik, ekstrakulikuler ya dan SKTM menyertakan keputusannya tidak menerima beasiswa, maka ( )

0,0785139

Lalu bandingkan antara hasil perhitungannya jika Dm > Dtm maka untuk keputusan selanjutnya adalah menerima. Akan tetapi jika Dm < Dtm maka keputusan selanjutnya adalah tidak menerima. Dari hasil perhitungan diatas di peroleh :

Dm(1) = 0,03060284 Dtm (1) = 0,0785139

Setelah dibandingkan dari data tersebut diperoleh Dm (1) < Dtm (1), maka untuk keputusan selanjutnya dengan memiliki nilai

rata-rata tinggi, absensi baik, ektrakulikuler ya, dan sktm menyertakan diprediksi menerima beasiswa.

3). Proses Dan Hasil Dalam Rapidminer a) Split Validation

Dalam penelitian ini menggunakan tools data mining rapidminer. Dari data yang telah di proses di ketahui tipe data dan jenis atribut dari masing-masing atribut pada tabel 6:

Tabel 6

Tipe data atribut dalam rapidminer

Pada tahapan proses data mining setelah himpunan data atau dataset siap diolah maka selanjutnya adalah metode data mining dimana metode data mining yang digunakan naïve bayes. Dalam penelitian ini digunakan validasi split validation dimana validasi ini dignakan untuk memvalidasi model yang digunakan valid atau tidak sehingga hasil penelitian yang dilakukan lebih akurat hasilnya.

Dalam split validasi data harus dibagi menjadi data training dan data testing. Dalam Penelitian ini melakukan 10 kali validasi, yaitu 90% data training dan 10% data testing, 80% data training dan 20% data testing, 70% data training dan 30% data testing, dan seterusnya.

Dimana proses-proses yang dilakukan dapat dilihat pada gambar 2 dibawah ini:

Sumber : Rapidminer

Gambar 2 Proses 1 Rapidminer Split Validation

Pada gambar 3 adalah proses penerapan metode naïve bayes, apply model dan performance (classification). Dapat dilihat pada gambar dibawah ini:

Atribut Tipedata Jenis Atribut Rata-rata Polynominal Atribut Biasa Absensi Polynominal Atribut Biasa Ekstrakulikuler Polynominal Atribut Biasa SKTM Polynominal Atribut Biasa Keputusan Polynominal Label

(6)

Sumber : Rapidminer

Gambar 3 Proses 2 Rapidminer Split Validation

Dalam proses ini peneliti menggunakan operator seperti:

1. Read Excel yang fungsinya adalah untuk mengimport data dan membaca data yang telah disimpan dalam file excel yang berformat .xls atau .xlsx.

2. Split Validation merupakan operator validasi sederhana untuk mengevaluasi model.

3. Naïve Bayes (gambaran umum naïve bayes).

4. Apply Model merupakan operator yang berfungsi untuk menerapkan model pada dataset.

5. Performance (Classification) merupakan operator yang berfungsi untuk mengevaluasi penelitian dimana hasilnya berupa nilai accuracy dan confusion matrix.

Hasil confusion matrix algoritma naïve bayes dapat dilihat pada gambar 4 dibawah ini:

Sumber : Rapidminer

Gambar 4 Hasil Confusion Matrix Split Validation

Confusion matrix ini berguna untuk mengevaluasi kinerja model klasifikasi yang dilakukan yang mana berdasarkan pada kemampuan akurasi suatu model yakni model dalam penelitian ini naïve bayes yang telah divalidasi menggunakan split validation.

Akurasi dinyatakan dalam persentase (%).

Pada penelitian ini diperoleh nilai akurasinya adalah 89,93%.

Nilai akurasi ini dapat dari perhitungan jumlah data yang diprediksi benar dan diprediksi salah. Dimana dalam gambar diatas diperoleh hasilnya sebagai berikut:

1. Pred tidak menerima - true tidak menerima (artinya jumlah data yang benar diprediksi tidak menerima) = 250 data

2. Pred menerima - true menerima (artinya jumlah data yang benar diprediksi tidak menerima) = 0 data

3. Pred tidak menerima - true menerima (artinya jumlah data yang diprediksi tidak menerima tapi kenyataannya menerima) = 28 data

4. Pred menerima - true tidak menerima (artinya jumlah data yang diprediksi menerima tapi kenyataannya tidak menerima) = 0 data

5. Nilai akurasi diperoleh dari total jumlah data yang benar diprediksi dibagi total jumlah data. nilai akurasi dinyatakan dalam persentase

Akurasi =

Akurasi =

Akurasi = 89,93%

Setelah dilakukannya penelitian maka diperoleh nilai akurasi dalam penelitian ini yang tinggi yaitu 89,93%.

b) Cross Validation

Pada tahapan proses data mining setelah himpunan data atau dataset siap diolah maka selanjutnya adalah metode data mining dimana metode data mining yang digunakan naïve bayes. Dalam penelitian ini digunakan validasi cross validation dimana validasi ini digunakan untuk memvalidasi model yang digunakan valid atau tidak sehingga hasil penelitian yang dilakukan lebih akurat hasilnya.

Dimana proses-proses yang dilakukan dapat dilihat pada gambar 5 dibawah ini:

Sumber : Rapidminer

Gambar 5 Proses 1 Rapidminer Cross Validation

Pada gambar 6 adalah proses penerapan metode naïve bayes, apply model dan performance (classification). Dapat dilihat pada gambar dibawah ini:

(7)

Sumber : Rapidminer

Gambar 6 Proses 2 Rapidminer Cross Validation

Dalam proses ini peneliti menggunakan operator seperti:

1. Read Excel yang fungsinya adalah untuk mengimport data dan membaca data yang telah disimpan dalam file excel yang berformat .xls atau .xlsx.

2. Cross Validation merupakan operator validasi sederhana untuk mengevaluasi model.

3. Naïve Bayes (gambaran umum naïve bayes).

4. Apply Model merupakan operator yang berfungsi untuk menerapkan model pada dataset.

5. Performance (Classification) merupakan operator yang berfungsi untuk mengevaluasi penelitian dimana hasilnya berupa nilai accuracy dan confesion matrix.

Hasil confusion matrix algoritma naïve bayes dapat dilihat pada gambar 7 dibawah ini:

Sumber : Rapidminer

Gambar 7 Hasil Confusion Matrix Cross Validation

Confusion matrix ini berguna untuk mengevaluasi kinerja model klasifikasi yang dilakukan yang mana berdasarkan pada kemampuan akurasi suatu model yakni model dalam penelitian ini naïve bayes yang telah divalidasi menggunakan cross validation.

Akurasi dinyatakan dalam persentase (%).

Pada penelitian ini diperoleh nilai akurasinya adalah 89,85%.

Nilai akurasi ini dapat dari perhitungan jumlah data yang diprediksi benar dan diprediksi salah. Dimana dalam gambar diatas diperoleh hasilnya sebagai berikut:

1. Pred tidak menerima - true tidak menerima (artinya jumlah data yang benar diprediksi tidak menerima) = 832 data

2. Pred menerima - true menerima (artinya jumlah data yang benar diprediksi tidak menerima) = 0 data

3. Pred tidak menerima - true menerima (artinya jumlah data yang diprediksi tidak menerima tapi kenyataannya menerima) = 94 data

4. Pred menerima - true tidak menerima (artinya jumlah data yang diprediksi menerima tapi kenyataannya tidak menerima) = 0 data

5. Nilai akurasi diperoleh dari total jumlah data yang benar diprediksi dibagi total jumlah data. nilai akurasi dinyatakan dalam persentase

Akurasi =

Akurasi =

Akurasi = 89,85%

Setelah dilakukannya penelitian maka diperoleh nilai akurasi dalam penelitian ini yang tinggi yaitu 89,85%.

4. Kesimpulan

Dari beberapa uraian sebelumnya yang telah dibahas, penulis dapat mengambil kesimpulan dari pembahasan bab-bab sebelumnya, yaitu:

1. Kesulitan yang dihadapi SMK Al - Falah Tanjungjaya dalam menentukan siswa yang menerima beasiswa.

2. Metode yang digunakan untuk memprediksi siswa yang menerima beasiswa ini adalah metode naïve bayes.

3. Penerapan metode naïve bayes pada data penerima beasiswa SMK Al - Falah Tanjungjaya memperoleh nilai akurasi yang telah dilakukan dalam rapidminer menggunakan split validation sebesar 89,93%, sedangkan menggunakan cross validation sebesar 89,85%.

Referensi

Andriyana, v. (2015). Perbandingan 3 Metode dalam Data Mining untuk Memprediksi Penerima Beasiswa Berdasarkan Prestasi di SMA Negeri 6 Surakarta.

Antony Anwari Rahman dan Agus Suryanto, (2017). Beasiswa dengan Metode Naïve Bayes Classifier, 2(3), 1–8.

Dahri, D., Agus, F., & Khairina, D. M. (2016).

Metode Naïve Bayes untuk Penentuan Penerima Beasiswa Bidikmisi Universitas Mulawarman, 11(2).

Destiawati, F. (2016). Kajian Perancangan Rule Algoritma Terhadap Kelayakan

(8)

Pemberian Beasiswa pada Sekolah Menegah Atas.

Fitriyani, & Wahono, R. S. (2015). Integrasi Bagging dan Greedy Forward Selection pada Prediksi Cacat Software dengan Menggunakan Naïve Bayes.

Guterres, J. A. D. (2015). Kelayakan Algoritma C45 Sebagai Pendukung Keputusan dalam Pengajuan Penerima Beasiswa, 142–147.

Mukminin, A., & Riana, D. (2017). Komparasi Algoritma C4 . 5 , Naïve Bayes dan Neural Network untuk Klasifikasi Tanah. Mukminin, Amirul Riana, Dwiza, 4(1), 21–31.

Murniasaih. (2009). Beasiswa Pendidikan.

Yogyakarta.

Nuraeni, N. (2017). Penentuan Kelayakan Kredit dengan Algoritma Naïve Bayes Classifier.

Rahman, A. A. (2017). Implementasi Sistem Informasi Seleksi Penerima Beasiswa dengan Metode Naïve Bayes Classifier.

Ramdhani, Y. (2015). Komparasi Algoritma LDA dan Naïve Bayes dengan Optimasi Fitur untuk Klasifikasi Citra Tunggal Pap Smear. Informatika, II(2), 434–441.

Riana, D., Hidayanto, A. N., & Fitriyani. (2017).

Integration of Bagging and greedy forward selection on image pap smear classification using Naïve Bayes.

Ridwan, M., Suyono, H., & Sarosa, M. (2013).

Penerapan Data Mining untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes Classifier, 7(1), 59–64.

Sari, B. W. (2017). Penentuan Kelayakan Penerima Bantuan Renovasi Rumah Warga Miskin Menggunakan Naïve Bayes. 34-38.

Septiani, W. D. (2017). Komparasi Metode Klasifikasi Data Mining Algoritma C4.5 dan Naïve Bayes untuk Prediksi Penyakit Hepatitis. Pilar Nusa Mandiri, 13(1), 76–84

Suyanto. (2017). Data Mining untuk Klasifikasi dan Klasterisasi Data. Bandung:

Informatika Bandung.

Wati, R. (2016). Penerapan Algoritma Genetika untuk Seleksi Fitur pada Analisis Sentimen Review Jasa Maskapai Penerbangan Menggunakan Naïve Bayes, 4, 25–31.

Wulansari Fridayanthie Program Studi Manajemen Informatika AMIK, E., Jakarta, B., Fatmawati No, J. R., Labu, P., & Selatan Indonesia, J. (2015).

Analisa Data Mining untuk Prediksi Penyakit Hepatitis dengan Menggunakan Metode Naïve Bayes dan Support Vector Machine, 3(1).

Yutanto, H. (2018). Penerapan Data Mining Sebagai Model Seleksi Penerima Beasiswa Penuh.

Referensi

Dokumen terkait

Skripsi yang berjudul “ Pengaruh Penerapan Syariah Marketing Terhadap Reputasi Program Beasiswa Pena Bangsa Pada Yayasan Dana Sosial Al-Falah Sidoarjo ” ini

Tujuan penelitian ini adalah untuk mengetahui apakah ada perbedaan prestasi belajar yang dicapai oleh siswa yang menerima beasiswa dengan bukan penerima

yang menerima beasiswa dengan bukan penerima beasiswa siswa kelas VIII di. SMPN I

Pada penelitian ini dikembangkan sebuah prototype aplikasi penjurusan siswa yang bertujuan untuk melakukan pengujian penerapan metode Naïve Bayes dalam memberikan rekomendasi

Dalam melakukan seleksi beasiswa tersebut tentu akan mengalami kesulitan karena banyaknya pelamar beasiswa dan banyaknya kriteria yang digunakan untuk menentukan

Dalam pemilihan penerima beasiswa masalah yang dihadapi peneliti ini menyaring ribuan peserta yang dilakukan secara manual, SPK dapat membantu pihak panitia dalam

Dengan teknik klasifikasi menggunakan algoritma naïve bayes classification NBC dalam pengolahan data tersebut, diharapkan dapat dibangun sebuah model yang dapat digunakan untuk

SIMPULAN Hasil perhitungan yang telah dilakukan pada KNN, NAÏVE BAYES dan CART pada penentuan penerima beasiswa dapat diperoleh kesimpulan Algoritme CART merupakan Algoritme dengan