• Tidak ada hasil yang ditemukan

PENERAPAN ALGORITMA NAIVE BAYES DALAM PROSES PENENTUAN JURUSAN PADA SMAN 7 BANJARMASIN

N/A
N/A
Nguyễn Gia Hào

Academic year: 2023

Membagikan "PENERAPAN ALGORITMA NAIVE BAYES DALAM PROSES PENENTUAN JURUSAN PADA SMAN 7 BANJARMASIN"

Copied!
8
0
0

Teks penuh

(1)

290 PENERAPAN ALGORITMA NAIVE BAYES DALAM PROSES PENENTUAN

JURUSAN PADA SMAN 7 BANJARMASIN Dian Agustini dan Muthia Farida

Fakultas Teknologi Informasi Universitas Islam Kalimantan Email : dian.da989@yahoo.co.id

ABSTRAK

Algoritma Naive Bayes merupakan satu algoritma yang mudah dan sering digunakan di dalam teknik pengelompokan data kerana membuat suatu perkiraan yang efsien dan tidak memerlukan banyak parameter. Beberapa penelitian telah menghasilkan kesimpulan bahwa algoritma K-Means dapat dipergunakan untuk mengelompokkan data berdasarkan atribut-atribut tertentu. Pada penelitian ini akan digunakan algoritma Naive Bayes untuk mengelompokkan data siswa Sekolah Menengah Atas berdasarkan Nilai mata pelajaran inti untuk proses penjurusan. Penelitian ini juga menguji tingkat akurasi algoritma Naive Bayes dalam penentuan jurusan pada Sekolah Menengah Atas.

Kata Kunci : Klasifikasi, Penjurusan Siswa, Kriteria Ketuntasan Minimum Naive Bayes

PENDAHULUAN

Sesuai kurikulum yang berlaku diseluruh Indonesia, maka siswa kelas X SMA yang naik ke kelas XI akan mengalami pemilihan jurusan/penjurusan. Penjurusan yang tersedia di SMA meliputi Ilmu Pengetahuan Alam (IPA), Ilmu Pengetahuan Sosial (IPS), dan Ilmu Bahasa. Penjurusan tersebut akan disesuaikan dengan minat dan kemampuan seorang siswa.

Karena bertujuan agar nantinya pelajaran yang akan diberikan kepada siswa tersebut menjadi lebih terarah karena telah sesuai dengan kemampuan serta minat dari siswa tersebut. Salah satu pertimbangan untuk menyeleksi siswa dalam menentukan jurusan adalah prestasi siswa pada semester satu dan dua (kelas X) dalam bentuk nilai mata pelajaran.

METODE PENELITIAN

A. Metode Penelitian yang dipakai menggunakan Metode Eksperimen dengan Tahapan : 1. Pengumpulan Data (Data Gathering)

Penelitian ini menggunakan data primer pada Sekolah Menengah Atas Negeri 7 Banjarmasin.

2. Pengolahan Awal Data (Data Pre-processing)

Data yang telah diperoleh di transformasikan untuk mendapatkan atribut yang relevan dan sesuai dengan format input algoritma soft computing.

3. Model/Metode Yang Diusulkan (Proposed Model/Method)

(2)

291 Metode yang

Diusulkan adalah metode perbandingan tingkat akurasi dari algoritma soft computing yang dapat digunakan untuk mengklasifikasikan data.

4. Eksperiment dan Pengujian Metode (Method Test dan Experiment)

Masing-masing algoritma akan menggunakan data yang sama. Sebagian data digunakan untuk data training dansebagian data lagi sebagai data testing.

Perhitungan dengan masing-masing algoritma akan dilakukan berulang kali sehingga mendapatkan hasil yang terbaik.

5. EvaluasidanValidasi Hasil (Result Evaluation and Validation). Evaluasi dilakukan dengan cara mengamati hasil klasifikasi dengan menggunak analgoritma soft computing.

B. Pengumpulan Data

Data yang digunakan berupa data primer yang meliputi : data siswa, nilai mata pelajaran semester 1 dan 2, angket minat siswa serta nilai psikotes siswa. Sedangkan kan untuk sampel data yang akan digunakan adalah data nilai (sebelum peminatan atau penjurusan) sebanyak 256 siswa.

C. Pengolahan Data Awal

Data yang diambil dari Sekolah Menengah Atas Negeri 7 Banjarmasin sebanyak 256 data pada tahun 2014-2015 masih berupa data yang terdiri dari berbagai macam parameter, sehingga harus diolah terlebih dahulu. Dalam hal ini, dilakukan perubahan dan kategori untuk mendapatkan hasil yang lebih baik. Data asli seperti NIS, Nama, Jenis Kelamin, Nilai mata pelajaran dalam bentuk kognitif, apektif, psikomotorik pada semester 1 dan semester 2 seperti Agama, PKN, Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, Biologi, Sejarah, Ekonomi, Geografi, Sosiologi, Seni, Pendidikan Jasmani, TIK, Bahasa Jepang, Mulok, Nilai mata pelajaran

peminatan seperti Matematika, Fisika, Kimia, Biologi, rata-rata nilai mata pelajaran peminatan, angket minat siswa terhadap jurusan IPA dan IPS.

Data mata pelajaran untuk nilai siswa semester 1 hanya beberapa mata pelajaran saja yang ditampilkan seperti Nilai Kognitif, Afektif, Psikomotorik untuk

mata pelajaran Agama, Pkn dan Bahasa Indonesia. Table ini hanya untuk menampilkan data Asli nilai siswa pada semester 1.

No NIS K Agm

A Agm

K PKn

A PKn

K Bin

A Bin

P Bin 1 10741 L 92 Amat

Baik 82 Amat

Baik 83 Amat Baik 80 2 10745 P 90 Amat

Baik 80 Amat

Baik 82 Baik 80 3 10758 P 81 Amat

Baik 85 Amat

Baik 81 Baik 80

(3)

292 4 10770 P 92 Amat

Baik 83 Amat

Baik 82 Baik 80 5 10785 P 90 Amat

Baik 79 Amat

Baik 81 Baik 80

NO NIS L/P

ANGKET MINAT

IPA IPS

1 10741 L IPA

2 10745 P IPS

3 10758 P IPA

4 10770 P IPA

5 10785 P IPA

Angket Minat Siswa

No NIS L/P PSIKOTES

IQ Prediksi Nilai Jurusan

1 10741 L 110 7,25 IPA

2 10745 P 94 5,16 IPS

3 10758 P 109 7,14 IPA

4 10770 P 119 8,24 IPA

5 10785 P 103 6,04 IPS

Nilai Psikotes Siswa

No NIS M AT

1 FI S1

KI M1

BI O1

RT 1

MA T2

FI S2

KI M2

BI O2

RT 2 1 1074

1 88 82 80 80 83 88 77 81 80 82

2 1074

5 78 75 75 76 76 78 75 80 76 77

3 1075

8 90 78 80 76 81 90 77 82 77 82

4 1077

0 82 75 77 81 79 80 75 82 85 81

5 1078

5 76 75 75 76 76 78 75 78 77 77

Data Nilai Siswa Semester 1 & 2 METODE

(4)

293 Dari masalah diatas, setelah dilakukan studi literature dari beberapa buku dan jurnal, ditemukan bahwa untuk penentuan jurusan siswa di Sekolah Menengah Atas dapat menggunakan metode data mining, dengan konsep Klasifikasi dan algoritma Naïve Bayes.

Data akan ditraining yang selanjutnya akan diuji. Pengujian dilakukan untuk menemukan nilai akurasi dari masing-masing metode, algoritma dari metode yang digunakan akan diimplementasikan dengan menggunakan RapidMiner.

EKSPERIMEN DAN PENGUJIAN MODEL

Metode yang dikembangkan dalam penelitian ini akan diterapkan pada data siswa Sekolah Menengah Atas Negeri 7 Banjarmasin melalui suatu model simulasi menggunakan RapidMiner. Evaluasidilakukandenganmenganalisahasilklasifikasi.

Pengukurandalampenelitianuntuk permasalahan dalam klasifikasi yang biasa digunakan adalah confusion matrix (precision, recall dan accuracy) untuk mengevaluasi hasil dari algoritma Naive Bayes.

PEMBAHASAN

Hasil Eksperimen dan Pengujian Metode Pertama kali pengujian dilakukan dengan data yang belum dikategorikan namun telah dimodifikasi agar dapatdiimplementasikan pada Rapid Miner, seperti terlihat pada tabel data awal sebagai berikut : Data terdiri dari atribut Nama, Jenis Kelamin, Angket Minat, Psikotest Jurusan, dan rekomendasi rapor yang diambil dari nilai semester 1 dan semester 2. Untuk pengujian pertama, Hasil terlihat pada gambar dibawah ini :

Gambar : Akurasi Hasil Algoritma Naïve Bayes menggunakan Percobaan 1

Berdasarkan gambar diatas, dapat dijelaskan bahwa Jumlah True Positive (TP) adalah 44 record diklasifikasi sebagai true terpilih dan false negative (FN) sebanyak 25 record diklasifikasi sebagai true terpilih tetapi false terpilih. Berikutnya 16 record untuk true

(5)

294 negative (TN) diklasifikasikan sebagai false terpilih dan 14 record false positif (FR) diklasifikasikan sebagai false terpilih ternyata true. Berdasarkan gambar 4.1 menunjukkan bahwa nilai akurasi mencapai 58,56%.

Gambar : Precision Hasil Algoritma Naïve Bayes menggunakan Percobaan 1

Berdasarkan gambar diatas, dapat dijelaskan bahwa Untuk jumlah True Positive (TP) adalah 44 record diklasifikasi sebagai true terpilih dan false negative (FN) sebanyak 25 record diklasifikasi sebagai true terpilih tetapi false terpilih. Berikutnya 16 record untuk true negative (TN) diklasifikasikan sebagai false terpilih dan 14 record false positif (FR)

diklasifikasikan sebagai false terpilih ternyata true. Berdasarkan gambar 4.2 menunjukkan bahwa nilai Precision adalah 46,67%.

Sedangkan untuk nilai Recall jumlah True Positive (TP) adalah 44 record diklasifikasi sebagai true terpilih dan false negative (FN) sebanyak 25 record diklasifikasi sebagai true terpilih tetapi false terpilih. Berikutnya 16 record untuk true negative (TN) diklasifikasikan sebagai false terpilih dan 14 record false positif (FR) diklasifikasikan sebagai false terpilih ternyata true. Berdasarkan gambar 4.3 menunjukkan bahwa nilai Recall 36,67 %.

Gambar : PerformaceVector Algoritma Naïve Bayes Menggunakan Percobaan 1

(6)

295 Dikarenakan nilai akurasinya masih rendah, maka dilakukan percobaan kedua dengan menggunakan data yang melibatkan angket minat, psikotest jurusan, rata-rata semester 1, rata-rata semester 2 serta rekomendasi rapor.

No l/p angket minat

psikotes jurusan

rata2 smt

1

rata2 smt 2

rekomendasi rapor

1 P IPA IPA 77 79 IPS

2 L IPA IPS 78 79 IPS

3 P IPA IPA 78 78 IPS

4 L IPA IPA 80 80 IPA

5 P IPS IPA 79 79 IPS

Data Percobaan 2 Naïve Bayes

Dari percobaan kedua dengan menggunakan data diatas, didapatkan hasil seperti terlihat

Gambar : Akurasi Hasil Algoritma Naïve Bayes menggunakan Percobaan 2

Berdasarkan gambar diatas, dapat dijelaskan bahwa Jumlah True Positive (TP) adalah 58 record diklasifikasi sebagai true terpilih dan false negative (FN) sebanyak 3 record diklasifikasi sebagai true terpilih tetapi false terpilih. Berikutnya 2 record untuk true negative (TN) diklasifikasikan sebagai false terpilih dan 37 record false positif (FR) diklasifikasikan sebagai false terpilih ternyata true. Berdasarkan gambar 4.5 menunjukkan bahwa nilai akurasi mencapai 95,00 %. Sementara untuk precision dapat dilihat pada gambar dibawah ini :

(7)

296 Gambar : Precision Hasil Algoritma Naïve Bayes menggunakan Percobaan 2

Berdasarkan gambar diatas, dapat dijelaskan bahwa Untuk jumlah True Positive (TP) adalah 58 record diklasifikasi sebagai true terpilih dan false negative (FN) sebanyak 3 record diklasifikasi sebagai true terpilih tetapi false terpilih. Berikutnya 2 record untuk true negative (TN) diklasifikasikan sebagai false terpilih dan 37 record false positif (FR) diklasifikasikan sebagai false terpilih ternyata true. Berdasarkan gambar 4.6 menunjukkan bahwa nilai Precision mencapai 96,00 %.

Gam bar 5.8 Rec all Hasi l Algoritma Naïve Bayes menggunakan Percobaan 2

Sedangkan untuk nilai Recall jumlah True Positive (TP) adalah 58 record diklasifikasi sebagai true terpilih dan false negative (FN) sebanyak 3 record diklasifikasi sebagai true terpilih tetapi false terpilih. Berikutnya 2 record untuk true negative (TN) diklasifikasikan sebagai false terpilih dan 37 record false positif (FR) diklasifikasikan sebagai false terpilih ternyata true. Berdasarkan gambar 4.8 menunjukkan bahwa nilai Recall 92,50%. Pada percobaan 2 dihasilkan Performace Vector seperti gambar dibawah ini :Gambar : PerformaceVector Algoritma Naïve Bayes Menggunakan Percobaan 2

1. Perbandingan Hasil Algoritma Pada Percobaan 1 dan 2

Algoritma

Akurasi (%) Presisi (%) Recall (%) Per.1 Per 2 Per.1 Per 2 Per.1 Per 2 Naïve Bayes 58,56 95,00 46,67 96 36,67 92,50

KNN 56,56 93,00 43,33 91,50 34,17 92,50

(8)

297 2. Implikasi dan Penelitian

Data hasilperbandingantersebutdisimpulkan Naïve Bayes lebihakuratdaripada k-NN dalampenentuanjurusansiswa di SekolahMenengahAtasNegeri 7

Banjarmasin.Denganadanyapenerapan Naïve Bayes diharapkam mampu memberikan solusi bagi siswa dan dapat membantu pihak sekolah dalam menentukan jurusan yang sesuai yang akan ditempuh oleh siswa.

KESIMPULAN

Berdasarkan hasil eksperimen dan evaluasi yang dilakukan maka dapat disimpulkan bahwa Algoritma Naïve Bayes dapat digunakan untuk meningkatkan akurasi penentuan jurusan siswa, dengan tingkat keakurasi 95% sehingga dapat membantu bagi pihak sekolah dalam menentukan jurusan siswa berdasarkan nilai mata pelajaran, minat serta test psikologi.

DAFTAR PUSTAKA

Chang Wen-Chih, “Integrating IRT to Clustering Student’s Ability with K-Means,” in 2009 Fourth International Conference on Innovative Computing, Information, and Control, 2009

Bahar, Penentuan Jurusan Sekolah Menengah Atas Dengan Algoritma Fuzzy C-Means, Semarang, Indonesia, 2011.

Sumanto, Penerapan Fuzzy C-Means dalam Pemilihan Peminatan Tugas Akhir, Jakarta, Indonesia, 2010

Daniel T Larase, Discovering Knowlegde in Data : an Introduction to Data Mining. New Jersey, United States of America : Wiley, 2005

Ian H Witten, Data Mining : Practical Machine Learning Tools and Techniques, 2nd Ed. San Francisco : Morgan Kaufmann Publisher, 2005

Sugiyono, 2006, Metode Penelitian Kuantitatif, Kualitatif dan R & D, Alfabeta, Bandung.

Referensi

Dokumen terkait

Penerapan media pembelajaran berbasis multimedia interaktif dalam mata pelajaran IPA (Ilmu Pengetahuan Alam) khususnya pada materi objek IPA dan pengamatannya

Permasalahan yang ada dalam pembelajaran IPA di kelas IX SMPN 1 Arjasa yang akan dipecahkan: 1 Proses pembelajaran IPA-biologi topik bioteknologi di SMPN 1 Arjasa menuntut untuk dapat