1
PENDAHULUAN
1.1. Latar Belakang Masalah
Sistem informasi dapat digunakan untuk mendapatkan, mengolah dan menyebarkan informasi untuk menunjang kegiatan operasional sehari-hari sekaligus menunjang kegiatan pengambilan keputusan strategis (Triana et al.
2017). Sistem informasi juga bisa menjadi alat modern yang dapat diaplikasikan untuk mendukung peningkatan kualitas, salah satunya untuk institusi pendidikan. Di dunia pendidikan sekarang ini banyak kegiatan yang di dukung dengan sistem komputerisasi dan digitalisasi sehingga ketersediaan data lebih mudah untuk di peroleh, misal dengan adanya UNBK yaitu ujian nasional berbasis komputer dan juga PPDB Online yaitu penerimaan peserta didik baru secara online.
SMK Negeri Manonjaya setiap tahunnya melakukan penerimaan peserta didik baru (PPDB), penentuan keputusan penerimaan memperhatikan aturan- aturan tertentu baik dari pemerintahan maupun dari pihak sekolah. Dalam penentuan hasil seleksi PPDB membutuhkan ketelitian dalam mengolah data- datanya, karena banyaknya data yang harus disesuaikan dengan ketentuan persyaratan penerimaan. Adanya seleksi penerimaan ini menjadi salah satu cara untuk menyaring peserta didik yang layak diterima, sehingga diharapkan dapat meningkatkan kualitas, prestasi dan nama baik sekolah. Untuk itu sebaiknya perlu dilakukan analisis data calon peserta didik untuk menentukam kelayakan diterima atau tidaknya. Dari adanya permasalahan tersebut maka penulis tertarik
untuk melalukan penelitian data mining untuk mengklasifikasikan kelayakan diterima atau tidaknya calon peserta didik tersebut.
Naive Bayes adalah salah satu algoritma yang dapat di gunkanan untuk melakukan proses pengklasifikasian data mining, algoritma naive bayes banyak digunakan oleh peneliti sebelumnya dan memperoleh nilai akurasi yang tinggi, diantaranya penelitian yang dilakukan oleh Diana Laily Fithri dan Eko Darmanto (2014) memprediksi kelulusan mahasiswa dengan penerapan metode algoritma naive bayes dengan hasil tingkat akurasi sebesar 93%, penelitian yang dilakukan oleh Husni Naparin (2016) klasifikasi peminatan siswa SMA menggunakan metode naive bayes memiliki tingkat akurasi tinggi sebesar 99.47%, penelitian Mohamad Fajarianditya Nugroho dan Setyoningsih Wibowo (2017) fitur seleksi forward selection untuk menetukan atribut yang berpengaruh pada klasifikasi kelulusan mahasiswa fakultas ilmu komputer UNAKI Semarang menggunakan algoritma naive bayes dengan hasil akurasi 97,14% dan termasuk dalam kategori excellent classification, penelitian Duwi Cahya Putri Buani (2016) optimasi algoritma naive bayes dengan menggunakan algoritma genetika untuk prediksi kesuburan (Fertility) hasil akurasinya 99,33%, penelitian Oktariani Nurul Pratiwi (2016) analisa perbandingan algoritma k-means, decision tree, dan naive bayes untuk sistem pengelompokkan siswa otomatis nilai akurasi algoritma naive bayes adalah yang terbesar yaitu 70,37%, decision tree 59,26% dan k-means 26%. Oleh karena itu dalam penelitian ini penulis akan menggunakan teknik pengklasifikasian dengan menggunakan algoritma naive bayes.
Berdasarkan uraian sebelumnya maka penulis bermaksud mengangkat permasalahan tersebut sebagai bahan penulisan Skripsi dengan judul “Analisa Metode Klasifikasi Algoritma Naive Bayes Untuk Penerimaan Peserta Didik Baru Pada SMKN Manonjaya Tasikmalaya”.
1.2. Identifikasi Masalah
Berdasarkan latar belakang masalah diatas, permasalahan yang dapat diidentifikasikan adalah:
1. Berapa nilai akurasi algoritma naive bayes untuk mengklasifikasikan penerimaan peserta didik baru pada SMKN Manonjaya?
2. Bagaimana hasil pengujian confussion matrix algoritma naive bayes untuk mengklasifikasikan penerimaan peserta didik baru pada SMKN Manonjaya?
3. Bagaimana hasil pengujian ROC Curve algoritma naive bayes untuk mengklasifikasikan data penerimaan peserta didik baru pada SMKN Manonjaya?
1.3. Maksud dan Tujuan
Penelitian ini dimaksudkan untuk mengetahui hasil evaluasi klasifikasi data mining untuk menentukan diterima atau tidaknya calon peserta didik menggunakan algoritma naive bayes. Secara rinci maksud dari penelitian ini adalah sebagai berikut:
1. Untuk mengetahui berapa nilai akurasi algoritma naive bayes untuk mengklasifikasikan penerimaan peserta didik baru pada SMKN Manonjaya.
2. Untuk mengetahui bagaimana hasil pengujian confussion matrix algoritma naive bayes untuk mengklasifikasikan penerimaan peserta didik baru pada SMKN Manonjaya.
3. Untuk mengetahui bagaimana hasil pengujian ROC Curve algoritma naive bayes untuk mengklasifikasikan penerimaan peserta didik baru pada SMKN Manonjaya.
Tujuan penelitian ini adalah untuk melengkapi salah satu syarat yang telah ditentukan dalam mencapai kelulusan program Strata Satu (S1) pada Universitas BSI Bandung.
1.4. Metode Penelitian
Metode yang digunakan pada penelitian ini antara lain:
A. Metode Penelitian
Metode yang digunakan pada penelitian data mining ini adalah:
1. Klasifikasi Data Mining
Klasifikasi data mining merupakan teknik untuk mempelajari sekumpulan data sehingga dihasilkan aturan yang bisa mengklasifikasi atau mengenali data-data baru yang belum pernah dipelajari.
2. Seleksi Fitur
Tujuan utama dari seleksi fitur adalah fokus pada mencari sebuah data yang relevan. Fitur yang tidak relevan dan fitur berlebihan berpengaruh terhadap hasil sehingga pemilihan fitur harus bisa mengidentifikasi data tersebut
3. Naive Bayes
Naive Bayes merupakan algoritma pengklasifikasian dengan metode probabilitas dan statistik, dan memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya.
B. Teknik Pengumpulan Data
Penulis melakukan pengumpulan data dengan menggunakan beberapa cara, yaitu:
1. Observasi (Observation)
Penulis melakukan pengamatan secara langsung mencari dan mengumpulkan data – data yang akan dijadikan objek oleh penulis.
2. Studi Pustakan (Library Research)
Penulis melakukan studi kepustakaan dengan tujuan agar memperoleh data teoritis yang bersumber dari buku ilmiah dan tulisan yang berkaitan, metode ini digunakan sebagai pendukung dan penunjang dari data yang telah ada.
3. Wawancara (Interview)
Dalam metode wawancara ini, penulis dapat memperoleh data informasi langsung dari sumbernya dengan cara melakukan tanya jawab dan bertatap muka antar penulis dengan narasumber.
4. Dokumentasi (Documentation)
Mendapatkan informasi dengan cara mengumpulkan data-data baik itu berupa foto, gambar, berkas-berkas, yang biasanya dilakukan setelah melakukan observasi dan wawancara.
1.5. Ruang Lingkup
Agar penelitian ini tetap fokus dengan tujuan untuk menghasilkan uraian penelitian yang sistematis dan analisa yang objective, diperlukan pembatasan masalah. Maka penulis membuat batasan yang spesifik sebagai berikut:
1. Penelitian ini hanya ditujukan untuk mengetahui hasil evaluasi klasifikasi penerimaan peserta didik baru menggunakan metode naive bayes pada SMKN Manonjaya dilihat dari hasil nilai akurasi dan nilai AUC.
2. Data yang akan digunakan dalam penelitian merupakan data yang diperoleh dari pihak SMKN Manonjaya.
3. Hasil penelitian tidak berupa sistem/program/website untuk menentukan diterima atau tidaknya peserta didik baru pada SMKN Manonjaya.
1.6. Hipotesis
Berdasarkan permasalahan diatas maka hipotesis dalam penelitian ini adalah:
H0: Diduga hasil klasifikasi data mining metode klasifikasi naive bayes untuk penerimaaan peserta didik baru pada SMKN Manonjaya memiliki nilai akurasi yang tinggi.
H1: Diduga hasil klasifikasi data mining metode klasifikasi naive bayes untuk penerimaaan peserta didik baru pada SMKN Manonjaya memiliki nilai akurasi yang rendah.