Rekomendasi Jurusan Kuliah Berdasarkan Minat dan Kemampuan Menggunakan Metode Content Based Filtering
Tiara Amelia1, Prajoko2, Agung Pambudi3
Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sukabumi Email: [email protected]
Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sukabumi Email: prajoko-ti@ummi.ac.id
Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sukabumi Email: agungpambd@ummi.ac.id
Abstrak
Pendidikan merupakan hak dan kewajiban semua warga negara. semakin baik kualitas pendidikan semakin baik kualitas bangsa itu sendiri. Pemerintah negara indonesia memiliki kebijakan belajar selama dua belas tahun yaitu dari Sekolah Dasar sampai menengah keatas. Perguruan tinggi memang tidak diwajibkan, tetapi peran nya sangat penting dalam mencetak generasi berkualitas.Tingkatan yang di miliki perguruan tinggi akan berbeda dengan sekolah menengah atas. Dalam perguruan tinggi seorang mahasiswa akan belajar berdasarkan jurusan yang dipilih sebelumnya. Oleh karena itu memilih jurusan yang tepat merupakan hal pertama yang harus di persiapkan secara matang oleh calon mahasiswa baru. Salah memilih jurusan akan berakibat fatal bagi mahasiswa. Adapun tujuan dari penelitian ini adalah membuat sebuah pemodelan rekomendasi dengan mengunakan metode Content Based Filtering. dengan tujuan menentukan jurusan yang sesuai dengan minat kemampuan yang dimiliki siswa. Peneliatan tersebut dilakukan di Universitas Muhammadiyah Sukabumi, dengan Data pemodelan berupa data data mahasiswa yang saat ini sedang berkuliah di perguruan tinggi tersebut.
selain menghasilkan pemodelan rekomendasi, peneliti juga menghitung nilai akurasi dari pemodelan yang telah dibuat dengan metode Content Based Filtering. dengan menggunakan Naïve bayes jenis MultinomialNB serta menggunakan Confusion Matrik. Hasil akurasi yang dihasilkan sebesar 94%
Kata Kunci: Content Based Filtering, Rekomendasi, Naïve Bayes, Confosion Matrik
PENDAHULUAN
Pendidikan merupakan sebuah pondasi dalam kehidupan bernegara. Pendidikan yang baik dapat dijadikan sebuah acuan kemajuan suatu negara. Dalam pembukaan Undang- Undang 1945 dinyatakan bahwa salah satu tujuan negara indonesia adalah mencerdaskan kehidupan bangsa. Sehingga sudah menjadi kewajiban pemerintah untuk memberikan fasilitas pendidikan yang layak. Dalam UUD 1945 pasal 31 ayat 2 dijelaskan bahwa
“Setiap warga negara mengikuti pendidikan dasar dan pemerintah wajib membiayainya. Dalam negara indonesia pemerintah mengeluarkan kebijakan bagi setiap warga negara nya yaitu mewajibkan belajar selama dua belas tahun, meliputi Sekolah Dasar, Sekolah Menengah Pertama, Dan Sekolah Menengah Atas. Perguruan tinggi tidak diwajibkan pemerintah. Tetapi peranya sangat
penting dalam mencetak generasi bangsa yang berkualitas. Tujuan dibentuuknya perguruan tinggi sudah dijelaskan secara jelas dalam Undang-Undang 1945 nomor 12 tahun 2012 pasal 1. Yang berisi
“Tujuan dibentuknya perguruan tinggi adalah untuk menyelenggarakan pendidikan tinggi yang mencakup Diploma, Sarjana, Magister, dan program doktor. Sistematika dalam perkuliahan berbeda dengan sekolah.
Dalam perkuliahan calon mahasiswa akan memilih suatu bidang tertentu yang harus dipilih. Hal pertama yang harus di persiapkan adalah memilih jurusan. Salah dalam memilih jurusan akan berakibat fatal bagi mahasiswa, mereka yang merasa salah memilih jurusan akan memilih drop out sehingga tidak melanjutnya perkuliahan. Keresahan dalam memilih jurusan sering dirasakan oleh siswa tingkat akhir menengah atas. Kurangnya informasi dan pemahaman mengenai kegiatan
perkuliahan menyebabkan mereka kesulitan memilih jurusan yang sesuai. Selain itu belum adanya sebuah sistem yang dapat melakukan rekomendasi jurusan kepada siswa.
Dalam dunia teknologi informasi, terdapat dua model sistem rekomendasi, Content Based Filtering, dan Collaborative Filtering. Metode Content Based Filtering memiliki fungsi melakukan rekomendasi berdasarkan kemiripan profil pengguna dan permasaan profil item (Nastiti, 2019) . Dimana item tersebut merupakan yang disukai pengguna di masa lampau. Contoh, kita menyukai buku berjudul :”Hujan Karya Tere Liye”. Jika kita akan mencoba membaca buku baru sistem akan melakukan rekomendasi buku yang ditulis oleh Tere Liye.
Sedangkan Metode Collaborative Filtering melakukan rekomendasi berdasarkan tanggapan dari orang lain
(Sukma Pradana &
Hartawan, 2021)
. Contoh misalnya“Rekomendasi Buku yang paling banyak dibaca”. Dari penelitian yang telah dilakukan, metode content based filtering sering mendapatkan nilai akurasi unggul dibanding dengan Collaborative Filtering. Dalam penelitian dengan judul Perbandingan Algoritma Content Based Filtering dan Collaborative filtering dalam rekomendasi kegiatan Ekstrakurikuler siswa, Content Based Filtering menghasilkan nilai akurasi sebanyak 74% dan Collaborative Filtering menghasilkan 54%.
Metode rekomendasi yang paling tepat untuk menyelesaikan permasalahan diatas adalah dengan memilih metode Content Based Filtering. Dengan melihat beberapa penelitian terdahulu metode ini menghasilkan Nilai Akurasi lebih unggul dibanding dengan metode rekomendasi lain. Peneliti akan membuat pemodelan rekomendasi jurusan kuliah berdasarkan minat dan kemampuan siswa menggunakan kaidah tahapan metode content based filtering.
METODE PENELITIAN
Gambar 1. Tahapan Metode Penelitian Metode penelitan merupakan sebuah cara ilmiah yang dilakukan ketika kita melakukan penelitian. metode penelitian yang digunakan adalah Knowledge Discovery Database . merupakan salah satu metode yang digunakan dalam proses data mining untuk mencari data, pola data, serta melibatkan algoritma dalam penyelesaianya.(Fatoni Batari Agung Larasati, 2021) Tahapan dari KDD antara lain, Selection Data, Preprocessing, Transformation, Data Mining, Evaluasi, Knowledge.
2.1 Selection Data
Tahapan ini merupakan proses pengumpulan data, proses pengumpulan data dilakukan di Universitas Muhammadiyah Sukabumi, adapun data yang dikumpulkan adalah data data mahasiswa yang sedang berkuliah di kampus tersebut. data dikumpulkan melalui google Formulir, lalu hasilnya akan disusun dan dijadikan sebuah dataset. Dataset nantinya akan dijadikan data pemodelan dengan menggunakan Metode yang dipilih yaitu Content Based Filtering. sekarang data sudah tercatat sekitar 231 orang.
2.2 Preprocessing Data
Tahapan selanjutnya adalah tahapan mempersiapkan data. Dataset yang sudah disusun tidak bisa langsung di jadikan pemodelan. Dalam tahapan ini peneliti melakuan beberapa proses seperti Mencari Missing Value, serta mencari Duplikat data.
Proses tersebut bertujuan agar data menjadi lebih benar serta siap dilakukan pemodelan, dan menghindari Nilai Error.
2.3 Transformation Data
Transformasi data adalah mengubah bentuk data menjadi sebuah bentuk data baru agar lebih mudah dipahami oleh pengguna. Atau sering disebut dengan visualisasi data. Untuk visualisasi data peneliti menggunakan library pyton yaitu Matplotlib. Merupakan Library Pyhton
yang digunakan untuk visualisasi data kedalam bentuk diagram ataupun garis.
Serta dapat berfungsi untuk proses plot seperti menggambar, edit, dan proses lainya. (Setiawan et al., 2020)
2.4 Proses Pemodelan Content Based Filtering
Ketika data sudah melewati beberapa tahapan maka tahapan ini adalah tahapan penting yaitu melakukan pemodelan dengan metode yang telah di pilih sebelumnya yatu mengguanakn metode content based Filtering.
pemodelan dilakukan sampai menghasilkan pengetahuan baru yaitu bentuk model rekomendasi. Ada beberapa library pyhton yang digunakan dalam proses pemodelan content based filtering.
2.4.1. Sastrawi
Sastrawi merupakan Library Python yang dapat melakukan pengurangan kata kata yang tidak sesuai dengan bentuk baku bahasa indonesia. (Saputra et al., 2015). Dalam penelitian ini penggunaan sastrawi untuk menghapus kata hubung dari atribut minat &
kemampuan mahasiswa. Contoh
Tabel 1. Contoh Impelementasi Sastrawi Sebelum
Sastrawi
Sesudah Sastrawi Teknik
Informatika suka bermain komputer dan menemukan cara kerja komputer, memiliki keinginan menciptakan sebuah aplikasi, suka bermain games dan ingin menciptakan games sendiri, memiliki penalaran logika yang bagus,
cenderung lebih mudah bekerja dan berpikir hal yang
berhubungan dengan angka
Suka, Bermain,Komputer, menemukan,
Aplikasi,bermain,games Penalaran,Logika,bekerja, Mudah, angka
2.4.1. Bag_Of word (Bow)
Merupakan sebuah model yang mempresentasikan objek, atau sering disebut dengan kumpulan kata-kata unik dalam dokumen. Dalam penelitian Bag_Of Word digunakan untuk menggabungkan Key_word yang sudah di bentuk.(Tari Mardiana, 2015)
2.4.2. Cosine Simmilarity
Merupakan perhitungan untuk menghitung nilai kesamaan.(Riyani et al., 2019) Dalam penelitian ini Cosine Simmilarity digunakan untuk menghitung nilai kesamaan antara data jurusan yang dijadikan pemodelan. Nilai persamaan paling tinggi nantinya akan di rekomendasikan sistem kepada pengguna.
Adapun rumus perhitunganya adalah
𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 (𝐴, 𝐵) = 𝑐𝑜𝑠(𝜃)
= 𝛴𝑖=1𝑛 𝐴𝑖𝐵𝑖
√
𝛴𝑖=1𝑛 𝐴𝑖2√
𝛴𝑖=1𝑛 𝐵𝑖2 2.5 EvaluasiDilakukan untuk mencari nilai akurasi dari pemodelan yang telah kita buat dengan metode yang dipilih sebelumnya. Kegiatan tersebut perlu dilakukan agar mengetahui metode tersebut sudah cocok apa tidak jika dijadikan pemodelan rekomendasi. Dalam melakukan evaluasi peneliti memilih naïve bayes jenis multinomialNb untuk mencari prediksi dari nilai probalitas. Yang selanjutnya akan diukur seberapa baik performanya dengan menggunakan Confusion Matrik. (Nugroho K.
S., 2013)
2.5.1. Naïve bayes
Merupakan algoritma klasifikasi yang dapat melakukan prediksi kelas dalam probabilitas. Adapun naïve bayes jenis multinomialNb digunakan untuk mengetahui jumlah kata yang muncul dalam dokumen.
Selain itu jenis multinomialNb sangat cocok digunakan untuk proses klasifikasi yang berbentuk teks. (Destuardi & Sumpeno, 2009) 2.5.2. Confusion Matrik
Confusion matrik secara sederhana dapat mencari tahu seberapa baik model yang telah kita buat. Selain itu Confosion matrik dapat memberikan informasi mengenai TP, FP, TN, FN. (Normawati & Prayogi, 2021) Sebenernya dengan menggunakan algoritma klasifikasi, kita sudah bisa mengetahui hasil prediksi dari pemodelan yang telah kita buat.
Tetapi dengan menggunakan confusion matrik kita akan mendapatkan beberapa manfaat antara lain :
1. Menunjukan model ketika membuat prediksi.
2. Dapat memberi informasi mengenai kesalahan yang dibuat oleh model 3. Kolom dari confosion matrik dapat
merepresentasikan instance dari kelas prediksi.
4. Baris dalam confosion matrik mewakili instance dari kelas aktual.
Tabel 2. Tabel Confusion Matrik
Selain mencari nilai akurasi dari pemodelan yang telah dibuat, kita juga akan mencari nilai Presisi, Recall, serta F-1Score
HASIL DAN PEMBAHASAN 3.1 Selection Data
Data yang dikumpulkan adalah data data mahasiswa yang saat ini sedang berkuliah di universitas muhammadiyah sukabumi.
Proses pengumpulan data dilakukan dengan membagikan Goggle Formulir. data dikumpulkan sejak tanggal 30 januari 2023.
Adapun butir pertanyaan dari google Form yang sudah dibagikan antara lain :
Tabel 3. Pertanyaan Goggle Formulir No Pertanyaan Minat Bakat 1 Cenderung lebih mudah bekerja dan
berpikir mengenai hal-hal yang berhubungan dengan angka
2 tertarik mempelajari ilmu komputer 3 Memiliki penalaran logika yang bagus 4 Tertarik mempelajari ilmu
insfrastruktur suatu bangunan 5 Menyukai cabang ilmu sains
6 Menyukai kegiatan yang melibatkan ekperimen kimia
7 Cenderung menyukai praktik di banding teori
8 memiliki keinginan menciptakan sebuah aplikasi
9 menyukai kegiatan multimedia dan desain
10 Mencintai dan gemar mempelajari segala sesuatu yang berhubungan
11 cenderung tertarik mengembangkan
usaha produksi bidang
pertanian,peternakan, kehutanan 12 cenderung menyukai ilmu budidaya
perairan
13 memiliki ketertarikan mengenai ilmu pengembangan biota air laut maupun tawar
14 Tidak mengabaikan kelestarian alam atau lingkungan
15 tertarik dan memiliki kemampuan bidang medis
16 senang membantu memiliki sifat peduli terhadap orang lain
17 Memiliki kemampuan yang baik dalam mapping wilayah
18 Mempertimbangkan baik sisi plus ataupun minus terhadap keputusan yang akan diambil dalam menghadapi sebuah masalah
19 Peduli dan ringan tangan kepada orang lain
20 cenderung tertarik dalam dunia Perbankan
21 menyukai dan memilki kemampuan Pengarsipan
22 memiliki kemampuan analisis yang bagus
23 memiliki keinginan bekerja dikantor 24 tertarik mempelajari ilmu pajak 25 Cenderung suka mengajar atau melatih
orang
26 gemar berolahraga
27 menyukai dan memiliki kemampuan di bidang seni
28 Menyukai kegiatan olah tubuh 29 suka pelajaran matematika 30 suka teori di banding praktik
31 Menyukai dunia seni peran atau menari 32 Menggemari kegiatan yang melibatkan
tulisan
33 Gemar menuangkan ide dalam bentuk tulisan atau puisi
34 menyukai memiliki kemampuan menghasilkan sebuah produk
35 ingin memulai bisnis saya sendiri 36 mencintai dunia bisnis
37 cenderung tertarik mempelajari ilmu mengenai administrasi pemerintahan, masyarakat, kebijakan publik
38 memiliki ketertarikan mempelajari biroraksi
39 cenderung kreative
40 gemar berargumen
41 memiliki ketertarikan menjalankan bisnis berbasis teknologi
42 tertarik mepelajari ilmu manajemen dan bisnis ritel
43 senang melakukan diskusi
44 tertarik untuk menjadi seorang pengacara
45 cenderung orang yang detail dan teorganisir
46 senang bekerja secara berkelompok Pertanyaan diatas bersumber pada Buku, Jurnal ilmiah, serta Website psikotes. Data yang sudah dikumpulkan disusun kembali menjadi sebuah dataset. Dataset nantinya akan dijadikan pengolahan. Dibawah ini merupakan atribut- atribut data yang akan digunakan dalam proses pemodelan antara lain :
Tabel 4. Atribut Data No Atribut Keterangan
1 Nama Berfungsi sebagai Id 2 Jenis kelamin Untuk membedakan
Gender mahasiswa 3 Asal Sekolah Asal sekolah mahasiswa 4 Jurusan Jurusan yang dipilih
mahasiswa 5 Minat
_Kemampuan
Pemilihan Minat dan kemampuan yang dimiliki oleh mahasiswa
6 Alasan Memilih Jurusan
Alasan memilih jurusan yang dipilih
7 Kesesuain memilih jurusan
Bentuk pertanyaan kesesuaian jurusan yang dipilih dengan minat dan kemampuan yang dimiliki.
3.2 Preprocessing Data
Proses yang dilakukan dalam proses Prepcosessing data antara lain :
3.2.1 Mencari Nilai Yang Hilang
Library pyhton yang digunakan isnull().sum(). Fungsi nya adalah untuk memastikan tidak ada nilai yang hilang.
Adapun hasil dalam program yang telah dibuat adalah
Gambar 2. Mencari missing Value
3.2.2 Mencari Data Duplikat
Selanjutnya adalah mencari nilai duplikat. Adapun library python yang digunakan adalah Duplicated() . yang memiliki fungsi mencari nilai duplikat pada DataFrame. Adapun hasil dari program yang telah dibuat adalah
Gambar 3. Mencari duplikat kata 3.3 Tranformasi Data
Tahapan ini adalah tahapan visualisasi data kedalam bentuk yang mudah di pahami.
Disini peneliti melakukan bentuk visualalisasi ke dalam bentuk diagram lingkaran. Dibawah ini merupakan hasil diagram lingkaran yang telah dibuat menggunakan Library Matplotlib. Adalah
Gambar 4. Diagram Lingkaran 3.4 Pemodelan Content Based Filtering
Dibawah ini merupakan tahapan tahapan proses pemodelan yang dilakukan. antara lain :
3.4.1. Mencari Kata Kunci
Tahapan pertama yaitu mencari nilai kata kunci dari setiap jurusan yang ada di Universitas Muhammadiyah sukabumi.
Contohnya peng-implementasian dari program yang telah dibuat dijelaskan dalam bentuk tabel:
tabel 5. contoh Key word setiap jurusan
Nama Jurusan Key Word
mahasiswa0 7
Administras i Bisnis
['menyukai', 'memiliki', 'kemampuan', 'menghasilkan ', 'sebuah', 'produk', 'ingin', 'memulai', 'bisnis', 'saya', 'sendiri', 'mencintai', 'dunia']
mahasiswa1 0
kimia ['menyukai', 'kegiatan', ' eksperimen', 'cenderung', 'praktik', 'dibanding', 'teori']
Fungsi dari kata kunci tersebut adalah untuk membedakan anatara jurusan yang satu dengan yang lain.
3.4.2. Sastrawi
Penerepan sastrawi dalam program yang telah dibuat, digambarkan dengan tabel dibawah ini :
Tabel 6. Contoh Implementasi Sastrawi
Mahasis wa 07
Admi nistra si Bisni s
Menyukai,
Memiliki,kemampuan,menghasilkan ,produk,bisnis,mencintai,dunia,
mahasisw a10
Kimi a
Menyukai,
kegiatan,ekperimen,cenderung,praktik, dibanding teori
Bisa dilihat perbedaan dengan tabel sebelumnya, di tabel sebelumnya ada kata ingin, Saya, Sendiri, di tahapan berikutnya kata kata seperti itu dihapus agar tidak menggangu proses pemodelan nantinya, serta performa pemodelan dapat lebih baik.
3.4.3. Bag Of word
Tahapan selanjutnya adalah merapihkan kata dalam tabel diatas. Karena bisa dilihat pada tabel diatas, kata tersebut belum rapih serta masih rancu. Adapun
pengimplementasian di gambarkan dengan tabel dibawah ini :
Tabel 7.Bag_Of word
Nama Bag_of word
Mahasiswa07 Administrasi Bisnis menyukai memiliki kemampuan menghasilkan produk bisnis mencintai dunia
Mahasiswa10 kimia menyukai kegiatan eksperimen cenderung praktik dibanding teori Untuk performa lebih baik lagi, dua kalimat diatas digabungkan menjadi sebuah penggabungan kata. Seperti tabel dibawah ini :
Tabel 8 Kumpulan Bag _ of word
Admnistrasi Bisnis Cenderung Dibanding Dunia Ekperimen Kegiatan kemampuan Kimia Memiliki Mencintai Menghasilkan Menyukai Praktik Produk teori
Adapun tabel tersebut jika diimpelementasikan dengan program yang telah dibuat adalah :
Gambar 6 kumpulan Bag_Of Word Setelah digabungkan kedalam bentuk bag_of word langkah selanjutnya adalah menghitung nilai persamaan antara Kedua jurusan tersebut.
dengan menggunakan rumus persamaan Cosine Simmilarity.
3.4.4. Cosine Simmilarity
Tahapan mencari nilai persamaan dengan Cosine Simmilarity antara lain :
1. Mengubah bentuk kata yang ada dalam tabel bag_of word kedalam vektor 1 dan 0 menggunakan Count_Vectorizer.
Seperti tabel dibawah ini
Tabel 9. Tabel Vektor Jurusan Vektor
Administra si Bisni
1,1,0,0,1,0,0,1,0,1,1,1,1,0 ,1,0
Kimia 0,0,1,1,0,1,1,0,1,0,0,0,1,1 ,0,1,
Hasil 0 dan 1, dihasilkan dari Kata dalam BoW . Jika kata tersebut bernilai 1 berarti Iya dan 0 berarti tidak.
2. Setelah diubah kedalam bentuk Vektor.
Masukan kedalam perhitungan cosine simmilarity seperti ini :
a. AdministrasiBisnis=
(1,1,0,0,1,0,0,1,0,1,1,1,1,0,1,0) b. Kimia =
(0,0,1,1,0,1,1,0,1,0,0,0,1,1,0,1,) Selanjutnya masukan kedalam rumus perhitungan Cosine Simmilarity menghasilkan nilai
3.5 Rekomendasi
Langkah selanjutnya adalah rekomendasi.
Sistem akan melakukan rekomendasi berdasarkan nilai persamaan Cosine Simmilarity yang tinggi
3.6 Evaluasi
Tahapan selanjutnya adalah menguji
keakuratan hasil pemodelan yang telah dilakukan. adapun tabel Confosion Matrik yang telah dihasilkan dengan kesulurah data yaitu :Gambar 7. Tabel Confusion Matrik Keterangan :
Actual = Nilai data benar Prediction = nilai prediski data 0 = Administrasi Bisnis
1 = Administrasi Publik 2 = Agribisnis
3 = akuakultur 4 = Akuntansi
5 = Hubungan Masyarakat 6 = Hukum
7 = Kimia
8 = Manajemen Ritel
9 = Pendidikan Bahasa Sastra Indonesia 10 =Pendidikan Biologi
11 =Pendidikan Guru paud
12 = Pendidikan Guru Sekolah Dasar 13 = Pendidikan Jasmani dan Rohani 14 = Pendidikan Matematika
15 = Pendidikan Teknologi Informasi 16 = Perawat
7 = Perpajakan 18 = Sastra Inggris 19 = Teknik Informatika 20 = Teknik Sipil
Tabel diatas nantinya akan dijadikan acuan dalam menghitung nilai Presisi , Recall , dan Akurasi.
3.6.1 Presisi
Merupakan tingkat ketepatan hasil klasifikasi dari keseluruhan Dokumen.
Perhitunganya adalah :
𝑃𝑟𝑒𝑐𝑖𝑠𝑜𝑛 TP 𝑇𝑃 + 𝐹𝑃
Contoh perhitungan Presisi dengan Mengambil salah satu data yaitu Administrasi Bisnis hasil nya adalah
1. Presisi administrasi Bisnis
Presisi Administrasi Bisnis =3/
(0+0+0+0+0+0+0+0+0+0+0+0+0+0+
0+0+0+0+0)=3/3 = 1 . 3.6.2 Recall
Merupakan tingkat keberhasilan mengenali suatu kelas. Perhitungany adalah
𝑅𝑒𝑐𝑎𝑙𝑙 𝑇𝑃 𝑇𝑃 + 𝐹𝑁
Contoh perhitungan Recall dari salah satu contoh yaitu Administrasi Bisnis adalah
1.
Recall Administrasi Bisnis3/(3+0+0+0+1+0+0+0+0+0+0+0+0+0 +0+0+0+0+0+0+0) = ¾ = 0,75
3.6.3 Akurasi
Adapun perhitunganya adalah.
𝐴𝑐𝑢𝑟𝑎𝑟𝑐𝑦 𝑇𝑃 𝐴𝑙𝑙 𝐶𝑙𝑎𝑠𝑠 𝑇𝑜𝑡𝑎𝑙 𝑆𝑢𝑝𝑝𝑜𝑟𝑡
Akurasi yang didapatkan dari pemodelan yang telah dibuat adalah 94%. Dijelaskan secara jelas dalam gambar dibawah ini :Gambar 8. Tabel Presisi Recall Akurasi
KESIMPULAN
Penelitian ini bertujuan untuk mengimplementasikan metode Content Based Filtering dalam membuat pemodelan rekomendasi jurusan yang sesuai dengan minat dan kemampuan yang dimiliki siswa.
Selain menghasilkan bentuk pemodelan.
Penelitian ini menghasilkan nilai ketepatan dari pemodelan yang telah dibuat menggunakan metode Content Based Filtering. dari 21 jurusan yang dijadikan pemodelan rekomendasi menghasilkan Nilai akurasi sebesar 94%.
REFERENSI
[1] Destuardi, I., & Sumpeno, S. (2009). Klasifikasi Emosi Untuk Teks Bahasa Indonesia Menggunakan Metode Naive Bayes. In Seminar Nasional Pascasarjana IX-ITS.
[2] Nastiti, P. (2019). Penerapan Metode Content Based Filtering Dalam Implementasi Sistem Rekomendasi Tanaman Pangan. Teknika, 8(1), 1–10.
https://doi.org/10.34148/teknika.v8i1.139 [3] Normawati, D., & Prayogi, S. A. (2021).
Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter. In Jurnal Sains Komputer & Informatika (J-SAKTI (Vol. 5, Issue 2).
[4] Riyani, A., Zidny Naf’an #2, M., &
Burhanuddin, A. (2019). Penerapan Cosine Similarity dan Pembobotan TF-IDF untuk Mendeteksi Kemiripan Dokumen. In JLK (Vol.
2, Issue 1).
[5] Saputra, N., Adji, T. B., & Permanasari, A. E.
(2015). ANALISIS SENTIMEN DATA
PRESIDEN JOKOWI DENGAN
PREPROCESSING NORMALISASI DAN STEMMING MENGGUNAKAN METODE
NAIVE BAYES DAN SVM Oleh. In Jurnal Dinamika Informatika (Vol. 5, Issue 1).
6[6] Setiawan, H., Utami, E., & Al Fatta, H. (2020).
Penerapan Arima Dan Artificial Neural Network Untuk Prediksi Penderita DBD Di Kabupaten Sragen. Majalah Ilmiah Bahari
Jogja, 18(2), 64–78.
https://doi.org/10.33489/mibj.v18i2.220 7[7] Sukma Pradana, D., & Hartawan, G. P. (2021).
Perbandingan Algoritma Content-Based Filtering dan Collaborative Filtering dalam Rekomendasi Kegiatan Ekstrakurikuler Siswa.
Jurnal Ilmiah Komputer.
8[8] Tari Mardiana. (2015). Kluster Bag-of-Word Menggunakan Weka. Jurnal Edukasi Dan Penelitian Informatika.
9[9] Fatoni Batari Agung Larasati, H. F. (2021).
SISTEM REKOMENDASI PRODUCT
EMINA COSMETICS DENGAN
MENGGUNAKAN METODE CONTENT - BASED FILTERING. Jurnal Manajemen Informatika Sistem Informasi, 24–24.