Rekomendasi Jurusan Kuliah Berdasarkan Minat dan Kemampuan Menggunakan Metode Content Based Filtering

(1)

Rekomendasi Jurusan Kuliah Berdasarkan Minat dan Kemampuan Menggunakan Metode Content Based Filtering

Tiara Amelia¹, Prajoko², Agung Pambudi³

Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sukabumi Email: [email protected]

Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sukabumi Email: prajoko-ti@ummi.ac.id

Fakultas Sains dan Teknologi, Universitas Muhammadiyah Sukabumi Email: agungpambd@ummi.ac.id

Abstrak

Pendidikan merupakan hak dan kewajiban semua warga negara. semakin baik kualitas pendidikan semakin baik kualitas bangsa itu sendiri. Pemerintah negara indonesia memiliki kebijakan belajar selama dua belas tahun yaitu dari Sekolah Dasar sampai menengah keatas. Perguruan tinggi memang tidak diwajibkan, tetapi peran nya sangat penting dalam mencetak generasi berkualitas.Tingkatan yang di miliki perguruan tinggi akan berbeda dengan sekolah menengah atas. Dalam perguruan tinggi seorang mahasiswa akan belajar berdasarkan jurusan yang dipilih sebelumnya. Oleh karena itu memilih jurusan yang tepat merupakan hal pertama yang harus di persiapkan secara matang oleh calon mahasiswa baru. Salah memilih jurusan akan berakibat fatal bagi mahasiswa. Adapun tujuan dari penelitian ini adalah membuat sebuah pemodelan rekomendasi dengan mengunakan metode Content Based Filtering. dengan tujuan menentukan jurusan yang sesuai dengan minat kemampuan yang dimiliki siswa. Peneliatan tersebut dilakukan di Universitas Muhammadiyah Sukabumi, dengan Data pemodelan berupa data data mahasiswa yang saat ini sedang berkuliah di perguruan tinggi tersebut.

selain menghasilkan pemodelan rekomendasi, peneliti juga menghitung nilai akurasi dari pemodelan yang telah dibuat dengan metode Content Based Filtering. dengan menggunakan Naïve bayes jenis MultinomialNB serta menggunakan Confusion Matrik. Hasil akurasi yang dihasilkan sebesar 94%

Kata Kunci: Content Based Filtering, Rekomendasi, Naïve Bayes, Confosion Matrik

PENDAHULUAN

Pendidikan merupakan sebuah pondasi dalam kehidupan bernegara. Pendidikan yang baik dapat dijadikan sebuah acuan kemajuan suatu negara. Dalam pembukaan Undang- Undang 1945 dinyatakan bahwa salah satu tujuan negara indonesia adalah mencerdaskan kehidupan bangsa. Sehingga sudah menjadi kewajiban pemerintah untuk memberikan fasilitas pendidikan yang layak. Dalam UUD 1945 pasal 31 ayat 2 dijelaskan bahwa

“Setiap warga negara mengikuti pendidikan dasar dan pemerintah wajib membiayainya. Dalam negara indonesia pemerintah mengeluarkan kebijakan bagi setiap warga negara nya yaitu mewajibkan belajar selama dua belas tahun, meliputi Sekolah Dasar, Sekolah Menengah Pertama, Dan Sekolah Menengah Atas. Perguruan tinggi tidak diwajibkan pemerintah. Tetapi peranya sangat

penting dalam mencetak generasi bangsa yang berkualitas. Tujuan dibentuuknya perguruan tinggi sudah dijelaskan secara jelas dalam Undang-Undang 1945 nomor 12 tahun 2012 pasal 1. Yang berisi

“Tujuan dibentuknya perguruan tinggi adalah untuk menyelenggarakan pendidikan tinggi yang mencakup Diploma, Sarjana, Magister, dan program doktor. Sistematika dalam perkuliahan berbeda dengan sekolah.

Dalam perkuliahan calon mahasiswa akan memilih suatu bidang tertentu yang harus dipilih. Hal pertama yang harus di persiapkan adalah memilih jurusan. Salah dalam memilih jurusan akan berakibat fatal bagi mahasiswa, mereka yang merasa salah memilih jurusan akan memilih drop out sehingga tidak melanjutnya perkuliahan. Keresahan dalam memilih jurusan sering dirasakan oleh siswa tingkat akhir menengah atas. Kurangnya informasi dan pemahaman mengenai kegiatan

(2)

perkuliahan menyebabkan mereka kesulitan memilih jurusan yang sesuai. Selain itu belum adanya sebuah sistem yang dapat melakukan rekomendasi jurusan kepada siswa.

Dalam dunia teknologi informasi, terdapat dua model sistem rekomendasi, Content Based Filtering, dan Collaborative Filtering. Metode Content Based Filtering memiliki fungsi melakukan rekomendasi berdasarkan kemiripan profil pengguna dan permasaan profil item (Nastiti, 2019) . Dimana item tersebut merupakan yang disukai pengguna di masa lampau. Contoh, kita menyukai buku berjudul :”Hujan Karya Tere Liye”. Jika kita akan mencoba membaca buku baru sistem akan melakukan rekomendasi buku yang ditulis oleh Tere Liye.

Sedangkan Metode Collaborative Filtering melakukan rekomendasi berdasarkan tanggapan dari orang lain

(Sukma Pradana &

Hartawan, 2021)

. Contoh misalnya

“Rekomendasi Buku yang paling banyak dibaca”. Dari penelitian yang telah dilakukan, metode content based filtering sering mendapatkan nilai akurasi unggul dibanding dengan Collaborative Filtering. Dalam penelitian dengan judul Perbandingan Algoritma Content Based Filtering dan Collaborative filtering dalam rekomendasi kegiatan Ekstrakurikuler siswa, Content Based Filtering menghasilkan nilai akurasi sebanyak 74% dan Collaborative Filtering menghasilkan 54%.

Metode rekomendasi yang paling tepat untuk menyelesaikan permasalahan diatas adalah dengan memilih metode Content Based Filtering. Dengan melihat beberapa penelitian terdahulu metode ini menghasilkan Nilai Akurasi lebih unggul dibanding dengan metode rekomendasi lain. Peneliti akan membuat pemodelan rekomendasi jurusan kuliah berdasarkan minat dan kemampuan siswa menggunakan kaidah tahapan metode content based filtering.

METODE PENELITIAN

Gambar 1. Tahapan Metode Penelitian Metode penelitan merupakan sebuah cara ilmiah yang dilakukan ketika kita melakukan penelitian. metode penelitian yang digunakan adalah Knowledge Discovery Database . merupakan salah satu metode yang digunakan dalam proses data mining untuk mencari data, pola data, serta melibatkan algoritma dalam penyelesaianya.(Fatoni Batari Agung Larasati, 2021) Tahapan dari KDD antara lain, Selection Data, Preprocessing, Transformation, Data Mining, Evaluasi, Knowledge.

2.1 Selection Data

Tahapan ini merupakan proses pengumpulan data, proses pengumpulan data dilakukan di Universitas Muhammadiyah Sukabumi, adapun data yang dikumpulkan adalah data data mahasiswa yang sedang berkuliah di kampus tersebut. data dikumpulkan melalui google Formulir, lalu hasilnya akan disusun dan dijadikan sebuah dataset. Dataset nantinya akan dijadikan data pemodelan dengan menggunakan Metode yang dipilih yaitu Content Based Filtering. sekarang data sudah tercatat sekitar 231 orang.

2.2 Preprocessing Data

Tahapan selanjutnya adalah tahapan mempersiapkan data. Dataset yang sudah disusun tidak bisa langsung di jadikan pemodelan. Dalam tahapan ini peneliti melakuan beberapa proses seperti Mencari Missing Value, serta mencari Duplikat data.

Proses tersebut bertujuan agar data menjadi lebih benar serta siap dilakukan pemodelan, dan menghindari Nilai Error.

2.3 Transformation Data

Transformasi data adalah mengubah bentuk data menjadi sebuah bentuk data baru agar lebih mudah dipahami oleh pengguna. Atau sering disebut dengan visualisasi data. Untuk visualisasi data peneliti menggunakan library pyton yaitu Matplotlib. Merupakan Library Pyhton

(3)

yang digunakan untuk visualisasi data kedalam bentuk diagram ataupun garis.

Serta dapat berfungsi untuk proses plot seperti menggambar, edit, dan proses lainya. (Setiawan et al., 2020)

2.4 Proses Pemodelan Content Based Filtering

Ketika data sudah melewati beberapa tahapan maka tahapan ini adalah tahapan penting yaitu melakukan pemodelan dengan metode yang telah di pilih sebelumnya yatu mengguanakn metode content based Filtering.

pemodelan dilakukan sampai menghasilkan pengetahuan baru yaitu bentuk model rekomendasi. Ada beberapa library pyhton yang digunakan dalam proses pemodelan content based filtering.

2.4.1. Sastrawi

Sastrawi merupakan Library Python yang dapat melakukan pengurangan kata kata yang tidak sesuai dengan bentuk baku bahasa indonesia. (Saputra et al., 2015). Dalam penelitian ini penggunaan sastrawi untuk menghapus kata hubung dari atribut minat &

kemampuan mahasiswa. Contoh

Tabel 1. Contoh Impelementasi Sastrawi Sebelum

Sastrawi

Sesudah Sastrawi Teknik

Informatika suka bermain komputer dan menemukan cara kerja komputer, memiliki keinginan menciptakan sebuah aplikasi, suka bermain games dan ingin menciptakan games sendiri, memiliki penalaran logika yang bagus,

cenderung lebih mudah bekerja dan berpikir hal yang

berhubungan dengan angka

Suka, Bermain,Komputer, menemukan,

Aplikasi,bermain,games Penalaran,Logika,bekerja, Mudah, angka

2.4.1. Bag_Of word (Bow)

Merupakan sebuah model yang mempresentasikan objek, atau sering disebut dengan kumpulan kata-kata unik dalam dokumen. Dalam penelitian Bag_Of Word digunakan untuk menggabungkan Key_word yang sudah di bentuk.(Tari Mardiana, 2015)

2.4.2. Cosine Simmilarity

Merupakan perhitungan untuk menghitung nilai kesamaan.(Riyani et al., 2019) Dalam penelitian ini Cosine Simmilarity digunakan untuk menghitung nilai kesamaan antara data jurusan yang dijadikan pemodelan. Nilai persamaan paling tinggi nantinya akan di rekomendasikan sistem kepada pengguna.

Adapun rumus perhitunganya adalah

𝑆𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 (𝐴, 𝐵) = 𝑐𝑜𝑠(𝜃)

= 𝛴_𝑖=1^𝑛 𝐴_𝑖𝐵_𝑖

√

𝛴_𝑖=1^𝑛 𝐴_𝑖²

√

𝛴_𝑖=1^𝑛 𝐵_𝑖² 2.5 Evaluasi

Dilakukan untuk mencari nilai akurasi dari pemodelan yang telah kita buat dengan metode yang dipilih sebelumnya. Kegiatan tersebut perlu dilakukan agar mengetahui metode tersebut sudah cocok apa tidak jika dijadikan pemodelan rekomendasi. Dalam melakukan evaluasi peneliti memilih naïve bayes jenis multinomialNb untuk mencari prediksi dari nilai probalitas. Yang selanjutnya akan diukur seberapa baik performanya dengan menggunakan Confusion Matrik. (Nugroho K.

S., 2013)

2.5.1. Naïve bayes

Merupakan algoritma klasifikasi yang dapat melakukan prediksi kelas dalam probabilitas. Adapun naïve bayes jenis multinomialNb digunakan untuk mengetahui jumlah kata yang muncul dalam dokumen.

Selain itu jenis multinomialNb sangat cocok digunakan untuk proses klasifikasi yang berbentuk teks. (Destuardi & Sumpeno, 2009) 2.5.2. Confusion Matrik

Confusion matrik secara sederhana dapat mencari tahu seberapa baik model yang telah kita buat. Selain itu Confosion matrik dapat memberikan informasi mengenai TP, FP, TN, FN. (Normawati & Prayogi, 2021) Sebenernya dengan menggunakan algoritma klasifikasi, kita sudah bisa mengetahui hasil prediksi dari pemodelan yang telah kita buat.

Tetapi dengan menggunakan confusion matrik kita akan mendapatkan beberapa manfaat antara lain :

(4)

1. Menunjukan model ketika membuat prediksi.

2. Dapat memberi informasi mengenai kesalahan yang dibuat oleh model 3. Kolom dari confosion matrik dapat

merepresentasikan instance dari kelas prediksi.

4. Baris dalam confosion matrik mewakili instance dari kelas aktual.

Tabel 2. Tabel Confusion Matrik

Selain mencari nilai akurasi dari pemodelan yang telah dibuat, kita juga akan mencari nilai Presisi, Recall, serta F-1Score

HASIL DAN PEMBAHASAN 3.1 Selection Data

Data yang dikumpulkan adalah data data mahasiswa yang saat ini sedang berkuliah di universitas muhammadiyah sukabumi.

Proses pengumpulan data dilakukan dengan membagikan Goggle Formulir. data dikumpulkan sejak tanggal 30 januari 2023.

Adapun butir pertanyaan dari google Form yang sudah dibagikan antara lain :

Tabel 3. Pertanyaan Goggle Formulir No Pertanyaan Minat Bakat 1 Cenderung lebih mudah bekerja dan

berpikir mengenai hal-hal yang berhubungan dengan angka

2 tertarik mempelajari ilmu komputer 3 Memiliki penalaran logika yang bagus 4 Tertarik mempelajari ilmu

insfrastruktur suatu bangunan 5 Menyukai cabang ilmu sains

6 Menyukai kegiatan yang melibatkan ekperimen kimia

7 Cenderung menyukai praktik di banding teori

8 memiliki keinginan menciptakan sebuah aplikasi

9 menyukai kegiatan multimedia dan desain

10 Mencintai dan gemar mempelajari segala sesuatu yang berhubungan

11 cenderung tertarik mengembangkan

usaha produksi bidang

pertanian,peternakan, kehutanan 12 cenderung menyukai ilmu budidaya

perairan

13 memiliki ketertarikan mengenai ilmu pengembangan biota air laut maupun tawar

14 Tidak mengabaikan kelestarian alam atau lingkungan

15 tertarik dan memiliki kemampuan bidang medis

16 senang membantu memiliki sifat peduli terhadap orang lain

17 Memiliki kemampuan yang baik dalam mapping wilayah

18 Mempertimbangkan baik sisi plus ataupun minus terhadap keputusan yang akan diambil dalam menghadapi sebuah masalah

19 Peduli dan ringan tangan kepada orang lain

20 cenderung tertarik dalam dunia Perbankan

21 menyukai dan memilki kemampuan Pengarsipan

22 memiliki kemampuan analisis yang bagus

23 memiliki keinginan bekerja dikantor 24 tertarik mempelajari ilmu pajak 25 Cenderung suka mengajar atau melatih

orang

26 gemar berolahraga

27 menyukai dan memiliki kemampuan di bidang seni

28 Menyukai kegiatan olah tubuh 29 suka pelajaran matematika 30 suka teori di banding praktik

31 Menyukai dunia seni peran atau menari 32 Menggemari kegiatan yang melibatkan

tulisan

33 Gemar menuangkan ide dalam bentuk tulisan atau puisi

34 menyukai memiliki kemampuan menghasilkan sebuah produk

35 ingin memulai bisnis saya sendiri 36 mencintai dunia bisnis

37 cenderung tertarik mempelajari ilmu mengenai administrasi pemerintahan, masyarakat, kebijakan publik

38 memiliki ketertarikan mempelajari biroraksi

39 cenderung kreative

(5)

40 gemar berargumen

41 memiliki ketertarikan menjalankan bisnis berbasis teknologi

42 tertarik mepelajari ilmu manajemen dan bisnis ritel

43 senang melakukan diskusi

44 tertarik untuk menjadi seorang pengacara

45 cenderung orang yang detail dan teorganisir

46 senang bekerja secara berkelompok Pertanyaan diatas bersumber pada Buku, Jurnal ilmiah, serta Website psikotes. Data yang sudah dikumpulkan disusun kembali menjadi sebuah dataset. Dataset nantinya akan dijadikan pengolahan. Dibawah ini merupakan atribut- atribut data yang akan digunakan dalam proses pemodelan antara lain :

Tabel 4. Atribut Data No Atribut Keterangan

1 Nama Berfungsi sebagai Id 2 Jenis kelamin Untuk membedakan

Gender mahasiswa 3 Asal Sekolah Asal sekolah mahasiswa 4 Jurusan Jurusan yang dipilih

mahasiswa 5 Minat

_Kemampuan

Pemilihan Minat dan kemampuan yang dimiliki oleh mahasiswa

6 Alasan Memilih Jurusan

Alasan memilih jurusan yang dipilih

7 Kesesuain memilih jurusan

Bentuk pertanyaan kesesuaian jurusan yang dipilih dengan minat dan kemampuan yang dimiliki.

3.2 Preprocessing Data

Proses yang dilakukan dalam proses Prepcosessing data antara lain :

3.2.1 Mencari Nilai Yang Hilang

Library pyhton yang digunakan isnull().sum(). Fungsi nya adalah untuk memastikan tidak ada nilai yang hilang.

Adapun hasil dalam program yang telah dibuat adalah

Gambar 2. Mencari missing Value

3.2.2 Mencari Data Duplikat

Selanjutnya adalah mencari nilai duplikat. Adapun library python yang digunakan adalah Duplicated() . yang memiliki fungsi mencari nilai duplikat pada DataFrame. Adapun hasil dari program yang telah dibuat adalah

Gambar 3. Mencari duplikat kata 3.3 Tranformasi Data

Tahapan ini adalah tahapan visualisasi data kedalam bentuk yang mudah di pahami.

Disini peneliti melakukan bentuk visualalisasi ke dalam bentuk diagram lingkaran. Dibawah ini merupakan hasil diagram lingkaran yang telah dibuat menggunakan Library Matplotlib. Adalah

Gambar 4. Diagram Lingkaran 3.4 Pemodelan Content Based Filtering

Dibawah ini merupakan tahapan tahapan proses pemodelan yang dilakukan. antara lain :

3.4.1. Mencari Kata Kunci

Tahapan pertama yaitu mencari nilai kata kunci dari setiap jurusan yang ada di Universitas Muhammadiyah sukabumi.

Contohnya peng-implementasian dari program yang telah dibuat dijelaskan dalam bentuk tabel:

(6)

tabel 5. contoh Key word setiap jurusan

Nama Jurusan Key Word

mahasiswa0 7

Administras i Bisnis

['menyukai', 'memiliki', 'kemampuan', 'menghasilkan ', 'sebuah', 'produk', 'ingin', 'memulai', 'bisnis', 'saya', 'sendiri', 'mencintai', 'dunia']

mahasiswa1 0

kimia ['menyukai', 'kegiatan', ' eksperimen', 'cenderung', 'praktik', 'dibanding', 'teori']

Fungsi dari kata kunci tersebut adalah untuk membedakan anatara jurusan yang satu dengan yang lain.

3.4.2. Sastrawi

Penerepan sastrawi dalam program yang telah dibuat, digambarkan dengan tabel dibawah ini :

Tabel 6. Contoh Implementasi Sastrawi

Mahasis wa 07

Admi nistra si Bisni s

Menyukai,

Memiliki,kemampuan,menghasilkan ,produk,bisnis,mencintai,dunia,

mahasisw a10

Kimi a

Menyukai,

kegiatan,ekperimen,cenderung,praktik, dibanding teori

Bisa dilihat perbedaan dengan tabel sebelumnya, di tabel sebelumnya ada kata ingin, Saya, Sendiri, di tahapan berikutnya kata kata seperti itu dihapus agar tidak menggangu proses pemodelan nantinya, serta performa pemodelan dapat lebih baik.

3.4.3. Bag Of word

Tahapan selanjutnya adalah merapihkan kata dalam tabel diatas. Karena bisa dilihat pada tabel diatas, kata tersebut belum rapih serta masih rancu. Adapun

pengimplementasian di gambarkan dengan tabel dibawah ini :

Tabel 7.Bag_Of word

Nama Bag_of word

Mahasiswa07 Administrasi Bisnis menyukai memiliki kemampuan menghasilkan produk bisnis mencintai dunia

Mahasiswa10 kimia menyukai kegiatan eksperimen cenderung praktik dibanding teori Untuk performa lebih baik lagi, dua kalimat diatas digabungkan menjadi sebuah penggabungan kata. Seperti tabel dibawah ini :

Tabel 8 Kumpulan Bag _ of word

Admnistrasi Bisnis Cenderung Dibanding Dunia Ekperimen Kegiatan kemampuan Kimia Memiliki Mencintai Menghasilkan Menyukai Praktik Produk teori

Adapun tabel tersebut jika diimpelementasikan dengan program yang telah dibuat adalah :

Gambar 6 kumpulan Bag_Of Word Setelah digabungkan kedalam bentuk bag_of word langkah selanjutnya adalah menghitung nilai persamaan antara Kedua jurusan tersebut.

dengan menggunakan rumus persamaan Cosine Simmilarity.

3.4.4. Cosine Simmilarity

Tahapan mencari nilai persamaan dengan Cosine Simmilarity antara lain :

1. Mengubah bentuk kata yang ada dalam tabel bag_of word kedalam vektor 1 dan 0 menggunakan Count_Vectorizer.

Seperti tabel dibawah ini

(7)

Tabel 9. Tabel Vektor Jurusan Vektor

Administra si Bisni

1,1,0,0,1,0,0,1,0,1,1,1,1,0 ,1,0

Kimia 0,0,1,1,0,1,1,0,1,0,0,0,1,1 ,0,1,

Hasil 0 dan 1, dihasilkan dari Kata dalam BoW . Jika kata tersebut bernilai 1 berarti Iya dan 0 berarti tidak.

2. Setelah diubah kedalam bentuk Vektor.

Masukan kedalam perhitungan cosine simmilarity seperti ini :

a. AdministrasiBisnis=

(1,1,0,0,1,0,0,1,0,1,1,1,1,0,1,0) b. Kimia =

(0,0,1,1,0,1,1,0,1,0,0,0,1,1,0,1,) Selanjutnya masukan kedalam rumus perhitungan Cosine Simmilarity menghasilkan nilai

3.5 Rekomendasi

Langkah selanjutnya adalah rekomendasi.

Sistem akan melakukan rekomendasi berdasarkan nilai persamaan Cosine Simmilarity yang tinggi

3.6 Evaluasi

Tahapan selanjutnya adalah menguji

keakuratan hasil pemodelan yang telah dilakukan. adapun tabel Confosion Matrik yang telah dihasilkan dengan kesulurah data yaitu :

Gambar 7. Tabel Confusion Matrik Keterangan :

Actual = Nilai data benar Prediction = nilai prediski data 0 = Administrasi Bisnis

1 = Administrasi Publik 2 = Agribisnis

3 = akuakultur 4 = Akuntansi

5 = Hubungan Masyarakat 6 = Hukum

7 = Kimia

8 = Manajemen Ritel

9 = Pendidikan Bahasa Sastra Indonesia 10 =Pendidikan Biologi

11 =Pendidikan Guru paud

12 = Pendidikan Guru Sekolah Dasar 13 = Pendidikan Jasmani dan Rohani 14 = Pendidikan Matematika

15 = Pendidikan Teknologi Informasi 16 = Perawat

7 = Perpajakan 18 = Sastra Inggris 19 = Teknik Informatika 20 = Teknik Sipil

Tabel diatas nantinya akan dijadikan acuan dalam menghitung nilai Presisi , Recall , dan Akurasi.

3.6.1 Presisi

Merupakan tingkat ketepatan hasil klasifikasi dari keseluruhan Dokumen.

Perhitunganya adalah :

𝑃𝑟𝑒𝑐𝑖𝑠𝑜𝑛 TP 𝑇𝑃 + 𝐹𝑃

Contoh perhitungan Presisi dengan Mengambil salah satu data yaitu Administrasi Bisnis hasil nya adalah

1. Presisi administrasi Bisnis

Presisi Administrasi Bisnis =3/

(0+0+0+0+0+0+0+0+0+0+0+0+0+0+

0+0+0+0+0)=3/3 = 1 . 3.6.2 Recall

Merupakan tingkat keberhasilan mengenali suatu kelas. Perhitungany adalah

𝑅𝑒𝑐𝑎𝑙𝑙 𝑇𝑃 𝑇𝑃 + 𝐹𝑁

Contoh perhitungan Recall dari salah satu contoh yaitu Administrasi Bisnis adalah

1.

Recall Administrasi Bisnis

3/(3+0+0+0+1+0+0+0+0+0+0+0+0+0 +0+0+0+0+0+0+0) = ¾ = 0,75

(8)

3.6.3 Akurasi

Adapun perhitunganya adalah.

𝐴𝑐𝑢𝑟𝑎𝑟𝑐𝑦 𝑇𝑃 𝐴𝑙𝑙 𝐶𝑙𝑎𝑠𝑠 𝑇𝑜𝑡𝑎𝑙 𝑆𝑢𝑝𝑝𝑜𝑟𝑡

Akurasi yang didapatkan dari pemodelan yang telah dibuat adalah 94%. Dijelaskan secara jelas dalam gambar dibawah ini :

Gambar 8. Tabel Presisi Recall Akurasi

KESIMPULAN

Penelitian ini bertujuan untuk mengimplementasikan metode Content Based Filtering dalam membuat pemodelan rekomendasi jurusan yang sesuai dengan minat dan kemampuan yang dimiliki siswa.

Selain menghasilkan bentuk pemodelan.

Penelitian ini menghasilkan nilai ketepatan dari pemodelan yang telah dibuat menggunakan metode Content Based Filtering. dari 21 jurusan yang dijadikan pemodelan rekomendasi menghasilkan Nilai akurasi sebesar 94%.

REFERENSI

[1] Destuardi, I., & Sumpeno, S. (2009). Klasifikasi Emosi Untuk Teks Bahasa Indonesia Menggunakan Metode Naive Bayes. In Seminar Nasional Pascasarjana IX-ITS.

[2] Nastiti, P. (2019). Penerapan Metode Content Based Filtering Dalam Implementasi Sistem Rekomendasi Tanaman Pangan. Teknika, 8(1), 1–10.

https://doi.org/10.34148/teknika.v8i1.139 [3] Normawati, D., & Prayogi, S. A. (2021).

Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter. In Jurnal Sains Komputer & Informatika (J-SAKTI (Vol. 5, Issue 2).

[4] Riyani, A., Zidny Naf’an #2, M., &

Burhanuddin, A. (2019). Penerapan Cosine Similarity dan Pembobotan TF-IDF untuk Mendeteksi Kemiripan Dokumen. In JLK (Vol.

2, Issue 1).

[5] Saputra, N., Adji, T. B., & Permanasari, A. E.

(2015). ANALISIS SENTIMEN DATA

PRESIDEN JOKOWI DENGAN

PREPROCESSING NORMALISASI DAN STEMMING MENGGUNAKAN METODE

(9)

NAIVE BAYES DAN SVM Oleh. In Jurnal Dinamika Informatika (Vol. 5, Issue 1).

6[6] Setiawan, H., Utami, E., & Al Fatta, H. (2020).

Penerapan Arima Dan Artificial Neural Network Untuk Prediksi Penderita DBD Di Kabupaten Sragen. Majalah Ilmiah Bahari

Jogja, 18(2), 64–78.

https://doi.org/10.33489/mibj.v18i2.220 7[7] Sukma Pradana, D., & Hartawan, G. P. (2021).

Perbandingan Algoritma Content-Based Filtering dan Collaborative Filtering dalam Rekomendasi Kegiatan Ekstrakurikuler Siswa.

Jurnal Ilmiah Komputer.

8[8] Tari Mardiana. (2015). Kluster Bag-of-Word Menggunakan Weka. Jurnal Edukasi Dan Penelitian Informatika.

9[9] Fatoni Batari Agung Larasati, H. F. (2021).

SISTEM REKOMENDASI PRODUCT

EMINA COSMETICS DENGAN

MENGGUNAKAN METODE CONTENT - BASED FILTERING. Jurnal Manajemen Informatika Sistem Informasi, 24–24.