• Tidak ada hasil yang ditemukan

ANALISIS PENENTUAN DOSEN PEMBIMBING SKRIPSI MAHASISWA MENGGUNAKAN NAIVE BAYES CLASSIFIER. Sri Rahayu, Fatayat, Roni Salambue, Al Aminuddin

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS PENENTUAN DOSEN PEMBIMBING SKRIPSI MAHASISWA MENGGUNAKAN NAIVE BAYES CLASSIFIER. Sri Rahayu, Fatayat, Roni Salambue, Al Aminuddin"

Copied!
10
0
0

Teks penuh

(1)

ANALISIS PENENTUAN DOSEN PEMBIMBING SKRIPSI MAHASISWA MENGGUNAKAN NAIVE BAYES CLASSIFIER

Sri Rahayu, Fatayat, Roni Salambue, Al Aminuddin Mahasiswa Program Studi S1 Sistem Informasi

Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia

[email protected]

ABSTRACT

Determination of the mentor lecturer for students is very influential in completing the final task. Lecturers who are competent and in accordance with the field of student's final assignment able to direct of the student's final assignment. In this thesis, text mining is used to classify the appropriate guidance lecturers for students in completing the final assignment. Classification is applied to the title of the student's final assignment based on experience and field of mentor lecturers. The algorithm used naive bayes classifier algorithm. Before the data classification processed at the text preprocessing stage, which consist of case folding, stopcharacter removal, stopword, stemming, and weighted. Evaluation to measure the accuracy of this system using confussion matrix which resulted in 78% accuracy in mentor lecturers and generate acuration of 95% in field of expertise.

Keywords: Mentor Lecturer, Naive Bayes Classifier, Text preprocessing, final project. ABSTRAK

Penentuan dosen pembimbing untuk mahasiswa/i sangat berpengaruh dalam menyelesaikan skripsi. Dosen pembimbing yang kompeten dan sesuai dengan bidang skripsi mahasiswa mampu mengarahkan skripsi mahasiswa tersebut. Dalam skripsi ini

text mining digunakan untuk mengklasifikasi dosen pembimbing yang tepat untuk

mahasiswa/i dalam menyelesaikan skripsi. Klasifikasi diterapkan pada judul skripsi mahasiswa berdasarkan pengalaman dan bidang dosen pembimbing. Algoritma yang digunakan adalah algoritma naive bayes classifier. Sebelum dilakukan klasifikasi data, terlebih dahulu diproses pada tahap text preprocessing, yang terdiri dari case folding,

stopcharacter removal, stopword, stemming, dan pembobotan. Evaluasi untuk

mengukur akurasi pada sistem ini menggunakan confussion matrix yang menghasilkan akurasi 78% pada dosen pembimbing dan menghasilkan akurasi 95% pada bidang keahlian.

(2)

PENDAHULUAN

Salah satu syarat kelulusan mahasiswa untuk mendapatkan gelar sesuai dengan program studinya adalah dengan mengerjakan skripsi. Skripsi adalah sebuah mata kuliah yang harus ditempuh oleh seorang mahasiswa menjelang akhir studinya. Mata kuliah ini berbentuk proyek mandiri yang dilakukan oleh mahasiswa dibawah bimbingan dosen pembimbing (Maulani and Simbolon, 2019). Penentuan dosen pembimbing skripsi adalah hal yang harus dilakukan setiap universitas dan jurusan masing-masing untuk membantu mahasiswa dalam menyelesaikan skripsi. Mahasiswa membutuhkan dosen pembimbing sebagai tempat konsultasi dalam penyelesaian skripsi. Tugas penentuan pembimbing dan penguji skripsi mahasiswa biasanya diberikan kepada ketua jurusan yang dalam penentuannya masih menggunakan cara konvensional dengan mengandalkan pengetahuan pribadi tentang spesifikasi keahlian dosen yang sesuai dengan judul skripsi mahasiswa. Dalam menentukan hal tersebut terkadang terjadi keputusan yang kurang optimal dimana dosen yang ditunjuk kurang sesuai dengan topik skripsi mahasiswa, akibatnya dapat mengurangi kualitas skripsi mahasiswa. Penelitian ini bertujuan untuk menentukan dosen pembimbing skripsi mahasiswa yang tepat dalam membimbing skripsi mahasiswa.

METODE PENELITIAN a. Teknik Pengumpulan Data

Data yang digunakan pada penelitian ini adalah data judul mahasiswa. Teknik pengumpulan data yang digunakan pada penelitian ini yaitu wawancara dan studi literatur. Wawancara dilakukan terhadap koordinator admin sebagai pihak yang memiliki kewajiban dalam mengelola data judul mahasiswa. Studi literatur dilakukan dengan mengambil data sample yang terdapat pada jurnal, buku, atau media eletronik yang memiliki keterikatan dengan materi penelitian.

b. Peralatan yang Digunakan

Adapun peralatan yang digunakan dalam penelitian ini terbagi menjadi 2 kategori, yaitu hardware dan software. Peralatan hardware dapat dilihat pada Tabel 1 dan software pada Tabel 2.

Tabel 1. Hardware yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Laptop Pengolahan data Lenovo G40

(3)

Tabel 2. Software yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Windows Sistem operasi Windows 10 Pro

2 Microsof Office Word Penulisan dokumen teks Word 2019

3 Sublime Text Teks editor 3

5 Python Bahasa pemrograman 3.4.2

6 Mozilla Firefox Penghubung dengan

internet

4.6.4

c. Text Mining

Text mining adalah penggalian informasi dari teks oleh user menggunakan tools

analisis. Secara umum text mining mengadopsi proses-proses didalam data mining dan didalam text mining juga menggunakan teknik data mining (Efendi, 2017). Prosedur utama dalam metode ini terkait dengan menemukan kata-kata yang dapat mewakili isi dari dokumen untuk selanjutnya dilakukan analisis keterhubungan antar dokumen dengan menggunakan metode statistik tertentu seperti analisis kelompok, klasifikasi, dan asosiasi.

d. Text Preprocessing

Text preprocessing menjadi tahap awal dalam text mining. Preprocessing

dilakukan untuk menghilangkan bagian atau teks yang tidak diperlukan sehingga mendapatkan data yang berkualitas untuk dieksekusi (Efendi, 2017). Beberapa proses yang dilakukan pada text preprosesing adalah case folding, tokenizing, stop word

removal, dan stemming.

a. Case folding adalah mengubah semua huruf dalam dokumen menjadi huruf kecil.

Hanya huruf ‘a’ sampai dengan ‘z’ yang diterima karakter selain huruf dihilangkan dan dianggap delimiter.

b. Tokenizing merupakan proses pemisahan suatu rangkaian karakter berdasarkan

karakter spasi dan pada waktu yang bersamaan dilakukan juga proses penghapusan karakter tertentu seperti tanda baca.

c. Filtering adalah tahap mengambil kata-kata penting dari hasil tokenizing.

d. Stemming digunakan untuk mengubah term yang masih melekat dalam term

tersebut awalan, sisipan dan akhiran. e. Algoritma Naive Bayes Classifier

Naïve Bayes Classifier merupakan sebuah metode klasifikasi yang berakar pada

Teorema Bayes. Metode pengklasifikasian dengan menggunakan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris, Thomas Bayes, yaitu memprediksi peluang dimasa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes.

Jika X adalah vektor masukan yang berisi fitur dan Y adalah label kelas, Naive

(4)

didapatkan setelah fitur-fitur X diamati, notasi ini disebut juga probabilitas akhir (posterior probability) untuk Y, sedangkan P (Y) disebut probabilitas awal (prior

probability). Selama proses pelatihan harus dilakukan pembelajaran probabilitas akhir P

(X|Y) pada model untuk setiap kombinasi X dan Y berdasarkan informasi yang didapat dari data latih.

Formulasi Naïve Bayes untuk klasifikasi adalah :

P(Wk | Vj) = nk+1 (1) n + |vocab |

Keterangan :

Wk : Kata dalam kategori j Vj : Kategori atau label data

nk : frekuensi munculnya kata wk pada dokumen berkategori Vj n : Banyaknya seluruh kata dalam dokumen berkategori Vj |vocab| : Banyaknya kata dalam contoh penelitian.

nk+1 : ‘add one’ atau laplace smoothing yang menghentikan nilai 0 pada hasil perkalian.

f. Confussion Matrix

Confusion Matrix adalah evaluasi dari sebuah klasifikasi data mining yang

direpresentasikan menjadi tabel (Gorunescu 2011). Confussion matrix berisi informasi perbandingan label hasil klasifikasi dengan label sebenarnya (Indriyanti, Sugianti and Karomi, 2017).

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 =𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑙𝑎𝑠𝑖𝑓𝑖𝑘𝑎𝑠𝑖 𝑏𝑒𝑛𝑎𝑟

𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑢𝑗𝑖 𝑋 100% (2)

HASIL DAN PEMBAHASAN a. Data

Data yang digunakan dalam penelitian ini adalah data judul skripsi mahasiswa dan list dosen pembimbing judul skripsi mahasiswa. Total judul skripsi yang didapatkan adalah sebanyak 361 judul skripsi dengan 28 dosen pembimbing,

b. Text Preprocessing

Pada tahapan ini akan dilakukan text preprocessing terhadap data yang akan diolah agar dataset bersih dari noise.

Tabel 1. Sampel Data Testing dan Data Training

Data Training Judul Skripsi Mahasiswa Kelas

1 Implementasi Fuzzy dan Metode Certainty Factor Untuk Mendiagnosa Gangguan Kepribadian

23 2 Perbandingan algoritma mean filter dalam mereduksi 24

(5)

noise pada citra digital

3 Klasifikasi Penentuan Subsidi Listrik Rumah Tangga Menerapkan Metode Learning Vector Quantization

25 4 Pencarian pola peminjaman buku pada perpustakaan

UIN SUSKA Riau dengan Algoritma Prefixspan

26

Data Testing Judul Skripsi Mahasiswa Kelas

5 Algoritma Stemming Bahasa Melayu ?

Tahap preprocessing terdiri dari beberapa tahapan, yaitu : a. Case folding dan stop character removal

Tabel 2. Hasil Proses Case Folding dan Stop Character Removal

Data Training Judul Skripsi Mahasiswa Kelas

1 implementasi fuzzy dan metode certainty factor untuk mendiagnosa gangguan kepribadian

23 2 perbandingan algoritma mean filter dalam mereduksi

noise pada citra digital

24 3 klasifikasi penentuan subsidi listrik rumah tangga

menerapkan metode learning vector quantization

25 4 pencarian pola peminjaman buku pada perpustakaan

uin suska riau dengan algoritma prefixspan

26

Data Testing Judul Skripsi Mahasiswa Kelas

5 algoritma stemming bahasa melayu ?

b. Tokenizing

Tokenizing adalah proses sebuah kalimat atau paragraf dipecah menjadi sebuah

kata.

Tabel 3. Hasil Tokenizing

1 2 3 4 5

implementasi perbandingan klasifikasi pencarian algoritma

fuzzy algoritma klasifikasi pola stemming

dan mean penentuan peminjaman bahasa

metode filter subsidi minjam melayu

certainty dalam listrik buku

factor mereduksi rumah pada

untuk noise tangga perpustakaan

mendiagnosa pada menerapkan uin

gangguan citra metode suska

kepribadian digital learning riau

vector dengan

quantization algoritma prefixspan

(6)

c. Stopword removal dan stemming

Stopword removal adalah sebuah proses penghapusan kata/term yang tidak

berhubungan. Tujuan stopword ini untuk meminimalisir kata yang dianggap tidak penting dalam memudahkan proses klasifikasi.

Tabel 4. Hasil Stopword Removal dan Stemming

2 3 4 5

fuzzy banding klasifikasi pola stemming

metode mean penentu Pinjam bahasa

certainty filter subsidi buku melayu

factor reduksi listrik pustaka

diagnosa noise rumah uin

ganggu citra tangga suska

pribadi digital nerap riau

learning prefixspan vector

quantization c. Klasifikasi Algoritma Naive Bayes Classifier

Klasifikasi algoritma Naive Bayes Classifier dibagi menjadi 2 tahapan, yaitu tahap

training (pelatihan) dan tahap testing (pengujian).

Pada tahapan training ini dicari nilai probabilitas kelas dari data latih. Perhitungan nilai probabilitas setiap term atau token untuk setiap kelas dari data latih dapat dilihat sebagai berikut :

1. Hitung probabilitas setiap kategori menggunakan persamaan: P (Vj) = | doc j | Contoh P (23) = 14 361 P (23) = 0,04 P (24) = 9 361 P (24) = 0,02 P (25) = 9 361 P (25) = 0,02 P (26) = 25 361 P (26) = 0,07 P (28) = 3 361 P (28) = 0,008 P (29) = 24 361 P (29) = 0,07 P (30) = 10 361 P (30) = 0,03 P (31) = 1 361 P (31) = 0,003 P (32) = 23 361 P (32) = 0,06 P (33) = 11 361 P (33) = 0,03 P (34) = 12 361 P (34) = 0,03 P (35) = 10 361 P (35) = 0,03

(7)

2. Hitung probabilitas masing-masing kata (stemming, bahasa, melayu). Probabilitas masing-masing kata pada dosen dihitung menggunakan persamaan :

P(Wk | Vj) = nk+1 n + |vocab |

Probabilitas tiap term id pada dosen 23 Probabilitas kata “ stemming’’

P(“fuzzy” | ”23”) = 0 + 1 = 0.0007407407407407407 139 + 1211

Probabilitas kata “ bahasa’

P(“bahasa” | ”23”) = 0 + 1 = 0.0007407407407407407 139+ 1211

Probabilitas kata “ melayu’’

P(“melayu” | ”23”) = 0 + 1 = 0.0007407407407407407 139 + 1211

Menghitung nilai probabilitas kata (term) pada tiap kelas

P(sampel|23)= p ( 23 ) × p (stemming | 23) × p (bahasa | 23) × p (melayu | 23) P(sampel|23)= 14

361× (0.0007407407407407407) × (0.0007407407407407407) × (0.0007407407407407407)

= 1.5762297793996056e-11

(8)

Tabel 6. Probabilitas kata pada setiap bidang keahlian

Stemming Bahasa Melayu

RPL 0.00031 0.00187 0.00062

Pemrograman 0.00268 0.00537 0.00179

Machine Learning 0.00063 0.00126 0.000633

Android 0.000746 0.00224 0.000746

Tabel 7. Probabilitas rekomendasi dosen pembimbing

Tabel 8. Probabilitas rekomendasi bidang keahlian

No Bidang Probabilitas

1 Pemrograman 7.5949510981803e-09

2 RPL 2.0689857265128327e-10

3 Machine Learning 5.216791999998871e-11

4 Android 5.192345476252833e-11

Nilai probabilitas tertinggi yang diperoleh yaitu kategori atau kelas Id_Dosen 36 dengan nilai probabilitas sebesar 7.738178421521332e-09. Sehingga data uji judul atau skripsi mahasiswa yaitu “Stemming Bahasa Melayu” memiliki dosen pembimbing dengan Id_Dosen 36.

d. Evaluasi Klasifikasi Dosen Pembimbing dan Bidang Keahlian

Evaluasi dilakukan dengan menggunakan confussion matrix untuk melihat seberapa baik classifier mengenali class.

a. Dosen Pembimbing Akurasi = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑘𝑙𝑎𝑠𝑖𝑓𝑖𝑘𝑎𝑠𝑖 𝑏𝑒𝑛𝑎𝑟 𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑢𝑗𝑖 × 100 % = 57 73× 100% = 78.08 %

(9)

b. Bidang Keahlian Akurasi = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑘𝑙𝑎𝑠𝑖𝑓𝑖𝑘𝑎𝑠𝑖 𝑏𝑒𝑛𝑎𝑟 𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑢𝑗𝑖 × 100 % = 66 73× 100% = 90,41 % KESIMPULAN

Berdasarkan hasil penelitian ini dapat disimpulkan beberapa hal, yaitu:

1. Data mining sangat berguna untuk penentuan dosen pembimbing dengan

menggunakan kaidah klasifikasi.

2. Dari hasil penelitian, peneliti berhasil mengimplementasikan algoritma naive

bayes untuk penentuan dosen pembimbing dan bidang, hasil dari pengolahan 361

data menggunakan algoritma naive bayes dengan pembagian data 80:20 dimana data training sebanyak 80% dan data testing sebanyak 20%.

3. Penelitian ini telah menguji kemampuan algoritma klasifikasi naive bayes dan diperoleh akurasi sebesar 78% untuk klasifikasi dosen pembimbing dan 90% untuk klasifikasi bidang keahlian.

UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada ibu Fatayat, S.Kom., M.Kom, bapak Roni Salambue, S.Kom., M.Si. dan bapak Al Aminuddin, ST., M.Sc. yang telah membimbing, memotivasi, dan membantu penelitian serta penulisan karya ilmiah ini.

DAFTAR PUSTAKA

Asril, H. and Kamila, I. (2019) ‘Klasifikasi Dokumen Skripsi Berbasis Text Mining menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor’, (November), pp. 178–187.

Berliana, G., Shaufiah, S.T., M. T. and Siti Sa’adah, S.T., M. T. (2018) ‘Klasifikasi Posting Tweet mengenai Kebijakan Pemerintah Menggunakan Naive Bayesian Classification’, e-Proceeding of Engineering, 5(1), pp. 1562–1569.

Indriyanti, Sugianti, D. and Karomi, M. A. Al (2017) ‘Peningkatan Akurasi Algoritma KNN dengan Seleksi Fitur Gain Ratio untuk Klasifikasi Penyakit Diabetes Mellitus’, pp. 1-6.

Efendi, Z. (2017) ‘Text Mining Classification Sebagai Rekomendasi Dosen Pembimbing Skripsi Program Studi Sistem Informasi’, pp. 235–242.

(10)

Apotek Arjowinangun’, Indonesian Jurnal on Computer Science - Speed (IJCSS)

Gambar

Tabel 1. Hardware yang digunakan
Tabel 2. Software yang digunakan
Tabel 2. Hasil Proses Case Folding dan Stop Character Removal
Tabel 4. Hasil Stopword Removal dan Stemming
+3

Referensi

Dokumen terkait

Apabila sudah memperoleh Dosen Pembimbing, maka dalam waktu 4 bulan mahasiswa yang bersangkutan harus secepatnya mendaftar tes pendadaran

Penulisan skripsi dengan judul “Fenomena Kecemasan Berkomunikasi dan Ketidakpastian Mahasiswa dalam Interaksi Komunikasi Antarpribadi dengan Dosen Pembimbing dalam Bimbingan

Layanan yang harus diberikan oleh Dosen Pembimbing Akademik kepada Mahasiswa meliputi 17 indikator: yaitu (1) DPA mudah ditemui, (2) Mahasiswa dapat

DAFTAR DOSEN PEMBIMBING AKADEMIK MAHASISWA BARU TAHUN AKADEMIK 2013/2014.. JURUSAN

Oleh karena itu, peneliti mencoba membangun sebuah aplikasi penentuan tema skripsi yang mampu membantu mahasiswa dalam menentukan tema skripsi menggunakan metode naive bayes

DAFTAR DOSEN PEMBIMBING AKADEMIK MAHASISWA BARU TAHUN AKADEMIK 2013/2014.. JURUSAN TEKNOLOGI

Maka dari ini mahasiswa diharuskan menyelesaikan syarat-syarat tugas akhir dalam bimbingan skripsi, setiap mahasiswa yang menjalankan harus mendapatkan bimbingan dari dosen- dosen yang

Dosen pembimbing adalah dosen yang ditugaskan untuk membimbing dan mengarahkan mahasiswa dalam menyelesaikan penulisan Skripsi dengan SK Dekan Fakultas Pertanian UNTAG 1945 Samarinda..