• Tidak ada hasil yang ditemukan

PREDIKSI MASA STUDI SARJANA MENGGUNAKAN DATA MINING PADA PRODI S1 MATEMATIKA FMIPA UNIVERSITAS RIAU

N/A
N/A
Nguyễn Gia Hào

Academic year: 2023

Membagikan "PREDIKSI MASA STUDI SARJANA MENGGUNAKAN DATA MINING PADA PRODI S1 MATEMATIKA FMIPA UNIVERSITAS RIAU"

Copied!
14
0
0

Teks penuh

(1)

PREDIKSI MASA STUDI SARJANA MENGGUNAKAN DATA MINING PADA PRODI S1 MATEMATIKA

FMIPA UNIVERSITAS RIAU

Rifomajesty Islamy, Joko Risanto, S.Kom., M.Kom.

Mahasiswa Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia

rifomajesty.islami5676@student.unri.ac.id ABSTRACT

Prediction of undergraduate study period is influential in helping the study program to monitor the development of studies from its students and prevent the existence of students that will result in the perfomance of the study program decreases. It can also help the study program in producing a skinned scholar who will be useful during the reaccreditation process. This research aims to find out the predictions of the length of study period of students using the web-based Naive Bayes method. The prediction of the undergraduate study period consists of two stages, namely the stages in data processing using the Naive Bayes method and the stages in system creation. The stages of data processing using the Naive Bayes method consists of data collection, data cleansing, data integration, data selection, data transformation and Naive Bayes stages. While the stages in the creation of the system consist of requirment, design, implementation and testing. Users can input variabels that are used to make prediction, then the system will provide the results of student study period predictions based on calculations of Naive Bayes method. The variabels used are gender, GPA semester IV, parental work and parental income also the resulting predictions are study period on time or not. The system is designed using UML diagrams with PHP programming languages and MySQL databases. The results of system testing conducted using confusion matrix againts 28 undergraduate study period data with on time and not on time labels resulted in an accuracy rate of 78.57%.

Keywords: Data Mining, Naive Bayes, Prediction, Undergraduate Study Period, Web.

ABSTRAK

Prediksi masa studi sarjana berpengaruh dalam membantu program studi untuk memantau perkembangan studi dari mahasiswanya dan mencegah adanya mahasiswa yang akan mengakibatkan kinerja program studi tersebut menurun. Hal ini juga dapat membantu program studi dalam menghasilkan sarjana yang berkulitas yang akan berguna ketika proses reakreditasi. Penelitian ini bertujuan untuk mengetahui prediksi lama masa studi mahasiswa menggunakan metode Naive Bayes berbasis web. Prediksi masa studi sarjana terdiri dari dua tahapan yaitu tahapan dalam pengolahan data menggunakan metode Naive Bayes dan tahapan dalam pembuatan sistem. Tahapan- tahapan pengolahan data menggunakan metode Naive Bayes terdiri dari pengumpulan data, pembersihan data, integrasi data, seleksi data, transformasi data dan tahapan Naive Bayes. Sedangkan tahapan-tahapan dalam pembuatan sistem terdiri dari requirment,

(2)

design, implementation dan testing. Pengguna dapat melakukan input variabel yang digunakan untuk melakukan prediksi, kemudian sistem akan memberikan hasil prediksi masa studi mahasiswa berdasarkan perhitungan metode Naive Bayes. Adapun variabel yang digunakan yaitu jenis kelamin, IPK semester IV, pekerjaan orang tua dan penghasilan orang tua serta prediksi yang dihasilkan yaitu masa studi tepat waktu atau tidak tepat waktu. Sistem ini dirancang menggunakan UML diagram dengan bahasa pemrograman PHP dan database MySQL. Hasil pengujian sistem yang dilakukan dengan menggunakan confusion matrix terhadap 28 data masa studi sarjana dengan label tepat waktu dan tidak tepat waktu menghasilkan tingkat akurasi sebesar 78.57%.

Kata Kunci: Data Mining, Naive Bayes, Masa Studi Sarjana, Prediksi, Web.

PENDAHULUAN

Ketatnya persaingan dalam mendapatkan lapangan pekerjaan menuntut sebuah perguruan tinggi dalam menghasilkan sarjana yang berkualitas dan memiliki daya saing tinggi. Untuk itu, setiap perguruan tinggi melakukan evaluasi performansi mahasiswa.

Hasil evaluasi tersebut disimpan dalam basis data akademik dan dapat digunakan sebagai pendukung keputusan oleh manajemen perguruan tinggi. Salah satu variabel indikator efisiensi proses pendidikan yaitu informasi mengenai lama masa studi mahasiswa. Program studi memiliki kewajiban untuk memantau perkembangan studi dari mahasiswanya. Program studi juga mempunyai tugas untuk memprediksi lama studi dari setiap mahasiswanya untuk menentukan dan mengantisipasi terjadinya mahasiswa yang ’mangkrak’ atau ’mangkir’ yang akan menyebabkan kinerja program studi menjadi kurang baik. Penelitian ini diharapkan dapat membantu Program Studi S1 Matematika FMIPA Universitas Riau untuk mengetahui masa studi mahasiswanya maka penulis bermaksud melakukan penelitian prediksi masa studi sarjana dengan metode Naive Bayes yang mampu membantu Program Studi dalam menghasilkan lulusan yang berkualitas serta memiliki daya saing yang tinggi yang nantinya juga akan berguna dalam proses reakreditasi. Pada penelitian ini, penulis melakukan pengujian metode yang sudah ada untuk diterapkan pada kasus nyata yaitu prediksi masa studi sarjana dengan metode naive bayes.

STUDI PUSTAKA a. Prediksi

Prediksi adalah suatu proses memperkirakan secara sistematis tentang sesuatu yang paling mungkin terjadi di masa depan berdasarkan informasi masa lalu dan sekarang yang dimiliki, agar kesalahannya (selisih antara sesuatu yang terjadi dengan hasil perkiraan) dapat diperkecil. Prediksi tidak harus memberikan jawaban secara pasti kejadian yang akan terjadi, melainkan berusaha untuk mencari jawaban sedekat mungkin yang akan terjadi (Orpa, Ripanti, & Tursina, 2019).

b. Data Mining

Data Mining merupakan proses pengekstraksian informasi dari sekumpulan data yang sangat besar melalui penggunaan algoritma dan teknik penarikan dalam bidang statistik, pembelajaran mesin dan sistem manajemen basis data. Definisi lain

(3)

historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran besar (Saleh, 2015).

c. Naive Bayes

Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang dimasa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi Naive Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya (Amelia, Lumenta, & Jacobus, 2017).

Teorema Bayes memiliki bentuk umum sebagai berikut (Jananto, 2013):

( | ( | (

( ... (1) ( | ( | ( ... (2) X = data dengan class yang belum diketahui.

H = hipotesis data X merupakan suatu class spesifik.

P (H | X) = probabilitas hipotesis H berdasarkan kondisi X (posteriori prob).

P (H) = probabilitas hipotesis H (prior prob).

P (X | H) = probabilitas hipotesis X berdasarkan kondisi tersebut.

P (X) = probabilitas dari X.

METODE PENELITIAN a. Tahapan Penelitian

Dalam penelitian ini dibagi menjadi 2 tahapan yaitu tahapan Data Mining dan tahapan pembuatan sistem. Langkah-langkah yang dilakukan dalam menggunakan Data Mining untuk memprediksi dapat dilihat pada gambar berikut:

Gambar 1. Tahapan Data Mining.

(4)

Setelah dilakukan tahapan Data Mining sesuai dengan tahapan-tahapan diatas,maka akan dilakukan tahapan pembuatan sistem yang dapat dilihat pada gambar berikut:

Gambar 2. Tahapan-tahapan Dalam Pembuatan Sistem.

HASIL DAN PEMBAHASAN a. Tahapan Data Mining

Pada tahapan ini dilakukan beberapa tahapan dalam data mining. Adapun tahapan- tahapannya terdiri dari pembersihan data, integrasi data, seleksi data, transformasi data, tahapan naive bayes, evaluasi pola dan presentasi pengetahuan. Data-data yang dikumpulkan adalah data pribadi mahasiswa tahun 2012 hingga 2014 dan data IPK semester IV mahasiswa tahun 2012 hingga 2014.

1. Pembersihan Data

Dalam penelitian ini data diambil dari data mahasiswa tahun 2012 hingga 2014 dan data IPK semester IV mahasiswa di Dekanat FMIPA Universitas Riau. Jumlah data sebelum dilakukan cleaning berjumlah 134 data, dan setelah melalui proses cleaning data yang diperoleh berjumlah 109 data. Dapat dilihat pada tabel 1 dan 2.

Tabel 1. Data Pribadi Mahasiswa Tahun 2012 hingga 2014.

No NIM Nama Jenis

Kelamin

Pekerjaan

Orang Tua Penghasilan Orang Tua 1 1203113430 Atika Elsafina P Buruh Rp. 1.000.000 – Rp. 2.500.000

2 1203113461 Andi Ilham L Karyawan

Swasta Rp. 1.000.000 – Rp. 2.500.000 3 1203113471 Fadhli Wahyudi L Pekerja Usaha

Menengah Rp. 2.500.000 – Rp. 5.000.000 4 1203113497 Masnida Esra

Elisabet P Wiraswasta Rp. 1.000.000 – Rp. 2.500.000 5 1203113519 Yurisda Nur Ain P Ibu Rumah

Tangga Rp. 1.000.000 – Rp. 2.500.000

Tabel 2. Data IPK Semester IV Mahasiswa.

No NIM Nama IPK Semester 4

1 1203113430 Atika Elsafina 3.26

2 1203113461 Andi Ilham 2.78

3 1203113471 Fadhli Wahyudi 3.09

4 1203113497 Masnida Esra Elisabet 3.09

5 1203113519 Yurisda Nur Ain 3.16

2. Integrasi Data

Setelah dilakukan pembersihan data, kemudian dilanjutkan dengan proses integrasi data. Pada integrasi data ini akan dilakukan penggabungan dari beberapa atribut pada data mahasiswa tahun 2012 hingga tahun 2014 dan data IPK semester IV mahasiswa menjadi satu tabel. Dapat dilihat pada tabel 3.

(5)

Tabel 3. Integrasi Data Mahasiswa dan Data IPK Semester IV.

No NIM Nama Jenis

Kelamin IPK Sem IV

Pekerjaan Orang Tua

Penghasilan Orang Tua

1 1203113430 Atika Elsafina P 3.26 Buruh Rp. 1.000.000 –

Rp. 2.500.000

2 1203113461 Andi Ilham L 2.78 Karyawan Swasta Rp. 1.000.000 –

Rp. 2.500.000 3 1203113471 Fadhli Wahyudi L 3.09 Pekerja Usaha

Menengah

Rp. 2.500.000 – Rp. 5.000.000 4 1203113497 Masnida Esra

Elisabet P 3.09 Wiraswasta Rp. 1.000.000 –

Rp. 2.500.000 5 1203113519 Yurisda Nur

Ain P 3.16 Ibu Rumah Tangga Rp. 1.000.000 –

Rp. 2.500.000

3. Seleksi Data

Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. Setelah dilakukan integrasi data, dilakukan seleksi terhadap data atribut yang akan berguna dalam proses prediksi. Atribut yang dipilih ialah NIM, jenis kelamin, IPK semester IV, pekerjaan orang tua, penghasilan orang tua dan keterangan lulus. Atribut yang tidak digunakan akan dihapus dari tabel. Dapat dilihat pada tabel 4.

Tabel 4. Data Mahasiswa Yang Digunakan Dalam Prediksi.

No NIM Jenis

Kelamin

IPK Sem IV

Pekerjaan Orang Tua

Penghasilan Orang Tua

Keterangan Lulus

1 1203113430 P 3.26 Buruh Rp. 1.000.000 –

Rp. 2.500.000

Tidak Tepat Waktu

2 1203113461 L 2.78 Karyawan Swasta Rp. 1.000.000 –

Rp. 2.500.000

Tidak Tepat Waktu

3 1203113471 L 3.09 Pekerja Usaha

Menengah

Rp. 2.500.000 – Rp. 5.000.000

Tidak Tepat Waktu

4 1203113497 P 3.09 Wiraswasta Rp. 1.000.000 –

Rp. 2.500.000

Tidak Tepat Waktu 5 1203113519 P 3.16 Ibu Rumah Tangga Rp. 1.000.000 –

Rp. 2.500.000 Tepat Waktu

4. Transformasi Data

Proses transformasi dilakukan pada data yang telah dipilih, sehingga data tersebut sesuai untuk digunakan. Proses ini merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

a) Variabel Jenis Kelamin.

Untuk variabel jenis kelamin, dikarenakan hanya berisi dua nilai maka tidak dilakukan transformasi data. Variabel jenis kelamin terdiri dari 2 kategori yaitu: P untuk perempuan dan L untuk laki-laki.

b) Variabel IPK Semester IV.

Transformasi nilai IPK semester IV dilakukan dengan mengubah nilai IPK menjadi beberapa kategori yaitu:

Tabel 5. Transformasi IPK Semester IV.

No. IPK Asli IPK Transformasi

1 3.51 - 4.00 A

2 2.75 - 3.50 B

3 2.00 - 2.74 C

4 0.00 - 1.99 D

(6)

c) Variabel Pekerjaan Orang Tua.

Untuk variabel pekerjaan orang tua tidak dilakukan transformasi data. Kategori pada variabel pekerjaan orang tua sesuai dengan data pribadi mahasiswa.

d) Variabel Penghasilan Orang Tua.

Transformasi nilai penghasilan orang tua diubah menjadi beberapa kategori seperti di bawah ini:

Tabel 6. Transformasi Penghasilan Orang Tua.

No. Pennghasilan Orang Tua Asli Penghasilan Transformasi

1 Rp. 100.000 - Rp. 500.000 1

2 Rp. 500.000 - Rp. 1.000.000 2

3 Rp. 1.000.000 - Rp. 2.500.000 3 4 Rp. 2.500.000 - Rp. 5.000.000 4 5 Rp. 5.000.000 - Rp. 7.500.000 5 6 Rp. 7.500.000 - Rp. 10.000.000 6

7 > Rp. 10.000.000 7

5. Tahapan Naive Bayes

Adapun yang akan dilakukan dalam tahapan ini, yaitu:

a) Menghitung P(H) untuk setiap kelas.

Tabel 7. Kelas Masa Studi Sarjana.

Kelas Masa Studi Sarjana Jumlah (Satuannya) Probabilitas

Tepat Waktu 45

P (TepatWaktu)

= 45/81

= 0.555555556

Tidak Tepat Waktu 36

P (TidakTepatWaktu)

= 36/81

= 0.444444444

b) Menghitung P(H|X) untuk setiap kriteria dan setiap kelas.

Tabel 8. Probabilitas Jenis Kelamin.

No Kelas Masa Studi Sarjana

Jenis Kelamin Jumlah

Probabiltas

1 Tepat Waktu

P 28

P (Jenis Kelamin P | Tepat Waktu)

= 28/47

= 0.596

L 19

P (Jenis Kelamin L | Tepat Waktu)

= 19/47

= 0.404

2 Tidak Tepat Waktu

P 28

P (Jenis Kelamin P | Tidak Tepat Waktu)

= 28/38

= 0.737

L 10

P (Jenis Kelamin L | Tidak Tepat Waktu)

= 10/38

= 0.263

Tabel 9. Probabilitas Variabel IPK Semester IV.

No Kelas Masa Studi Sarjana

IPK

Transformasi Jumlah Probabilitas

1 Tepat Waktu A 11

P (IPK A | Tepat Waktu)

= 11/49

= 0.224

(7)

Lanjutan Tabel 9.

No Kelas Masa Studi Sarjana

IPK

Transformasi Jumlah Probabilitas

1 Tepat Waktu

B 36

P (IPK B | Tepat Waktu)

= 36/49

= 0.735

C 1

P (IPK C | Tepat Waktu)

= 1/49

= 0.020

D 1

P (IPK D | Tepat Waktu)

= 1/49

= 0.020

2 Tidak Tepat Waktu

A 1

P (IPK A | Tidak Tepat Waktu)

= 1/40

= 0.025

B 27

P (IPK B | Tidak Tepat Waktu)

= 27/40

= 0.675

C 11

P (IPK C | Tidak Tepat Waktu)

= 11/40

= 0.275

D 1

P (IPK D | Tidak Tepat Waktu)

= 1/40

= 0.025

Tabel 10. Probabilitas Variabel Pekerjaan Orang Tua.

No Kelas Masa Studi

Sarjana Pekerjaan Orang Tua Jumlah Probabilitas

1 Tepat Waktu

Wiraswasta 6

P (Pekerjaan Orang Tua Wiraswasta | Tepat Waktu)

= 6/66

= 0.091

Buruh 7

P (Pekerjaan Orang Tua Buruh | Tepat Waktu)

= 7/66

= 0.106

Karyawan Swasta 2

P (Pekerjaan Orang Tua Karyawan Swasta | Tepat Waktu)

= 2/66

= 0.030 Pekerja Usaha

Menengah 3

P (Pekerjaan Orang Tua Pekerja Usaha Menengah | Tepat Waktu)

= 3/66

= 0.045

Petani 16

P (Pekerjaan Orang Tua Petani | Tepat Waktu)

= 16/66

= 0.242

Pns 3

P (Pekerjaan Orang Tua PNS | Tepat Waktu)

= 3/66

= 0.045 Pensiunan Pns/Tni 2

P (Pekerjaan Orang Tua Pensiunan PNS/TNI | Tepat Waktu)

= 2/66

= 0.030

(8)

Lanjutan Tabel 10.

No Kelas Masa Studi

Sarjana Pekerjaan Orang Tua Jumlah Probabilitas

2 Tidak Tepat Waktu

Wiraswasta 4

P (Pekerjaan Orang Tua Wiraswasta | Tepat Waktu)

= 4/57

= 0.070

Buruh 6

P (Pekerjaan Orang Tua Buruh | Tepat Waktu)

= 6/57

= 0.105

Karyawan Swasta 3

P (Pekerjaan Orang Tua Karyawan Swasta | Tepat Waktu)

= 3/57

= 0.053 Pekerja Usaha

Menengah 3

P (Pekerjaan Orang Tua Pekerja Usaha Menengah | Tepat Waktu)

= 3/57

= 0.053

Petani 12

P (Pekerjaan Orang Tua Petani | Tepat Waktu)

= 12/57

= 0.211

Pns 3

P (Pekerjaan Orang Tua PNS | Tepat Waktu)

= 3/57

= 0.053 Pensiunan Pns/Tni 1

P (Pekerjaan Orang Tua Pensiunan PNS/TNI | Tepat Waktu)

= 1/57

= 0.018

Tabel 11. Probabilitas Variabel Penghasilan Orang Tua.

No Kelas Masa Studi Sarjana

Penghasilan Orang

Tua Transformasi Jumlah Probabilitas

1 Tepat Waktu

1 6

P (Penghasilan Orang Tua 1 | Tepat Waktu)

= 6/52

= 0.115

2 3

P (Penghasilan Orang Tua 2 | Tepat Waktu)

= 3/52

= 0.058

3 23

P (Penghasilan Orang Tua 3 | Tepat Waktu)

= 23/52

= 0.442

4 5

P (Penghasilan Orang Tua 4 | Tepat Waktu)

= 5/52

= 0.096

5 10

P (Penghasilan Orang Tua 5 | Tepat Waktu)

= 10/52

= 0.192

6 4

P (Penghasilan Orang Tua 6 | Tepat Waktu)

= 4/52

= 0.077

7 1

P (Penghasilan Orang Tua 7 | Tepat Waktu)

= 1/52

= 0.019

(9)

Lanjutan Tabel 11.

No Kelas Masa Studi Sarjana

Penghasilan Orang

Tua Transformasi Jumlah Probabilitas

2 Tidak Tepat Waktu

1 4

P (Penghasilan Orang Tua 1 | Tidak Tepat Waktu)

= 4/43

= 0.093

2 5

P (Penghasilan Orang Tua 2 | Tidak Tepat Waktu)

= 5/43

= 0.116

3 18

P (Penghasilan Orang Tua 3 | Tidak Tepat Waktu)

= 18/43

= 0.419

4 11

P (Penghasilan Orang Tua 4 | Tidak Tepat Waktu)

= 11/43

= 0.256

5 2

P (Penghasilan Orang Tua 5 | Tidak Tepat Waktu)

= 2/43

= 0.047

6 1

P (Penghasilan Orang Tua 6 | Tidak Tepat Waktu)

= 1/43

= 0.023

7 2

P (Penghasilan Orang Tua 7 | Tidak Tepat Waktu)

= 2/43

= 0.047

c) Cari P(H|X) terhadap data testing, yang paling besar menjadi kesimpulan kelas masa studi sarjana.

Tabel 12. Data Testing Yang Diprediksi.

No NIM Jenis

Kelamin IPK S IV Pekerjaan Orang Tua

Penghasilan Orang Tua

1 1403112100 L C Pedagang Kaki Lima 2

Tabel 13. Data Testing Tepat Waktu.

Kelas Masa Studi Sarjana Tepat Waktu Probabilitas

P (Tepat Waktu) 0.556

P (JK | L) 0.404

P (IPK | C) 0.020

P (Pekerjaan Orang Tua | Pedagang Kaki Lima) 0.030

P (Penghasilan Orang Tua | 2) 0.058

P (Masa Studi Sarjana = Tepat Waktu | X) = P (JK = L | Masa Studi Sarjana = Tepat Waktu) x P (IPK = C | Masa Studi Sarjana = Tepat Waktu) x P (Pekerjaan Orang Tua = Pedagang Kaki Lima | Masa Studi Sarrjana = Tepat Waktu) x P (Penghasilan Orang Tua

= 2 | Masa Studi Sarjana = Tepat Waktu).

= 0.556 x 0.404 x 0.020 x 0.030 x 0.058.

= 0.00001.

(10)

Tabel 14. Data Testing Tidak Tepat Waktu.

Kelas Masa Studi Sarjana Tepat Waktu Probabilitas

P (Tidak Tepat Waktu) 0.444

P (JK | L) 0.263

P (IPK | C) 0.275

P (Pekerjaan Orang Tua | Pedagang Kaki Lima) 0.018

P (Penghasilan Orang Tua | 2) 0.116

P (Masa Studi Sarjana = Tidak Tepat Waktu | X) = P (JK = L | Masa Studi Sarjana = Tidak Tepat Waktu) x P (IPK = C | Masa Studi Sarjana = Tidak Tepat Waktu) x P (Pekerjaan Orang Tua = Pedagang Kaki Lima | Masa Studi Sarjana = Tidak Tepat Waktu) x P (Penghasilan Orang Tua = 2 | Masa Studi Sarjana = Tidak Tepat Waktu).

= 0.444 x 0.263 x 0.275 x 0.018 x 0.116.

= 0.00007.

Tabel 15. Hasil Data Testing.

Kelas Masa Studi Sarjana Probabilitas

Tepat Waktu 0.00001

Tidak Tepat Waktu 0.00007

Nilai Terbesar 0.00007

Berdasarkan tabel diatas dapat disimpulkan bahwa nilai probabilitas akhir terbesar ada di kelas masa studi sarjana Tidak Tepat Waktu, maka hasil dari prediksi data testing tersebut masuk kedalam klasifikasi Masa Studi Sarjana “Tidak Tepat Waktu”.

6. Evaluasi Pola

Melakukan evaluasi penghitungan akurasi metode menggunakan confusion matrix.

Pembagian dataset dalam penelitian ini adalah 81 data training dan 28 data testing maka diperoleh hasil seperti tabel 16.

Tabel 16. Tabel Confusion Matrix.

Kelas Sebenarnya Kelas Prediksi Metode

Tepat Waktu Negatif

Tepat Waktu 13 (TP) 4 (FN)

Tidak Tepat Waktu 2 (FP) 9 (TN)

= 78,57%.

= 21,43%.

= 76,47%.

= 81,82%.

(( ( (( (

= 50,79%.

(((

= 56,97%.

7. Presentasi Pengetahuan

Memperlihatkan data hasil prediksi berdasarkan target yang ingin dicapai yaitu prediksi tentang informasi masa studi sarjana mahasiswa. Dapat dilihat pada tabel 17.

(11)

Tabel 17. Kelas Masa Studi Data Testing.

No NIM Klasifikasi Masa Studi

1 1403112100 Tidak Tepat Waktu

2 1403110201 Tidak Tepat Waktu

3 1403110684 Tepat Waktu

4 1403110717 Tidak Tepat Waktu

5 1403112226 Tepat Waktu

6 1403112468 Tidak Tepat Waktu

7 1403113314 Tepat Waktu

8 1403113527 Tepat Waktu

9 1403113580 Tepat Waktu

10 1403113892 Tepat Waktu

b. Tahapan Pembuatan Sistem

Setelah dilakukan tahapan Data Mining sesuai dengan tahapan-tahapan diatas, maka akan dilakukan tahapan dalam pembuatan sistem.

1. Requirment

Tahap pertama dalam pembuatan sistem adalah mempersiapkan dan menganalisa kebutuhan dari software yang akan dikerjakan.

Adapun kebutuhan yang diperlukan dalam perancangan sistem ini antara lain:

a) Dibutuhkan data yang akan diprediksi yaitu data-data mahasiswa Program Studi S1 Matematika dari angkatan 2012 dan 2013 yang sudah lulus serta mahasiswa angkatan 2014 yang telah lulus.

b) Sistem yang akan dibangun berbasis web menggunakan bahasa pemrograman PHP dan database MySQL.

Input dari sistem yang akan dibangun berupa data-data mahasiswa Program Studi S1 Mamatika dari angkatan 2012 dan 2013 yang sudah lulus serta mahasiswa angkatan 2014 yang telah lulus sesuai dengan variabel yang digunakan pada penelitian.

2. Design

Desain sistem merupakan tahapan penggambaran dan perencanaan bagaimana sistem akan dibentuk dan persiapan untuk rancang bangun implementasi. Adapun diagram yang digunakan terdiri dari use case diagram dan activity diagram. Berikut usecase diagram dapat dilihat pada Gambar 3 berikut:

Gambar 3. Use Case Diagram.

(12)

3. Implementation

Pada tahap ini merupakan proses pembuatan sistem yang mengacu dari hasil analisa dan perancangan sistem, perhitungan menggunakan metode Naive Bayes akan diimplementasikan dalam sistem, untuk pembuatan sistem menggunakan bahasa pemrograman PHP dan HTML. Adapun tampilan yang dibuat seperti di bawah ini:

1) Halaman mahasiswa.

Pada halaman mahasiswa berisi data-data mengenai informasi mahasiswa secara keseluruhan seperti pada gambar dibawah:

Gambar 4. Tampilan halaman mahasiswa.

2) Halaman proses.

Pada halaman ini dilakukan proses pembobotan variabel-variabel dan kelas yang ada sesuai dengan data training. Setelah didapatkan hasil pembobotan dari masing- masing variabel dan kelas, lalu dilakukan prediksi terhadap data testing. Dapat dilihat pada gambar 5 dan gambar 6 berikut:

Gambar 5. Tampilan halaman proses pembobotan.

(13)

3) Tampilan halaman prediksi.

Pada halaman ini menampilkan prediksi dicari berdasarkan NIM dan mencari prediksi mahasiswa dengan cara mengisi sesuai dengan variabel. Dapat dilihat pada gambar 7 dan gambar 8 berikut ini:

Gambar 7. Tampilan prediksi cari NIM.

Gambar 8. Tampilan prediksi mahasiswa.

4) Tampilan halaman akurasi.

Pada halaman akurasi ini menampilkan hasil akurasi dari data testing yang digunakan apakah hasil kelas prediksi masa studi sarjana manual sesuai atau tidak dengan hasil kelas prediksi masa studi sarjana pada sistem dapat dilihat pada gambar 9 berikut:

Gambar 9. Tampilan halaman priority alternatif.

4. Testing

Pada tahapan ini dilakukan pengujian menggunakan metode black box testing sehingga dapat menunjukkan apakah sistem yang telah dibuat dapat berjalan sesuai dengan yang diharapkan atau tidak. Berdasarkan hasil pengujian menggunakan metode black box testing, dapat disimpulkan bahwa setiap fitur pada sistem berjalan sesuai dengan yang diharapkan sebagaimana mestinya.

(14)

KESIMPULAN

Berdasarkan penelitian yang dilakukan oleh penulis dengan mengamati dan menganalisa sistem pengolahan data yang digunakan serta didukung teori dan alat yang berkaitan dengan penelitian, maka dapat diambil kesimpulan sebagai berikut:

1. Prediksi masa studi sarjana melalui beberapa tahapan yang harus dilakukan dalam pembuatan sistem antara lain, requirment, design, implementation dan testing.

2. Prediksi masa studi sarjana dengan menggunakan metode naive bayes melalui tahapan-tahapan penting antara lain adalah pengumpulan data, pembersihan data, integrasi data, seleksi data, transformasi data dan tahapan naive bayes.

3. Berdasarkan hasil dari tahap implementation, dapat disimpulkan bahwa sistem berjalan dengan baik sebagaimana mestinya.

4. Prediksi masa studi sarjana menggunakan metode Naive Bayes dapat menghasilkan hasil prediksi yang cukup akurat.

SARAN

Berdasarkan kesimpulan diatas, maka penulis merekomendasikan beberapa hal berupa saran-saran sebagai berikut:

1. Prediksi ini dapat dilakukan dengan menggunakan variabel-variabel lainnya yang mempengaruhi masa studi sarjana misalnya jalur masuk perguruan tinggi.

2. Data yang digunakan pada prediksi sebaiknya lebih diperbanyak agar hasil prediksi pada sistem semakin akurat.

3. Prediksi ini juga dapat dilakukan menggunakan metode lainnya seperti metode C.45, Artificial Neural Network (ANN), dan metode lainnya sehingga dapat membandingkan metode mana yang memiliki hasil lebih baik.

4. Mencoba mengkombinasikan metode ini dengan metode lainnya untuk mendapatkan hasil yang lebih optimal.

UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada Bapak Joko Risanto, S.Kom., M.Kom.

yang telah membimbing, memotivasi serta membantu penelitian dan penulisan karya ilmiah ini.

DAFTAR PUSTAKA

Amelia, M. W., Lumenta, A. S., & Jacobus, A. (2017). Prediksi Masa Studi Mahasiswa Dengan Menggunakan Algoritma Naive Bayes. E-Journal Teknik Informatika, 11(1), 1-7.

Jananto, A. (2013). Algoritma Naive Bayes Untuk Mencari Perkiraan Waktu Studi Mahasiswa. Jurnal Teknologi Informasi DINAMIK, 18(1), 9-16.

Orpa, E. P., Ripanti, E. F., & Tursina. (2019). Model Prediksi Awal Masa Studi Mahasiswa Menggunakan Algoritma Decision Tree C4.5. Sistem dan Teknologi Informasi, 7(4), 272-278.

Saleh, A. (2015). Implementasi Metode Klasifikasi Naive Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga. Citec Journal, 2(3), 207-217.

Referensi

Dokumen terkait

Pada gambar 5 diatas, terlihat hasil prediksi naïve bayes ini sudah bisa menampilkan hasiil prediksi dari sebuah dataset yang ingin diuji, caranya hanya dengan

Based on the comparison of simple additive weighting on Data 1 and Data 2, determination single tuition class of student using Data 2 recorded in Table 13 is better than using Data 1