• Tidak ada hasil yang ditemukan

KLASIFIKASI KETEPATAN WAKTU PEMBAYARAN SPP DI PONDOK PESANTREN AL-ARIFAH MENGGUNAKAN ALGORITMA NAIVE BAYES

N/A
N/A
Protected

Academic year: 2021

Membagikan "KLASIFIKASI KETEPATAN WAKTU PEMBAYARAN SPP DI PONDOK PESANTREN AL-ARIFAH MENGGUNAKAN ALGORITMA NAIVE BAYES"

Copied!
8
0
0

Teks penuh

(1)

Vol. XX, No. XX, Bulan 20XX, pp. xx-xx

KLASIFIKASI KETEPATAN WAKTU PEMBAYARAN SPP

DI PONDOK PESANTREN AL-ARIFAH MENGGUNAKAN ALGORITMA NAIVE

BAYES

Agus Bahtiar

1

, Mulyawan

2

, Suryani

3

, Dindin Firmansyah

4

Intisari— Pondok pesantren Al – Arifah salah satu

pondok yang bertempat di pesantren tertua di Indonesia yaitu Buntet Pesantren Cirebon. Pesantren memegang peran penting dalam pendidikan agama. Namun, banyak pesantren – pesantren yang dalam pembiayaan operasional tidak ditanggung oleh negara melainkan oleh pihak pesantren sendiri. Sehingga banyak permasalahan terkait pembayaran operasional pondok seperti halnya pembayaran SPP. Pembayaran SPP menjadi masalah penting di pondok pesantren Al – Arifah karena banyak dari para santri atau orang yang belajar di pesantren terlambat membayar SPP meskipun sudah ditetapkan batas waktu pembayaran. Oleh karena itu, perlu adanya evaluasi yang dilakukan dalam pembayaran SPP. Untuk mengatasi permasalahan tersebut perlu dilakukan pendeteksian faktor – faktor yang menjadi penyebab terjadinya keterlambatan pembayaran SPP dengan menggunakan data mining. Teknik data mining yang digunakan adalah klasifikasi dengan metode algoritma Naive Bayes. Berdasarkan hasil pengujian akurasi 45 data training dan 22 data testing dari model yang dihasilkan diperoleh tingkat accuracy sebesar 63,64%.

Kata Kunci— Data Mining, Classification, SPP Payment, Naive Bayes Algorithm

Abstract— Al-Arifah Islamic boarding school is one of the oldest Islamic boarding schools in Indonesia, the Islamic Boarding School Buntet Cirebon. Islamic boarding school play an important role in religious education. However, there are many islamic boarding school which are not covered by the state in operational funding but by the islamic boarding school itself. So there are many problems related to operational payments such as the payment of the cottage school fees. SPP payment is an important problem at Al - Arifah Islamic boarding school because many of the students or people who study at the islamic boarding school are late paying the tuition fees even though the payment deadline has been set. Therefore, there needs to be an evaluation carried out in SPP payments. To overcome these problems, it is necessary to detect factors that are causing the late payment of SPP by using data mining. The data mining technique used is the classification by the Naive Bayes algorithm method. Based on the results of testing 45 data training accuracy and 22 data testing of the resulting model obtained an accuracy level of 63.64%.

Keywords— Data Mining, Classification, SPP Payment, Naive Bayes Algorithm

I. PENDAHULUAN

A. Latar Belakang

Pesantren Buntet adalah salah satu lembaga pendidikan swasta dari Yayasan Lembaga Pendidikan Islam yang berfokus pada pendidikan ilmu pengetahuan Agama Islam. Pesantren buntet terbagi atas beberapa pondok yang salah

satunya adalah Pondok Al – Arifah. Pondok Al – Arifah dalam pembiayaan operasional pendidikan pondok sebagian besar dibebankan pada santri atau sebutan orang yang belajar agama dipesantren. Biaya pendidikan adalah salah satu masukan pendukung bagi penyelenggaraan pendidikan. Biaya ini berperan sangat penting bagi tercapainya pendidikan yang baik dari pesantren maupun dari sekolah dan universitas. Dalam hal ini salah satu biaya pendidikan yang terdapat pada pondok Al - Arifah yaitu biaya persantri yang wajib dibayarkan dalam setiap bulan atau yang lebih dikenal dengan Sumbangan Pembinaan Pendidikan (SPP). Biaya SPP ini umumnya diterapkan oleh instansi/sekolah swasta yang dibebankan pada setiap siswa. Karenasekolah swasta dalam pengelolaan pendidikan dibebankan kepada masyarakat atau kebijakan lokal. Berbeda dengan sekolah Negeri yang biaya umumnya ditanggung oleh pemerintah[1]. Sehingga dalam hal ini pihak pondok membebankan biaya SPP kepada wali santri. untuk setiap bulannya. Yang mana bertujuan untuk kelangsungan pendidikan dipondok Al – Arifah.

Dalam hal ini masalah yang muncul terkait pembayaran SPP yaitu apabila para santri terlambat membayarkan SPP dari waktu yang telah ditentukan. Hal ini menjadi masalah karena pembayaran SPP adalah salah satu faktor penting untuk memberikan kualitas pelayanan yang baik bagi pihak pondok. Mengutip data dari hasil wawancara pengasuh pondok, bahwa santri yang terlambat membayar SPP pada tahun ajaran 2018/2019 sekitar 60% dari total seluruh santri yang jumlah 98 santri. Umumnya, faktor yang menjadi penyebab dari permasalah diatas yaitu faktor ekonomi pendapatan orang tua atau wali santri, dan juga faktor kebiasaan santri yang melambatkan pembayaran meskipun sudah diberikan uang oleh orang tuanya, bahkan sering sekali santri menggunakan uang yang seharusnya untuk membayar pondok, digunakan untuk biaya pribadi mereka. Hal tersebut menjadi masalah yang sulit karena banyaknya santri yang terlambat membayar SPP, sehingga menyebabkan pemasukan dana bagi pondok akan berkurang. Sedangkan biaya tersebut sangat dibutuhkan untuk kelangsungan pendidikan pondok seperti halnya membayar gaji ustadz atau ustadzah dan membayar kebutuhan pokok untuk memberi makan para santri setiap harinya. Maka perlu adanya solusi terhadap permasalahan tersebut dengan cara mengklasifikasikan pembayaran beradasarkan dengan tingkat ketepatan waktu pembayaran. Sehingga dapat menjadi bahan evaluasi pihak pondok untuk meningkatkan pembayaran SPP tepat pada waktu yang ditentukan.

Tujuan dari penelitian ini adalah mengklasifikasikan pembayaran SPP berdasarkan ketepatan waktu pembayaran dengan menggunakan algoritma Naive Bayes. Algoritma Naive Bayes adalah salah satu Top 10 Algorithms in Data Mining yang telah dipublikasikan pada bulan desember 2006 oleh IEEE Internasional Conference on Data Mining[1].

(2)

Penelitian sejenis juga dilakukan oleh Luthfi, terkait dengan penerapan metode Naive Bayes pada permasalahan keterlambatan pembayaran sumbangan pendidikan di SMK Al – Islam Surakarta. Penelitian tersebut menjelaskan pembangunan suatu sistem prediksi dengan menggunakan metode Naive Bayes. Sistem prediksi tersebut dibuat untuk mengatasi permasalahan keterlambatan pembayaran sumbangan pendidikan. Sehingga pihak sekolah dapat memperkirakan siswa – siswi yang akan membayar tepat waktu atau terlambat[1].

Metode Naive Bayes juga dapat diimplementasikan untuk mengevaluasi kinerja akademik pada STMIK Dipanegara Makasar, terkait dengan permasalahan keterlambatan kelulusan. Pada penelitian tersebut mengambil data dua tahun pertama untuk digunakan sebagai tabel probabilitas sebagai dasar rekomendasi untuk proses kelulusan yang tepat waktu dengan nilai yang optimal berdasaran riwayat nilai yang telah ditempuh mahasiswa. Hasil yang diperoleh dari penerapan metode Naive Bayes menunjukkan bahwa faktor yang paling mempengaruhi keterlambatan kelulusan mahasiswa adalah Indeks Prestasi (IP) pada semester 1, 2, 3, 4, dan jenis kelamin. Sehingga faktor tersebut dapat menjadi bahan evaluasi pihak akademik mahasiswa[2].

Penelitian ini juga mengacu pada penelitian terkait dengan keterlambatan pembayaran angsuran pada koperasi simpan pinjam

.

Penelitian tersebut menjelaskan tentang kendala yang sering terjadi pada koperasi terkait pembayaran angsuran, sehingga menyebabkan ter jadinya kredit macet. Berdasarkan permasalahan tersebut pihak koperasi mencari sebuah solusi untuk meminimalisir kredit macet dengan pendeteksian kriteria – kriteria nasabah yang akan meminjam dengan menggunakan metode Naive Bayes. Sehingga pihak koperasi dapat menentukan layak atau tidaknya nasabah untuk melakukan peminjaman[3]

Dengan demikian, dirasakan perlu untuk melakukan suatu pengujian untuk mengklasifikasikan ketepanan waktu pembayaran spp di pondok pesantren Al Arifah dengan menggunakan Rapidminer dan algoritma Naïve Bayes.

B. Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan diatas, maka rumusan masalahnya adalah :

1) Apakah algoritma Naive Bayes dapat digunakan untuk mengklasifikasi data pembayaran SPP terkait dengan permasalahan keterlambatan pembayaran SPP?

2) Berapa tingkat akurasi yang dihasilkan dari penerapan algoritma Naive Bayes?

3) Faktor apa yang menjadi penyebab terjadinya keterlambatan pembayaran SPP?

C. Batasan Masalah

Penelitian ini lebih fokus pada masalah sebagai berikut :

1) Pada penelitian ini hanya menjelaskan tentang

klasifikasi dan pembayaran spp

2) Penelitian ini dilakukan pada pondok pesantren

Al-Arifah Buntet Cirebon.

3) Metode yang digunakan pada penelitian ini Algoritma

Naive Bayes Classifier

D. Tujuan Penelitian

Tujuan dari penelitian ini adalah :

1) Untuk mengklasifikasi data pembayaran SPP di pondok pesantren Al - Arifah dilihat dari aspek tingkat ketepatan waktu membayar dengan algoritma tertentu.

2) Untuk menghasilkan model dan tingkat akurasi dari penerapan algoritma terhadap data pembayaran spp. 3) Untuk menjadikan bahan evaluasi pihak pondok

terkait pembayaran SPP di pondok pesantren Al – Arifah.

II. LANDASAN TEORI

A. Literatur Review

Pada penelitian yang dilakukan oleh Muqorobin, menguraikan bahwa tujuan dari penelitian ini adalah menerapkan metode Naive Bayes dengan metode Information Gain untuk keterlambatan waktu pembayaran sekolah. Penelitian ini dilakukan untuk memprediksi keterlambatan pembayaran sekolah berdasarkan informasi data penghasilan orang tua, pendidikan orang tua, usia, dan juga tanggungan orang tua. Prediksi ini diharapkan dapat menjadi solusi untuk mengoptimalkan keterlambatan pembayaran sekolah. Penelitian ini menganalisis data keterlambatan pembayaran dengan memprediksi tingkat keterlambatan pembayaran menggunakan algoritma Naive Bayes dan juga Information Gain dengan hasil tingkat akurasi 80% dengan hanya menggunakan algoritma Naive Bayes saja dan 90% dengan metode Information Gain[1].

Berdasarkan penelitian yang bertujuan untuk mengevaluasi kinerja akademik pada kampus STMIK Dipanegara Makassar pada dua tahun pertama dengan menggunakan teknik data mining algoritma Naive Bayes Classifier (NBC). Dalam penelitian tersebut menganalisis tingkat ketepatan waktu kelulusan berdasarkan nilai yang telah ditempuh mahasiswa. Sample data yang digunakan untuk data training dan data testing adalah nilai mahasiswa angkatan 2008 – 2011 yang sudah dinyatakan lulus, sedangkan untuk data targetnya menggunakan data nilai mahasiswa angkatan 2013 – 2014 yang belum lulus. Hasil yang diperoleh dari penelitian tersebut menunjukkan faktor yang paling mempengaruhi kelulusan mahasiswa adalah Indeks Prestasi (IP) pada semester 1,2,3,4 dan juga faktor jenis kelamin dengan nilai akurasi 92,3%, sehingga faktor tersebut dapat menjadi solusi bagi akademik untuk mengevaluasi sistem akademik yang sudah berjalan[2].

Penelitian yang bertujuan untuk memprediksi kredit macet pada koperasi simpan pinjam pada tahun 2018. Penelitian tersebut mengacu pada permasalahan kendala pembayaran angsuran pinjaman sehingga menyebabkan terjadinya kredit macet. Koperasi adalah salah satu wadah yang menjadi peranan penting dalam membantu masyarakat kecil dan menengah. Sehingga permasalahan kredit macet menjadi kendala yang serius bagi kelangsungan koperasi. Oleh karena itu, penelitian tersebut memberikan solusi untuk meminimalisir permasalahan yang terjadi dengan memprediksikan kredit macet berdasarkan kriteria – kriteria nasabah yang layak untuk mengajukan pinjaman seperti pekerjaan, status tempat tinggal, pendapat perbulan, permohonan pinjaman dan cicilan perbulan. Teknik data mining yang digunakan adalah klasifikasi dengan metode algoritma naive bayes. Berdasarkan pengujian akurasi dari model yang dihasilkan diperoleh tingkat akurasi sebesar 56%,

(3)

sensitivity (True Positive Rate (TP Rate) or Recall) sebesar 46,80%, specificity (False Negative Rate (FN Rate or Precision) sebesar 69,81%, Positive Predictive Value (PPV) sebesar 57,89%, dan Negative Predictive Value (NPV) sebesar 59,67%. Hasil tersebut berkaitan dengan kriteria pekerjaan, status tempat tinggal, pendapatan perbulan, permohonan pinjaman dan cicilan perbulan[3].

Pada penelitian yang dilakukan oleh Muqorobin menguraikan bahwa tujuan dari penelitian ini adalah menerapkan metode Naive Bayes dengan metode Information Gain untuk keterlambatan waktu pembayaran sekolah. Penelitian ini dilakukan untuk memprediksi keterlambatan pembayaran sekolah berdasarkan informasi data penghasilan orang tua, pendidikan orang tua, usia, dan juga tanggungan orang tua. Prediksi ini diharapkan dapat menjadi solusi untuk mengoptimalkan keterlambatan pembayaran sekolah. Penelitian ini menganalisis data keterlambatan pembayaran dengan memprediksi tingkat keterlambatan pembayaran menggunakan algoritma Naive Bayes dan juga Information Gain dengan hasil tingkat akurasi 80% dengan hanya menggunakan algoritma Naive Bayes saja dan 90% dengan metode Information Gain[1]. Berdasarkan penelitian yang bertujuan untuk mengevaluasi kinerja akademik pada kampus STMIK Dipanegara Makassar pada dua tahun pertama dengan menggunakan teknik data mining algoritma Naive Bayes Classifier (NBC). Dalam penelitian tersebut menganalisis tingkat ketepatan waktu kelulusan berdasarkan nilai yang telah ditempuh mahasiswa. Sample data yang digunakan untuk data training dan data testing adalah nilai mahasiswa angkatan 2008 – 2011 yang sudah dinyatakan lulus, sedangkan untuk data targetnya menggunakan data nilai mahasiswa angkatan 2013 – 2014 yang belum lulus. Hasil yang diperoleh dari penelitian tersebut menunjukkan faktor yang paling mempengaruhi kelulusan mahasiswa adalah Indeks Prestasi (IP) pada semester 1,2,3,4 dan juga faktor jenis kelamin dengan nilai akurasi 92,3%, sehingga faktor tersebut dapat menjadi solusi bagi akademik untuk mengevaluasi sistem akademik yang sudah berjalan[2].

Penelitian yang bertujuan untuk memprediksi kredit macet pada koperasi simpan pinjam pada tahun 2018. Penelitian tersebut mengacu pada permasalahan kendala pembayaran angsuran pinjaman sehingga menyebabkan terjadinya kredit macet. Koperasi adalah salah satu wadah yang menjadi peranan penting dalam membantu masyarakat kecil dan menengah. Sehingga permasalahan kredit macet menjadi kendala yang serius bagi kelangsungan koperasi. Oleh karena itu, penelitian tersebut memberikan solusi untuk meminimalisir permasalahan yang terjadi dengan memprediksikan kredit macet berdasarkan kriteria – kriteria nasabah yang layak untuk mengajukan pinjaman seperti pekerjaan, status tempat tinggal, pendapat perbulan, permohonan pinjaman dan cicilan perbulan. Teknik data mining yang digunakan adalah klasifikasi dengan metode algoritma naive bayes. Berdasarkan pengujian akurasi dari model yang dihasilkan diperoleh tingkat akurasi sebesar 56%, sensitivity (True Positive Rate (TP Rate) or Recall) sebesar 46,80%, specificity (False Negative Rate (FN Rate or Precision) sebesar 69,81%, Positive Predictive Value (PPV) sebesar 57,89%, dan Negative Predictive Value (NPV) sebesar 59,67%. Hasil tersebut berkaitan dengan kriteria

pekerjaan, status tempat tinggal, pendapatan perbulan, permohonan pinjaman dan cicilan perbulan[3]

B. Landasan Teori 1). Data Mining

Data mining adalah suatu proses komputasi untuk menemukan pola dalam kumpulan data yang besar. Gambaran proses data mining sebagai pengetahuan penemuan didatabase diantaranya: penggunaan algoritma, alat statistik, dan pembelajaran mesin untuk mengekstarak

pola yang sebelumnya tidak

diketahui. Data mining mendukung proses

analisis data dengan mengidentifikasi cluster,

mendeteksi anomali, menemukan dependensi,

dan menemukan korelasi[3].

2). Klasifikasi

Klasifikasi juga merupakan salah satu dari metode atau teknik data mining[2]. Definisi Klasifikasi adalah suatu pekerjaan menilai objek data yang bertujuan untuk dimasukan pada kelas tertentu dari sejumlah kelas yang tersedia. Didalam klasifikasi terdapat dua pekerjaan utama, yaitu pembangunan model sebagai prototipe untuk disimpan sebagai memori dan penggunaan model tersebut digunakan untuk pengenalan/klasifikasi/prediksi pada suatu objek data lain agar diketahui pada kelas mana objek data tersebut disimpan pada model yang telah dibangun[5]

Dalam metode klasifikasi terdapat beberapa fase penyelesaian yaitu dimulai dari Training data dan diakhiri dengan proses Testing data sehingga dihasilkan sebuah keputusan yang akurat. Berikut adalah gambar alur pemecahan metode Klasifikasi[6].

3) Pembayaran spp

Pembayaran SPP adalah pembayaran bulanan atau juga bisa diartikan pembayaran biaya operasional instansi/pendidikan yang harus dibayarkan perbulan[8]. SPP dapat diartikan sumbangan pembinaan pendidikan yang bayarkan oleh siswa di sekolah-sekolah[9]. Tujuan dari SPP tersebut adalah agar instansi/pendidikan dapat membiayai operasional pendidikan dan juga membiayai fasilitas pendidikan sehingga instansi/sekolah dapat menjalankan kegiatan belajar yang lebih baik[9]

4). Algoritma Naïve Bayaes

Algoritma adalah teknik penyusunan tahapan untuk menyelesaikan masalah dalam bentuk kalimat dengan jumlah kata yang terbatas, tersusun secara logis dan sistematis[10]. Algoritma juga sering didefinisakan sebagai suatu prosedur untuk menyelesaikan persoalan dengan menggunakan langkah – langkah tertentu dan terbatas jumlahnya[2]

Dalam algoritma ini menggunakan teorema Bayes dan mengasumsikan semua atribut indepeden atau tidak

(4)

saling ketergantungan yang diberikan nilai oleh variabel kelas[11]. Dasar teorema Naive Bayes adalah sebagai berikut[12].

𝑃(𝐻|𝑋) =𝑃(𝑋|𝐻).𝑃(𝐻)

𝑃(𝑋) (1) Dimana :

X = Data dengan class yang belum diketahui H = Hipotesis Data X merupakan suatu class spesifik

P(H|X) = Probabilitas hipotesis H berdasarkan

kondisi X (posteriori probabilitas)

P(H) = Probabilitas hipotesis H (prior probabilitas)

P(X|H) = Probabilitas X berdasarkan kondisi

tersebut

P(X) = Probabilitas dari X

Berdasarkan uraian diatas, dapat dijelaskan bahwa P(H|X) merupakan probabilitas dari H yang didalam X atau dalam bahasa lain bahwa P(H|X) merupakan persentase dengan banyaknya H didalam X, P(X|H) merupakan probabilitas X didalam H, P(H) merupakan probabilitas prior dari H dan P(X) merupakan probabilitas prior dari X. Dan adapun untuk klasifikasi data continue menggunakan rumus Densitas Gauss[5]:

𝑃(𝐹𝑖= 𝑓𝑖 | 𝐶 = 𝑐𝑗) = 1 √2𝜋𝑠𝑗 𝑒 (𝑓𝑖 − 𝑥̅𝑗)2 2𝑠 𝑗2 (2) Dimana : P = Peluang 𝐹𝑖 = Atribut ke - 𝑖 𝑓𝑖 = Nilai Atribut ke - 𝑖 C = Kelas yang dicari

𝑐𝑗 = Sub kelas yang dicari

𝑥̅𝑗 = Rata – rata (Mean) hitung dari suatu atribut pada kelas ke -𝑗

𝑠 𝑗2 = Variansi dari suatu atribut pada kelas ke -𝑗

𝑠𝑗 = Deviasi standar dari suatu atribut pada kelas ke -𝑗 Adapun pengujian akurasi yang digunakan pada Algoritma Naive Bayes umumnya menggunakan metode Confusion Matrix dengan rumus sebagai berikut[13].

Tabel 2.2 Rumus Confusion Matrix

Correct Classification Classified as + - + True Positive (TP) False Negative (FN) - False Postive (FP) True Negative (TN) Berikut adalah penjelasan dari tabel rumus confusion matrix:

1. Precision digunakan untuk mengukur seberapa besar proporsi

dari kelas positif yang berhasil diprediksi dengan benar dari keseluruhan kelas postive, yang dihitung menggunakan rumus :

Precision = 𝑇𝑃

𝑇𝑃+𝐹𝑃 (3)

2. Recall digunakan untuk menunjukkan presentase kelas data

positif yang berhasil diprediksi benar dari seluruh data kelas positif, yang dihitung menggunakan rumus:

Recall = 𝑇𝑃

𝑇𝑃+𝐹𝑁 (4)

4. Accuracy adalah jumlah perbandingan data yang benar

dengan jumlah keseluruhan data. Dapat dihitung dengan menggunakan rumus:

Accuracy = 𝑇𝑃+𝑇𝑁

𝑇𝑃+𝑇𝑁+𝐹𝑁+𝐹𝑃∗ 100% (5)

5. Rapidminer

RapidMiner adalah perangkat lunak yang digunakan untuk knowledge discovery yang memiliki kurang lebih 400 operator data mining, termasuk operator input, operator output, data preprocessing dan visualisasi[3]. Definisi lain dari RapidMiner adalah software pengolah data dengan menggunakan prinsip data mining. RapidMiner mengekstrak pola – pola dari data set yang besar dengan mengkombinasikan metode statistik, kecerdasan buatan dan database[14]. RapidMiner juga dapat didefinisikan sebagai tools yang digunakan dalam teknik yang berada pada lingkungan machine learning, data mining, text mining, dan predictive analytics[15]

Kelebihan RapidMiner dalam pengolahan data mining adalah sangat mudah digunakan untuk melakukan perhitungan data yang sangat banyak dengan menggunakan operator – operator[14]. Operator ini berfungsi untuk memodifikasi data, yang mana data tersebut disambungkan dengan node – node pada operator, kemudian pengguna hanya tinggal menghubungkan ke node untuk melihat hasilnya. Hasil yang ditampilkan RapidMiner secara visual dengan grafik. Dengan kelebihan tersebut, menjadikan RapidMiner sebagai software pilihan untuk melakukan ekstraksi data dengan metode – metode data mining[14].

III. METODE PENELITIAN

A. Alur Penelitian

Alur penelitian yang digunakan pada penelitian ini akan dijelaskan pada gambar berikut :

Gambar 3.1 Alur penelitian

Berdasarkan gambar diatas dapat dijelaskan alur penelitian sebagai berikut :

(5)

1. Identifikasi masalah, menentukan latar belakang masalah, parameter dan solusi permasalahan.

2.

Pengumpulan Data, mengumpulkan dengan menggunakan cara observasi, wawancara dan studi pustaka. Sehingga menghasilkan data pembayaran SPP yang diberikan oleh pihak pondok baik data primer maupun data sekunder dan juga literatur – literatur yang menyangkut pembahasan pada penelitian ini

.

Tabel 3.1 Data Primer pembayaran SPP

No. Nama Lengkap Jenis Kelamin TTL Alamat Ket. Pembayaran 1 Abidzar Al-Ghiffari A L 04- Okt-05 Kab. Tegal TEPAT 2 Abdul Rohim L 25- Sep-05 Kab. Kuningan TEPAT 3 Adha Maulana L 20-Jan-05 Kab. Indramayu TERLAMBAT 4 Afri Yusuf L 14- Nov-02 Kab. Indramayu TEPAT 5 Akbar Ibrahim L 24- Agu-06 Kab. Karawang TERLAMBAT 6 Akila Najwa P 22- Mei-04 Kab. Cirebon TEPAT 7 Amanda Alya T P 31-Jul-05 Kab. Majalengka TEPAT 8 Anisa Dwi Hartini P 31-Jan-06 Kab. Karawang TEPAT 9 Bayu 'Abdul Haqiqi L 07- Agu-01 Kab. Lebak TEPAT 10 Dika Dwi Febriana L 02- Feb-02 Kab. Indramayu TERLAMBAT …. …. … … … …. … … … ….. 51 Yosi Rahmandani P 07- Okt-06 Kab. Tegal TEPAT 52 Zahwa Gizelia R P 08- Okt-05 Kab. Purwakarta TERLAMBAT

Sumber data : pengasuh Pondok Tabel 2.2 Data sekunder pembayaran SPP

No. Nama Nama Orang Tua

Pekerjaan Ortu Pendapatan Perbulan Ayah Ibu 1 Abidzar Al-Ghiffari A Ulul Absor Neli

Rahmawati Wirausaha Gaji<5Jt 2

Abdul

Rohim Ade Juhri Carsih Wiraswasta Gaji<1Jt 3

Adha Maulana

Yudi

Yanto Yati Wiraswasta Gaji<5Jt 4 Afri Yusuf Rustayim Salamah Wirausaha Gaji<1Jt 5

Akbar

Ibrahim Gustomi eha julaiha Wirausaha Gaji<5Jt 6

Akila

Najwa Carlam Masfuhah Wirausaha Gaji<5Jt 7

Amanda

Alya T Jumena Diani Wiraswasta Gaji<5Jt 8

Anisa Dwi Hartini

Deden

Yuhendi Imas K. Wiraswasta Gaji<5Jt 9 Bayu 'Abdul Haqiqi Ayi Gufron Sini Nasiah PNS Gaji<5Jt 10 Dika Dwi

Febriana Carino Sumiyati Wirausaha Gaji<5Jt

…. …. ….

…..

51 Yosi

Rahmandani Anwari Rasiyem Wiraswasta Gaji<1Jt 52 Zahwa Gizelia R Taufik Nugraha Tri Putri

Martini Wiraswasta Gaji<5Jt

Sumber data : pihak pengurus pondok

3. Seleksi Data (Selection), menseleksi data yang sudah terkumpul untuk digunakan sebagai proses data mining yang dipisahkan dari data operasional atau dataset.

4. Pemilihan Data (Preprocessing/Cleaning), membuang data yang sudah tidak terpakai dan juga pada tahap ini meliputi pemeriksaan data dan memperbaiki data jika terjadi kesalahan, seperti halnya kesalahan penulisan atau cetak (typografi).

Tabel 2.3 Hasil processing data

No. Nama Lengkap Jenis Kelamin Pekerjaan Ortu Pendapatan perbulan Ket. Pembayaran 1 Abidzar

Al-Ghiffari A L Wirausaha Gaji<5Jt TEPAT 2

Abdul

Rohim L Wiraswasta Gaji<1Jt TEPAT 3

Adha

Maulana L Wiraswasta Gaji<5Jt TERLAMBAT 4 Afri Yusuf L Wirausaha Gaji<1Jt TEPAT 5

Akbar

Ibrahim L Wirausaha Gaji<5Jt TERLAMBAT 6

Akila

Najwa P Wirausaha Gaji<5Jt TEPAT 7

Amanda

Alya T P Wiraswasta Gaji<5Jt TEPAT 8

Anisa Dwi

Hartini P Wiraswasta Gaji<5Jt TEPAT 9

Bayu 'Abdul

Haqiqi L PNS Gaji<5Jt TEPAT 10

Dika Dwi

Febriana L Wirausaha Gaji<5Jt TERLAMBAT ….. …………. ….. ……… ……. …….. … ……… …….. ……… ……….. ……. 44 Yosi Rahmandani P

Wiraswasta Gaji<1Jt TEPAT 45

Zahwa Gizelia R

P

Wiraswasta Gaji<5Jt TERLAMBAT

5. Transformasi Data (Transformation), pada fase ini dilakukan proses transformasi bentuk data yang belum memiliki entitas yang jelas kedalam bentuk data yang valid atau siap untuk dilakukan proses Data Mining.

Tabel 2.4 Data Training

Jenis Kelamin Pekerjaan Ortu Pendapatan perbulan Ket. Pembayaran L Wirausaha Gaji<5Jt TEPAT L

Wiraswasta Gaji<1Jt TEPAT L

Wiraswasta Gaji<5Jt TERLAMBAT L

Wirausaha Gaji<1Jt TEPAT L

Wirausaha Gaji<5Jt TERLAMBAT P Wirausaha Gaji<5Jt TEPAT P

Wiraswasta Gaji<5Jt TEPAT P

Wiraswasta Gaji<5Jt TEPAT L

PNS Gaji<5Jt TEPAT L

Wirausaha Gaji<5Jt TERLAMBAT …..

….. ….. …..

(6)

L

PNS Gaji<5Jt TERLAMBAT L

Wirausaha Gaji<5Jt TEPAT

6. Implementasi Data mining, pada fase ini dilakukan analisis data dengan menggunakan Algoritma Naive Bayes Classifier. Sehingga menghasilkan model dan tingkat akurasi pada penerapan algortima tersebut. 7. Interpretasi/Evaluasi , pada fase yang terakhir yang

dilakukan adalah proses pembentukan kesimpulan dari hasil yang telah didapatkan.

IV.HASI PENELITIAN DAN PEMBAHASAN

4.1 HASIL PENGUJIAN

Pada hasil pengujian data terdapat beberapa output yang dihasilkan oleh software RapidMiner yaitu :

Gambar 4.1 Proses konfigurasi operator Naïve Bayes Rapidminer

Berdasarkan pada gambar 4.1 dapat dijelaskan bahwa proses perhitungan Naïve Bayes dengan menggunakan tools Rapidminer yang pertama dilakukan proses import data training dan data testing, Kemudian data tersebut disambungkan dengan tools operators pada RapidMiner seperti gambar diatas. Selanjutnya dilakukan proses run, setelah dirun maka akan muncul hasil klasifikasi pada data example set. Berikut hasil perhitungan naive bayes dengan menggunakan tools RapidMiner.

Gambar 4.2 hasil perhitungan Naïve Bayes Rapidminer

Berdasarkan gambar 4.2 maka dapat dijelaskan bahwa hasil dari proses klasifikasi data pembayaran SPP dengan tools Ms. Excel dan tools RapidMiner bernilai SAMA. Berikut kesimpulan hasil yang diperoleh dari kedua tools tersebut.

PREDICTED CLASS

TEPAT TERLAMBAT

TEPAT 11 6

TERLAMBAT 2 3

Gambar 4.3 Hasil tools Rapidminer

Pada gambar 4.3 merupakan hasil pengujian dengan tools RapidMiner dengan jumlah True Positive adalah 11 data diklasifikasikan sebagai pred.TEPAT dan class TEPAT, False Positive sebanyak 6 data diklasifikasikan sebagai pred.TEPAT tetapi class TERLAMBAT, True Negative sebanyak 3 data diklasifikasikan sebagai pred. TERLAMBAT dan Class TERLAMBAT, dan False Negative sebanyak 2 data diklasifikasikan sebagai pred. TERLAMBAT tetapi class TEPAT. Oleh karena itu, dapat disimpulkan bahwa hasil klasifikasi data pembayaran SPP dengan menggunakan tools RapidMiner dan Ms. Excel bersifat SAMA.

4.2 TINGKAT AKURASI PENERAPAN MODEL ALGORITMA

Metode pengujian tingkat akurasi yang digunakan adalah metode confusion matrix yang terdiri dari precission, recall, dan acuracy. Pengujian confusion matrix untuk data testing yang diolah menggunakan tools Ms. Excel untuk nilai akurasinya dapat dilihat pada tabel berikut :

Tabel 4.1 Hasil Pengujian Confusion Matrix tools Ms. Excel

CLASS Klasifikasi Precision pred.TEPAT pred.TERLAMBAT TEPAT 11 2 64,71% TERLAMBAT 6 3 60,00% Recall 84,62% 33,33% Acuracy 63,64%

Adapun pengujian confusion matrix yang diolah menggunakan tools RapidMiner dengan operator Performance, untuk nilai akurasinya dapat dilihat pada gambar berikut

Gambar 4.4 Hasil Pengujian Confusion Matrix tools RapidMiner

(7)

Gambar 4.5 Grafik Hasil Pengujian Naive Bayes Classifier Dalam penerapan operator Performance bukan hanya confusion matrix saja yang dihasilkan. Akan tetapi, juga menghasilkan Area Under Curve (AUC) yang akan ditampilkan pada gambar kurva Receiver Operating Characteristic (ROC) berikut:

Gambar 4.6 Kurva Receiver Operating Characteristic (ROC) Kurva Receiver Operating Characteristic (ROC) digunakan untuk mengekspresikan data confusion matrix. Garis horizontal mewakili nilai False Positive (FP) dan garis vertikal mewakili nilai True Positive (TP). Dari gambar 4.6 dapat diketahui bahwa nilai Area Under Curve (AUC) model algoritma Naive Bayes sebesar 0.671 dengan positive class TERLAMBAT, AUC (optimistic) sebesar 0.718 dengan positive class TERLAMBAT, dan AUC (pessimistic) sebesar 0.624 dengan positive class TERLAMBAT.

4.2 PEMBAHASAN

Pada tahap ini merupakan pembahasan hasil dari pengujian Algoritma Naive Bayes yang telah dilakukan pada tools Ms. Excel dan tools RapidMiner. Berikut penjelasan dari penelitian ini

1.

Pada penelitian ini penulis menggunakan 52 dataset yang terdiri dari data primer dan data sekunder. Dari 52 data tersebut, 45 data digunakan sebagai data training dan dari data training terdapat 22 data yang digunakan sebagai data testing yang kemudian digunakan sebagai pengujian pada penelitian ini baik menggunakan manual tools Ms. Excel maupun dengan tools RapidMiner.

2.

Untuk bagian Class Prediction menggunakan 22 data pada data testing. Terdapat data yang cocok antara kelas Tepat dan pred.Tepat yaitu sebanyak 11 Data (True

Positive) dan untuk data kelas Lambat yang cocok dengan pred.Terlambat sebanyak 3 data (True Negative) dan data untuk kelas Tepat tetapi pred.Terlambat sebanyak 2 data (False Negative) dan data untuk kelas Terlambat tetapi pred.Tepat sebanyak 6 data (False Postive).

3.

Tingkat accuracy pada perhitungan manual di tools Ms. Excel dan perhitungan menggunakan tools RapidMiner bernilai sama, yaitu sebesar 63,64%. Precision untuk kelas TEPAT sebesar 64,71%, sedangkan untuk kelas TERLAMBAT sebesar 60,00%. Dan Recall untuk kelas TEPAT sebesar 84,62%, sedangkan untuk kelas TERLAMBAT sebesar 33,33%.

4.

Faktor yang menjadi permasalahan terjadinya keterlambatan pembayaran SPP berkaitan dengan status ekonomi orang tua, juga pekerjaan orang tua serta jenis kelamin

.

V. PENUTUP A. KESIMPULAN

Berdasarkan hasil pengujian serta pembahasan dalam penelitian ini maka dapat disimpulkan sebagai berikut : 1. Algoritma Naive Bayes dapat digunakan untuk

mengklasifikasi data pembayaran SPP berdasarkan ketetapan waktu pembayaran.

2. Dari 22 data testing yang digunakan dapat diklasifikasikan sebanyak 11 data sebagai True Positive, 3 data sebagai True Negative, 2 data sebagai False Negative, dan 6 data sebagai False Positive.

3. Algoritma Naive Bayes dalam memprediksi Tepat atau Terlambat santri membayar SPP memiliki tingkat

accuracy sebesar 63,64%, precision pada kelas TEPAT

sebesar 64,71% sedangkan pada kelas TERLAMBAT sebesar 60,00%, dan recall pada kelas TEPAT sebesar 84,62% sedangkan pada kelas TERLAMBAT sebesar 33,33%.

4. Faktor – faktor yang mempengaruhi tingkat ketepatan waktu pembayaran SPP pada Pondok Pesantren Al – Arifah bukan hanya dari faktor pekerjaan orang tua dan pendapatan perbulan orang tua saja, tetapi faktor eksternal juga mempengaruhi.

B. SARAN

Berdasarkan hasil penelitian yang telah dilakukan maka muncul gagasan – gagasan yang dirangkum dalam usulan dan saran untuk penelitian yang berhubungan dengan Klasifikasi Pembayaran SPP Berdasarkan Tingkat Ketepatan Waktu Pembayaran Menggunakan Algoritma Naive Bayes antara lain :

1. Dalam penelitian ini hanya menggunakan satu metode klasifikasi data mining saja. Oleh karena itu disarankan untuk melakukan pengembangan atau penambahan metode – metode klasifikasi yang lain, sehingga menghasilkan nilai yang lebih baik.

0% 50% 100%

Accuracy Precison Recall

HASIL PENGUJIAN NAIVE BAYES

(8)

2. Dari hasil nilai akurasi yang dihitung dengan tools RapidMiner sebesar 63,64% dengan data training berjumlah 45 data melalui operator Performance dalam penelitian ini masih belum cukup memuaskan. Oleh karena itu disarankan untuk menambah atau mencoba operator pengujian akurasi yang lain atau juga dapat menambahkan jumlah data training yang lebih besar, sehingga dapat menghasilkan nilai akurasi yang lebih baik.

REFERENSI

[1] M. Muqorobin, K. Kusrini, and E. T. Luthfi, “Optimasi Metode Naive Bayes Dengan Feature Selection Iinformation Gain Untuk Prediksi Keterlambatan Pembayaran SPP Sekolah,” J. Ilm. SINUS, vol. 17, no. 1, p. 1, 2019.

[2] M. S. Mustafa, M. R. Ramadhan, and A. P. Thenata, “Implementasi Data Mining untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier,” Creat. Inf. Technol. J., vol. 4, no. 2, p. 151, 2018.

[3] D. Puspitasari, S. S. Al Khautsar, and W. P. Mustika, “Algoritma Naïve Bayes Untuk Memprediksi Kredit Macet Pada Koperasi Simpan Pinjam,” J. Inform. Upgris, vol. 4, no. 2, 2019.

[4] A. Asroni, N. Maharty Ali, and S. Riyadi, “Perkiraan Masa Tunggu Alumni Mendapatkan Pekerjaan Menggunakan Metode Prediksi Data Mining Dengan Algoritma Naive Bayes Classifier,” Semesta Tek., vol. 21, no. 2, pp. 189–197, 2018.

[5] M. Sabransyah, Y. N. Nasution, and D. Tisna, “Aplikasi Metode Naive Bayes dalam Prediksi Risiko Penyakit Jantung Naive Bayes Method for a Heart Risk Disease Prediction Application,” J. Eksponensial, vol. 8, pp. 111–118, 2017.

[6] D. Nofriansyah, Algoritma Data Mining Dan Pengujian, vol. 4. Pendidikan Deepublish, 2017. [7] Y. Nurdiyanti, “Pembayaran Spp Dengan System

Informasi Manajemen Sekolah: Studi Pada Madrasyah Aliyah Ypp Babakan Jamanis,” J. Manag. Rev., vol. 2,

no. 1, p. 183, 2018.

[8] Rachman Arief, “Aplikasi Pembayaran dan Perizinan Santri Ponpes Assalafi Al Fithrah Surabaya Berbasis Web,” J. Iptek Olahraga, vol. 22, p. 121, 2018. [9] I. S. Ma’rifati, “Sistem Informasi Akuntansi

Pendapatan Sumbangan Pembinaan Pendidikan (SPP) Pada SMU XYZ,” J. Evolusi, vol. 3, no. 1, pp. 1–8, 2015.

[10] D. Suarga, M.Sc, Algoritma dan Pemrograman. CV. Andi Publisher, 2012.

[11] E. Manalu, F. A. Sianturi, and M. R. Manalu, “Penerapan Algoritma Naive Bayes Untuk Memprediksi Jumlah Produksi Barang Berdasarkan Data Persediaan Dan Jumlah Pemesanan Pada Cv . Papadan Mama Pastries,” Effrida Manalu, Fricles Ariwisanto Sianturi, Mamed Rofendy Manalu, vol. 1, no. 2, pp. 16–21, 2017.

[12] M. Hasan, “Prediksi Tingkat Kelancaran Pembayaran Kredit Bank Menggunakan Algoritma Naive Bayes Berbasis Forward Selection,” Ilk. J. Ilm. Vol. 9 Nomor 3, vol. 9, pp. 317–324, 2017.

[13] S. Salmu and A. Solichin, “Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes : Studi Kasus UIN Syarif Hidayatullah Jakarta,” Semin. Nas. Multidisiplin Ilmu 2017, no. April, pp. 701–709, 2017.

[14] D. Novianti, “Perancangan Sistem Tempat Sampah Pintar Dengan Sensor HCRSF04,” Paradig. J. Komput. dan Inform. Akad. Bina Saran Inform., vol. XXI, no. 1, pp. 2017–2020, 2019.

[15] W. Muslehatin and M. Ibnu, “Penerapan Naïve Bayes Classification untuk Klasifikasi Tingkat Kemungkinan Obesitas Mahasiswa Sistem Informasi UIN Suska Riau,” Semin. Nas. Teknol. Informasi, Komun. dan Ind., p. 7, 2017.

[16] P. S. Dr., Metode Penelitian Pendidikan. Bandung: CV. Alfabeta, 2015.

Gambar

Tabel 2.2 Rumus Confusion Matrix
Tabel 2.4 Data Training
Tabel 4.1 Hasil Pengujian Confusion Matrix tools Ms. Excel
Gambar 4.5 Grafik Hasil Pengujian Naive Bayes Classifier  Dalam  penerapan  operator  Performance  bukan  hanya  confusion  matrix  saja  yang  dihasilkan

Referensi

Dokumen terkait