Penerapan Algoritma NBC Untuk Klasifikasi Kepuasan Pelanggan Pada LAKSANA Setiabudi
Yusuf Mulyadi1, Rangga Sanjaya2
1Universitas BSI
e-mail: [email protected]
2Universitas BSI e-mail: [email protected]
Abstrak
Bisnis restoran merupakan bisnis yang cukup diminati oleh para wirausahawan. Warung Nasi Khas Sunda Asli LAKSANA Setiabudi merupakan salah satu restoran yang berada di Kota Bandung. Banyaknya restoran yang ada di Kota Bandung khususnya restoran yang menyediakan makanan khas sunda, tentunya para pelaku usaha menginginkan usahanya berkembang sehingga para pelaku usaha harus memperhatikan kualitas pelayanan dalam memberikan kepuasan terhadap pelanggan. Untuk menganalisis kepuasan pelanggan dapat diterapkan salah satu teknik data mining yaitu klasifikasi dengan menggunakan algoritma Naive Bayes Classifier (NBC). Algoritma ini dipilih karena algoritma tersebut mudah untuk diterapkan dan menghasilkan akurasi yang cukup tinggi. Data yang digunakan diperoleh dari menyebarkan kuesioner kepada pelanggan sebanyak 170 data yang kemudian dibagi menjadi dua bagian yaitu 80% data training (136 data) dan 20% data testing (34 data). Hasil yang diperoleh dengan menggunakan algoritma tersebut adalah pelanggan yang menyatakan puas sebanyak 73,5%
dan tidak puas sebanyak 26,00% dengan menghasilkan hasil klasifikasi tingkat akurasi sebesar 88,24% dan hasil yang diperoleh dari pengolahan kurva ROC untuk algoritma Naive Bayes Classifier menghasilkan nilai AUC sebesar 0,983 yang termasuk kategori Excellent Classification.
Kata Kunci: Data Mining, Naive Bayes Classifier, Kepuasan Pelanggan.
Abstract
The restaurant business is a business which is quite attractive to entrepreneurs. Warung Nasi Khas Sunda Asli LAKSANA Setiabudi is one of the restaurants which is located in the city of Bandung. With The increasing number of restaurants in the city of Bandung, especially restaurants that provide authentic Sundanese food, of course, business persons want their business to grow so that they must pay attention to the quality of service in providing satisfaction to customers. To analyze customer satisfaction, one of the data mining techniques which can be applied is classification using the Naive Bayes Classifier (NBC) algorithm. This algorithm was chosen because the algorithm is easy to implement and it has excellent accuracy. The data were obtained from distributing questionnaires to customers as many as 170 data which were then divided into two parts, namely 80% training data (136 data) and 20%
testing data (34 data). The results obtained by using the algorithm are 73.5% satisfied customers and 26.00% dissatisfied customers by producing an accuracy classification result of 88.24% and the results obtained from processing the ROC curve for the Naive Bayes Classifier algorithm produce AUC value of 0.983 which belongs to the category of Excellent Classification.
Keywords: Data Mining, Naive Bayes Classifier, Customer Satisfaction.
1. Pendahuluan
Bisnis restoran merupakann usaha komersial yang harus dilandasi rasa keinginan mendapatkan keuntungan tertentu. Bisnis restoran merupakan bisnis yang cukup diminati oleh para
wirausahawan. Selain itu bisnis restoran merupakan bisnis yang sangat menjanjikan untuk mendapatkan keuntungan yang menggiurkan. Setiap restoran menyediakan berbagai jenis makanan yang menjadi ciri khas dari restoran tersebut salah satunya adalah restoran yang menyediakan
makanan khas sunda (Amrullah et al., 2016).
Warung Nasi Khas Sunda Asli LAKSANA Setiabudi merupakan salah satu restoran yang berada di Kota Bandung.
Banyaknya restoran yang ada di Kota Bandung khususnya restoran yang menyediakan makanan khas sunda, tentunya para pelaku usaha menginginkan usahanya berkembang sehingga para pelaku usaha harus memperhatikan kualitas pelayanan dalam memberikan kepuasan terhadap pelanggan (Latunka et al., 2017).
Untuk menganalisis kepuasan pelanggan dapat diterapkan teknik data mining dengan metode Naive Bayes Classifier (NBC). Metode Naive Bayes Classifier digunakan pada penelitian (Pintoko & Lhaksamana, 2017) yang membuktikan bahwa metode ini dapat memberikan hasil klasifikasi tanggapan masyarakat terhadap jasa transportasi online pada salah satu platform media sosial twitter dengan memiliki beberapa kelebihan antara lain, sederhana, cepat, dan berakurasi tinggi dengan hasil akurasi sebesar 86,80%.
Menurut Connolly dan Begg (Siregar dan Puspabhuana, 2017) data mining adalah suatu proses ekstraksi atau penggalian data yang belum diketahui sebelumnya, namun dapat dipahami dan berguna dari database yang besar serta digunakan untuk membuat suatu keputusan bisnis yang sangat penting.
Klasifikasi merupakan suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan.
Teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasikan dan dengan menggunakan hasilnya untuk memberikan sejumlah aturan. Model klasifikasi yang populer adalah Decision Tree, Naive Bayes Classifier, Neural Networks, Genetic Algorithm, dan Support Vector Machine (Nofriansyah dan Nurcahyo, 2015).
Naive Bayes Classifier merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman sebelumnya (Siregar dan Puspabhuana, 2017).
Metode naive bayes juga dinilai berpotensi baik dalam mengklasifikasikan
objek dibandingkan dengan metode pengklasifikasian lain dalam hal akurasi dan efisiensi komputasi. Persamaan dari teorema Bayes adalah (Saleh, 2015):
( | ) ( | ) ( ) ( ) Keterangan:
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi X (posteriori probabilitas)
P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis H
P(X) : Probabilitas X
Sumber:(Saleh, 2015)
Gambar 1. Alur dari Naive Bayes Kepuasan pelanggan dapat diartikan sebagai pendapat dari pelanggan yang mengkonsumsi atau membeli suatu barang sesuai dengan apa yang diinginkan atau diharapkan atau bahkan dapat lebih dari itu.
Pada umumnya kepuasan pada tiap pelanggan tidak selalu sama dan berbeda- beda. Tidak jarang ada konsumen yang mendapat begitu banyak promosi atau kemudahan yang ditawarkan namun tidak puas, dan tak jarang juga dengan kondisi dan keadaan yang sederhana konsumen juga cukup puas (Tarigan, et al., 2017).
Penelitian mengenai kesuksesan penerapan algoritma Naive Bayes Classifier untuk klasifikasi telah dilakukan oleh beberapa penelitian sebelumnya, diantaranya Analisis Sentimen Jasa Transportasi Online pada Twitter Menggunakan Metode Naïve Bayes Classifier (Pintoko dan Lhaksamana, 2017), Implementasi Algoritma Naïve Bayes Classifier Untuk Klasifikasi Penerima Beasiswa PPA di Universitas AMIKOM
Yogyakarta (Adi, 2018)
,
Sistem Klasifikasi Kinerja Satpam Menggunakan Metode Naïve Bayes Classifier (Wibowo dan Hartati, 2016), Penerapan PSO Untuk Seleksi Fitur Pada Klasifikasi Dokumen Berita Menggunakan NBC (Junianto dan Riana, 2017).2. Metode Penelitian
Dalam penelitian ini akan menggunakan teknik pengambil sampel yaitu sampling insidental. Sampling insidental yaitu teknik penentuan sampel berdasarkan kebetulan atau insidental bertemu dengan peneliti dapat digunakan sebagai sampel, bila dipandang orang yang kebetulan ditemui itu cocok sebagai sumber data (Sugiyono, 2018). Sampel yang digunakan untuk penelitian ini berjumlah 170 data hasil dari kuesioner yang telah diisi oleh pengunjung Warung Nasi Khas Sunda Asli LAKSANA Setiabudi pada bulan April 2019.
Atribut yang digunakan dalam kuesioner terdiiri dari 13 atribut bertipe kategorikal yaitu jenis_kelamin, usia, pekerjaan, pendapatan, keamanan makanan, kenyamanan, kebersihan, keramahan, kecepatan penyajian, tanggap, reputasi, akses lokasi, kepuasan.:
1. jenis_kelamin Laki-laki dan perempuan.
2. usia
15-20 tahun, 21-25 tahun, 26-30 tahun, 31- 35 tahun, >35 tahun.
3. pekerjaan
Ibu rumah tangga, pelajar/mahasiswa, karyawan, wirausaha, lainnya.
4. pendapatan
<Rp. 1.000.000, <Rp 2.000.000, <Rp.
3.000.000, <Rp. 4.000.000, >Rp. 4.000.000 5. keamanan
sangat terjamin, terjamin, tidak terjamin, tidak tahu.
6. kenyamanan
sangat nyaman, nyaman, kurang nyaman, tidak nyaman, sangat tidak nyaman.
7. kebersihan
sangat bersih, bersih, kurang bersih, kotor, sangat kotor.
8. keramahan
sangat ramah, ramah, kurang ramah, tidak ramah, sangat tidak ramah.
9. kecepatan
sangat cepat, cepat, kurang cepat, tidak cepat, sangat lamban.
10. tanggap
sangat tanggap, tanggap, kurang tanggap, tidak tanggap, sangat tidak tanggap.
11. reputasi
sangat baik, baik, kurang baik, tidak tahu.
12. Akses lokas
Sangat dekat, dekat, jauh, sangat jauh.
13. kepuasan puas dan tidak puas
Penelitian ini dilakukan dengan mengadopsi metode CRISP-DM.
Berdasarkan penelitian sebelumnya yang telah dilakukan oleh (Fadillah, 2015).
Gambar 2. The CRISP-DM Process Model
Sumber: (Chapman et al., 2000) A. Business Understanding
Tahapan ini merupakan langkah awal untuk mengetahui masalah yang akan diselesaikan untuk mencapai tujuan yang diinginkan. Kegiatannya antara lain menentukan sasaran atau tujuan bisnis, memahami situasi bisnis, menentukan data mining dan membuat perencanaan strategi serta jadwal penelitian.
B. Data Understanding
Tahap ini diperlukan untuk mempersiapkan data yang akan diolah agar dapat dimodelkan dengan memeriksa apakah data tersebut normal, lengkap dan konsisten sehingga dapat dimodelkan sesuai dengan metode data mining yang akan digunakan. Pada penelitian ini data yang digunakan adalah data primer, yaitu data yang diperoleh dari kuesioner yang telah diisi oleh pengunjung Warung Nasi Khas Sunda Asli LAKSANA Setiabudi.
C. Data Preparation
Tahap ini meliputi semua aktivitas untuk membuat data set yang akan digunakan telah siap untuk dijadikan bahan penelitian. Pada penelitian ini data yang telah diperoleh dalam bentuk kuesioner kemudian diolah menggunakan Microsoft Office Excel untuk membagi data menjadi dua kategori yaitu 80% data training dan 20% data testing.
D. Modeling
Merupakan fase pemilihan teknik data mining dengan menentukan algoritma yang akan digunakan. Dalam penelitian ini algoritma klasifikasi yang akan digunakan adalah Naive Bayes Classifier. Untuk mengetahui hasil dari akurasi dari pemodelan peneliti menggunakan software RapidMiner. Berikut tahapan untuk melakukan pemodelan dengan menggunakan software RapidMiner:
3. Hasil dan Pembahasan 3.1. Hasil penelitian
Dalam penelitian ini akan dilakukan eksperimen terhadap metode klasifikasi data mining yaitu Naive Bayes Classifier dengan melakukan perhitungan manual dan software RapidMiner. Eksperimen dilakukan dengan membagi 170 data menjadi dua bagian yaitu 136 data training dan 34 data testing.
Gambar 3. Menjalankan Proses Modeling Hasil yang diperoleh dari pemodelan menggunakan rapidminer menhasilkan model baru yang dapat digunakan untuk mencari nilai prediksi pada data testing dalam pemodelan Naive Bayes Classifier, dilakukan dengan cara menghitung posterior dan probabilitas masing-masing kelas. Berikut adalah salah satu contoh perhitungannya:
Data testing:
Tabel 1. Data testing Atribut Jawaban
Jenis_kelamin Perempuan
Usia 21-25
Pekerjaan Karyawan Pendapatan <Rp2.000.000 Keamanan Terjamin Kenyamanan Nyaman Kebersihan Bersih Keramahan Ramah Kecepatan Cepat Tanggap Tanggap Reputasi Baik
Akses Dekat
Kepuasan Puas
Berdasarkan probabilitas prior yang telah dihitung sebelumnya, dapat dihitung probabilitas posterior dari data testing sebagai berikut:
P(X|Kepuasan = Puas)
=P(perempuan)*P(21-25)*P(karyawan)*
P(<Rp2.000.000)*P(terjamin)*P(nyaman)*
P(bersih)*P(ramah)*P(cepat)*P(tanggap)*P (baik)*P(dekat)*P(H)
=0,545*0,396*0,267*0,129*0,732*0,574*0,6 63*0,653*0,762*0,723*0,653*0,574*0,743
=0,000207
P(X|Kepuasan = Tidak Puas)
=P(perempuan)*P(21-25)*P(karyawan)*
P(<Rp2.000.000)*P(terjamin)*P(nyaman)*
P(bersih)*P(ramah)*P(cepat)*P(tanggap)*P (baik)*P(dekat)*P(H)
=0,514*0,371*0,371*0,114*0,343*0,400*0,4 85*0,286*0,057*0,029*0,657*0,485*0,257
=2,055E-8
Dari hasil perhitungan tersebut diketahui bahwa P(X|Kepuasan = Puas) lebih besar daripada P(X|Kepuasan = Tidak Puas), sehingga diprediksi bahwa data testing tersebut bernilai Puas.
3.2. Evaluasi dan Validasi Hasil
Untuk mencari keseluruhan hasil klasifikasi pada seluruh data testing, digunakan software RapidMiner yang menghasilkan confusion matrix. Dapat dilihat perhitungan confusion matrix dari model Naive Bayes Classifier dibawah ini:
Tabel 2. Confusion Matrix Prediksi Aktual Puas Aktual Tidak
Puas
Puas 20 0
Tidak Puas 4 10
Dari confusion matrix pada Tabel 2.
dapat diukur tingkat akurasi dari klasifikasi sebagai berikut:
TP = 20; FP = 0; TN = 10; FN= 4 Akurasi = ((TP+TN) / (TP+FP+TN+FN))
* 100%
Akurasi = ((20+10) / (20+0+10+4)) * 100%
Akurasi = 88,24%
Hasil yang diperoleh dari pengolahan kurva ROC untuk algoritma Naive Bayes Classifier menghasilkan nilai AUC sebesar 0,983 yang termasuk kategori Excellent Classification.
Gambar 4. Kurva ROC Algoritma Naive Bayes Classifier
3.3. Implikasi Penelitian
Berdasarkan hasil penelitian ini pihak restoran dapat mengetahui tanggapan pelanggan terhadap pelayanan yang sedang berjalan dengan menggunakan kuesioner dengan hasil yang menunjukan bahwa mayoritas pelanggan dari 170 responden sebesar 73,5% menyatakan puas.
Diketahui bahwa algoritma Naive Bayes Classifier dengan 13 atribut dapat dijadikan alternatif untuk pemodelan klasifikasi data mining pada dataset kepuasan pelanggan. Hal ini ditunjukan
bahwa algoritma Naive Bayes Classifier menghasilkan akurasi yang cukup tinggi dan masuk ke dalam kategori klasifikasi yang sangat baik. Dengan menghasilkan hasil klasifikasi dengan tingkat akurasi sebesar 88,24%.
Hasil penelitian ini dapat diterapkan dan dikembangkan dengan membuat program atau aplikasi untuk mengimplementasikan model yang telah dibuat sehingga di masa yang akan datang pelanggan tidak perlu menentukan kepuasannya sendiri.
4. Kesimpulan
Penelitian ini membahas analisis sampai dengan pengujian pada penerapan algoritma Naive Bayes Classifier untuk klasifikasi kepuasan pelanggan pada Warung Nasi Khas Sunda Asli LAKSANA Setiabudi. Berdasarkan hasil eksperimen yang telah diuraikan sebelumnya pada penelitian ini, maka dapat ditarik kesimpulan sebagai berikut:
Dari penelitian yang telah dilakukan dengan menggunakan data dari kuesioner yang telah diisi oleh pelanggan sebanyak 170 data, dapat diketahui bahwa pelanggan yang menyatakan puas terhadap pelayanan Warung Nasi Khas Sunda Asli LAKSANA Setiabudi merupakan yang paling banyak dengan presentasi sebesar 73,5%.
Algoritma Naive Bayes Classifier dapat digunakan untuk mengklasifikasikan kepuasan pelanggan di Warung Nasi Khas Sunda Asli LAKSANA Setiabudi. Hal ini dikarenakan algoritma tersebut dapat menghasilkan akurasi yang cukup tinggi dengan hasil klasifikasi dengan tingkat akurasi sebesar 88,24% dan masuk dalam kategori sangat baik.
Berikut beberapa saran yang dapat diberikan penulis untuk pengembangan penelitian yang telah dibuat, antara lain:
1. Pada penelitian berikutnya dapat dilakukan eksperimen dengan menambah data yang lebih banyak karena semakin banyak data, akurasi akan semakin bertambah.
2. Penelitian dapat dikembangkan atau dikomparasi dengan menggunakan algoritma lainnya seperti Neural Networks atau Support Vector Manchine sehingga didapat hasil akurasi yang lebih baik.
3. Dibuatkannya sebuah program atau aplikasi dari model yang telah dibuat untuk mengimplementasikan model
tersebut sehingga dapat lebih memudahkan pihak restoran nantinya dalam peningkatan kualitas pelayanan restoran tersebut.
Referensi
Adi, S. (2018). Implementasi Algoritma Naive Bayes Classifier Untuk Klasifikasi Penerima Beasiswa PPA Di Universitas Amikom Yogyakarta.
Jurnal Mantik Penusa, 22(1), 11–
16.
Amrullah, Hubeis, M., & S. Palupi, N.
(2016). Strategi Pengembangan Bisnis Restoran Makassar Berbahan Baku Hasil Ternak dalam Mendukung Penyediaan Makanan Sehat ( Studi Kasus di Restoran Marannu dan Karebosi Kelapa Gading ), 11(1).
Aulianita, R., & Rifai, A. (2018). Optimasi Particle Swarm Optimization Pada Naive Bayes Untuk Sentiment Analysis Furniture, 3(1), 31–40.
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C.,
& Wirth, R. (2000). CRISP-DM 1.0 Step-by-step Data Mining Guide (1st ed.). SPSS Inc.
Christie, D. A., Baskoro, D. A., Ambarwati, L., & Wicaksana, I. W. S. (2013).
BELAJAR DATA MINING DENGAN RAPID MINER. Diambil dari https://www.academia.edu/7712860/B elajar_Data_Mining_dengan_RapidMi ner (26 Mei 2019)
Fadillah, A. P. (2015). Penerapan Metode CRISP-DM untuk Prediksi Kelulusan Studi Mahasiswa Menempuh Mata Kuliah (Studi Kasus Universitas XYZ).
Jurnal Teknik Informatika Dan Sistem Informasi, 1(3), 260–270.
https://doi.org/10.28932/jutisi.v1i3.406 Fatmawati. (2016). Perbandingan Algoritma
Klasifikasi Data Mining Model C4 . 5 Dan Naive Bayes Untuk Prediksi Penyakit Diabetes. Jurnal Techno Nusa Mandiri, XIII(1), 50–59.
Gorunescu, F. (2011). Data Mining:
Concepts, Models and Techniques (12th ed.). Berlin: Springer Science &
Business Media.
Hayuningtyas, R. Y., & Sari, R. (2019).
ANALISIS SENTIMEN OPINI PUBLIK BAHASA INDONESIA TERHADAP WISATA TMII MENGGUNAKAN NAÏVE BAYES DAN PSO. Jurnal TECHNO Nusa Mandiri, 16(1), 37–42.
Junianto, E., & Riana, D. (2017).
Penerapan PSO Untuk Seleksi Fitur Pada Klasifikasi Dokumen Berita Menggunakan NBC. Jurnal Informatika, 4(1), 38–45.
Latunka, I. A., Mandey, S. L., & Repi, A. L.
(2017). ANALISIS PENGARUH
KUALITAS LAYANAN DAN
KEPUASAN PELANGGAN
TERHADAP LOYALITAS PADA RESTORAN FASTFOOD PIZZA HUT DI MANADO TOWN SQUARE, 5(2), 1891–1900.
Mardiana, T. (2018). OPTIMASI NAÏVE
BAYES DENGAN PARTICLE
SWARM OPTIMIZATION DAN STRATIFIED UNTUK PREDIKSI KREDIT MACET PADA KOPERASI, 1(1), 43–50.
Moleong, L. J. (2017). Metodologi Penelitian Kualitatif (Edisi Revisi) (37th ed.). Bandung: PT. Remaja Rosdakarya.
Muflikhah, L., Ratnawati, D. E., & Putri, R.
R. M. (2018). Data Mining (1st ed.).
Malang: UB Press.
Nofriansyah, D., & Nurcahyo, G. W. (2015).
Algoritma Data Mining Dan Pengujian (1st ed.). Yogyakarta: Deepublish.
Noor, J. (2016). Metodologi Penelitian:
Skripsi, Tesis, Disertasi & Karya Ilmiah (7th ed.). Jakarta: Prenada Media Group.
Pintoko, B. M., & Lhaksamana, K. M.
(2017). Analisis Sentimen Jasa Transportasi Online pada Twitter Menggunakan Metode Naïve Bayes Classifier, 5(3), 8121–8130.
Saleh, A. (2015). Implementasi Metode Klasifikasi Naïve Bayes dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga. Citec Journal, 2(3), 207–217. Retrieved from ojs.amikom.ac.id/index.php/citec/articl e/download/375/355
Siregar, A. M., & Puspabhuana, A. (2017).
DATA MINING: Pengolahan Data Menjadi Informasi dengan RapidMiner (1st ed.). Surakarta: CV Kekata Group.
Sofyan, A. A., Iqbal, M., & Awanda, I.
(2018). Sistem Informasi Pelayanan dan Controlling Franchise Berbasis Web Rumah Makan Raja Raja. Jurnal Sisfotek Global, 8(2), 2–8. Retrieved from
http://journal.stmikglobal.ac.id/index.p hp/sisfotek/article/view/183
Sugiyono. (2018). Metode Penelitian
Kuantitatif, Kualitatif, dan R&D (28th ed.). Bandung: Alfabeta.
Sulistyawati, N. M. A., & Seminari, N. K.
(2015). Kepuasan Pelanggan Restoran Indus, 4(8), 2318–2332.
Suyanto. (2017). Data Mining Untuk Klasifikasi dan Klasterisasi Data (1st ed.). Bandung: Informatika Bandung.
Tarigan, H. D., Destiawati, F., &
Fitriansyah, A. (2017).
Implementasi Algoritma C4.5 Terhadap Kepuasan Pelanggan.
Ethos (Jurnal Penelitian Dan Pengabdian Masyarakat), Vol. 6, No, 80–86.
Vercellis, C. (2009). Business Intelligence:
Data Mining and Optimization for Decision Making (1st ed.). Chichester:
John Wiley & Sons Ltd,.
https://doi.org/10.1002/978047075386 6
Wibowo, A. P., & Hartati, S. (2016). Sistem Klasifikasi Kinerja Satpam Menggunakan Metode Naїve Bayes Classifier. Jurnal Invotek Polbeng-Seri Informatika, 1(2), 192–201.