• Tidak ada hasil yang ditemukan

Analisis Klasifikasi Perfomance KPI Salesman Menggunakan Metode Decision Tree Dan Naïve Bayes

N/A
N/A
Protected

Academic year: 2023

Membagikan "Analisis Klasifikasi Perfomance KPI Salesman Menggunakan Metode Decision Tree Dan Naïve Bayes"

Copied!
10
0
0

Teks penuh

(1)

Analisis Klasifikasi Perfomance KPI Salesman Menggunakan Metode Decision Tree Dan Naïve Bayes

Seanand Sonia Shabrilianti1, Agung Triayudi2*, Dhieka Avrilia Lantana3

Fakultas Teknologi Komunikasi dan Informatika, Sistem Informasi, Universitas Nasional, Jakarta, Indonesia Email: 1soniaseanand@gmail.com, 2,*agungtriayudi@civitas.unas.ac.id, 3dhiekalantana12@gmail.com

Email Penulis Korespondensi: agungtriayudi@civitas.unas.ac.id Submitted 01-2-2023; Accepted 20-02-2023; Published 27-02-2023

Abstrak

Seiring berkembangnya teknologi secara cepat dan inovatif sangat memberikan pengaruh besar terutama bagi perusahaan besar. Tidak seperti saat ini bagi para karyawannya masih menggunakan cara manual, seperti dalam menentukan hasil pencapaian salesman. Dengan adanya teknologi dapat membantu berbagai bentuk permasalahan dalam pekerjaan, menjadikannya lebih mudah dikerjakan dalam waktu yang mungkin singkat menjadikan waktu lebih efisien. Penelitian ini bertujuan untuk meningkatkan kinerja dari karyawan perusahaan yang diutamakan agar melakukan pekerjaan dengan bantuan teknologi atau lebih tepatnya pada suatu sistem sehingga tidak lagi mengerjakan pekerjaan secara manual, juga membantu perusahaan lebih berkembang dengan adanya teknolgi yang akan terus baru. Penelitian ini juga bertujuan untuk menguji hasil dari tingkat akurasi dengan menggunakan dua metode, guna mencari yang terbaik diantara dua metode itu pada data hasil pencapaian KPI salesman. Dengan menggunakan dua metode yaitu metode decision tree dan naïve bayes. Klasifikasi dari dua metode ini dapat menguji hasil dari seberapa tinggi hasil akurasi berdasarkan data yang diolah. Menggunakan lebih dari satu metode untuk mencari manakah metode yang lebih berpengaruh, dan lebih baik dalam klasifikasi tersebut. Hasil penelitian ini menunjukan jika dengan metode decision tree mendapat hasil yang sangat baik dalam penelitian i ni dikarenakan menghasilkan akurasi yang sempurna, mencapai angka 100% sedangkan dengan metode naïve bayes hanya 41%.

Kata Kunci: Teknologi; Hasil Pencapaian; Data Mining; Tingkat Akurasi; Klasifikasi Abstract

Along with the rapid and innovative development of technology, it has a big influence, especially for large companies. Unlike today, employees still use manual methods, as in determining the results of the achievement of the salesman. With the existence of technology can help various forms of problems in work, Making it easier to work with in a possibly short period of time makes time more efficient.

This study aims to improve the performance of company employees who are prioritized to do work with the help of technology, or rather on a system so that it no longer does the work manually, also helps the company develop more with the existence of technology that will continue to be new. This study also aims to test the results of the level of accuracy using two methods, in order to find the best between the two methods on the data of the results of achieving salesman KPI. By using two methods, namely the decision tree method and naïve bayes. The classification of these two methods can test the results of how high the accuracy results are based on the processed data. Using more than one method to find which method is more influential, and better in those classifications. The results of this study show that the decision tree method got very good results in this study because it produced perfect accuracy, reached the 100% mark whereas by the naïve bayes method it was only 41%.

Keywords: Technology; Achievement Results; Data Mining; Accuracy Rate; Classification

1. PENDAHULUAN

Perkembangan pada teknologi saat ini sangatlah berkembang sangat pesat dan tentunya akan terus menerus berkembang dan berinovasi seiring berjalan nya waktu juga perkembangan jaman, masyarakat pun tidak bisa diam tetapi harus mengikuti disetiap perkembangannya dengan memanfaatkan pada kegiatan sehari – hari. Guna memanfaatkan adanya teknologi yang dibutuhkan masyarakat pada pencatatan insentif penjualan pada salesman yang cepat dan juga akurat, akan sangat membantu dalam mempersingkat waktu pengerjaannya. Untuk itu diperlukan adanya mobilitas pencatatan yang mampu menganalisa hasil perhitungannya di dalam suatu sistem yang semakin hari jumlah salesman akan terus bertambah. [1] Pada saat ini banyak kondisi menentukan hasil pencapaian dari perhitungan KPI salesman menggunakan angka manual atau presentase manual yang belum bisa dengan jelas memberikan informasi hasil dari analisis salesman capai target atau pun tidak capai target. Sehingga adanya kesulitan pada pimpinan untuk menganalisis pencapaian dari banyaknya salesman, apabila dapat dianalisis pimpinan menentukan keputusan secara efektif dan juga memberikan wawasan baru dalam menganalisis data.[2]

Dalam melakukan pengumpulan data masih dilakukan manual dan untuk mengetahui hasil pencapaiannya harus mendatangi kantor pusat melakukan pengecekan apakah salesman nya capai atau tidak, bukan hanya beberapa salesman yang akan datang untuk pengecekan pencapaian tetapi bisa mencapai ribuan yang mana memakan waktu lama sehingga proses nya sangat panjang membuat pekerjaan tidak efektif juga belum dipastikan tingkat akurasi kebenarannya apakah sesuai dengan data yang ada. [3] Sangat akan membantu jika mengikuti teknologi yang terus berkembang pesat saat ini memberikan kemudahan dalam melakukan pekerjaan dan tentunya akan mempersingkat waktu juga mendapat hasil yang lebih akurat tanpa perlu mendatangi kantor pusat hanya untuk mengetahui pencapaian dapat di akses pada sistem dengan lebih mudahnya. [4]

KPI berupa serangkaian indicator kunci yang memiliki sifat terukur dan memberikan informasi beban sasaran yang strategis dari pencapaian suatu organisasi, dimana organisasi tersebut secara interaktif terintegrasi dalam sebuah strategi organisasi dengan secara menyeluruh. [5] KPI juga digunakan untuk menentukan objektif yang terukur, melihat tren, dan mendukung pengambilan keputusan.

(2)

Copyright © 2023 Seanand Sonia Shabrilianti, Page 183 Pada penelitian terdahulu yang berjudul “Sistem Pendukung Analisa Key Performance Indicaor (KPI) Menggunakan Metode Data Mining Berbasis Web Python Programming” mendapat kesimpulan dari hasil pengolahan data dengan menggunakan teknik data mining diatas, penulis membuat sistem visualisasi data berbasis web python programming dan library pendukung yang mampu menjawab tantangan masalah yang ada dalam analisis data dan pengambilan keputusan fungsi pimpinanatau pengguna aplikasi webterkait dengan persentase hasil kepuasan pengguna terhadapt sistem sebesar 93%. [6]

Pada penelitian terdahulu mengenai klasifikasi menggunakan dua metode yang berjudul “Analisa Algortima Decision Tree dan Naïve Bayes Pada Pasien Penyakit Liver” mendapat kesimpulan dengan menggunakan Decision Tree(C4.5) dan Naïve Bayes. Untuk mengetahui komparasi algoritma yang paling baik dalam menentukan penyakit liver. Mendapat kesimpulan dari metode yang memberikan pecahan untuk permasalahan dalam mengindentifikasi penyakit liver ialah Decision Tree(C4.5). [7] Penelitian terdahulu yang berjudul “Algoritma Naïve Bayes, Decision Tree, dan SVM untuk KlasifikasiPersetujuan Pembiayaan Nasabah Koperasi Syariah” memberikan kesimpulan hasil kinerja terbaik mendapat akurasi setinggi 89,86% dan AUC 0,939 pada kelas macet dan lancar dibandingkan dengan Naïve Bayes dan Decision Tree. Sedangkan Sistem Pendukung Persetujuan Pembiayaan (SPPP) dengan menggunakan SVM mendapatkan hasil akurasi klasifikasi setinggi 94% dari 50 record dataset. [8] Ada pula penelitian terdahulu mengenai metode naïve bayes yang berjudul “Aplikasi Monitoring dan Penentuan Peringkat Kelas Menggunakan Naïve Bayes Classifier” mendapat kesimpulan aplikasi monitoring dan penentuan peringkat kelas menggunakan Naïve Bayes Classifier dapat mengelola fungsi masing-masing user dengan sangat baik, pada peringkat siswa menyeleksi kriteria- kriteria yang dibutuhkan dengan akurasi 66.94% dari 732 data testing siswa menggunakan aplikasi Rapidminer.

Menggunakan blackbox didapatkan nilai 100% dari 16 responden. Dalam aspek usability, pengujian didapatkan nilai 89.2% sehingga aplikasi memiliki hasil uji kegunaan yang sangat tinggi atau mudah untuk digunakan. [9]

Berdasarkan teorema bayes kontribusi yang sama pentingnya ataupun bebas dalam memilih kelas tertentu dari semua kegiatan. Menentukan gambaran persepsi masyarakat pada text mining merupakan metode dari naïve bayes yang sering disebut juga dengan naïve bayes classifier. [10] Kontribusi riset ini sangat membantu untuk meminimalisi waktu pengerjaan dalam menentukan pencapaian dari salesman, sehingga jika ada salesman yang baru nantinya sudah dengan mudah dari secara otomatis akan terlihat hasil dari pencapaiannya. Dari permasalahan yang ada dapat ditemukan adanya peluang untuk menerapkannya ke dalam data mining dengan akurasi yang baik dan dapat digunakan untuk perusahaan dalam menentukan hasil pencapaian sehingga diharapkan dapat mempersingkat waktu pengerjaan dan juga hasil yang lebih akurat. [11] Dengan demikian penelitian ini bertujuan dalam menentukan KPI salesman dengan menggunakan dua metode klasifikasi dan juga metode klasifikasi manakah yang sesuai dalam menentukan KPI salesman sehingga dengan mengatahui hal berikut dapat membantu meringankan pekerjaan memanfaatkan adanya teknologi yang berkembang.

2. METODOLOGI PENELITIAN

2.1 Tahapan Penelitian

Metode ini data digunakan untuk melakukan pengujian pada klasifikasi dari dua metode yaitu decision tree dan naïve bayes. Pada tahapan penelitian ini dilakukan sesuai dengan langkah – langkah yang dimulai dengan melakukan pengumpulan data yaitu dataset pencapaian salesman untuk selanjutnya data tersebut akan diolah menjadi data yang sesuai dengan format pada sistem. Dengan menggunakan bahasa pemrograman python untuk melanjutkan pengujian algoritma metode decision tree dan naïve bayes. Pengujian akan mendapatkan hasil akurasi dari dua metode yang kemudian akan terlihat pembanding antara dua metode manakah yang lebih baik untuk dikemukakan.

(3)

Gambar 1. Metode Penelitian 2.2 Data Set

Beberapa contoh data yang akan diolah untuk pengujian dua metode yang selanjutnya dilakukan implementasi untuk mendapatkan nilai hasil akurasi. Terdapat kolom ‘sld_code’, ‘nama_sld’, ‘category_sld’, ‘hygiene_factor’, ‘kpi_ss’,

‘insentif_sld’ dari dataset ini akan diubah menjadi numerik untuk menyesuaikan dengan rumus algoritma yang digunakan.

Tabel 1. Dataset KPI Salesman

sld_code nama_sld category_sld hygiene_factor kpi_ss insentif_sld

45 BAMBANG 4 SLD CORPORATE Comply Batas Tengah Achieve

53 MAHPUDIN 3 SR 2ND DEALER Comply Batas Atas Achieve

54 TEDIE S 3 SR 2ND DEALER Comply Batas Bawah Not Achieve

56 OCID MADROIS 3 SLD CORPORATE Not Comply BatasTengah Achieve

61 SWAT-HC-FAISAL SLD LMT Comply BatasTengah Achieve

62 SWAT-HC-ADE SLD LMT Not Comply BatasTengah Not Achieve

2.3 Metode Data Mining

Data Mining adalah suatu proses dari pengumpulan data serta pengolahan data yang selanjutnya akan di ekstrak menjadi informasi penting dari dalam data tersebut. Proses ini dapat dilakukan dengan menggunakan perangkat lunak (software) yang tentunya dibantu dengan adanya perhitungan seperti sistematika, matematika ataupun juga teknologi Artificial Intelligence (AI) yang merupakan bidan dari bebagai bidang keilmuan. [12] Pada data mining ada beberapa metode yang dapat digunakan dan juga di terapkan pada kehidupan untuk menanalisis secara meluas pengetahuan secara mudah pada banyak orang salah metodenya yaitu salah satunya adalah metode klasifikasi. [13] Pada sistem yang akan melakukan klasifikasi dengan benar untuk semua dataset yang ada, tetapi kinerja pada sistem tidak bisa mencapai angka 100% benar, hal ini kinerja juga harus diukur. Umumnya mengukur kinerja klasifikasi dengan matriks konfusi.[14] Pada data mining ada beberapa metode yang dapat digunakan dan juga di terapkan pada kehidupan untuk menanalisis secara meluas pengetahuan secara mudah pada banyak orang salah metodenya yaitu salah satunya adalah metode klasifikasi. [15]

2.3.1 Decision Tree

Adapun klasifikasi decision tree yang popular dalam hal membuat keputusan dalam suatu kasus, tidak diperlukan proses pengelolaan pengetahuan yang sudah terdahulu untuk menyelesaikan kasus – kasus yang memiliki sebuah dimensi yang

(4)

Copyright © 2023 Seanand Sonia Shabrilianti, Page 185 besar. [16] Klasifikasi decision tree dapat di pergunakan untuk mengklasifikasikan beberapa aspek yang ingin di kembangkan atau juga menjadi acuan dari yang sudah pernah dialami agar kedepannya dapat memberikan keamanan dan kenyamanan kepada konsumen sehingga kedua belah pihak tidak merasa dirugikan.[17]

Berikut cara menghitung nilai gain menggunakan rumus [18]:

𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑟𝑜𝑝𝑦(𝑆) − ∑𝑛𝑖=1 |𝑆𝑖||𝑆|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖) (1) Keterangan :

S = himpunan kasus A = atribut

n = jumlah partisi atribut A

|Si| = jumlah kasus pada partisi ke i

|S| = jumlah kasus dalam S

Berikut untuk rumus entropy[12] :

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑𝑛𝑖=1𝑝𝑖∗ 𝑙𝑜𝑔2𝑝𝑖 (2)

Keterangan :

S = himpunan kasus A = fitur

n = jumlah partisi S

pi = proporsi dari Si terhadap S 2.3.1 Naïve Bayes

Metode naïve bayes merupakan algoritma dari machine learning dalam mengatasi permasalahan klasifikasi dengan menerapkan teorema probabilitas bayes.[19] Metode ini dikenal dengan kesederhanaannya dan juga keefektifannya juga cepat dalam membangun model dan membuat prediksi dengan algortima naïve bayes. Naïve bayes ini bertujuan untuk melakukan klasifikasi probabilitas berdasarkan dari pembelajaran mesin atas probabilitas lainnya. [20]

Torema Bayesmemiliki rumus sebagai berikut : 𝑃(𝐻|𝑋) =𝑃(𝑋|𝐻)𝑥 𝑃(𝐻)

𝑃(𝑋) (3)

Keterangan :

X = Data dengan class yang belum diketahui H = Hipotesis data merupakan suatu class spesifik

P(H|X) = Probabilitas hipotesis H berdasar kondisi X (Posteriori Probabilitas) P(H) = Probabilitas hipotesis H (Prior Probabilitas)

P(X|H) = Probabilitas X berdasarkan kondisi hipotesis H P(X) = Probabilitas X

3. HASIL DAN PEMBAHASAN

Key Performance Indicator sebagai yang paling kritikal untuk kesuksesan organisasi pada kondisi sekarang dan di masa datang. Key Performance Indicator merupakan ukuran berskala dan kuantitatif yang digunakan untuk mengevaluasi kinerja organisasi dalam tujuan mencapai target organisasi. KPI menjadi salah satu acuan untuk salesman mendapatkan insentif, tidak hanya satu KPI tetapi terdapat beberapa KPI yang harus dipenuhi syarat nya oleh salesman, jika salesman tidak mencapai batas presentase salah satu KPI maka tidak akan mendapatkan insentif. KPI sebagai alat ukur yang dapat menggambarkan tingkat efektivitas pada perusahaan dalam mencapai tujuan bisnisnya.

Pengujian ini dilakukan untuk menemukan metode terbaik digunakan pada dataset perhitungan pencapaian KPI dari penjualan salesman. Dengan menggunakan bahasa pemrograman python pada metode decision tree dan naïve bayes diawali dengan mengolah dataset yang digunakan dengan format file .csv sesuai dengan yang dibutuhkan oleh sistem, data diubah kedalam numerik menjadikan terbentuknya beberapa category yang mencari hasil akhir dari salesman achieve dan not achieve. Menggunakan porsi perbandingan data prediksi dan data testing 80% dan 20% pada metode decision tree, data prediksi dan data testing 50% dan 50% pada metode naïve bayes.

Terdapat beberapa parameter yang digunakan untuk mengevaluasi model (mengukur sejauh mana tingkat kebenaran dari model Machine Learning) dalam melakukan prediksi. Parameter tersebut terdapat dalam bagian confusion matrix.

a. Accuracy (Akurasi) : Persentase hasil model yang diprediksi benar.

Akurasi = (TP + TN ) / (TP+FP+FN+TN)

b. Precision (Presisi) : Persentase hasil model yang diprediksi Benar Positif (True Positive) dibandingkan dengan keseluruhan hasil yang diprediksi positif.

Presisi = (TP) / (TP+FP)

(5)

c. Recall (Sensitifitas) : Persentase hasil model yang diprediksi Benar Positif (True Positive) dibandingkan dengan keseluruhan data yang aktual positif.

Recall = (TP) / (TP + FN)

d. Specificity : Persentase hasil model yang diprediksi negatif dibandingkan dengan keseluruhan data negative.

Specificity = (TN)/ (TN + FP)

e. F1 Score : Perbandingan rata-rata presisi dan recall yang dibobotkan F1 Score = 2 * (Recall*Presisi) / (Recall + Presisi)

3.1 Pengujian Decision Tree

Setelah dataset diolah sesuai yang dibutuhkan sistem agar mudah terbaca dilanjutkan dengan membuat kelas untuk memisahkan data penting yang akan diklasifikasikan pada metode decision tree. Pada decision tree ini akar pohon tertinggi mendapatkan hasil akurasi 100% dan akan terbagi kedalam beberapa akar pohon tersebut. Confusion matrix merupakan tabel yang digunakan untuk mengukur performa dari model yang digunakan. Matrix ini berisi 4 kuadran yang terdiri atas:

a. TP (True Positive) : Hasil prediksi dan kenyataan (Actual) positif b. TN (True Negative) : Hasil Prediksi dan actual negative

c. FP (False Positif) : Hasil prediksi positif, tetapi actual negative

d. FN (False Negatif) : Hasil prediksi negative, tetapi actual positifGunalan huruf kecil dan abjed untuk penomoran list.

Berdasarkan hasil dari metode decision tree dapat dilihat bahwa sebanyak 378 masuk dalam klasifikasi TP (True positif) artinya hasil prediksi dan actual menghasilkan hasil yg sama (yaitu 378 salesman masuk dalam kategori achieve).

Sedangkan 259 lainnya masuk dalam klasifikasi TN (True Negatif) artinya hasil prediksi dan actual menyatakan hasil yg sama (yaitu 259 salesman masuk dalam kategori non achieve).[21]

Hasil analisis menggunakan decision tree menghasilkan 100% baik akurasi maupun nilai f1-score. Sesuai dengan penjelsan di atas jika hasil antara False Positif dan False Negatif hampir sama (atau hasil klasifikasi dari prediksi tidak tepat) maka nilai f1-score yang menjadi acuan dalam menentukan model terbaik.

Gambar 2. Confusion Matrix Decision Tree Mendapatkan wujud dari pohon akar dengan keterangan sebagai berikut :

a. Node 1 : Pada kategori Class A (kelompok salesman achieve) dengan kpi_ss <= 1.5 akan mengikuti panah TRUE ke kiri dan sisanya mengikuti panah FALSE ke kanan (kpi yang didapatkan > 1.5). Dengan jumlah salesman dengan KPI

<= 1.5 sebanyak 1469 dan 1076 untuk KPI > 1.5 b. Node 2 :

1. Cabang True : Pada kategori Class B (kelompok salesman tidak achieve) dengan kpi_ss <= 0.5 akan mengikuti panah TRUE ke kiri dan sisanya mengikuti panah FALSE ke kanan (kpi yang didapatkan > 0.5). Dengan jumlah salesman dengan KPI <= 0.5 sebanyak 245 dan 927 untuk KPI > 0.5

2. Cabang False : Pada kategori Class A (kelompok salesman achieve) dengan KPI hygiene_factor <= 0.5 akan mengikuti panah TRUE ke kiri dan sisanya mengikuti panah FALSE ke kanan (kpi yang didapatkan > 0.5). Dengan jumlah salesman dengan KPI <= 0.5 sebanyak 1224 dan 149 untuk KPI > 0.5

c. Node 3 :

1. Cabang True : Pada kategori Class A (kelompok salesman achieve) dengan KPI hygiene_factor <= 0.5 akan mengikuti panah TRUE ke kiri dan sisanya mengikuti panah FALSE ke kanan (kpi yang didapatkan > 0.5). Dengan jumlah salesman dengan KPI <= 0.5 sebanyak 245 dan 33 untuk KPI > 0.5. Dapat disimpulkan kpi_ss <= 0.5 Sebanyak 894 salesman dengan kategori tidak achieve mendapatkan kpi_ss <= 0.5

2. Cabang False : Sebanyak 1224 salesman mendapatkan kpi hygiene factor > 0.5 pada kategori Achieve, Sedangkan 149 lainnya berada di hygiene factor <= 0.5 dg kategori non achieve

(6)

Copyright © 2023 Seanand Sonia Shabrilianti, Page 187 d. Node 4 : Sebanyak 245 salesnya mendapat hygiene factor > 0.5 di kategori achieve, dan 33 sisanya mendapatkan

hygiene factor <= 0.5 pada kategori non achieve.

Gambar 3. Pohon Akar (Decision Tree)

Berikut adalah hasil dari wujud pohon akar dengan menggunakan dataset hasil pencapaian KPI salesman yang sudah diuji coba menggunakan metode decision tree.

3.2 Pengujian Naïve Bayes

Pada metode naïve bayes juga digunakan proses implementasi menggunakan python untuk menguji akurasi dan juga confusion matrix dengan memasukan dataset yang sama untuk melakukan analisa pada klasifikasi tersebut. Dataset terbagi menjadi x dan y melakukan transform data dan split data untuk mendapatkan hasil akurasi dari klasifikasi data yang ingin diperoleh.

Pemilihan Acuan dalam Menentukan Algoritma Machine Learning (Metode yang digunakan):

a. Pilih algoritma yang memiliki Akurasi tinggi Jika dataset memiliki jumlah data False Negatif dan False Positif yang sangat mendekati (Symmetric). Tetapi jika dari jumlahnya tidak mendekati, akan lebih baik menggunakan F1 Score sebagai acuan

b. Pilih algoritma yang memiliki Recall tinggi Jika peneliti/analis lebih memilih False Positif lebih baik terjadi daripada False Negatif.

c. Pilih algoritma yang memiliki Presisi tinggi Jika peneliti/analis lebih menginginkan terjadi True Positif dan sangat tidak menginginkan terjadi False Positif

d. Pilih algoritma yang memiliki Specificity tinggi Jika peneliti/analis tidak menginginkan terjadinya False positif.

Macro avg merupakan hasil rata-rata dari kategori 0 dan 1 dari masing-masing precision, recall dan f1-score.

sedangkan weighted avg adalah nilai rata-rata yang telah terboboti. Pembobotan menyatakan tingkat kepentingan dari masing-masing kriteria dalam melakukan proses evaluasi. Semakin tinggi nilai precision, recall. f1-score dan akurasi maka semakin baik model yang dihasilkan dalam memprediksi.

Hasil analisis menggunakan naïve bayes menghasilkan akurasi 41% dan 29% untuk nilai f1-score. Sesuai dengan penjelsan di atas jika hasil antara False Positif dan False Negatif hampir sama (atau hasil klasifikasi dari prediksi tidak tepat) maka nilai f1-score yang menjadi acuan dalam menentukan model terbaik.

Gambar 4. Confusion Matrix Naive Bayes

(7)

3.3 Tampilan Sistem

Setelah melakukan uji coba mengenai algoritma decision tree dan juga naïve bayes ke dalam bahasa pemrograman python akan di tampilkan ke dalam sistem dengan menggunakan streamlit agar lebih mudah dipahami. Didalam sistem ditampilkan dari mulai data input atau juga dataset yang digunakan pada penelitian ini yaitu pencapaian KPI pada salesman. Pada menu klasifikasi terdapat 3 pilihan menu yaitu ‘Data Input’, ‘Metode Klasifikasi’, dan juga ‘Hasil Akhir Klasifikasi’ seperti berikut:

Pada menu klasifikasi yang pertama yaitu berisikan mengenai data input yaitu dataset yang digunakan dalam penelitian ini, terdapat juga fitur untuk melakukan proses upload file csv pada tampilan menu pertama dan tabel yang berikan data. Tampilan pada aplikasi sistem terdapat 2 menu klasifikasi yaitu menu data input, metode klasifikasi, hasil akhir klasifikasi.

Gambar 5. Menu Klasifikasi

Pada menu data input terdapat fitur untuk upload dengan format csv untuk upload file tersebut menampilkan tabel dari dataset yang digunakan.

Gambar 6. Menu Data Input

Pada menu metode penelitian terdapat dari 3 gambar berbeda yaitu hasil dari pohon akar pengujian decision tree, hasil tingkat akurasi dari matriks konfusi decision tree dan juga naïve bayes berikut dengan penjelasan lengkap dari gambar tersebut.Pada menu selanjutnya yaitu menu kedua ada menu metode klasifikasi yang berisikan 3 gambar berikut dengan penjelasannya, pada gambar pertama terdapat hasil dari data yang diolah menggunakan bahasa pemrograman python dengan algoritma decision tree sehingga menampilkan hasil dari pohon akar.

Gambar 7. Menu Metode Klasifikasi 1

(8)

Copyright © 2023 Seanand Sonia Shabrilianti, Page 189 Gambar 8. Menu Metode Klasifikasi 2

Pada gambar kedua menampilkan hasil dari tingkat akurasi confusion matrix dengan metode decision tree.

Gambar 9. Menu Metode Klasifikasi 3

Pada menu terakhir yaitu menu hasil akhir klasifikasi terdapat penjelasan dari kesimpulan hasil akhir perbandingan metode yang baik digunakan dari kedua metode yaitu metode decision tree dan juga naïve bayes.

Gambar 10. Menu Hasil Akhir Klasifikasi Hasil confusion matrix menunjukkan bahwa :

a. Jumlah salesman yang diprediksi "achieve" dan menurut data aktual "tidak achieve" sebesar 657

b. Jumlah salesman yang diprediksi "tidak achieve" dan menurut data aktual seharusnya "achieve" sebesar 934

(9)

Gambar 11. Menu Hasil Akhir dan Kesimpulan Klasifikasi

Pada menu terakhir yaitu menu ‘Hasil Akhir Penelitian’ terdapat hasil dari akurasi decision tree dan naïve bayes beserta kesimpulan dari hasil klasifikasi pada penelitian ini.

Decision tree: Hasil analisis menggunakan decision tree menghasilkan 100% baik akurasi maupun nilai f1-score.

Sesuai dengan penjelsan di atas jika hasil antara False Positif dan False Negatif hampir sama (atau hasil klasifikasi dari prediksi tidak tepat) maka nilai f1-score yang menjadi acuan dalam menentukan model terbaik.

Naïve bayes : Hasil analisis menggunakan naïve bayes menghasilkan akurasi 41% dan 29% untuk nilai f1-score.

Sesuai dengan penjelsan di atas jika hasil antara False Positif dan False Negatif hampir sama (atau hasil klasifikasi dari prediksi tidak tepat) maka nilai f1-score yang menjadi acuan dalam menentukan model terbaik.

Kesimpulannya : Berdasarkan analisis di atas, metode decision tree merupakan metode terbaik dalam klasifikasi achievement dari salesman karena menghasilkan akurasi sempurna yaitu sebesar 100%.

4. KESIMPULAN

Pada penelitian ini sudah dilakukan pengujian menggunakan data pencapaian KPI salesman menggunakan bahasa pemrograman python dengan dua metode klasifikasi ini mendapatkan kesimpulan metode decision tree merupakan model yang terbaik dalam klasifikasi achievement bagi salesman karena menghasilkan tingkat akurasi yang tinggi. Penelitian ini juga membuktikan adanya peluang dalam bentuk implementasi data kedalam data mining sehingga memberikan inovasi yang baru dalam bentuk klasifikasi di dalam sistem. Hasil yang didapatkan dari melakukan pengujian tingkat akurasi dengan metode naïve bayes yaitu 41% dan 29% untuk nilai f1-score. Hasil dari klasifikasi menunjukan prediksi tidak tepat yang mana hasil antara false positif dengan false negative yang hampir sama. Maka dari itu nilai f1-score menjadi acuan dalam menentukan model mana yang terbaik.

REFERENCES

[1] N. Feronica, S. Rivaldi, and Y. Rostianingsih, “Sales Management dalam Pengukuran Key Performance Indicator Dengan Menggunakan Metode C4.5 pada CV.X.”

[2] S. Bahri, A. Itb, and J. Dahlan, “IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KETERLAMBATAN JAM MASUK KERJA MENGGUNAKAN ALGORITMA KLASIFIKASI,” vol. 1, no. 1, pp. 11–20, 2020.

[3] S. Mulyana, F. Imansyah, and R. Yacoub, “ANALISIS TRAFIK PANGGILAN SUARAPADAJARINGAN GSMBERDASARKANPARAMETER KPI(KEY PERFORMANCE INDICATOR)”.

[4] M. Ghufroni An and A. Kurniawan, “Sistem Informasi Manajemen Berbasis Key Performance Indicator (KPI) dalam Mengukur Kinerja Guru,” 2022.

[5] R. Dwi, P. Magister, M. Fakultas, and E. Dan Bisnis, “PENGEMBANGAN GENERAL KEY PERFORMANCE INDICATORS UNTUK PENINGKATAN KINERJA PLATO FOUNDATION.”

[6] A. R. Wahidah et al., “SISTEM PENDUKUNG ANALISA KEY PERFORMANCE INDICATOR (KPI) MENGGUNAKAN METODE DATA MINING BERBASIS WEB PYTHON PROGRAMMING.”

[7] N. Rahman, “ANALISA ALGORITMA DECISION TREE DAN NAÏVE BAYES”.

[8] N. Nurajijah and D. Riana, “Algoritma Naïve Bayes, Decision Tree, dan SVM untuk Klasifikasi Persetujuan Pembiayaan Nasabah Koperasi Syariah,” Jurnal Teknologi dan Sistem Komputer, vol. 7, no. 2, pp. 77–82, Apr. 2019, doi:

10.14710/jtsiskom.7.2.2019.77-82.

(10)

Copyright © 2023 Seanand Sonia Shabrilianti, Page 191 [9] B. S. Gandhi, D. A. Megawaty, and D. Alita, “APLIKASI MONITORING DAN PENENTUAN PERINGKAT KELAS

MENGGUNAKAN NAÏVE BAYES CLASSIFIER,” Jurnal Informatika dan Rekayasa Perangkat Lunak (JATIKA), vol. 2, no.

1, pp. 54–63, 2021, [Online]. Available: http://jim.teknokrat.ac.id/index.php/informatika

[10] D. Darwis, N. Siskawati, and Z. Abidin, “Penerapan Algoritma Naive Bayes untuk Analisis Sentimen Review Data Twitter BMKG Nasional,” vol. 15, no. 1.

[11] A. Nurwahidah, A. Sawal, M. T. Afifudin, and H. Sari, “PERANCANGAN KEY PERFORMANCE INDICATOR (KPI) SEBAGAI DASAR PENGUKURAN KINERJA KARYAWAN DI GUDANG SPAREPART PADA PT XYZ,” ARIKA, vol.

15, no. 2, 2021.

[12] S. Alim, “IMPLEMENTASI ORANGE DATA MINING UNTUK KLASIFIKASI KELULUSAN MAHASISWA DENGAN MODEL K-NEAREST NEIGHBOR, DECISION TREE SERTA NAIVE BAYES ORANGE DATA MINING IMPLEMENTATION FOR STUDENT GRADUATION CLASSIFICATION USING K-NEAREST NEIGHBOR, DECISION TREE AND NAIVE BAYES MODELS.”

[13] B. Andriska, C. Permana, and I. K. Dewi, “Komparasi Metode Klasifikasi Data Mining Decision Tree dan Naïve Bayes Untuk Prediksi Penyakit Diabetes,” Jurnal Informatika dan Teknologi, vol. 4, no. 1, 2021, doi: 10.29408/jit.v4i1.2994.

[14] D. P. Utomo and M. Mesran, “Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 4, no. 2, p. 437, Apr. 2020, doi: 10.30865/mib.v4i2.2080.

[15] D. Ainnur, R. Saragih, M. Safii, and D. Suhendro, “Penerapan Data Mining Klasifikasi Tingkat Kepuasan Mahasiswa Terhadap Pelayanan Sistem Informasi di Program Studi Sistem Informasi,” 2021. [Online]. Available: https://ejurnal.seminar- id.com/index.php/josh/

[16] A. Adha, Y. Yunus, and G. Nurcahyo, “Prediksi Potensi Relawan Pendonor Darah Menjadi Pendonor Darah Tetap dengan Penerapan Metode Klasifikasi Decision Tree,” Jurnal Informasi dan Teknologi, pp. 233–238, Aug. 2021, doi:

10.37034/jidt.v3i4.158.

[17] H. Hafizan and A. N. Putri, “Penerapan Metode Klasifikasi Decision Tree Pada Status Gizi Balita Di Kabupaten Simalungun,”

2020.

[18] N. Wijaya, M. Endah, and M. Feliati, “Seminar Nasional UNRIYO [Desember] [2020] 424 PENERAPAN ALGORITMA DECISION TREE C.45 UNTUK KLASIFIKASI DATA STATUS HUNI RUMAH REHABILITASI PASCA ERUPSI MERAPI APPLICATION OF C.45 DECISION TREE ALGORITHM FOR REHABILITATION HOUSEHOLD DATA CLASSIFICATION POST ERUPTION OF MERAPI.”

[19] T. Putra, A. Triayudi, and Andrianingsih., “Analisis Sentimen Pembelajaran Daring menggunakan Metode Naïve Bayes, KNN, dan Decision Tree,” Jurnal Teknologi Informasi dan Komunikasi), vol. 6, no. 1, p. 2022, 2022, doi: 10.35870/jti.

[20] M. Yudhi Putra and D. Ismiyana Putri, “Pemanfaatan Algoritma Naïve Bayes dan K-Nearest Neighbor Untuk Klasifikasi Jurusan Siswa Kelas XI.”

[21] T. Sinta Peringkat et al., “KOMPARASI ALGORITMA DECISION TREE, NAIVE BAYES DAN K-NEAREST NEIGHBOR UNTUK MEMPREDIKSI MAHASISWA LULUS TEPAT WAKTU”, [Online]. Available: www.bri-institute.ac.id

Referensi

Dokumen terkait

Hasil analisis klasifikasi sentimen Twitter terhadap penyedia layanan kinerja telekomunikasi menggunakan Multinomial Naïve Bayes Tree menghasilkan akar pohon keputusan

Decision Tree Algoritma Index Gini merupakan sebuah pohon keputusan yang terbentuk dari node pohon sehingga saling mempengaruhi faktor yang diuji dengan menggunakan nilai Gini

Hasil analisa dengan metode decision tree dalam penelitian ini ditarik kesimpulan bahwa atribut Lingkungan sangat berpengaruh dalam faktor penyalahgunaan narkoba sebagai root

Naïve Bayes adalah salah satu metode klasifikasi berbasis numeris dengan pendekatan probabilistic [13] yang berakar pada teorema bayes dimana proses klasifikasi dilakukan dengan

Data yang telah dilakukan proses akan menjadi dataset akhir yang nantinya akan diuji dengan mengukur kedekatan dengan data yang ada dengan menggunakan rumus naïve bayes,

Naïve Bayes adalah salah satu metode klasifikasi berbasis numeris dengan pendekatan probabilistic [13] yang berakar pada teorema bayes dimana proses klasifikasi dilakukan dengan

The test results state that Gaussian Naïve Bayes is the best algorithm for classifying music genres compared to Bernoulli Naïve Bayes and Multinomial Naïve Bayes Keywords:

Hasil ini menunjukan algoritma Decision Tree memiliki keakuratan lebih tinggi dibandingkan dengan algoritma Naïve Bayes sehingga algoritma Decision Tree merupakan teknik yang tepat