BAB 4 HASIL DAN PEMBAHASAN
4.3 Klasifikasi Naive Bayes
Pada proses klasifikasi metode naive Bayes terdapat tiga alur yaitu menghitung probabilitas prior, menghitung probabilitas setiap variabel bebas pada setiap kelompok dan menghitung perkalian probabilitas prior dan probabilitas variabel bebas pada setiap kelompok. Adapun data yang digunakan untuk perhitungan klasifikasi adalah menggunakan data training 80% sebanyak 164 data, sedangkan data testing 20% sebanyak 41 data. Pada kali ini akan diberikan contoh perhitungan menggunakan data randomisasi ke 4. Adapun tahapan-tahapan klasifikasi metode naive Bayes dalam pengklasifikasian status pembayaran pajak sebagai berikut:
1. Menghitung probabilitas prior (awal) setiap kelompok
Tahapan klasifikasi metode naive Bayes yang pertama yaitu menghitung probabilitas prior pada kedua kelompok menggunakan data training. Adapun nilai probabilitas prior setiap kelompok menggunakan Persamaan (2.4) sebagai berikut:
a. Kelompok pertama (wajib pajak badan dengan status patuh membayar PPN)
Pada 164 data training yang ada, terdapat 83 wajib pajak badan yang berstatus patuh membayar pajak, sehingga nilai probabilitas prior kelompok pertama sebagai berikut:
1 83 ( ) 164 P Y 0,5061
Jadi, probabilitas prior wajib pajak badan dengan status patuh membayar PPN adalah sebesar 0,5061.
b. Kelompok kedua (wajib pajak badan dengan status tidak patuh membayar PPN)
Pada 164 data training yang ada, terdapat 81 wajib pajak badan dengan status tidak patuh membayar pajak, sehingga nilai probabilitas prior kelompok kedua sebagai berikut:
2 81 ( ) 164 P Y 0, 4939
Jadi, probabilitas prior wajib pajak badan dengan status tidak patuh membayar PPN adalah sebesar 0,4939. Adapun nilai probabilitas prior wajib pajak badan pada setiap kelompok dapat dilihat pada Tabel 4.1.
Tabel 4.1 Probabilitas Prior Pada Setiap Kelompok Status Pembayaran PPN Jumlah Probabilitas
Patuh 83 0,5061
Tidak Patuh 81 0,4939
2. Menghitung probabilitas setiap variabel bebas pada setiap kelompok Perhitungan nilai probabilitas setiap variabel bebas pada kedua kelompok dilakukan pada data testing berdasarkan data training. Pada data testing pertama diketahui wajib pajak badan memiliki pendapatan (X sebesar 1-10 1) Miliar Rupiah, bentuk badan (X berupa PT dan memiliki status pelaporan 2) pajak (X tepat waktu, sehingga perhitungan nilai probabilitas setiap variabel 3) bebas pada kedua kelompok menggunakan Persamaan (2.6) sebagai berikut: a. Pendapatan (X 1)
Adapun nilai probabilitas variabel pendapatan data testing pertama pada setiap kelompok sebagai berikut :
Probabilitas variabel pendapatan untuk status patuh membayar pajak dihitung sebagai berikut:
1 19 ( =1-10 Miliar | Patuh) 83 P X 0, 2289
Sehingga probabilitas variabel pendapatan sebesar 1-10 Miliar Rupiah dengan syarat status patuh membayar pajak adalah sebesar 0,2289. Probabilitas variabel pendapatan untuk status tidak patuh membayar pajak dihitung sebagai berikut:
1 20 ( =1-10 Miliar | TidakPatuh) 81 P X 0, 2469
Sehingga probabilitas variabel pendapatan sebesar 1-10 Miliar Rupiah dengan syarat status tidak patuh membayar pajak adalah sebesar 0,2469. Adapun nilai probabilitas variabel pendapatan pada setiap kelompok dapat dilihat pada Tabel 4.2. Angka di dalam kurung menyatakan nilai probabilitas variabel pendapatan.
Tabel 4.2 Probabilitas Variabel Pendapatan Pada Setiap Kelompok Pendapatan Status Pembayaran Pajak
Patuh Tidak Patuh < 100 Juta 35 (0,4217) 30 (0,3704) 100 – 500 Juta 8 (0,0964) 16 (0,1975) 500 Juta – 1 Miliar 9 (0,1084) 8 (0,0988) 1 – 10 Miliar 19 (0,2289) 20 (0,2469) > 10 Miliar 12 (0,1446) 7 (0,0864) Sumber: Lampiran 7 b. Bentuk Badan (X 2)
Adapun nilai probabilitas variabel bentuk badan data testing pertama pada setiap kelompok sebagai berikut:
Probabilitas variabel bentuk badan untuk status patuh membayar pajak dihitung sebagai berikut:
2 36 ( =PT | Patuh) 83 P X 0, 4337
Sehingga probabilitas variabel bentuk badan berupa PT dengan syarat status patuh membayar pajak adalah sebesar 0,4337. Probabilitas variabel bentuk badan untuk status tidak patuh membayar pajak dihitung sebagai berikut: 2 27 ( =PT | Tidak Patuh) 81 P X 0,3333
Sehingga probabilitas variabel bentuk badan berupa PT dengan syarat status tidak patuh membayar pajak adalah sebesar 0,3333. Adapun nilai probabilitas variabel bentuk badan pada setiap kelompok dapat dilihat pada Tabel 4.3. Angka di dalam kurung menyatakan nilai probabilitas variabel bentuk badan.
Tabel 4.3 Probabilitas Variabel Bentuk Badan Pada Setiap Kelompok Bentuk Badan Status Pembayaran Pajak
Patuh Tidak Patuh
PT 36 (0,4337) 27 (0,3333) CV 36 (0,4337) 30 (0,3704) BUMN/BUMD 0 (0,0000) 7 (0,0864) Koperasi 3 (0,0361) 6 (0,0741) Lainnya 8 (0,0964) 11 (0,1358) Sumber: Lampiran 7
c. Status Pelaporan (X 3)
Adapun nilai probabilitas variabel status pelaporan data testing pertama pada setiap kelompok sebagai berikut:
Probabilitas variabel status pelaporan untuk status patuh membayar pajak dihitung sebagai berikut:
3
65 ( =Tepat Waktu | Patuh)
83
P X
0, 7831
Sehingga probabilitas variabel status pelaporan tepat waktu dengan syarat status patuh membayar pajak adalah sebesar 0,7831. Probabilitas variabel status pelaporan untuk status tidak patuh membayar pajak dihitung sebagai berikut:
3
53 ( =Tepat Waktu | Tidak Patuh)
81
P X
0, 6543
Sehingga probabilitas variabel status pelaporan tepat waktu dengan syarat status tidak patuh membayar pajak adalah sebesar 0,6543. Adapun nilai probabilitas variabel status pelaporan pada setiap kelompok dapat dilihat pada Tabel 4.4. Angka di dalam kurung menyatakan nilai probabilitas variabel status pelaporan.
Tabel 4.4 Probabilitas Variabel Status Pelaporan Pada Setiap Kelompok Status Pelaporan Status Pembayaran Pajak
Patuh Tidak Patuh
Tepat Waktu 65
(0,7831)
53 (0,6543) Tidak Tepat Waktu 18
(0,2169)
28 (0,3457)
3. Menghitung perkalian probabilitas prior dan probabilitas setiap variabel bebas pada setiap kelompok (posterior)
Tahap ketiga adalah menghitung perkalian probabilitas prior dan probabilitas posterior pada data testing. Pada data testing pertama diketahui wajib pajak badan memiliki pendapatan (X sebesar 1-10 Miliar Rupiah, bentuk badan 1)
2
(X berupa PT dan memiliki status pelaporan pajak ) (X3) tepat waktu. Adapun perhitungan perkalian probabilitas prior dan probabilitas posterior menggunakan Persamaan (2.7) sebagai berikut:
a. Kelompok pertama (wajib pajak badan dengan status patuh membayar pajak)
1 1 2 3 1 1 1 2 1 3 1
( | , , ) ( ) ( | ) ( | ) ( | )
P Y X X X P Y P X Y P X Y P X Y
1 2
(Patuh) ( 1-10 Miliar | Patuh) ( PT|
P P X P X
3
Patuh)P X( Tepat Waktu | Patuh)
0,5061 0, 2289 0, 4337 0, 7831
0, 0393
Sehingga dapat diketahui bahwa probabilitas wajib pajak yang berstatus patuh membayar pajak dengan syarat pendapatan sebesar 1-10 Miliar Rupiah, bentuk badan berupa PT dan status pelaporan tepat waktu adalah sebesar 0,0393.
b. Kelompok kedua (wajib pajak badan dengan status tidak patuh membayar pajak)
2 1 2 3 2 1 2 2 2 3 2
( | , , ) ( ) ( | ) ( | ) ( | )
P Y X X X P Y P X Y P X Y P X Y 1
(Tidak Patuh) ( 1 10 Miliar | Tidak Patuh)
P P X
2 3
( PT | Tidak Patuh) ( Tepat Waktu|
P X P X Tidak Patuh) = 0,4939 0,2469 0,3333 0,6543 0, 0266
Sehingga dapat diketahui bahwa probabilitas wajib pajak yang berstatus tidak patuh membayar pajak dengan syarat pendapatan sebesar 1-10 Miliar
Rupiah, bentuk badan berupa PT dan status pelaporan tepat waktu adalah sebesar 0,0266.
Setelah melakukan perhitungan probabilitas posterior pada kedua kelompok, dicari nilai maksimum pada kedua kelompok untuk menentukan hasil klasifikasi obyek. Berdasarkan hasil perhitungan dapat diketahui bahwa kelompok yang memiliki posterior terbesar adalah wajib pajak dengan kelompok status patuh membayar pajak, yaitu sebesar 0,0393 dibandingkan dengan posterior wajib pajak dengan kelompok status tidak patuh membayar pajak, yaitu sebesar 0,0266, sehingga dapat disimpulkan data testing pertama yaitu wajib pajak badan dengan pendapatan sebesar 1-10 Miliar Rupiah, bentuk badan berupa PT dan memiliki status pelaporan pajak tepat waktu diklasifikasikan masuk ke dalam kelompok pertama yaitu wajib pajak dengan status patuh membayar pajak. Nilai probabilitas posterior pada kedua kelompok untuk data testing lainnya dapat dilihat pada Lampiran 8.
4. Mengevaluasi Hasil Klasifikasi
Untuk mengevaluasi hasil klasifikasi pada metode naive Bayes dilakukan pengukuran tingkat akurasi dengan menghitung peluang kesalahan klasifikasi menggunakan APER. Pada proses klasifikasi, semakin kecil kesalahan klasifikasi menunjukkan bahwa semakin baik hasil klasifikasi yang didapatkan. Pada hasil klasifikasi, jumlah obyek yang tepat dan salah diklasifikasikan untuk masing-masing kelompok dapat dilihat pada Tabel 4.5. Tanda (*) pada angka-angka menyatakan jumlah obyek kelompok tertentu yang salah diklasifikasikan dengan menggunakan metode naive Bayes.
Tabel 4.5 Hasil Klasifikasi Metode Naive Bayes Klasifikasi Awal
Status Pembayaran Pajak
Prediksi Klasifikasi Metode Naive Bayes
Total Patuh Tidak Patuh
Patuh 15 5* 20
Tidak Patuh 2* 19 21
Total 17 24 41
Berdasarkan Tabel 4.5 dapat diketahui bahwa status pembayaran pajak pertambahan nilai di KPP Pratama Samarinda Ulu menggunakan metode naive Bayes diperoleh hasil yaitu dari 20 wajib pajak yang memiliki status patuh membayar PPN, terdapat 15 wajib pajak tepat diklasifikasikan memiliki status patuh membayar PPN dan 5 lainnya tidak tepat diklasifikasikan. Sedangkan dari 21 wajib pajak yang memiliki status tidak patuh membayar PPN, terdapat 19 wajib pajak tepat diklasifikasikan memiliki status tidak patuh membayar PPN dan 2 lainnya tidak tepat diklasifikasikan, sehingga berdasarkan Persamaan (2.11) maka diperoleh nilai APER sebagai berikut:
5 2 APER = 100% 41 7 100% 41 17, 07%
Jadi, nilai APER (laju error) pada hasil klasifikasi naive Bayes menggunakan data randomisasi ke-4 adalah sebesar 17,07%. Adapun nilai APER pada hasil klasifikasi menggunakan metode naive Bayes untuk semua percobaan randomisasi data disajikan pada Tabel 4.6 berikut:
Tabel 4.6 Nilai APER Pada Metode Naive Bayes untuk Setiap Percobaan Randomisasi Data
Randomisasi ke- APER
1 31,71% 2 29,27% 3 21,95% 4 17,07% 5 19,51% Sumber: Lampiran 7
Berdasarkan Tabel 4.6 dapat diketahui bahwa pada data randomisasi ke-4 mendapatkan nilai APER yang paling kecil, sehingga dapat disimpulkan dari semua percobaan randomisasi data, data randomisasi ke-4 dapat menghasilkan
ketepatan klasifikasi metode naive Bayes yang paling akurat. Selanjutnya data randomisasi ke-4 akan dicobakan pada metode K-NN untuk menentukan nilai K optimal.