Klasifikasi Naive Bayes - HASIL DAN PEMBAHASAN

BAB 4 HASIL DAN PEMBAHASAN

4.3 Klasifikasi Naive Bayes

Pada proses klasifikasi metode naive Bayes terdapat tiga alur yaitu menghitung probabilitas prior, menghitung probabilitas setiap variabel bebas pada setiap kelompok dan menghitung perkalian probabilitas prior dan probabilitas variabel bebas pada setiap kelompok. Adapun data yang digunakan untuk perhitungan klasifikasi adalah menggunakan data training 80% sebanyak 164 data, sedangkan data testing 20% sebanyak 41 data. Pada kali ini akan diberikan contoh perhitungan menggunakan data randomisasi ke 4. Adapun tahapan-tahapan klasifikasi metode naive Bayes dalam pengklasifikasian status pembayaran pajak sebagai berikut:

1. Menghitung probabilitas prior (awal) setiap kelompok

Tahapan klasifikasi metode naive Bayes yang pertama yaitu menghitung probabilitas prior pada kedua kelompok menggunakan data training. Adapun nilai probabilitas prior setiap kelompok menggunakan Persamaan (2.4) sebagai berikut:

a. Kelompok pertama (wajib pajak badan dengan status patuh membayar PPN)

Pada 164 data training yang ada, terdapat 83 wajib pajak badan yang berstatus patuh membayar pajak, sehingga nilai probabilitas prior kelompok pertama sebagai berikut:

1 83 ( ) 164 P Y  0,5061 

Jadi, probabilitas prior wajib pajak badan dengan status patuh membayar PPN adalah sebesar 0,5061.

b. Kelompok kedua (wajib pajak badan dengan status tidak patuh membayar PPN)

Pada 164 data training yang ada, terdapat 81 wajib pajak badan dengan status tidak patuh membayar pajak, sehingga nilai probabilitas prior kelompok kedua sebagai berikut:

2 81 ( ) 164 P Y  0, 4939 

Jadi, probabilitas prior wajib pajak badan dengan status tidak patuh membayar PPN adalah sebesar 0,4939. Adapun nilai probabilitas prior wajib pajak badan pada setiap kelompok dapat dilihat pada Tabel 4.1.

Tabel 4.1 Probabilitas Prior Pada Setiap Kelompok Status Pembayaran PPN Jumlah Probabilitas

Patuh 83 0,5061

Tidak Patuh 81 0,4939

2. Menghitung probabilitas setiap variabel bebas pada setiap kelompok Perhitungan nilai probabilitas setiap variabel bebas pada kedua kelompok dilakukan pada data testing berdasarkan data training. Pada data testing pertama diketahui wajib pajak badan memiliki pendapatan (X sebesar 1-10 ₁) Miliar Rupiah, bentuk badan (X berupa PT dan memiliki status pelaporan ₂) pajak (X tepat waktu, sehingga perhitungan nilai probabilitas setiap variabel ₃) bebas pada kedua kelompok menggunakan Persamaan (2.6) sebagai berikut: a. Pendapatan (X ₁)

Adapun nilai probabilitas variabel pendapatan data testing pertama pada setiap kelompok sebagai berikut :

Probabilitas variabel pendapatan untuk status patuh membayar pajak dihitung sebagai berikut:

1 19 ( =1-10 Miliar | Patuh) 83 P X  0, 2289 

Sehingga probabilitas variabel pendapatan sebesar 1-10 Miliar Rupiah dengan syarat status patuh membayar pajak adalah sebesar 0,2289. Probabilitas variabel pendapatan untuk status tidak patuh membayar pajak dihitung sebagai berikut:

1 20 ( =1-10 Miliar | TidakPatuh) 81 P X  0, 2469 

Sehingga probabilitas variabel pendapatan sebesar 1-10 Miliar Rupiah dengan syarat status tidak patuh membayar pajak adalah sebesar 0,2469. Adapun nilai probabilitas variabel pendapatan pada setiap kelompok dapat dilihat pada Tabel 4.2. Angka di dalam kurung menyatakan nilai probabilitas variabel pendapatan.

Tabel 4.2 Probabilitas Variabel Pendapatan Pada Setiap Kelompok Pendapatan ^{Status Pembayaran Pajak}

Patuh Tidak Patuh < 100 Juta ³⁵ (0,4217) 30 (0,3704) 100 – 500 Juta ⁸ (0,0964) 16 (0,1975) 500 Juta – 1 Miliar ⁹ (0,1084) 8 (0,0988) 1 – 10 Miliar ¹⁹ (0,2289) 20 (0,2469) > 10 Miliar ¹² (0,1446) 7 (0,0864) Sumber: Lampiran 7 b. Bentuk Badan (X ₂)

Adapun nilai probabilitas variabel bentuk badan data testing pertama pada setiap kelompok sebagai berikut:

Probabilitas variabel bentuk badan untuk status patuh membayar pajak dihitung sebagai berikut:

2 36 ( =PT | Patuh) 83 P X  0, 4337 

Sehingga probabilitas variabel bentuk badan berupa PT dengan syarat status patuh membayar pajak adalah sebesar 0,4337. Probabilitas variabel bentuk badan untuk status tidak patuh membayar pajak dihitung sebagai berikut: 2 27 ( =PT | Tidak Patuh) 81 P X  0,3333 

Sehingga probabilitas variabel bentuk badan berupa PT dengan syarat status tidak patuh membayar pajak adalah sebesar 0,3333. Adapun nilai probabilitas variabel bentuk badan pada setiap kelompok dapat dilihat pada Tabel 4.3. Angka di dalam kurung menyatakan nilai probabilitas variabel bentuk badan.

Tabel 4.3 Probabilitas Variabel Bentuk Badan Pada Setiap Kelompok Bentuk Badan ^{Status Pembayaran Pajak}

Patuh Tidak Patuh

PT ³⁶ (0,4337) 27 (0,3333) CV ³⁶ (0,4337) 30 (0,3704) BUMN/BUMD ⁰ (0,0000) 7 (0,0864) Koperasi ³ (0,0361) 6 (0,0741) Lainnya ⁸ (0,0964) 11 (0,1358) Sumber: Lampiran 7

c. Status Pelaporan (X ₃)

Adapun nilai probabilitas variabel status pelaporan data testing pertama pada setiap kelompok sebagai berikut:

Probabilitas variabel status pelaporan untuk status patuh membayar pajak dihitung sebagai berikut:

65 ( =Tepat Waktu | Patuh)

P X 

0, 7831



Sehingga probabilitas variabel status pelaporan tepat waktu dengan syarat status patuh membayar pajak adalah sebesar 0,7831. Probabilitas variabel status pelaporan untuk status tidak patuh membayar pajak dihitung sebagai berikut:

53 ( =Tepat Waktu | Tidak Patuh)

P X 

0, 6543



Sehingga probabilitas variabel status pelaporan tepat waktu dengan syarat status tidak patuh membayar pajak adalah sebesar 0,6543. Adapun nilai probabilitas variabel status pelaporan pada setiap kelompok dapat dilihat pada Tabel 4.4. Angka di dalam kurung menyatakan nilai probabilitas variabel status pelaporan.

Tabel 4.4 Probabilitas Variabel Status Pelaporan Pada Setiap Kelompok Status Pelaporan ^{Status Pembayaran Pajak}

Patuh Tidak Patuh

Tepat Waktu ⁶⁵

(0,7831)

53 (0,6543) Tidak Tepat Waktu ¹⁸

(0,2169)

28 (0,3457)

3. Menghitung perkalian probabilitas prior dan probabilitas setiap variabel bebas pada setiap kelompok (posterior)

Tahap ketiga adalah menghitung perkalian probabilitas prior dan probabilitas posterior pada data testing. Pada data testing pertama diketahui wajib pajak badan memiliki pendapatan (X sebesar 1-10 Miliar Rupiah, bentuk badan ₁)

(X berupa PT dan memiliki status pelaporan pajak ) (X₃) tepat waktu. Adapun perhitungan perkalian probabilitas prior dan probabilitas posterior menggunakan Persamaan (2.7) sebagai berikut:

a. Kelompok pertama (wajib pajak badan dengan status patuh membayar pajak)

1 1 2 3 1 1 1 2 1 3 1

( | , , ) ( ) ( | ) ( | ) ( | )

P Y X X X P Y P X Y P X Y P X Y

1 2

(Patuh) ( 1-10 Miliar | Patuh) ( PT|

P P X P X

    

Patuh)P X( Tepat Waktu | Patuh)

0,5061 0, 2289 0, 4337 0, 7831

   

0, 0393



Sehingga dapat diketahui bahwa probabilitas wajib pajak yang berstatus patuh membayar pajak dengan syarat pendapatan sebesar 1-10 Miliar Rupiah, bentuk badan berupa PT dan status pelaporan tepat waktu adalah sebesar 0,0393.

b. Kelompok kedua (wajib pajak badan dengan status tidak patuh membayar pajak)

2 1 2 3 2 1 2 2 2 3 2

( | , , ) ( ) ( | ) ( | ) ( | )

P Y X X X P Y P X Y P X Y P X Y 1

(Tidak Patuh) ( 1 10 Miliar | Tidak Patuh)

P P X

   

2 3

( PT | Tidak Patuh) ( Tepat Waktu|

P X P X     Tidak Patuh) = 0,4939 0,2469 0,3333 0,6543   0, 0266 

Sehingga dapat diketahui bahwa probabilitas wajib pajak yang berstatus tidak patuh membayar pajak dengan syarat pendapatan sebesar 1-10 Miliar

Rupiah, bentuk badan berupa PT dan status pelaporan tepat waktu adalah sebesar 0,0266.

Setelah melakukan perhitungan probabilitas posterior pada kedua kelompok, dicari nilai maksimum pada kedua kelompok untuk menentukan hasil klasifikasi obyek. Berdasarkan hasil perhitungan dapat diketahui bahwa kelompok yang memiliki posterior terbesar adalah wajib pajak dengan kelompok status patuh membayar pajak, yaitu sebesar 0,0393 dibandingkan dengan posterior wajib pajak dengan kelompok status tidak patuh membayar pajak, yaitu sebesar 0,0266, sehingga dapat disimpulkan data testing pertama yaitu wajib pajak badan dengan pendapatan sebesar 1-10 Miliar Rupiah, bentuk badan berupa PT dan memiliki status pelaporan pajak tepat waktu diklasifikasikan masuk ke dalam kelompok pertama yaitu wajib pajak dengan status patuh membayar pajak. Nilai probabilitas posterior pada kedua kelompok untuk data testing lainnya dapat dilihat pada Lampiran 8.

4. Mengevaluasi Hasil Klasifikasi

Untuk mengevaluasi hasil klasifikasi pada metode naive Bayes dilakukan pengukuran tingkat akurasi dengan menghitung peluang kesalahan klasifikasi menggunakan APER. Pada proses klasifikasi, semakin kecil kesalahan klasifikasi menunjukkan bahwa semakin baik hasil klasifikasi yang didapatkan. Pada hasil klasifikasi, jumlah obyek yang tepat dan salah diklasifikasikan untuk masing-masing kelompok dapat dilihat pada Tabel 4.5. Tanda (*) pada angka-angka menyatakan jumlah obyek kelompok tertentu yang salah diklasifikasikan dengan menggunakan metode naive Bayes.

Tabel 4.5 Hasil Klasifikasi Metode Naive Bayes Klasifikasi Awal

Status Pembayaran Pajak

Prediksi Klasifikasi Metode Naive Bayes

Total Patuh Tidak Patuh

Patuh 15 5* 20

Tidak Patuh 2* 19 21

Total 17 24 41

Berdasarkan Tabel 4.5 dapat diketahui bahwa status pembayaran pajak pertambahan nilai di KPP Pratama Samarinda Ulu menggunakan metode naive Bayes diperoleh hasil yaitu dari 20 wajib pajak yang memiliki status patuh membayar PPN, terdapat 15 wajib pajak tepat diklasifikasikan memiliki status patuh membayar PPN dan 5 lainnya tidak tepat diklasifikasikan. Sedangkan dari 21 wajib pajak yang memiliki status tidak patuh membayar PPN, terdapat 19 wajib pajak tepat diklasifikasikan memiliki status tidak patuh membayar PPN dan 2 lainnya tidak tepat diklasifikasikan, sehingga berdasarkan Persamaan (2.11) maka diperoleh nilai APER sebagai berikut:

5 2 APER = 100% 41  _ 7 100% 41   17, 07% 

Jadi, nilai APER (laju error) pada hasil klasifikasi naive Bayes menggunakan data randomisasi ke-4 adalah sebesar 17,07%. Adapun nilai APER pada hasil klasifikasi menggunakan metode naive Bayes untuk semua percobaan randomisasi data disajikan pada Tabel 4.6 berikut:

Tabel 4.6 Nilai APER Pada Metode Naive Bayes untuk Setiap Percobaan Randomisasi Data

Randomisasi ke- APER

1 31,71% 2 29,27% 3 21,95% 4 17,07% 5 19,51% Sumber: Lampiran 7

Berdasarkan Tabel 4.6 dapat diketahui bahwa pada data randomisasi ke-4 mendapatkan nilai APER yang paling kecil, sehingga dapat disimpulkan dari semua percobaan randomisasi data, data randomisasi ke-4 dapat menghasilkan

ketepatan klasifikasi metode naive Bayes yang paling akurat. Selanjutnya data randomisasi ke-4 akan dicobakan pada metode K-NN untuk menentukan nilai K optimal.

Dalam dokumen SKRIPSI. Fatihah Noor Ramaulidyah NIM (Halaman 44-52)