34
BAB IV
HASIL PENELITIAN DAN PEMBAHASAN
A. Hasil Penelitian
Hasil penelitian ini bertujuan untuk mendapatkan nilai akurasi pada algoritma naïve bayes dalam kelayakan penerimaan beras miskin (raskin) dengan cara pengolahan data sampel. Hasil dari penelitian ini berupa proses perhitungan berdasarkan model naïve bayes dan perhitungan menggunakan cross validation, kemudian hasil perhitungan tersebut di implementasikan pada sebuah website.
B. Dataset
Sebelum masuk pada proses algoritma naïve bayes terlebih dahulu kita harus mengurutkan (sort & filter) data, jumlah data yang terkumpul sebanyak 205 record, sehingga dapat dilihat pada tabel dibawah ini sebagai berikut:
Tabel IV.1 Data Mentahan
No Nama Jenis Lantai Ruma h Jenis Dinding Rumah Penerangan Yang digunakan Pekerjaan Kepala Rumah Tangga Jumlah Penghasi lan Kepemili
kan Aset Kelayakan 1 Bpk Udin Papan Papan Listrik Pedagang Sedang Ada Tidak Layak 2 Ibu Santi Papan Papan Menyambu
ng Pedagang Rendah Ada Layak 3 Bpk
Sulaeman Bilik Bamb u
Papan Listrik Buruh Rendah tidak ada Layak
4 Bpk Acip
Bilik Bamb u
Papan Menyambu
ng Buruh Rendah Ada Layak 5 Bpk Sony Keram
ik Tembok Listrik PNS Tinggi Ada Tidak Layak 6 Ibu
Purnama
Keram
7 Ibu Eno Keramik Tembok Listrik Pensiun Tinggi Ada Tidak Layak 8 Bpk
Jarkasih Tembok Tembok Listrik Buruh Rendah tidak ada Layak 9 Bpk
Udem Papan Papan Listrik Buruh Tinggi Ada Tidak Layak 10 Bpk Yani Bilik
Bambu Papan Listrik Buruh Rendah tidak ada Layak 11 Ibu Emar Bilik Bambu Bilik Bambu Listrik Tidak
Bekerja Rendah tidak ada Layak 12 Bpk Ano Keramik Tembok Listrik Pensiun Tinggi Ada Tidak Layak 13 Bpk
Usman Keramik Tembok Listrik Buruh Tinggi Ada Tidak Layak 14 Bpk
Ahmad Tembok Papan Listrik Buruh Rendah tidak ada Layak 15 Bpk
Pajar Keramik Papan
Menyambu
ng Buruh Rendah tidak ada Layak 16 Bpk Ade Keramik Tembok Listrik Buruh Rendah tidak ada Layak 17 Bpk
Ahmad
Bilik
Bambu Papan Listrik Buruh Sedang Ada Tidak Layak 18 Bpk
Beben Tembok Tembok Listrik Pedagang Sedang tidak ada Layak 19 Bpk
Encep Keramik Tembok Listrik Buruh Tinggi Ada Tidak Layak 20 Bpk
Asep Tembok Tembok Listrik Buruh Rendah Ada Layak 21 Bpk
Jeki Keramik Tembok Listrik Buruh Rendah tidak ada Layak 22 Bpk
Suhanda Keramik Tembok Listrik Buruh Rendah Ada Layak 23 Bpk Beni Bilik Bambu Bilik Bambu Menyambun
g Buruh Rendah ada Layak
… ……….. ………. ………. ……….. ………. ………. ……….. ……….
205 Bpk
Vian Keramik Tembok
Menyambun
g Buruh Rendah Ada Layak
Sumber : Data Desa Bencoy (2020)
Berdasarkan tabel diatas maka dapat diberikan keterangan sebagai berikut: 1. Kriteria 1 menjelaskan tentang “Jenis Lantai Rumah”
2. Kriteria 2 menjelaskan tentang “Jenis Dinding Rumah”
3. Kriteria 3 menjelaskan tentang “Penerangan Yang Digunakan” 4. Kriteria 4 menjelaskan tentang “Pekerjaan Kepala Rumah Tangga” 5. Kriteria 5 menjelaskan tentang “Jumlah Penghasilan”
6. Kriteria 6 menjelaskan tentang “Kepemilikan Aset”
Proses perhitungan data training dari data yang telah diperoleh,variabel yang akan digunakan dalam klasifikasi kelayakan penerimaan beras miskin ini yaitu:
a. Nama
Ialah varibel yang tidak akan dilakukan perhitungan jenis kelayakannya. b. Jenis Lantai Rumah
Merupakan variabel yang dikategorikan kedalam kondisi rumah,kemudian dikelompokan menjadi 4 bagian yaitu: Papan,Bilik Bambu,Keramik,dan Tembok. c. Jenis Dinding Rumah
Merupakan variabel yang dikategorikan kedalam kondisi rumah,kemudian dikelompokan menjadi 3 bagian yaitu: Papan,Bilik Bambu, dan Tembok.
d. Penerangan Yang Digunakan
Merupakan variabel yang dikelompokan menjadi 2 bagian yaitu: Listrik dan Menyambung.
e. Pekerjaan Kepala Rumah Tangga
Merupakan variabel awalnya ada 2 kategori yaitu Laki-laki dan Perempuan,kepala rumah tangga Perempuan dikarenakan suami telah meninggal dunia. Kategori ini kemudian diubah berdasarkan pekerjaannya dan dikelompokan menjadi 8 yaitu: Pedagang,Petani,Buruh,PNS,Sopir,Pensiun,Dokter,dan Tidak Bekerja.
f. Jumlah Penghasilan
Merupakan variabel yang dikelompokan menjadi 3 bagian yaitu: Rendah,Sedang,dan Tinggi. Kriteria tersebut dapat dilihat pada tabel 4.2.
Tabel IV.2 Jumlah Penghasilan
Jumlah Penghasilan
Kriteria Keterangan
Rendah <Rp.1.000.0000
Sedang Rp.1.000.000-2.500.000
Tinggi > Rp. 2.500.000
g. Kepemilikan Aset
Merupakan variabel yang dikelompokan menjadi 2 bagian yaitu: Ada dan Tidak Ada. Variabel ini jika dilihat dari kelompok “Ada” maka dapat dijelaskan bahwa kepemilikan aset itu didapat dari aset tanah,aset kebun,dan aset kendaraan.
C. Algoritma Naïve Bayes
Pembuatan model naïve bayes dilakukan pada dataset yang terdiri dari 6 atribut predictor dan 1 atribut class yang merupakan hasil akhir prediksi. Diketahui jumlah data yang diuji adalah 205 record.
Langkah pertama yang dilakukan untuk mendapatkan nilai probabilitas adalah dengan cara menghitung jumlah dari masing-masing class berdasarkan atribut yang telah ditentukan dengan menggunakan menggunakan persamaan (2.1).
P(Kelayakan=”Layak”) = 116 : 205= 0.565853659 P(Kelayakan=”Tidak Layak”) = 89 : 205 = 0.434146341
Proses mendapatkan nilai probabilitas dari setiap atribut,maka harus menghitung semua atribut berdasarkan setiap kasus. Berikut merupakan contoh nilai probabilitas pada atribut Jenis Lantai Rumah:
P(Jenis Lantai Rumah = “≤ Papan”|Y=”Layak”) =0,060344828 P(Jenis Lantai Rumah = “≤Papan”|Y=”Tidak Layak”) = 0,033707865 P(Jenis Lantai Rumah = “≤ Bilik Bambu”|Y=” Layak”) = 0,181034483 P(Jenis Lantai Rumah = “≤ |Bilik Bambu=” Tidak Layak”) = 0,033707865 P(Jenis Lantai Rumah = “≤ Keramik=” Layak”) = 0,431034483
P(Jenis Lantai Rumah = “≤ Keramik=” Tidak Layak”) = 1 P(Jenis Lantai Rumah = “≤ Tembok=” Layak”) = 0,327586207 P(Jenis Lantai Rumah = “≤ Tembok=” Tidak Layak”) =0,112359551
Hasil dari perhitungan keseluruhan atribut perhitungan probabilitas dapat dilihat pada tabel IV.3 dibawah ini:
Tabel IV.3 Perhitungan Manual Probabilitas Algoritma Naïve Bayes
No Jenis Atribut
Jumlah Kasus Probabilitas
Total Layak Tidak
Layak P(X | Layak)
P(X | Tidak Layak)
Total Kasus 205 116 89 0,565853659 0,434146341
1
Jenis Lantai rumah
Papan 10 7 3 0,060344828 0,033707865
Bilik bambu 24 21 3 0,181034483 0,033707865
Keramik 123 50 73 0,431034483 0,820224719
Tembok 48 38 10 0,327586207 0,112359551
2
Jenis Dinding rumah
Papan 28 20 8 0,172413793 0,08988764
Bilik bambu 33 30 3 0,25862069 0,033707865
Keramik 144 66 78 0,568965517 0,876404494
3
Penerangan Yang Digunakan
Listrik 176 94 82 0,810344828 0,921348315
Menyambung 29 22 7 0,189655172 0,078651685
4
Pekerjaan Kepala Rumah Tangga
Pedagang 60 24 36 0,206896552 0,404494382 Buruh 81 52 29 0,448275862 0,325842697 PNS 6 0 6 0 0,06741573 Pensiun 9 0 9 0 0,101123596 Sopir 4 4 0 0,034482759 0 Dokter 1 0 1 0 0,011235955 Petani 17 9 8 0,077586207 0,08988764 Tidak Bekerja 27 27 0 0,232758621 0 5 Jumlah Penghasilan Sedang 64 18 46 0,155172414 0,516853933 Rendah 98 98 0 0,844827586 0 Tinggi 43 0 43 0 0,483146067 6 Kepemilikan Aset Ada 129 40 89 0,344827586 1 Tidak Ada 76 76 0 0,655172414 0
Hasil perhitungan nilai probabilitas di atas maka dapat dibuatkan model Naive Bayes dengan Framework Rapidminer 5 seperti gambar dibawah ini:
Gambar IV.1 Tahapan Pemodelan Algoritam Naïve Bayes
Berikut merupakan langkah-langkah dalam membuat tahap pemodelan pada gambar di atas:
1. Membuka Rapidminer 5 hingga muncul tampilan berikut:
2. Setelah itu, klik New untuk memulai proses pengujian baru, kemudian pilih operator Import-Data-Read Excel untuk membaca data dengan format .xls.
Gambar IV.3 Tampilan Operator
3. Kemudian dibagian parameter klik import configuration wizard untuk memilih dataset yang akan digunakan.
Gambar IV.4 Tampilan Parameter
Gambar IV.5 Menentukan Lokasi Dataset
4. Kemudian tentukan sheet yang digunakan, seperti gambar berikut:
Gambar IV.6 Menentukan Sheet yang akan digunakan
5. Kemudian Klik tombol finish.
6. Setelah itu pilih operator lainnya yang dibutuhkan seperti validation yang berada di pilihan operator kemudian dibagian validation tersebut diklik dua kali sehingga
terbuka dua kolom yang terbagi yaitu kolom traning dan testing dibagian traning masukan algoritmanya yaitu naïve bayes dan bagian testing masukan apply model dan performance. Bisa dilihat pada Gambar IV.1.
7. Selanjutnya menjalankan pemodelan diatas sehingga menghasilkan perhitungan probabilitas yang disebut dengan probabilitas prior seperti gambar dibawah ini:
Sumber : Hasil Analisa (2020)
Gambar IV.7 Hasil Perhitungan Probabilitas dengan Rapidminer
Hasil dari gambar tersebut dapat diketahui bahwa pemodelan ini menghasilkan dua class yaitu class tidak layak dengan nilai probabilitas 0.434 atau 43,4% dan class layak dengan nilai probabilitas 0,566 atau 56,6% sehingga ketika kedua class tersebut dijumlahkan akan menghasilkan nilai 100%. Nilai pobabilitas prior ini biasanya digunakan untuk menentukan class pada kasus yang baru. Contoh kasus dapat dilihat pada Tabel IV.4 dibawah ini:
Tabel IV.4 Contoh Kasus
Atribut Parameter Layak Tidak Layak
Jenis Lantai Rumah Papan 0,060344828 0,033707865
Jenis Dinding Rumah Papan 0,172413793 0,08988764
Penerangan Yang digunakan Listrik 0,810344828 0,921348315 Pekerjaan Kepala Keluarga Pedagang 0,206896552 0,404494382 Jumlah Penghasilan Sedang 0,155172414 0,516853933
Kepemilikan Aset Ada 0,344827586 1
Setelah diketahui nilai probabilitas setiap atribut atau kriteria terhadap probabilitas tiap kelas atau P(X|Ci), maka langkah selanjutnya adalah menghitung total keseluruhan probabilitas tiap kelas. Perhitungan ini disesuaikan dengan contoh kasus pada tabel di atas.
P(X|Ci) : P(X|hasil= Layak)
= 0,060344828* 0,172413793* 0,810344828* 0,206896552*0,155172414 *0,344827586= 9,33365E-05
P(X|Ci) : P(X|hasil= Tidak Layak)
= 0,033707865* 0,08988764* 0,921348315*0,404494382* 0,516853933*1 = 0,000583627
P(X|Pi) : P(X|hasil= Layak) P(Layak)
= 9,33365E-05* 0.565853659 = 5,28148E-05
P(X|hasil= Tidak Layak) P(Tidak Layak)
= 0,000583627* 0.434146341= 0,00025338
Penyelesaian perhitungan probabilitas dapat dilihat pada gambar IV.8 dibawah ini:
Sumber : Hasil Analisa (2020)
Hasil dari perhitungan tersebut dapat diketahui nilai P(X| Layak) sebesar 5,28148E-05,sedangkan nilai P(X| Tidak Layak) adalah 0,00025338. Artinya nilai P(X| Layak) lebih kecil dari nilai P(X|Tidak Layak), sehingga dapat disimpulkan bahwa untuk kasus tersebut akan masuk kedalam klasifikasi kelas Tidak Layak.
D. Hasil Pengujian Model Naïve Bayes
Hasil dari uji coba yang dilakukan yaitu untuk menghasilkan nilai accuracy dan nilai AUC (Area Under Curve).
1. Evaluasi Model Dengan Confusion Matrix
Model confusion matrix akan membentuk matrix yang terdiri dari true positive, true negative, false positive, dan false negative. Di bawah ini merupakan gambaran dari hasil confusion matrix yang diperoleh dari pengujian pada data testing:
Sumber : Hasil Analisa (2020)
Gambar IV.9 Nilai Confusion Matrix
Berdasarkan gambar diatas terdapat rincian jumlah True Positive (TP) 83, False Negative (FN) 1, False Positive (FP) adalah 6 dan True Negative (TN) 115. Data tersebut maka dapat dihitung nilai accuracy,pression, sensitvity, specifity, PPV dan NPV. Data hasil olahan dapat dilihat pada gambar IV.6, dan gambar IV.7.
Secara manual data tersebut dapat dihitung menggunakan persamaan (2.3), (2.4), (2.5), (2.6), (2.7) sebagai berikut:
Specificity = = 0,9504
PPV = = 0,93258 dibulatkan 0,9326
NPV = = 0,99137 dibulatkan 0,9914
Accuracy = = = 0,96585 dibulatkan 0,9659
2. Evaluasi dengan ROC Curve
Hasil pengujian terhadap data testing menggunakan algoritma naïve bayes menghasilkan nilai AUC dalam grafik ROC yang dapat diketahui pada gambar di bawah ini:
Sumber : Hasil Analisa (2020)
Gambar IV.10 Nilai AUC Algoritma Naïve Bayes dalam Grafik ROC
Berdasarkan nilai AUC sebesar 0.999 yang ditunjukan gambar di atas dan ketika angka kurva tersebut dibulatkan akan menjadi 100 maka akurasi memiliki ini tingkat klasifikasi sangat baik.
E. Pengembangan Aplikasi
Berdasarkan hasil pengujian dengan algoritma naïve bayes diperoleh nilai probabilitas yang akan dikembangkan menjadi sebuah program. Program tersebut akan dikembangkan menggunakan bahasa pemrograman PHP dan MySQL berbasis website.
Pengujian model aplikasi dilakukan dengan menggunakan salah satu contoh kasus yang ada pada Tabel IV.4.
Sumber : Hasil Implementasi Analisa (2020).
Gambar IV.12 Implementasi Model Algoritma Naïve Bayes F. Analisis Hasil Pengujian Aplikasi
Analisis hasil pengujian aplikasi ini dilakukan untuk membandingkan hasil data yang ada dengan prediksi yang didapat pada aplikasi dari implementasi model yang telah dibuat. Pengujian ini dilakukan dengan memprediksi kasus yang sama pada Tabel IV.4 yang menunjukan hasil sebagai berikut:
Sumber : Hasil Implementasi Analisa (2020).
Gambar IV.13
Gambar IV.13 menunjukkan hasil yang diperoleh dari pengujian pada aplikasi. Berdasarkan pengujian tersebut, dapat dilihat bahwa prediksi yang dihasilkan oleh aplikasi sudah sama dengan data yang terdapat pada Tabel IV.3
Aplikasi yang dihasilkan kelayakan penerimaan bantuan beras miskin ini, bisa dapat membantu pegawai Desa Bencoy dalam memudahkan penentuan kelayakan penerimaan bantuan beras miskin.