Perbandingan Metode
Naive Bayes
dan
K-Nearest Neighbor
untuk Prediksi Perceraian
(Studi Kasus : Pengadilan Agama Cimahi)
Irma Apriliani Dahlia
1, Mohamad Irfan
2, Wisnu Uriawan
3Jurusan Teknik Informatika, Fakultas Sains dan Teknologi UIN SGD Bandung
Jl.A.H Nasution 105 Bandung 40614
1
irmaaprilia18@gmail.com
,
2irfan.bahaf@uinsgd.ac.id
,
3wisnu_u@uinsgd.ac.id
Abstract- Divorce in Cimahi Religious Courts have continued to rise each year, each month receives an average of 800 cases of divorce, of the 800 cases, 75% of divorce cases households, while the remaining other matters, such as marriage and inheritance confirmation. Based on these problems need for action in the form of a prediction to determine how many divorces every month. One suitable data processing techniques in helping the process of prediction occurrence of a divorce by using data mining techniques such as Naive Bayes algorithm and K-Nearest Neighbor. This algorithm has a high accuracy rate in predicting. This level of accuracy is best in between the two algorithms can be determined by doing a comparison. Comparison of algorithms aims to get the best algorithms considered in the process of predicting an issue, after making a comparison it can be concluded that Naive Bayes algorithm resulted in a 72.5% accuracy and K-Nearest neigbor algorithm produces an accuracy of 57.5%.
Keywords- Comparison, Predicts Divorce, Naive Bayes, K-Nearest Neighbor.
Abstrak- Perceraian di Pengadilan Agama Cimahi setiap tahun terus mengalami kenaikan, setiap bulannya rata-rata menerima 800 perkara cerai, dari 800 perkara tersebut, 75% perkara perceraian rumah tangga, sedangkan sisanya perkara lain, seperti nikah isbat dan waris. Berdasarkan masalah tersebut perlu adanya tindakan berupa prediksi untuk mengetahui seberapa banyak perceraian disetiap bulannya. Salah satu teknik pengolahan data yang cocok dalam membantu proses prediksi terjadinya suatu perceraian yaitu dengan menggunakan teknik data mining seperti algoritma Naive Bayes dan K-Nearest Neighbor. Algoritma ini memiliki tingkat akurasi yang tinggi dalam memprediksi. Tingkat akurasi yang terbaik di antara kedua algoritma ini dapat diketahui dengan cara melakukan perbandingan. Perbandingan algoritma bertujuan untuk mendapatkan algoritma yang dianggap paling baik pada proses memprediksi suatu permasalahan, setelah melakukan perbandingan maka dapat disimpulkan bahwa algoritma Naive Bayes menghasilkan akurasi 72,5% dan algoritma K-Nearest Neigbor menghasilkan akurasi 57,5%.
Kata Kunci- Perbandingan, Prediksi Perceraian, Naive Bayes, K-Nearest Neighbor.
I. PENDAHULUAN
Pernikahan dalam pandangan Islam merupakan sesuatu yang sakral, bermakna ibadah kepada Allah, mengikuti sunnah Rasulullah dan dilaksanakan atas dasar keikhlasan, tanggung jawab, dan mengikuti ketentuan-ketentuan hukum yang harus diindahkan. Sedangkan tujuan pernikahan sebagaimana difirmankan Allah SWT dalam surat Ar-Rum ayat 21 yang artinya “Dan di antara
tanda-tanda kekuasaan-Nya ialah Dia menciptakan untukmu isteri-isteri dari jenismu sendiri, supaya kamu cenderung dan merasa tenteram kepadanya dan dijadikan-Nya di antaramu rasa kasih dan sayang. Sesungguhnya pada yang demikian itu benar-benar terdapat tanda-tanda bagi kaum yang berfikir”.
Namun tidak dapat dipungkiri perbedaan-perbedaan dalam pernikahan sering menimbulkan pertengkaran antar suami istri. Munculnya berbagai permasalahan dalam pernikahan, seperti lingkungan, perselingkuhan, masalah anak, masalah ekonomi, usia mereka saat menikah, itu
dapat mengguncangkan sebuah pernikahan. Menurut salah satu media online [1], perceraian di wilayah Kabupaten Bandung, Kota Cimahi, setiap tahun terus mengalami kenaikan. Berdasarkan data dari Kantor Pengadilan Agama Cimahi yang membawahi daerah tersebut, sejak 2014 lalu, perkara perceraian yang ditangani rata-rata naik 25 persen. Panitera Pengadilan Agama Cimahi, Saefuloh mengatakan, setiap bulan rata-rata pihaknya menerima 800 perkara. Dari 800 perkara tersebut, 75 persen di antaranya adalah perkara perceraian rumah tangga. Sedangkan sisanya perkara lain, seperti nikah isbat, waris dan lainnya.
yang sering digunakan adalah Naive Bayes dan K-Nearest Neighbor. Algoritma Naive Bayes merupakan pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu kelas [3]. Sedangkan K-Nearest Neighbor mencari jarak terdekat antara data yang akan dievaluasi dengan data kasus sebelumnya [4]. Dari kedua metode tersebut perlu adanya perbandingan untuk mengetahui metode mana yang paling baik diantaranya sehingga pada proses prediksi akan lebih efektif, dan akurat.
Sehubungan dengan hal tersebut, maka dalam penelitian ini peneliti mengambil judul “Perbandingan
Metode Naive Bayes Dan K-Nearest Neighbor Untuk
Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi)”
II. METODE PENELITIAN
Metode pengembangan perangkat lunak yang digunakan penulis sebagai kerangka dalam penilitian dengan studi kasus ini adalah model prototype. Prototype merupakan suatu metode dalam pengembangan sistem yang cocok digunakan untuk tingkat penelitian yang masih baru dan ruang lingkup kecil [5].
Gambar 1.1 Prototype
A. DATA MINING
Secara sederhana, data mining mengacu pada
penggalian atau “mining” pengetahuan dari sejumlah data
yang besar. Data mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan menempatkan data mining di bidang ilmu mana karena data mining melibatkan integrasi teknik dari berbagai disiplin ilmu. Ada pihak yang berpendapat bahwa data mining tidak lebih dari
machine learning atau analisa statistik yang berjalan di atas database. Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge Discovery in Databases (KDD) [4]
B. NAIVE BAYES
Metode Naive Bayes adalah pengklasifikasian statistik yang dapat digunakan untuk memprediski probabilitas keanggotaan suatu class. Naive Bayes didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan decesion tree dan neural network. Naive Bayes terbukti memiliki akurasai dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar [3].
𝑃(𝐻|𝑋) =P(X|H). P(H)P(X)
P(H) : Probabilitas hipotesis H (probabilitas)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis H
P(X) : Probabilitas dari X C. K-NEAREST NEIGBOR
Metode K-Nearest Neighbor adalah metode pencarian kedekatan antara kasus baru dengan kasus lama berdasarkan pada pencocokan bobot dari beberapa atribut yang sudah ditentukan sebelumnya. Misalkan diinginkan untuk mencari solusi terhadap seorang pasien baru dengan menggunakan solusi dari pasien terdahulu. Untuk mencari kasus pasien mana yang akan digunakan, maka dihitung kedekatan kasus pasien baru dengan semua kasus pasien lama. Kasus pasien lama dengan kedekatan terbesar yang akan diambil sebagai solusi pada kasus pasien baru [6].
f : fungsi similarity atribut i antarakasus T dan kasus S
w : bobot yang diberikan pada atribut ke-i D. PENGUJIAN AKURASI
Confusion matrix adalah tool yang digunakan untuk evaluasi model klasifikasi untuk memperkirakan objek yang benar atau salah. Sebuah matrix dari prediksi yang akan dibandingkan dengan kelas yang asli dari inputan atau dengan kata lain berisi informasi nilai aktual dan prediksi [7]. Dengan perhitungan :
Accuracy = jumlah data keseluruhan jumlah nilai yang benar 𝑥 100%
III.HASIL DAN PEMBAHASAN
Objek penelitian ini yaitu data perceraian yang di ambil dari Pengadilan Agama Cimahi, dimana data training maupun data testing terdiri dari beberapa atribut seperti usia penggugat, usia tergugat, lama perkawinan, usia anak dan indikator. Hal ini akan menjadi satu kesatuan dalam pemrosesannya.
Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi)
184
Pada penelitian ini menggunakan data kasus perkara cerai yang diambil dari Pengadilan Agama Cimahi tahun 2016 [8]. Salah satu contoh kasus perkara yang diambil dari Pengadilan Agama Cimahi seperti pada Tabel dibawah ini.
Tabel 3.1 Data Penelitian Naive Bayes
B. PENGELOMPOKAN ATRIBUT
Pengelompokan ini bertujaun untuk mempermudah perhitungan dalam proses pengambilan keputusan bagi calon penggugat sebelum melakukan sidang perkara yang disajikan kedalam bentuk beberapa tabel berikut ini :
Tabel 3.2 Pengelompokan Usia Pengugugat
Tabel 3.3 Pengelompokan Usia Tergugat
Tabel 3.4 Pengelompokan Lama Perkawinan
Tabel 3.5 Pengelompokan Jumlah Anak
Tabel 3.6 Pengelompokan Indikator
C. KASUS BARU
Tabel 3.7 Contoh Kasus Baru
D. PROSES PERHITUNGAN KEMIRIPANN KASUS 1. Menghitung jumlah class atau label
Tentukan P(Y=CERAI) sebagai probabilitas orang yang cerai dan P(Y=TIDAK) sebagai probabilitas orang yang tidak cerai.
2. Menghitung jumlah kasus yang sama dengan class yang sama Jumlah data P(X|Y=CERAI) dengan
keterangan “CERAI” dibagi jumlah data CERAI dan
Jumlah data P(X|Y=TIDAK) dengan keterangan
“TIDAK” dibagi jumlah data TIDAK.
4. Bandingkan hasil class CERAI dan TIDAK Karena hasil (P|TIDAK) lebih besar dari (P|CERAI) maka keputusanya adalah “TIDAK”
E. CONTOH PERHITUNGAN KNN
Tabel 3.8 Contoh Kasus Baru
Kemudian dari data kasus yang sudah ada dicari nilai kedekatan dari usia tergugat, usia penggugat, lama perkawinan, jumlah anak, indikator dapat dilihat pada tabel berikut :
Tabel 3.9 Data Penelitian KNN
F. PEMBOBOTAN VARIABEL
Pembobotan ini bertujuan untuk mempermudah perhitungan dalam proses pengambilan keputusan nilai kasus lama dan kasus baru. Bobot jarak ini diberikan nilai antara 0 sampai dengan 1. Nilai 0 artinya jika atribut tidak berpengaruh dan sebaliknya nilai 1 jika atribut sangat berpengaruh.
Bobot satu atribut dengan atribut lain pada atribut bukan tujuan dapat didefinisikan dengan nilai berbeda yang disajikan kedalam bentuk beberapa tabel berikut ini :
Tabel 3.10 Pembobotan
G. KEDEKATAN VARIABEL
Kedekatan antara nilai-nilai dalam variabel juga perlu didefinisikan. Berikut adalah kedekatan antara nilai-nilai dalam variabel yang didefinisikan, yaitu :
a. Kedekatan Nilai Variabel Usia Penggugat
Berikut ini adalah kedekatan nilai variabel Usia Penggugat.
Tabel 3.11 Kedekatan Usia Pengugat
b. Kedekatan Nilai Variabel Usia Tergugat
Berikut ini model kedekatan nilai variabel Usia Tergugat didefinisikan :
Tabel 3.12 Kedekatan Usia Tergugat
c. Kedekatan Nilai Variabel Lama Perkawinan
Berikut ini adalah model kedekatan nilai variabel Lama Perkawinan yang didefinisikan :
Tabel 3.13 Kedekatan Lama Perkawinan
d. Kedekatan Nilai Variabel Jumlah Anak
Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi)
186
Tabel 3.14 Kedekatan Jumlah Anak
e. Kedekatan Nilai Variabel Indikator
Berikut ini adalah model kedekatan nilai variabel Indikator yang didefinisikan :
Tabel 3.15 Kedekatan Indikator
H. PROSES PERHITUNGAN KEMIRIPAN KASUS Untuk mencari kemiripannya antara kasus lama dan kasus baru. Sebelum melakukan perhitungan, untuk mempermudah dan mengefisienkan penulisan rumus maka dilakukan pendefinisian variabel sebagai berikut : NK = Nilai Kedekatan Kasus
NB = Nilai Bobot
NK = Kedekatan status usia penggugat kasus baru terhadap kasus lama NB = Bobot status usia penggugat NK = Kedekatan status usia tergugat
kasus baru terhadap kasus lama NK = Bobot status usia tergugat
NB = Kedekatan status lama perkawinan kasus baru terhadap kasus lama NK = Bobot status lama perkawinan NB = Kedekatan status jumlah anak kasus baru terhadap kasus lama NK = Bobot status jumlah anak NB = Kedekatan status indikator kasus baru terhadap kasus lama NK = Bobot status indikator S = Jarak
Berikut adalah proses perhitungan untuk mencari
similarity nya : Kasus K1
Kedekatan status usia penggugat kasus baru terhadap kasus lama = 0.666
Bobot status usia penggugat = 0.6
Kedekatan status usia tergugat kasus baru terhadap kasus lama = 0.399
Bobot status usia tergugat= 0.6
Kedekatan status lama perkawian kasus baru terhadap kasus lama = 0.833
Bobot status lama perkawinan = 0.4
Kedekatan status jumlah anak kasus baru terhadap kasus lama = 0.5
Bobot status jumlah anak = 0.2
Kedekatan status indikator kasus baru terhadap kasus lama = 0.571
Bobot status indikator = 0.8
= (0.666𝑥0.6) + (0.399𝑥0.6) + (0.833𝑥0.4) + (0.5𝑥0.2) + (0.571𝑥08)0.6 + 0.6 + 0.4 + 0.2 + 0.8
= 1.5442.6
= 0.593
Perhitungan seperti diatas berlaku sampai kasus ke 7, sehingga didapatkan hasil, dapat dilihat pada tabel berikut :
Tabel 3.12 Hasil perhitungan K1-K7
I. PERBANDINGAN AKURASI
Pada pengujian akurasi menggunakan dua kali percobaan dengan 20 data testing yang berbeda, 130 data training yang sama. Data tersebut akan diuji untuk mengetahui akurasi yang dihasilkan oleh algoritma Naive Bayes dan K-Nearest Neighbor, kemudian akan di analisa sehingga bisa diketahui jumlah benar dan salah saat melakukan prediksi pada data testing dapat dilihat pada tabel berikut :
Tabel 3.13 Uji Perhitungan Akurasi 1
Tabel 3.14 Uji Perhitungan Akurasi 2
Dari dua kali percobaan membandingkan algoritma
Naive Bayes dan K-Nearest Neighbor. Untuk memprediksi perceraian di Pengadilan Agama Cimahi dengan 20 data testing yang berbeda dihasilkan presentase keakurasian yang berberbeda pula.
J. HASIL
IV.KESIMPULAN DAN SARAN A. KESIMPULAN
Berdasarkan penelitian yang telah dilakukan diatas, maka dapat disimpulkan sebagai berikut :
1. Kinerja algoritma Naive Bayes pada saat melakukan prediksi tidak membutuhkan waktu lama karena memiliki kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar dan perhitungan manualnya tidak rumit, sedangkan pada algoritma K-Nearest Neighbor membutuhkan waktu cukup lama karena diperlukan perhitungan jarak dari tiap kasus baru pada keseluruhan kasus lama dan perhitungan manualnya lumayan cukup rumit. 2. Algoritma Naive Bayes dan K-Nearest Neighbor
untuk prediksi perceraian di Pengadilan Agama Cimahi menghasilkan akurasi 72,5% untuk algoritma niave bayes dan 57,5% untuk algoritma K-Nearest Neighbor dengan menggunkan 20 data testing dan 130 data training, maka algoritma Naive Bayes tepat untuk melakukan prediksi perceraian di Pengadilan Agama Cimahi.
B. SARAN
Untuk meningkatkan kinerja dan menyempurnakan penelitian yang telah dibuat, maka ada saran untuk pengembangan sistem sejenis sebagai berikut :
1. Diharapkan dapat membandingkkan dengan algoritma yang lain seperti Decesion Tree atau
Neural Network agar dapat mengetahuan algoritma yang lebih baik dalam proses memprediksi perceraian pada Pengadilan Agama Cimahi.
V. REFERENSI
[1] “Berita Perceraian Wilayah KBB.” [Online]. Available:
http://www.materikelas.com/2015/09/nikah-pengertian-hukum-rukun-dan syarat.html# / diakses pada tanggal 15/04/2017 11:31.
[2] P. Labu and J. Selatan, “Komparasi Metode Data
Mining Untuk Prediksi,” pp. 1–6, 2016.
[3] luthfi taufiq E. Kusrini, Algoritma Data Mining. Yogyakarta: Andi, 2009.
[4] Y. Agusta, “K-Means - Penerapan, Permasalahan
dan Metode Terkait,” J. Sist. dan Inform., vol. 3, no. Pebruari, pp. 47–60, 2007.
[5] P. Roger S, Rekayasa Perangkat Lunak :
Pendekatan Praktisi (Buku I). Yogyakarta: Andi, 2002.
[6] P. Mata, “PERBANDINGAN NAIVE BAYES CLASSIFIER DENGAN NEAREST
NEIGHBOR UNTUK IDENTIFIKASI,” vol. 1,
no. 2, pp. 82–86, 2016.
[7] Eska sarti Kundari, “PERBANDINGAN
DALAM PENGKLASIFIKASIAN PENYAKIT DIABETES MELITUS DI RUMAH SAKIT
KUMALA SIWI KUDUS,” UNIVERSITAS