IMPLEMENTASI DATA MINING DENGAN ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI ANGKA KELAHIRAN
Muhammad Idris
Prodi Teknik Informatika STMIK Budi Darma, Medan, Indonesia Jl. Sisingamangaraja No. 338, Medan, Indonesia
Abstrak
Kantor Kepala Desa Lalang Kecamatan Medang Deras Kabupaten Batubara yaitu Desa yang Terdiri Dari Sepuluh Dusun Yaitu Berdikari, Merdeka, Pengajian, Pekan, Mesjid Barat, Mesjid Timur, Tasak Lama, Tasak Baru, Sono Dan Pandau Palas. Prediksi angka kelahiran dilakukan dengan menggunakan algoritma data mining. Salah satu fungsi dalam data mining yang dapat digunakan untuk menyelesaikan masalah yang dihadapi pihak kantor desa untuk memprediksi angka kelahiran. Metode yang diusulkan yaitu naïve bayes.
Algoritma naïve bayes bertujuan untuk melakukan klasifikasi data pada kelas tertentu. Tujuan penelitian ini adalah untuk melihat pola prediksi dari setiap atribut-atribut yang terdapat pada data set dengan menggunakan algoritma naïve bayes dan melakukan pengujian data training terhadap data testing untuk melihat pemodelan data sudah baik atau belum. Dalam membangun aplikasi ini penulis menggunakan bahasa pemrograman visual basic 2008 serta microsoft access 2007 sebagai basis data. Klasifikasi Naïve Bayes dipakai untuk memprediksi angka kelahiran yang akan dialami pada setiap dusun dengan cara mensurvei jumlah penduduk pada setiap dusun, angka pernikahan, dan angka kelahiran . Semua data didiskritkan berdasarkan survei yang telah diteliti pada desa lalang. Hasi l dari penelitian ini adalah mempermudah pihak kantor desa lalang dalam proses pengelolaan data penduduk, membantu dalam proses penginputan data, pencarian data, dan laporan penduduk
Kata Kunci : Angka Kelahiran, Data Mining, Naïve.
I. PENDAHULUAN
Perkembangan yang saat ini dirasakan manfaatnya adalah penemuan informasi baru dengan mencari pola baru dari suatu data yang sangat besar yang dikenal dengan istilah data mining. Data mining merupakan proses dalam menganalisis data dari sudut pandang yang berbeda dan membentuknya menjadi informasi yang berguna sehingga pengguna dapat memahami substansi hubungan antara data. Data mining memiliki beberapa metode yang salah satunya ialah metode klasifikasi merupakan teknik data mining yang memetakan data ke kelompok yang telah di terapkan. Terdapat beberapa algoritma data mining yang menggunakan metode classification ini, seperti C4.5, CMAR, Naïve Bayes, K- Nearest Neighbours dan CART. Penggunaan metode klasifikasi dapat memanfaatkan beberapa algoritma diantaranya algoritma Naïve Bayes.
Angka kelahiran dan hasil penelitian didunia mengatakan bahwa ada kaitan antara angka kelahiran dan usia harapan hidup di suatu wilayah, makin rendahnya angka kelahiran makin tingginya usia harapan hidup.
Angka kelahiran adalah salah satu unsur dari pertambahan penduduk secara alami. Lahir adalah istilah yang dipergunakan dalam bidang demografi untuk menggambarkan jumlah anak yang benar-benar di lahirkan hidup.
Algoritma Naïve Bayes juga dapat membantu dalam memprediksi angka kelahiran diDesa Lalang.
Didalam pendataan kepala Desa Lalang juga menelusuri angka kelahiran di setiap dusun, agar data setiap bulan bisa diserahkan kekantor Dinas Catatan Sipil.
II. TEORITIS A. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik
atau metode tertentu. Teknik-teknik, metode-metode, atau algoritma dalam data mining sangat bervariasi.
Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses Knowledge Discovery in Database (KDD) secara keseluruhan [2].
Menurut Gartner Group, data mining adalah proses menemukan hubungan baru yang mempunyai arti, pola dan kebiasaan dengan memilah-milah sebagian besar data yang disimpan dalam media penyimpanan dengan menggunakan teknologi pengenalan pola seperti teknik statistik dan matematika. Data mining merupakan gabungan dari beberapa disiplin ilmu yang menyatukan teknik dari pembelajaran mesin,pengenalan pola, statistik, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar [2].
Data mining menurut David Hand, Heikki Mannila, dan Padhraic Smyth dari MIT adalah analisa terhadap data (biasanya data yang berukuran besar) untuk menemukan hubungan yang jelas serta menyimpulkannya yang belum diketahui sebelumnya dengan cara terkini dipahami dan berguna bagi pemilik data tersebut [2].
Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar.
Data mining merupakan serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual [2].
Dari definisi-definisi yang telah disampaikan, hal penting yang terkait dengan data mining menurut Gartner Group [2] :
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses merupakan data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu : 1. Description (Deskripsi)
Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data.
Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden.
Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimation (Estimasi)
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh yaitu estimasi nilai indeks prestasi kumulatif mahasiswa program pasca sarjana dengan melihat nilai indeks prestasi mahasiswa tersebut pada saat mengikuti program sarjana.
3. Prediction (Prediksi)
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang.Contoh prediksi dalam bisnis dan penelitian adalah :
a. Prediksi harga beras dalam tiga bulan yang akan datang.
b. Prediksi tingkat penganguran lima tahun akan datang.
c. Predisksi persentase kanaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikan.
Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
1. Classification (Klasifikasi)
Dalam klasifikasi, terdapat target variabel kategori.
Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.Contoh lain klasifikasi dalam bisnis dan penelitian adalah :
a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.
b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk.
c. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk penyakit apa.
2. Clustering (Pengklusteran)
Pengklusteranmerupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran.
Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal.Contoh pengklusteran dalam bisnis dan penelitian adalah :
a. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.
b. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik dan mencurigakan.
c. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar.
3. Association (Asosiasi)
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu.
Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.Contoh asosiasi dalam bisnis dan penelitian adalah :
a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respons positif terhadap penawaran upgrade layanan yang diberikan.
b. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.
B. Algoritma Naïve Bayes
Algoritma Naive Bayes Clasifier merupakan salah satu algoritma yang terdapat pada teknik klasifikasi. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi antar atribut saling bebas.
Klasifikasi Naive Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya.
Persamaan dari teorema Bayes adalah [3] : 𝑃(𝐻|𝑋)= 𝑃(𝑋|𝐻).𝑃(𝐻)
𝑃(𝑋)
Keterangan:
X : Sampel data yang memiliki kelas (label) yang tidak diketahui
H : Hipotesa bahwa X adalah data kelas (label) P(H) : Peluang dari hipotesa H
P(X) : Peluang dari data sampel yang diamati P(X|H) : Peluang dari data sampel X bila diasumsikan
bahwa hipotesa benar
Sehingga Naïve Bayesian Clasifier dapat didefinisikan juga sebagai metode klasifikasi yang berdasarkan teori probabilitas dan teorema bayesian dengan asumsi bahwa setiap variabel atauparameter penentu keputusan bersifat bebas (independence) sehingga keberadaan setiap variabel tidak ada kaitannya dengan keberadaan atribut yang lain.
Adapun alur dari metode Naive Bayes adalah sebagai berikut:
1. Menghitung Nilai Peluang Kasus Baru Dari Setiap Hipotesa dengan Klas (Label) yang ada "P(XK|Ci)"
2. Menghitung Nilai Akumulasi Peluang Dari Setiap Klas "P(X|Ci)"
3. Menghitung Nilai P(X|Ci) x P(Ci) 4. Menentukan Klas dari Kasus baru tersebut C. Angka Kelahiran
Angka kelahiran menurut umur (Age Specific Fertility Rate/ASFR) adalah menunjukkan banyaknya kelahiran 1000 perempuan [4].
ASFR merupakan indikator kelahiran yang memperhitungkan perbedaan fertilitas dari perempuan yang terpapar untuk melahirkan yaitu perempuan usia subur dengan memperhatikan karakteristik kelompok umurnya. Secara alamiah potensi (fekunditas) perempuan untuk melahirkan berbeda menurut umur, dan menjadi alami setelah usia 49 tahun. Secara sosial ada kecenderungan bahwa saat ini perempuan ingin membatasi jumlah anak setelah umur 35 tahun.
Pengetahuan mengenai ASFR akan berguna untuk pelaksanaan program KB dan peningkatan pelayanan kesehatan Ibu dan Anak. Indikator ASFR merupakan data dasar untuk mengembangkan proyeksi penduduk, untuk mengetahui jumlah penduduk menurut umur dan jenis kelamin dimasa yang akan datang. Hasil proyeksi penduduk merupakan basis data untuk perencanaan pembangunan manusia di tahun-tahun mendatang.
Menurut Mulyadi, Kelahiran merupakan hasil reproduksi yang nyata dari seorang wanita atau sekelompok wanita. Dengan kata lain fertilitas ini menyangkut banyaknya bayi yang lahir hidup. Fertilitas dalam pengertian demografi adalah kemampuan riil seorang wanita untuk melahirkan, yang dicerminkan dalam jumlah bayi yang dilahirkan. Tingkat kelahiran (fertilitas) ditentukan oleh jumlah penduduk wanita yang berada pada usia reproduksi. Semakin banyak jumlah penduduk wanita usia reproduksi, maka diasumsikan jumlah kelahiran semakin banyak pula.
Pengukuran kelahiran lebih kompleks dibandingkan dengan pengukuran mortalitas, karena seorang perempuan hanya meninggal satu kali, tetapi ia dapat melahirkan lebih dari seorang bayi. Disamping itu seorang yang meninggal pada hari dan waktu tertentu,
berarti mulai saat itu orang tersebut tidak mempunyai resiko kematian lagi. Sebaliknya seorang perempuan yang telah melahirkan seorang anak tidak berarti mengalami resiko melahirkan dari perempuan tersebut menurun. Kompleksnya pengukuran fertilitas karena melibatkan dua orang (suami dan istri), sedangkan kematian hanya melibatkan satu orang saja yang meninggal. Data angka kelahiran menjadi peluang pasar diIndonesia. Tiap tahun, angka kelahiran meningkat 1,49 persen.
III. ANALISA
Dalam penelitian skripsi ini akan di cari nilai peluang kasus baru dari setiap hipotesa dengan kelas (label) yang ada hubungannya dengan Angka Kelahiran.
Dalam menentukan Angka kelahiran yang akan diprediksi adalah dengan mengumpulkan data – data penduduk yang sudah didata sebelumnya. Untuk mengatasi permasalahan dalam memprediksi angka kelahiran untuk tahun 2017 diperlukan suatu alat analisis bagi kantor kepala desa untuk mengetahui tingkat tinggi atau rendahnya angka kelahiran pada setiap dusun khususnya pada desa lalang.
Maka, metode klasifikasi mampu menemukan model yang membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Oleh sebab itu, algoritma naive bayes dapat memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya. Sehingga dapat mengetahui tinggi atau rendahnya angka kelahiran pada suatu desa.
Tabel 1. Data Kependudukan Desa Lalang
Nama Dusun
Jlh Penduduk
Total Jumlah Penduduk
Angka Pernikahan
Klasifikasi Angka Kelahiran Lk Pr
Berdikari 270 253 523 9 12
Merdeka 399 354 753 17 18
Pekan 312 317 629 15 14
Pengajian 488 508 996 19 20
Mesjid
Barat 349 366 715 16 17
Mesjid
Timur 237 246 483 12 15
Tasak
Lama 404 367 771 23 21
Tasak Baru 287 276 563 20 25
Sono 489 440 929 26 30
Pandau
Palas 325 627 627 13 8
B. Klasifikasi Dari Kasus Baru
Berdasarkan tabel di atas dapat dihitung klasifikasi data angka kelahiran apabila diberikan input berupa total jumlah kelahiran, angka pernikahan, dan angka kelahiran menggunakan algoritma Naive Bayes.
Apabila diberikan input data baru, maka prediksi angka kelahiran dapat ditentukan melalui langkah berikut:
1. Memprediksi Angka Kelahiran Pada Dusun
“BERDIKARI”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3
Berdikari Dibawah 523 Diatas
523
Dibawah 9 Diatas 9
Dibawah 12 Diatas 12 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 523” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 1/10 = 0,1
P(Kriteria 1= “Di atas 523” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =9/10= 0,9
P(Kriteria 2= “Di bawah 9” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 1/10 = 0,1
P(Kriteria 2= “Di Atas 9” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 9/10= 0,9
P(Kriteria 3= “Di bawah 12” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 2/10 = 0,2
P(Kriteria 3= “Di atas 12” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 8/10= 0,8
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,1 x 0,1 x 0,2 = 0,002 P(X|Klasifikasi = “Rendah”)
= 0,9 x 0,69 x 0,8 = 0,648 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,648 x 4/10 = 0,2592 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0,002 x 6/10 = 0,0012
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0.2592 banding 0,0012, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan Berdika
ri
Dibawah 523 Diatas
523
Dibawah 9 Diatas
9
Dibawah 12 Diatas
12
Tinggi
2. Memprediksi Angka Kelahiran Pada Dusun
“MERDEKA”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Merdeka Dibawah
753 Diatas 753
Dibawah 17 Diatas
17
Dibawah 18 Diatas
18
1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 753” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 5/10 = 0,5
P(Kriteria 1= “Di atas 753” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =5/10= 0,5
P(Kriteria 2= “Di bawah 17” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 5/10 = 0,5
P(Kriteria 2= “Di Atas 17” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 5/10= 0,5
P(Kriteria 3= “Di bawah 18” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 5/10 = 0,5
P(Kriteria 3= “Di atas 18” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 5/10= 0,5
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,5 x 0,5 x 0,5 = 0,125 P(X|Klasifikasi = “Rendah”)
= 0,5 x 0,5 x 0,5 = 0,125 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,125 x 4/10 = 0,05
(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0,125 x 6/10 = 0,075
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0.075 banding 0,05, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3 Keterangan Merdeka Dibawah
753 Diatas
753
Dibawa h 17 Diatas
17
Dibawah 18 Diatas
18
Rendah
3. Memprediksi Angka Kelahiran Pada Dusun
“PEKAN”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Pekan Dibawah
629 Diatas
629
Dibawah 15 Diatas
15
Dibawah 14 Diatas
14 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 629” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 4/10 = 0,4
P(Kriteria 1= “Di atas 629” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =6/10= 0,6
P(Kriteria 2= “Di bawah 15” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 3/10 = 0,3
P(Kriteria 2= “Di Atas 15” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 7/10= 0,7
P(Kriteria 3= “Di bawah 14” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 2/10 = 0,2
P(Kriteria 3= “Di atas 14” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 8/10= 0,8
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,6 x 0,7 x 0,8 = 0,336 P(X|Klasifikasi = “Rendah”)
= 0,4 x 0,3 x 0,2 = 0,024 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,336 x 4/10 = 0,1344 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0,024 x 6/10 = 0,0144
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0,1344 banding 0,0144, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan Pekan Dibawah
639 Diatas
639
Dibawah 15 Diatas
15
Dibawah 14 Diatas
14
Tinggi
4. Memprediksi Angka Kelahiran Pada Dusun
“PENGAJIAN”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Pengajian Dibawah
996 Diatas 996
Dibawah 19 Diatas
19
Dibawah 20 Diatas
20 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 996” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 9/10 = 0,9
P(Kriteria 1= “Di atas 996” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =1/10= 0,1
P(Kriteria 2= “Di bawah 19” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 6/10 = 0,6
P(Kriteria 2= “Di Atas 19” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 4/10= 0,4
P(Kriteria 3= “Di bawah 20” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 6/10 = 0,6
P(Kriteria 3= “Di atas 20” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 4/10= 0,4
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,1 x 0,4 x 0,4 = 0,016
P(X|Klasifikasi = “Rendah”)
= 0,9 x 0,6 x 0,4 = 0,216 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,016 x 4/10 = 0,064
(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0,216 x 6/10 = 0,1296
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0.1296 banding 0,064, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Ketera ngan Pengaji
an
Dibawah 996 Diatas
996
Dibawa h 19 Diatas
19
Dibawa h 20 Diatas
20
Rendah
5. Memprediksi Angka Kelahiran Pada Dusun
“MESJID BARAT”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Mesjid
Barat
Dibawah 715 Diatas
715
Dibawah 16 Diatas
16
Dibawah 27 Diatas
27
1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 715” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 5/10 = 0,5
P(Kriteria 1= “Di atas 715” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =5/10= 0,5
P(Kriteria 2= “Di bawah 16” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 4/10 = 0,4
P(Kriteria 2= “Di Atas 16” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 6/10= 0,6
P(Kriteria 3= “Di bawah 17” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 4/10 = 0,4
P(Kriteria 3= “Di atas 17” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 6/10= 0,6
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,5 x 0,6 x 0,6 = 0,18 P(X|Klasifikasi = “Rendah”)
= 0,5 x 0,4 x 0,4 = 0,08 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,18 x 4/10 = 0,072
(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0,08 x 6/10 = 0,048
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0,072 banding 0,048, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan Mesjid
Barat
Dibawah 715 Diatas
715
Dibawah 16 Diatas
15
Dibawah 17 Diatas
17
Tinggi
6. Memprediksi Angka Kelahiran Pada Dusun
“MESJID TIMUR”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Mesjid
Timur
Dibawah 483 Diatas
483
Dibawah 12 Diatas
12
Dibawah 15 Diatas
15 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 483” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 0/10 = 0
P(Kriteria 1= “Di atas 483” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =10/10= 1
P(Kriteria 2= “Di bawah 12” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 1/10 = 0,1
P(Kriteria 2= “Di Atas 19” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 9/10= 0,9
P(Kriteria 3= “Di bawah 15” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 3/10 = 0,3
P(Kriteria 3= “Di atas 15” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 7/10= 0,7
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 1 x 0,9 x 0,7 = 0,63 P(X|Klasifikasi = “Rendah”)
= 0 x 1 x 0,3= 0
3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi =”Angka Kelahiran”)
= 0,63 x 4/10 = 0,252
(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0 x 6/10 = 0
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0.1296 banding 0,064, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan
Mesjid Timur
Dibawah 483 Diatas
483
Dibawah 12 Diatas
12
Dibawah 15 Diatas
15
Tinggi
7. Memprediksi Angka Kelahiran Pada Dusun
“TASAK LAMA”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Tasak
Lama
Dibawah 771 Diatas
771
Dibawah 23 Diatas
23
Dibawah 21 Diatas
21 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 771” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 7/10 = 0,7
P(Kriteria 1= “Di atas 771” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =3/10= 0,3
P(Kriteria 2= “Di bawah 23” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 8/10 = 0,8
P(Kriteria 2= “Di Atas 23” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 2/10= 0,2
P(Kriteria 3= “Di bawah 21” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 7/10 = 0,7
P(Kriteria 3= “Di atas 21” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 3/10= 0,3
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,3 x 0,2 x 0,3 = 0,018 P(X|Klasifikasi = “Rendah”)
= 0,7 x 0,8 x 0,7 = 0,392 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,018 x 4/10 = 0,072
(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0,392 x 6/10 = 0,2352
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0.2352 banding 0,072, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan Tasak
lama
Dibawah 771 Diatas
771
Dibawah 23 Diatas
23
Dibawah 21 Diatas
21
Rendah
8. Memprediksi Angka Kelahiran Pada Dusun
“TASAK BARU”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3
Tasak baru
Dibawah 563 Diatas
563
Dibawah 20 Diatas
20
Dibawah 25 Diatas
25 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 563” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 2/10 = 0,2
P(Kriteria 1= “Di atas 563” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =8/10= 0,8
P(Kriteria 2= “Di bawah 20” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 7/10 = 0,7
P(Kriteria 2= “Di atas 20” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 3/10= 0,3
P(Kriteria 3= “Di bawah 25” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 8/10 = 0,8
P(Kriteria 3= “Di atas 25” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 2/10= 0,2
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,8 x 0,3 x 0,2 = 0,048 P(X|Klasifikasi = “Rendah”)
= 0,2 x 0,7 x 0,8= 0,112 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,048 x 4/10 = 0,0192 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0, 112 x 6/10 = 0,0672
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0,0672 banding 0,0192, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan Tasak
baru
Dibawah 563 Diatas
563
Dibawah 20 Diatas
20
Dibawah 25 Diatas
25
Rendah
9. Memprediksi Angka Kelahiran Pada Dusun
“SONO”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Sono Dibawah
929 Diatas
929
Dibawah 26 Diatas
26
Dibawah 30 Diatas
30 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 929” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 8/10 = 0,8
P(Kriteria 1= “Di atas 929” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =2/10= 0,2
P(Kriteria 2= “Di bawah 26” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 9/10 = 0,9
P(Kriteria 2= “Di atas 26” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 1/10= 0,1
P(Kriteria 3= “Di bawah 30” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 1/10 = 0,1
P(Kriteria 3= “Di atas 30” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 9/10= 0,9
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,2 x 0,1 x 0,9 = 0,018 P(X|Klasifikasi = “Rendah”)
= 0,8 x 0,9 x 0,1= 0,072 3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,018x 4/10 = 0,0072 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0, 072 x 6/10 = 0,0432
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0,0432 banding 0,0072, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan Sono Dibawah
929 Diatas
929
Dibawah 26 Diatas
26
Dibawah 30 Diatas
30
Rendah
10. Memprediksi Angka Kelahiran Pada Dusun
“PANDAU PALAS”.
Nama Dusun
Kriteria 1 Kriteria 2 Kriteria 3 Pandau
Palas
Dibawah 627 Diatas
627
Dibawah 13 Diatas
13
Dibawah 8 Diatas
8 1. Menghitung Nilai P(XK|Ci)
P(Kriteria 1= “Di bawah 627” | Klasifikasi =
“Rendah”)
P(Kriteria 1 = 3/10 = 0,3
P(Kriteria 1= “Di atas 627” | Klasifikasi =
“Tinggi”)
P(Kriteria 1 =7/10= 0,7
P(Kriteria 2= “Di bawah 13” | Klasifikasi =
“Rendah”)
P(Kriteria 2 = 1/10 = 0,1
P(Kriteria 2= “Di atas 13” | Klasifikasi =
“Tinggi”)
P(Kriteria 2 = 9/10= 0,9
P(Kriteria 3= “Di bawah 8” | Klasifikasi =
“Rendah”)
P(Kriteria 3 = 0/10 = 0
P(Kriteria 3= “Di atas 8” | Klasifikasi =
“Tinggi”)
P(Kriteria 3 = 10/10= 1
2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)
= 0,7 x 0,9 x 1 = 0,63 P(X|Klasifikasi = “Rendah”)
= 0,3 x 0,1 x 0= 0
3. Hitung Nilai P(X|Ci) * P (Ci)
(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi
=”Angka Kelahiran”)
= 0,63 x 4/10 = 0,252
(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)
= 0 x 6/10 = 0
Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0,252 banding 0, maka :
Nama Dusun
Kreteria 1
Kreteria 2
Kreteria 3
Keterangan Pandau
Palas
Dibawah 627 Diatas
627
Dibawah 13 Diatas
13
Dibawah 8 Diatas
8
Tinggi
Berdasarkan perhitungan diatas bahwa dapat disimpulkan angka kelahiran pada setiap dusun desa lalang adalah sebagai berikut.
Tabel Hasil Pengujian Data Angka Kelahiran Nama Dusun Angka Kelahiran
Berdikari Tinggi
Merdeka Rendah
Pekan Tinggi
Pengajian Rendah
Mesjid Barat Tinggi
Mesjid Timur Tinggi
Tasak Lama Rendah
Tasak Baru Rendah
Sono Rendah
Pandau Palas Tinggi
IV. KESIMPULAN
Berdasarkan dari hasil analisa dan perancangan, implementasi dan pengujian yang telah di bahas pada bab-bab sebelumnya, maka penulis dapat menarik beberapa kesimpulan, yaitu:
1. Aplikasi data mining dengan algoritma naïve bayes ini dapat digunakan pada Kantor Kepala Desa Lalang.
2. Aplikasi data mining dengan algoritma naïve bayes ini dapat mempermudah pihak admini untuk melakukan evaluasi penentuan angka kelahiran
3. Penentuan data training dapat mempengaruhi hasil pengujian, karena pola dari data training tersebut akan dijadikan sebagai rule untuk menentukan kelas pada data kependudukan. Sehingga tinggi atau rendah tingkat akurasi yang di dapat dipengaruhi oleh penentuan data training.
REFERENCES
[1] Kennedi Tampubolon, Hoga Saragih, Bobby Reza,
"Implementasi Data Mining Algoritma Apriori Pada Sistem Persediaan Alat-Alat Kesehatan," Informasi dan Teknologi Ilmiah (INTI), vol. Volume : I, pp. 93-106, 2013.
[2] Yuli Mardi, "Data Mining : Klasifikasi Menggunakan Algoritma C4.5," Jurnal Edik Informatika, pp. 213-219.
[3] Minarni, Firman Aldyanto, "Prediksi Jumlah Produksi Roti Menggunakan Metode Logika Fuzzy," Jurnal TEKNOIF, vol. 4, pp. 59-65, Oktober 2016.
[4] Windi Yohana Oktavia, Tri Sukirno Putro, and Lapeti Sari,
"Pengaruh tingkat pendidikan, struktur umur dan kematian bayi terhadap fertilitas di Kota Pekanbaru," JOM FEKON, vol. Vol.
1, pp. 1-15, Oktober 2014.