• Tidak ada hasil yang ditemukan

1154 2531 2 PB

N/A
N/A
ruth manik

Academic year: 2023

Membagikan "1154 2531 2 PB"

Copied!
8
0
0

Teks penuh

(1)

IMPLEMENTASI DATA MINING DENGAN ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI ANGKA KELAHIRAN

Muhammad Idris

Prodi Teknik Informatika STMIK Budi Darma, Medan, Indonesia Jl. Sisingamangaraja No. 338, Medan, Indonesia

Abstrak

Kantor Kepala Desa Lalang Kecamatan Medang Deras Kabupaten Batubara yaitu Desa yang Terdiri Dari Sepuluh Dusun Yaitu Berdikari, Merdeka, Pengajian, Pekan, Mesjid Barat, Mesjid Timur, Tasak Lama, Tasak Baru, Sono Dan Pandau Palas. Prediksi angka kelahiran dilakukan dengan menggunakan algoritma data mining. Salah satu fungsi dalam data mining yang dapat digunakan untuk menyelesaikan masalah yang dihadapi pihak kantor desa untuk memprediksi angka kelahiran. Metode yang diusulkan yaitu naïve bayes.

Algoritma naïve bayes bertujuan untuk melakukan klasifikasi data pada kelas tertentu. Tujuan penelitian ini adalah untuk melihat pola prediksi dari setiap atribut-atribut yang terdapat pada data set dengan menggunakan algoritma naïve bayes dan melakukan pengujian data training terhadap data testing untuk melihat pemodelan data sudah baik atau belum. Dalam membangun aplikasi ini penulis menggunakan bahasa pemrograman visual basic 2008 serta microsoft access 2007 sebagai basis data. Klasifikasi Naïve Bayes dipakai untuk memprediksi angka kelahiran yang akan dialami pada setiap dusun dengan cara mensurvei jumlah penduduk pada setiap dusun, angka pernikahan, dan angka kelahiran . Semua data didiskritkan berdasarkan survei yang telah diteliti pada desa lalang. Hasi l dari penelitian ini adalah mempermudah pihak kantor desa lalang dalam proses pengelolaan data penduduk, membantu dalam proses penginputan data, pencarian data, dan laporan penduduk

Kata Kunci : Angka Kelahiran, Data Mining, Naïve.

I. PENDAHULUAN

Perkembangan yang saat ini dirasakan manfaatnya adalah penemuan informasi baru dengan mencari pola baru dari suatu data yang sangat besar yang dikenal dengan istilah data mining. Data mining merupakan proses dalam menganalisis data dari sudut pandang yang berbeda dan membentuknya menjadi informasi yang berguna sehingga pengguna dapat memahami substansi hubungan antara data. Data mining memiliki beberapa metode yang salah satunya ialah metode klasifikasi merupakan teknik data mining yang memetakan data ke kelompok yang telah di terapkan. Terdapat beberapa algoritma data mining yang menggunakan metode classification ini, seperti C4.5, CMAR, Naïve Bayes, K- Nearest Neighbours dan CART. Penggunaan metode klasifikasi dapat memanfaatkan beberapa algoritma diantaranya algoritma Naïve Bayes.

Angka kelahiran dan hasil penelitian didunia mengatakan bahwa ada kaitan antara angka kelahiran dan usia harapan hidup di suatu wilayah, makin rendahnya angka kelahiran makin tingginya usia harapan hidup.

Angka kelahiran adalah salah satu unsur dari pertambahan penduduk secara alami. Lahir adalah istilah yang dipergunakan dalam bidang demografi untuk menggambarkan jumlah anak yang benar-benar di lahirkan hidup.

Algoritma Naïve Bayes juga dapat membantu dalam memprediksi angka kelahiran diDesa Lalang.

Didalam pendataan kepala Desa Lalang juga menelusuri angka kelahiran di setiap dusun, agar data setiap bulan bisa diserahkan kekantor Dinas Catatan Sipil.

II. TEORITIS A. Data Mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik

atau metode tertentu. Teknik-teknik, metode-metode, atau algoritma dalam data mining sangat bervariasi.

Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses Knowledge Discovery in Database (KDD) secara keseluruhan [2].

Menurut Gartner Group, data mining adalah proses menemukan hubungan baru yang mempunyai arti, pola dan kebiasaan dengan memilah-milah sebagian besar data yang disimpan dalam media penyimpanan dengan menggunakan teknologi pengenalan pola seperti teknik statistik dan matematika. Data mining merupakan gabungan dari beberapa disiplin ilmu yang menyatukan teknik dari pembelajaran mesin,pengenalan pola, statistik, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar [2].

Data mining menurut David Hand, Heikki Mannila, dan Padhraic Smyth dari MIT adalah analisa terhadap data (biasanya data yang berukuran besar) untuk menemukan hubungan yang jelas serta menyimpulkannya yang belum diketahui sebelumnya dengan cara terkini dipahami dan berguna bagi pemilik data tersebut [2].

Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar.

Data mining merupakan serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual [2].

Dari definisi-definisi yang telah disampaikan, hal penting yang terkait dengan data mining menurut Gartner Group [2] :

1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.

(2)

2. Data yang akan diproses merupakan data yang sangat besar.

3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu : 1. Description (Deskripsi)

Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data.

Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden.

Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecenderungan.

2. Estimation (Estimasi)

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.

Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh yaitu estimasi nilai indeks prestasi kumulatif mahasiswa program pasca sarjana dengan melihat nilai indeks prestasi mahasiswa tersebut pada saat mengikuti program sarjana.

3. Prediction (Prediksi)

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang.Contoh prediksi dalam bisnis dan penelitian adalah :

a. Prediksi harga beras dalam tiga bulan yang akan datang.

b. Prediksi tingkat penganguran lima tahun akan datang.

c. Predisksi persentase kanaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikan.

Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.

1. Classification (Klasifikasi)

Dalam klasifikasi, terdapat target variabel kategori.

Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.Contoh lain klasifikasi dalam bisnis dan penelitian adalah :

a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan.

b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk.

c. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk penyakit apa.

2. Clustering (Pengklusteran)

Pengklusteranmerupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran.

Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal.Contoh pengklusteran dalam bisnis dan penelitian adalah :

a. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.

b. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam baik dan mencurigakan.

c. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar.

3. Association (Asosiasi)

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu.

Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.Contoh asosiasi dalam bisnis dan penelitian adalah :

a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respons positif terhadap penawaran upgrade layanan yang diberikan.

b. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.

B. Algoritma Naïve Bayes

Algoritma Naive Bayes Clasifier merupakan salah satu algoritma yang terdapat pada teknik klasifikasi. Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi antar atribut saling bebas.

Klasifikasi Naive Bayes diasumsikan bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada hubungannya dengan ciri dari kelas lainnya.

Persamaan dari teorema Bayes adalah [3] : 𝑃(𝐻|𝑋)= 𝑃(𝑋|𝐻).𝑃(𝐻)

𝑃(𝑋)

(3)

Keterangan:

X : Sampel data yang memiliki kelas (label) yang tidak diketahui

H : Hipotesa bahwa X adalah data kelas (label) P(H) : Peluang dari hipotesa H

P(X) : Peluang dari data sampel yang diamati P(X|H) : Peluang dari data sampel X bila diasumsikan

bahwa hipotesa benar

Sehingga Naïve Bayesian Clasifier dapat didefinisikan juga sebagai metode klasifikasi yang berdasarkan teori probabilitas dan teorema bayesian dengan asumsi bahwa setiap variabel atauparameter penentu keputusan bersifat bebas (independence) sehingga keberadaan setiap variabel tidak ada kaitannya dengan keberadaan atribut yang lain.

Adapun alur dari metode Naive Bayes adalah sebagai berikut:

1. Menghitung Nilai Peluang Kasus Baru Dari Setiap Hipotesa dengan Klas (Label) yang ada "P(XK|Ci)"

2. Menghitung Nilai Akumulasi Peluang Dari Setiap Klas "P(X|Ci)"

3. Menghitung Nilai P(X|Ci) x P(Ci) 4. Menentukan Klas dari Kasus baru tersebut C. Angka Kelahiran

Angka kelahiran menurut umur (Age Specific Fertility Rate/ASFR) adalah menunjukkan banyaknya kelahiran 1000 perempuan [4].

ASFR merupakan indikator kelahiran yang memperhitungkan perbedaan fertilitas dari perempuan yang terpapar untuk melahirkan yaitu perempuan usia subur dengan memperhatikan karakteristik kelompok umurnya. Secara alamiah potensi (fekunditas) perempuan untuk melahirkan berbeda menurut umur, dan menjadi alami setelah usia 49 tahun. Secara sosial ada kecenderungan bahwa saat ini perempuan ingin membatasi jumlah anak setelah umur 35 tahun.

Pengetahuan mengenai ASFR akan berguna untuk pelaksanaan program KB dan peningkatan pelayanan kesehatan Ibu dan Anak. Indikator ASFR merupakan data dasar untuk mengembangkan proyeksi penduduk, untuk mengetahui jumlah penduduk menurut umur dan jenis kelamin dimasa yang akan datang. Hasil proyeksi penduduk merupakan basis data untuk perencanaan pembangunan manusia di tahun-tahun mendatang.

Menurut Mulyadi, Kelahiran merupakan hasil reproduksi yang nyata dari seorang wanita atau sekelompok wanita. Dengan kata lain fertilitas ini menyangkut banyaknya bayi yang lahir hidup. Fertilitas dalam pengertian demografi adalah kemampuan riil seorang wanita untuk melahirkan, yang dicerminkan dalam jumlah bayi yang dilahirkan. Tingkat kelahiran (fertilitas) ditentukan oleh jumlah penduduk wanita yang berada pada usia reproduksi. Semakin banyak jumlah penduduk wanita usia reproduksi, maka diasumsikan jumlah kelahiran semakin banyak pula.

Pengukuran kelahiran lebih kompleks dibandingkan dengan pengukuran mortalitas, karena seorang perempuan hanya meninggal satu kali, tetapi ia dapat melahirkan lebih dari seorang bayi. Disamping itu seorang yang meninggal pada hari dan waktu tertentu,

berarti mulai saat itu orang tersebut tidak mempunyai resiko kematian lagi. Sebaliknya seorang perempuan yang telah melahirkan seorang anak tidak berarti mengalami resiko melahirkan dari perempuan tersebut menurun. Kompleksnya pengukuran fertilitas karena melibatkan dua orang (suami dan istri), sedangkan kematian hanya melibatkan satu orang saja yang meninggal. Data angka kelahiran menjadi peluang pasar diIndonesia. Tiap tahun, angka kelahiran meningkat 1,49 persen.

III. ANALISA

Dalam penelitian skripsi ini akan di cari nilai peluang kasus baru dari setiap hipotesa dengan kelas (label) yang ada hubungannya dengan Angka Kelahiran.

Dalam menentukan Angka kelahiran yang akan diprediksi adalah dengan mengumpulkan data – data penduduk yang sudah didata sebelumnya. Untuk mengatasi permasalahan dalam memprediksi angka kelahiran untuk tahun 2017 diperlukan suatu alat analisis bagi kantor kepala desa untuk mengetahui tingkat tinggi atau rendahnya angka kelahiran pada setiap dusun khususnya pada desa lalang.

Maka, metode klasifikasi mampu menemukan model yang membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Oleh sebab itu, algoritma naive bayes dapat memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya. Sehingga dapat mengetahui tinggi atau rendahnya angka kelahiran pada suatu desa.

Tabel 1. Data Kependudukan Desa Lalang

Nama Dusun

Jlh Penduduk

Total Jumlah Penduduk

Angka Pernikahan

Klasifikasi Angka Kelahiran Lk Pr

Berdikari 270 253 523 9 12

Merdeka 399 354 753 17 18

Pekan 312 317 629 15 14

Pengajian 488 508 996 19 20

Mesjid

Barat 349 366 715 16 17

Mesjid

Timur 237 246 483 12 15

Tasak

Lama 404 367 771 23 21

Tasak Baru 287 276 563 20 25

Sono 489 440 929 26 30

Pandau

Palas 325 627 627 13 8

B. Klasifikasi Dari Kasus Baru

Berdasarkan tabel di atas dapat dihitung klasifikasi data angka kelahiran apabila diberikan input berupa total jumlah kelahiran, angka pernikahan, dan angka kelahiran menggunakan algoritma Naive Bayes.

Apabila diberikan input data baru, maka prediksi angka kelahiran dapat ditentukan melalui langkah berikut:

1. Memprediksi Angka Kelahiran Pada Dusun

“BERDIKARI”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3

(4)

Berdikari Dibawah 523 Diatas

523

Dibawah 9 Diatas 9

Dibawah 12 Diatas 12 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 523” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 1/10 = 0,1

P(Kriteria 1= “Di atas 523” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =9/10= 0,9

 P(Kriteria 2= “Di bawah 9” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 1/10 = 0,1

 P(Kriteria 2= “Di Atas 9” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 9/10= 0,9

 P(Kriteria 3= “Di bawah 12” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 2/10 = 0,2

P(Kriteria 3= “Di atas 12” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 8/10= 0,8

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,1 x 0,1 x 0,2 = 0,002 P(X|Klasifikasi = “Rendah”)

= 0,9 x 0,69 x 0,8 = 0,648 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,648 x 4/10 = 0,2592 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0,002 x 6/10 = 0,0012

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0.2592 banding 0,0012, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan Berdika

ri

Dibawah 523 Diatas

523

Dibawah 9 Diatas

9

Dibawah 12 Diatas

12

Tinggi

2. Memprediksi Angka Kelahiran Pada Dusun

“MERDEKA”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Merdeka Dibawah

753 Diatas 753

Dibawah 17 Diatas

17

Dibawah 18 Diatas

18

1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 753” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 5/10 = 0,5

P(Kriteria 1= “Di atas 753” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =5/10= 0,5

 P(Kriteria 2= “Di bawah 17” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 5/10 = 0,5

P(Kriteria 2= “Di Atas 17” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 5/10= 0,5

 P(Kriteria 3= “Di bawah 18” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 5/10 = 0,5

P(Kriteria 3= “Di atas 18” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 5/10= 0,5

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,5 x 0,5 x 0,5 = 0,125 P(X|Klasifikasi = “Rendah”)

= 0,5 x 0,5 x 0,5 = 0,125 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,125 x 4/10 = 0,05

(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0,125 x 6/10 = 0,075

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0.075 banding 0,05, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3 Keterangan Merdeka Dibawah

753 Diatas

753

Dibawa h 17 Diatas

17

Dibawah 18 Diatas

18

Rendah

3. Memprediksi Angka Kelahiran Pada Dusun

“PEKAN”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Pekan Dibawah

629 Diatas

629

Dibawah 15 Diatas

15

Dibawah 14 Diatas

14 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 629” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 4/10 = 0,4

P(Kriteria 1= “Di atas 629” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =6/10= 0,6

 P(Kriteria 2= “Di bawah 15” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 3/10 = 0,3

P(Kriteria 2= “Di Atas 15” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 7/10= 0,7

(5)

 P(Kriteria 3= “Di bawah 14” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 2/10 = 0,2

P(Kriteria 3= “Di atas 14” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 8/10= 0,8

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,6 x 0,7 x 0,8 = 0,336 P(X|Klasifikasi = “Rendah”)

= 0,4 x 0,3 x 0,2 = 0,024 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,336 x 4/10 = 0,1344 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0,024 x 6/10 = 0,0144

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0,1344 banding 0,0144, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan Pekan Dibawah

639 Diatas

639

Dibawah 15 Diatas

15

Dibawah 14 Diatas

14

Tinggi

4. Memprediksi Angka Kelahiran Pada Dusun

“PENGAJIAN”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Pengajian Dibawah

996 Diatas 996

Dibawah 19 Diatas

19

Dibawah 20 Diatas

20 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 996” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 9/10 = 0,9

P(Kriteria 1= “Di atas 996” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =1/10= 0,1

 P(Kriteria 2= “Di bawah 19” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 6/10 = 0,6

 P(Kriteria 2= “Di Atas 19” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 4/10= 0,4

 P(Kriteria 3= “Di bawah 20” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 6/10 = 0,6

P(Kriteria 3= “Di atas 20” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 4/10= 0,4

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,1 x 0,4 x 0,4 = 0,016

P(X|Klasifikasi = “Rendah”)

= 0,9 x 0,6 x 0,4 = 0,216 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,016 x 4/10 = 0,064

(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0,216 x 6/10 = 0,1296

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0.1296 banding 0,064, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Ketera ngan Pengaji

an

Dibawah 996 Diatas

996

Dibawa h 19 Diatas

19

Dibawa h 20 Diatas

20

Rendah

5. Memprediksi Angka Kelahiran Pada Dusun

“MESJID BARAT”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Mesjid

Barat

Dibawah 715 Diatas

715

Dibawah 16 Diatas

16

Dibawah 27 Diatas

27

1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 715” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 5/10 = 0,5

P(Kriteria 1= “Di atas 715” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =5/10= 0,5

 P(Kriteria 2= “Di bawah 16” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 4/10 = 0,4

 P(Kriteria 2= “Di Atas 16” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 6/10= 0,6

 P(Kriteria 3= “Di bawah 17” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 4/10 = 0,4

P(Kriteria 3= “Di atas 17” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 6/10= 0,6

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,5 x 0,6 x 0,6 = 0,18 P(X|Klasifikasi = “Rendah”)

= 0,5 x 0,4 x 0,4 = 0,08 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,18 x 4/10 = 0,072

(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

(6)

= 0,08 x 6/10 = 0,048

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0,072 banding 0,048, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan Mesjid

Barat

Dibawah 715 Diatas

715

Dibawah 16 Diatas

15

Dibawah 17 Diatas

17

Tinggi

6. Memprediksi Angka Kelahiran Pada Dusun

“MESJID TIMUR”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Mesjid

Timur

Dibawah 483 Diatas

483

Dibawah 12 Diatas

12

Dibawah 15 Diatas

15 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 483” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 0/10 = 0

P(Kriteria 1= “Di atas 483” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =10/10= 1

 P(Kriteria 2= “Di bawah 12” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 1/10 = 0,1

 P(Kriteria 2= “Di Atas 19” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 9/10= 0,9

 P(Kriteria 3= “Di bawah 15” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 3/10 = 0,3

P(Kriteria 3= “Di atas 15” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 7/10= 0,7

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 1 x 0,9 x 0,7 = 0,63 P(X|Klasifikasi = “Rendah”)

= 0 x 1 x 0,3= 0

3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi =”Angka Kelahiran”)

= 0,63 x 4/10 = 0,252

(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0 x 6/10 = 0

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Tinggi ”) lebih tinggi dari P(X|Keterangan=”Rendah”) = 0.1296 banding 0,064, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan

Mesjid Timur

Dibawah 483 Diatas

483

Dibawah 12 Diatas

12

Dibawah 15 Diatas

15

Tinggi

7. Memprediksi Angka Kelahiran Pada Dusun

“TASAK LAMA”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Tasak

Lama

Dibawah 771 Diatas

771

Dibawah 23 Diatas

23

Dibawah 21 Diatas

21 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 771” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 7/10 = 0,7

P(Kriteria 1= “Di atas 771” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =3/10= 0,3

 P(Kriteria 2= “Di bawah 23” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 8/10 = 0,8

 P(Kriteria 2= “Di Atas 23” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 2/10= 0,2

 P(Kriteria 3= “Di bawah 21” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 7/10 = 0,7

P(Kriteria 3= “Di atas 21” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 3/10= 0,3

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,3 x 0,2 x 0,3 = 0,018 P(X|Klasifikasi = “Rendah”)

= 0,7 x 0,8 x 0,7 = 0,392 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,018 x 4/10 = 0,072

(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0,392 x 6/10 = 0,2352

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0.2352 banding 0,072, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan Tasak

lama

Dibawah 771 Diatas

771

Dibawah 23 Diatas

23

Dibawah 21 Diatas

21

Rendah

8. Memprediksi Angka Kelahiran Pada Dusun

“TASAK BARU”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3

(7)

Tasak baru

Dibawah 563 Diatas

563

Dibawah 20 Diatas

20

Dibawah 25 Diatas

25 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 563” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 2/10 = 0,2

P(Kriteria 1= “Di atas 563” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =8/10= 0,8

 P(Kriteria 2= “Di bawah 20” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 7/10 = 0,7

 P(Kriteria 2= “Di atas 20” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 3/10= 0,3

 P(Kriteria 3= “Di bawah 25” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 8/10 = 0,8

P(Kriteria 3= “Di atas 25” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 2/10= 0,2

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,8 x 0,3 x 0,2 = 0,048 P(X|Klasifikasi = “Rendah”)

= 0,2 x 0,7 x 0,8= 0,112 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,048 x 4/10 = 0,0192 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0, 112 x 6/10 = 0,0672

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0,0672 banding 0,0192, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan Tasak

baru

Dibawah 563 Diatas

563

Dibawah 20 Diatas

20

Dibawah 25 Diatas

25

Rendah

9. Memprediksi Angka Kelahiran Pada Dusun

“SONO”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Sono Dibawah

929 Diatas

929

Dibawah 26 Diatas

26

Dibawah 30 Diatas

30 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 929” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 8/10 = 0,8

P(Kriteria 1= “Di atas 929” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =2/10= 0,2

 P(Kriteria 2= “Di bawah 26” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 9/10 = 0,9

 P(Kriteria 2= “Di atas 26” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 1/10= 0,1

 P(Kriteria 3= “Di bawah 30” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 1/10 = 0,1

P(Kriteria 3= “Di atas 30” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 9/10= 0,9

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,2 x 0,1 x 0,9 = 0,018 P(X|Klasifikasi = “Rendah”)

= 0,8 x 0,9 x 0,1= 0,072 3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,018x 4/10 = 0,0072 (P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0, 072 x 6/10 = 0,0432

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0,0432 banding 0,0072, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan Sono Dibawah

929 Diatas

929

Dibawah 26 Diatas

26

Dibawah 30 Diatas

30

Rendah

10. Memprediksi Angka Kelahiran Pada Dusun

“PANDAU PALAS”.

Nama Dusun

Kriteria 1 Kriteria 2 Kriteria 3 Pandau

Palas

Dibawah 627 Diatas

627

Dibawah 13 Diatas

13

Dibawah 8 Diatas

8 1. Menghitung Nilai P(XK|Ci)

 P(Kriteria 1= “Di bawah 627” | Klasifikasi =

“Rendah”)

P(Kriteria 1 = 3/10 = 0,3

P(Kriteria 1= “Di atas 627” | Klasifikasi =

“Tinggi”)

P(Kriteria 1 =7/10= 0,7

 P(Kriteria 2= “Di bawah 13” | Klasifikasi =

“Rendah”)

P(Kriteria 2 = 1/10 = 0,1

(8)

P(Kriteria 2= “Di atas 13” | Klasifikasi =

“Tinggi”)

P(Kriteria 2 = 9/10= 0,9

 P(Kriteria 3= “Di bawah 8” | Klasifikasi =

“Rendah”)

P(Kriteria 3 = 0/10 = 0

P(Kriteria 3= “Di atas 8” | Klasifikasi =

“Tinggi”)

P(Kriteria 3 = 10/10= 1

2. Hitung Nilai P(X|Ci) Untuk Setiap Kelas (label) P(X|Klasifikasi = “Tinggi”)

= 0,7 x 0,9 x 1 = 0,63 P(X|Klasifikasi = “Rendah”)

= 0,3 x 0,1 x 0= 0

3. Hitung Nilai P(X|Ci) * P (Ci)

(P(X|Klasifikasi = “Tinggi”) x P(Klasifikasi

=”Angka Kelahiran”)

= 0,63 x 4/10 = 0,252

(P(X|Klasifikasi = “Rendah”) x P(Klasifikasi=”Angka Kelahiran”)

= 0 x 6/10 = 0

Berdasarkan perhitungan akhir dengan mengalikan nilai peluang dari kasus yang di angkat, kita melihat bahwa nilai P(X|Keterangan=”Rendah ”) lebih tinggi dari P(X|Keterangan=”Tinggi”) = 0,252 banding 0, maka :

Nama Dusun

Kreteria 1

Kreteria 2

Kreteria 3

Keterangan Pandau

Palas

Dibawah 627 Diatas

627

Dibawah 13 Diatas

13

Dibawah 8 Diatas

8

Tinggi

Berdasarkan perhitungan diatas bahwa dapat disimpulkan angka kelahiran pada setiap dusun desa lalang adalah sebagai berikut.

Tabel Hasil Pengujian Data Angka Kelahiran Nama Dusun Angka Kelahiran

Berdikari Tinggi

Merdeka Rendah

Pekan Tinggi

Pengajian Rendah

Mesjid Barat Tinggi

Mesjid Timur Tinggi

Tasak Lama Rendah

Tasak Baru Rendah

Sono Rendah

Pandau Palas Tinggi

IV. KESIMPULAN

Berdasarkan dari hasil analisa dan perancangan, implementasi dan pengujian yang telah di bahas pada bab-bab sebelumnya, maka penulis dapat menarik beberapa kesimpulan, yaitu:

1. Aplikasi data mining dengan algoritma naïve bayes ini dapat digunakan pada Kantor Kepala Desa Lalang.

2. Aplikasi data mining dengan algoritma naïve bayes ini dapat mempermudah pihak admini untuk melakukan evaluasi penentuan angka kelahiran

3. Penentuan data training dapat mempengaruhi hasil pengujian, karena pola dari data training tersebut akan dijadikan sebagai rule untuk menentukan kelas pada data kependudukan. Sehingga tinggi atau rendah tingkat akurasi yang di dapat dipengaruhi oleh penentuan data training.

REFERENCES

[1] Kennedi Tampubolon, Hoga Saragih, Bobby Reza,

"Implementasi Data Mining Algoritma Apriori Pada Sistem Persediaan Alat-Alat Kesehatan," Informasi dan Teknologi Ilmiah (INTI), vol. Volume : I, pp. 93-106, 2013.

[2] Yuli Mardi, "Data Mining : Klasifikasi Menggunakan Algoritma C4.5," Jurnal Edik Informatika, pp. 213-219.

[3] Minarni, Firman Aldyanto, "Prediksi Jumlah Produksi Roti Menggunakan Metode Logika Fuzzy," Jurnal TEKNOIF, vol. 4, pp. 59-65, Oktober 2016.

[4] Windi Yohana Oktavia, Tri Sukirno Putro, and Lapeti Sari,

"Pengaruh tingkat pendidikan, struktur umur dan kematian bayi terhadap fertilitas di Kota Pekanbaru," JOM FEKON, vol. Vol.

1, pp. 1-15, Oktober 2014.

Referensi

Dokumen terkait

Untuk menambah significant hasil, analisis perbandingan algoritma Naïve Bayes Classifier dengan Correlated-Naïve Bayes Classifier dapat diuji dengan data set yang

Algoritma Naïve Bayes bertujuan untuk melakukan klasifikasi data pada kelas tertentu, kemudian pola tersebut dapat digunakan untuk memperkirakan data

menggunakan penerapan algoritma ​ naïve bayes ​ untuk melakukan pengolahan ​ data ​ bencana gempa bumi di Kepulauan Maluku Pada BMKG, sehingga akan didapat hasil akurasi

Sebelum melakukan analisis prediksi awal penyakit Diabetes Mellitus dengan algoritma Naïve Bayes, terlebih dahulu harus membuat data training dari dataset. Kemudian

Algoritma Naïve Bayes bertujuan untuk melakukan klasifikasi data pada kelas tertentu, kemudian pola tersebut dapat digunakan untuk memperkirakan data

Untuk menambah significant hasil, analisis perbandingan algoritma Naïve Bayes Classifier dengan Correlated-Naïve Bayes Classifier dapat diuji dengan data set

KESIMPULAN Komparasi algoritma Naïve bayes dan SVM mendapatkan hasil terbaik dengan algoritma Naïve Bayes dikarenakan pada algoritma Naïve Bayes melakukan proses pencarian bobot dengan

Pengujian dilakukan menggunakan algoritma Naïve Bayes dan Support Vector Machine SVM Berdasarkan hasil pengujian model algoritma Naïve Bayes menghasilkan nilai akurasi sebesar 75,43%