Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan
Ideal Balita dengan
Menggunakan Metode Naive Bayes Classifier
Octia Nuraeni 55410244
Teknik Informatika
LATAR BELAKANG
• Perkembangan teknologi informasi yang semakin
pesat
• Penggunaan konsep data mining
• Pertumbuhan dan perkembangan anak balita
yang ideal merupakan hal penting dan sangat
diinginkan bagi setiap orang tua.
• Agar hasil pengukuran berat badan balita
mendapatkan
hasil
yang
optimal
maka
digunakan teknik data mining dengan algoritma
NBC (Naïve Bayes Classifier).
BATASAN MASALAH
Lokasi Penelitian:Posyandu G 20 A RW 022 wilayah RW 022, Harapan
Jaya Bekasi Utara
Responden:
Para Kader Posyandu dan Orangtua Balita
Waktu Penelitian :
Bulan Mei 2014
Metode:
Teknik Data Mining Klasifikasi, Naive
Bayes Classifier
Dataset :
Data penimbangan balita yang berjumlah
250 instances
Permasalahan:
Menerapkan teknik data mining untuk menampilkaninformasi pertumbuhan berat badan ideal
balita menggunakan software aplikasi WEKA V3.6.9
TUJUAN PENULISAN
Menerapkan teknik data mining dengan algoritma Naive Bayesian Classifier untuk menampilkan informasi yang berharga dari data posyandu mengenai pertumbuhan balita ideal dan tidak ideal di wilayah RW 022 Posyandu G 20 A, Harapan Jaya Bekasi Utara
1
Menganalisis data balita di Posyandu G 20 A dan membuktikan kebenaran dari teknik data mining dengan mengukur hasil akurasinya.
ANALISA DAN PEMBAHASAN
• Data mining adalah suatu disiplin ilmu atau teknik menggali informasi berharga yang tersembunyi pada suatu database dengan volume besar sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui.
• Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan suatu class data, dengan tujuan untuk dapat memperkirakan class dari suatu atribut yang labelnya tidak diketahui.
• Algoritma Naive Bayes adalah salah satu algoritma dalam teknik klasifikasi yang mudah diimplementasikan dan cepat prosesnya.
ANALISA DAN PEMBAHASAN
• Klasifikasi Naive Bayes merupakan bentuk klasifikasi yang melakukan teknik pengklasifikasian dengan menghitung derajat kecocokan dengan cara membandingkan nilai Posterior untuk masing-masing
class, dan mengambil class dengan nilai Posterior yang tinggi. Rumus Naive Bayes Classifier
atau
• Untuk klasifikasi dengan data kontinyu digunakan rumus Densitas
ANALISA DAN PEMBAHASAN
Class Name : Tabel 1. Data Training Balita : data_posyandu.csv
Pertumbuhan Berat Badan Ideal Balita Class Label Attribut :
Ideal = [ Ya | Tidak ] Identifier :
Nama Balita
Attribut/Variabel dan Anggota attribut - Usia [ <=12 | 13...24 | 25...36 |
37...48 | 49...60 ] - Status [ Bayi | Balita ] - Berat Badan
- Hasil Berat Badan [ Underweight | Normal | Overweight ] - Jenis Kelamin [ Laki-laki | Perempuan ]
ANALISA DAN PEMBAHASAN
Rancangan Algoritma Naive Bayes
1. Menghitung jumlah class atau label attribut
P(Ya) = 222/250 = 0,888 → Jumlah data “Ya” pada data training dibagi dengan jumlah keseluruhan data.
P(Tidak) = 28/250 = 0,112 → Jumlah data “Tidak” pada data training dibagi dengan jumlah keseluruhan data.
2. Apabila data numerik, hitung mean dan standar deviasi setiap atribut/variabel Kemudian menghitung densitas Gauss data menggunakan persamaan dibawah ini.
ANALISA DAN PEMBAHASAN
3. Menghitung jumlah kategori atribut yang sama dengan class yang sama
P(Status = Bayi |Ya) = 21/222 = 0,094 P(Berat Badan = 8 | Ya) = 0,394 P(Status = Bayi | Tidak) = 1/28 = 0,036 P(Berat Badan = 8 | Tidak) = 0,527 P(Usia = <=12 | Ya) = 21/222 = 0,094
P(Usia = <=12 | Tidak) = 1/28 = 0,036
P(Hasil Berat Badan = Normal | Ya) = 212/222 = 0,955 P(Hasil Berat Badan = Normal | Tidak) = 0/28 = 0
P(Jenis Kelamin = Laki-laki|Ya) = 115/222 = 0,518 P(Jenis Kelamin = Laki-laki | Tidak) = 14/28 = 0,5
4. Kalikan semua hasil atribut Ya dan Tidak, kemudian hitung probabilitas setiap kategori dari input yang diberikan
P(Ya) = P(Status = Bayi|Ya) × P(Usia = <=12|Ya) × P(Berat Badan = 8|Ya) × P(Hasil Berat Badan = Normal|Ya) × P(Jenis Kelamin = Laki-laki|Ya) × P(Ya) = 0,094 × 0,094 × 0,394 × 0,955 × 0,518 × 0,888
ANALISA DAN PEMBAHASAN
P(Tidak) = P(Status = Bayi|Tidak) × P(Usia = <=12|Tidak) × P(Berat Badan = 8|Tidak) × P(Hasil Berat Badan = Normal|Tidak) × P(Jenis Kelamin = Laki-laki|Tidak) × P(Tidak)
= 0,036 × 0,036 × 0,527 × 0 × 0,5 × 0,112 = 0
Probabilitas Ya = = 1 × 100 % = 100 % Probabilitas Tidak = = 0 × 100 % = 0 % 5. Bandingkan hasil class Ya, dan Tidak
Dari hasil diatas, terlihat bahwa nilai probabilitas tertinggi ada pada kelas (P|Ya) sehingga dapat disimpulkan bahwa bayi yang bernama Alvin Chandra masuk dalam klasifikasi “Ya”. Artinya bayi tersebut memiliki pertumbuhan berat badan ideal.
ANALISA DAN PEMBAHASAN
ANALISA DAN PEMBAHASAN
• Perbandingan hasil yang didapat secara real (perhitungan manual berdasarkan Metode Konvensional dan Tabel Berat Badan Ideal Anak menurut WHO) dengan hasil yang didapat dari perhitungan menggunakan tools WEKA dengan teknik classifier NaiveBayes, seperti yang terlihat pada tabel 2.
Tabel 2. Perbandingan Hasil Perhitungan Secara Manual dengan Metode Naive Bayes Classifier Menggunakan WEKA
SIMPULAN
• Melalui teknik data mining yang digunakan, penulis telah berhasil mengumpulkan, menganalisa, dan mengklasifikasikan data balita sebanyak 250 instances mengenai pertumbuhan berat badan ideal dan tidak ideal balita di wilayah RW 022 Posyandu G20 A, Harapan Jaya Bekasi Utara pada bulan Mei tahun 2014. Penggunaan aplikasi WEKA dirasa dapat mempermudah para kader posyandu dalam menampilkan informasi pertumbuhan berat badan ideal balita.
• Berdasarkan hasil uji coba terhadap tools WEKA, terdapat sedikit perbedaan dari tingkat kevalidan hasil perhitungan status berat badan ideal dengan teknik classifier NaiveBayes. Dari 250 data instances, terdapat 240 data yang sesuai dengan class yang diberikan dan 10 data yang tidak sesuai dengan hasil yang diberikan. Hal ini dapat terjadi karena data training yang digunakan cukup akurat, sehingga perhitungan presentase tingkat akurasinya sebesar 96%.
SARAN
• Penelitian lanjutan dapat juga dilakukan dengan menggabungkan metode Bayes dengan metode lain seperti Association Rules, Decision Tree, Neural Network (NN) dan Support Vector Machine (SVM). Hasil dari perangkat lunak WEKA hanya bisa digunakan sesuai dengan apa yang sudah dilatih menggunakan data
training, sehingga keakuratan data harus tetap terjaga agar
mampu memberikan hasil yang lebih signifikan.
• Penulis juga berharap pada penelitian lanjutan bisa diimplementasikan melalui bahasa pemrograman seperti Java, Visual Basic, Matlab, dan lain sebagainya, sehingga penerapan teknik data mining dapat lebih dimengerti oleh user apabila diimplementasikan kedalam suatu aplikasi.
DAFTAR PUSTAKA
[1] Aplikasi Weka. http://sourceforge.net/projects/weka/. Tanggal akses 19 Mei 2014 pukul 12.17.
[2] Budi, Santoso. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta:Graha Ilmu. [3] Bustami. Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data Nasabah Asuransi.
http://ejurnal.tif.unimal.ac.id/index.php/ejournal/article/download/37/22 Tanggal akses 30 Juni 2014 pukul 12:17
[4] Danone Institue. Prinsip 4: Pentingnya Menjaga Berat Badan Ideal Pada Anak.
http://www.danonenutrindo.org/prinsip4_anak_anak.php. Tanggal akses 08 Agustus 2014 pukul 12:50
[5] Fauzy, Nurrochim. 2013. Sistem Pendukung Keputusan Berbasis Android Sebagai Penentu Kelayakan Peminjaman Uang
Menggunakan Metode Naive Bayes. Jakarta:Universitas Persada Indonesia YAI
[6] Haryanto. 2012. Teknik Data Mining Untuk Mendapatkan Informasi Dari Keluaran Perangkat Jaringan. Jakarta:Binus University
[7] Kusumadewi, Sri. 2009. Klasifikasi Status Gizi Menggunakan Algoritma Naive Bayes Classification. Yogyakarta:Universitas Islam Indonesia
[8] Natalius, Samuel. 2010. Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen. Bandung:ITB [9] Planet Sehat. Cara Menghitung Berat Badan Ideal Dengan Metode IMT dan Konvensional.
http://planetsehat.com/tips-diet/berat-badan-ideal/cara-menghitung-berat-badan-ideal-dengan-metode-imt-dan-konvensional/ . Tanggal akses 08 Juli
2014 pukul 22:57
[10] Prabowo, Sony. Tabel Berat Badan Anak Menurut Usia.
http://majalahkesehatan.com/tabel-berat-badan-anak-menurut-usia/. Tanggal akses 07 Mei 2014 pukul 07:34
[11] Pratama, Anindito Yoga. 2012. Penerapan Teknik Data Mining Untuk Menentukan Hasil Seleksi Masuk Sman 99 Jakarta
Untuk Siswa / Siswi Smpn 9 Jakarta Menggunakan Decision Tree. Jakarta:Universitas Gunadarma
[12] Rumus Hitung. Tabel Berat Badan Dan Tinggi Ideal Anak 0-5 Tahun.
http://rumushitung.com/2013/06/01/tabel-berat-badan-dan-tinggi-ideal-anak-0-5-tahun/. Tanggal akses 07 Mei 2014 pukul 07:30
[13] Susanto, Sani, Ph.D, Suryadi, Dedy. 2010. Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data. Yogyakarta:Andi.