ISSN: 1978-1520 1
KOMPARASI ALGORITMA PEMODELAN STATUS NILAI
GIZI BALITA NAIVE BAYES DAN DECISION TREE (ID3)
COMPARISON OF MODELING ALGORITHMS VALUES
NUTRITIONAL STATUS OF CHILDREN NAIVE BAYES AND
DECISION TREE
Panghegar Habibie Muhammad 1, Y. Tyas Catur Pramudi2 Universitas Dian Nuswantoro, Jl. Nakula 1 No.5-11, Semarang, 50131
Jurusan Teknik Informatika, Fakultas Ilmu Komputer
e-mail: [email protected], [email protected]
Abstrak
Pusat Kesehatan Masyarakat (Puskesmas) sebagai salah satu jenis fasilitas pelayanan kesehatan tingkat pertama memiliki peranan penting dalam sistem kesehatan nasional, khususnya subsistem upaya kesehatan. Naive bayes merupakan teknik prediksi berbasis probabilitas sederhana yang berdasar pada penerapan aturan bayes dengan asumsi ketidaktergantungan yang kuat. Selain itu naive bayes juga dapat menganalisa variabel-variabel yang paling mempengaruhinya dalam bentuk peluang. Sedangkan Algoritma ID3 memiliki akurasi yang tinggi, relatif cepat dalam proses, dapat otomatis melakukan seleksi atribut, mudah digunakan dan mudah dipahami, serta dapat menangani atribut kosong (missing value). Tujuan dari penentuan status nilai gizi dengan model pohon keputusan dari data status gizi balita ini adalah menghasilkan rule yang dapat digunakan untuk mengetahui atribut apa saja yang paling dominan terhadap status gizi balita kurang ideal.
Kata kunci — Puskesmas, Status Gizi Balita, Naive Bayes, ID3
Abstract
Puskesmas is a health agency that has responsibility for health services such as health of infants and toddlers. During their operational duties as health institutions, puskesmas also have data health were annually increased. Data are often not yet been studied or analyzed further as the data on the nutritional status of infants, especially regarding data nutritional status of children under five. There are still some toddlers who were included in the nutritional status not good need for more attention to the analysis and nutritional. In this research, the author implements the method of Decision Tree algorithm (ID3 algorithm) for modeling the nutritional status of children with a case study in Puskesmas Poncol Semarang. ID3 algorithm chosen because it has the advantages of high accuracy, relatively fast in the process, can automatically perform a selection attributes, easy to use and easy to understand. The indicators used in the analysis of the study the nutritional status of children under five are Weight for Age (BB/U), Length for Age (TB/U), Weight for Length (BB/TB), and the identity of toddlers like address and age (U). The results of the decision tree model and rule data patterns informed nutritional status related to puskesmas which can then be used for extension materials, repair, or monitoring of infants nutrition.
Keywords—puskesmas, the nutritional status of children under five, Decision Tree, ID3
1. PENDAHULUAN
Pusat Kesehatan Masyarakat sebagai salah satu jenis fasilitas pelayanan kesehatan tingkat pertama memiliki peranan penting dalam sistem kesehatan nasional, khususnya subsistem upaya kesehatan. Pusat Kesehatan Masyarakat diharuskan meningkatkan kualitas pelayanan dan program jaminan sosial nasional [1]. Penelitian yang dilakukan di Puskesmas
yang diperoleh adalah data enam kelurahan wilayah Puskesmas Pandanaran meliputi Kelurahan Pleburan, Bulustalan, Wonodri, Barusari, Mugasari, dan Randusari. Jumlah data yang didapatkan sebanyak 288 data dan terdiri dari 4 atribut yaitu jenis kelamin, kategori, kelurahan, dan BB/U. Atribut jenis kelamin diperoleh berjumlah 155 untuk laki-laki dan 133 untuk perempuan. Atribut kategori diperoleh berjumlah 192 untuk batita dan 96 untuk balita. Atribut alamat diperoleh berjumlah 57 untuk Randusari, 48 untuk Barusari, 49 untuk Mugasari, 44 untuk Bulustalan, 43 untuk Wonodri, dan 47 untuk Pleburan. Atribut BB/U diperoleh berjumlah 240 untuk gizi baik, 34 untuk gizi kurang, 8 untuk gizi lebih, dan 6 untuk gizi buruk.
Permasalahan gizi yang masih tetap ada dan jumlah cenderung bertambah adalah masalah gizi kurang dan gizi buruk[2].Terdapat beberapa teknik untuk membantu mengolah sejumlah data yang besar dan beragam salah satunya yaitu penulis menggunakan teknik data mining. Data mining memiliki definisi yaitu serangkaian proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar [3]. Data mining sering disebut sebagai Knowledge Discovery in Database (KDD) yang memiliki pengertian yaitu kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Naive bayes merupakan teknik prediksi berbasis probabilitas sederhana yang berdasar pada penerapan aturan bayes dengan asumsi ketidaktergantungan yang kuat. Selain itu naive bayes juga dapat menganalisa variabel-variabel yang paling mempengaruhinya dalam bentuk peluang [5]. Sedangkan Algoritma ID3 memiliki kelebihan yaitu memiliki akurasi yang tinggi, relatif cepat dalam proses, dapat otomatis melakukan seleksi atribut, mudah digunakan dan mudah dipahami, serta dapat menangani atribut kosong (missing value) [6].
Pada penelitian ini penulis akan membandingkan antara metode algoritma Naive Bayes dan Decision Tree (ID3) untuk memodelkan penentuan status nilai gizi balita pada Puskesmas Pandanaran kota Semarang. Tujuan dari penentuan status nilai gizi dengan model pohon keputusan dari data status gizi balita ini adalah menghasilkan rule yang dapat digunakan untuk mengetahui atribut apa saja yang paling dominan terhadap status gizi balita kurang ideal. Dengan demikian dapat dibuat suatu rekomendasi akan penyuluhan sehingga dapat dilakukan perbaikan dan pemenuhan gizi balita menjadi lebih baik.
Berdasarkan latar belakang yang telah dikemukakan maka penulis menentukan judul “Komparasi Algoritma Pemodelan Status Nilai Gizi Balita Antara Naive Bayes dan Decision Tree (ID3) (Studi Kasus Puskesmas Pandanaran Kota Semarang)”.
2. METODE PENELITIAN 1. Objek Penelitian
Pengambilan data ini berasal dari objek penelitian Puskesmas Pandanaran Semarang yang memiliki alamat di Jalan Pandanaran 79 Semarang. Penelitian yang digunakan data status gizi balita.
2. Sumber Data
Sumber data adalah segala sesuatu yang dapat memberikan informasi mengenai data. Sumber data yang digunakan dalam penelitian ini yaitu: Data sekunder yaitu beberapa studi
3. Teknik Analisis Data
Metode analisis dan permodelan data yang digunakan dalam penelitian ini adalah Cross Industry Standard Processing-Data Mining (CRISP-DM) dengan tahapan fase berikut ini: a. Fase Pemahaman Bisnis
Penelitian ini mengedepankan penentuan tujuan proyek dan kebutuhan secara detail dimana lingkup bisnis atau unit penelitian secara keseluruhan serta juga menerjemahkan tujuan dan batasan dari data yang diambil dari puskesmas menjadi formula dari permasalahan data mining mulai dari menyiapkan strategi awal hingga metode yang dibutuhkan untuk mencapai tujuan.
b. Fase Pemahaman Data
Proses memahami arti atribut yang ada di dalam data kesehatan Tabel 1. Keterangan Atribut Data
c. Fase Pengolahan Data
Atribut yang digunakan yaitu kategori, jenis kelamin, alamat, dan BB/U dengan proses konversi sebagai berikut: Atribut kategori dikonversi menjadi balita dan batita. Atribut alamat dikonversi menjadi nama kelurahan. Atribut status gizi (BB/U) dikonversi menjadi 4 nilai kategori sesuai Indeks Antropometri.
d. Fase Pemodelan
Gambar 1. Diagram Penelitian
Atribut Keterangan
Tanggal Timbang Atribut in menginformasikan tanggal timbang terakhir balita
Nama Balita Atribut ini menginformasikan nama balita yang mendapat pelayanan kesehatan Alamat Atribut ini menginformasikan alamat balita
Nama Orang Tua Atribut ini menginformasikan nama orang tua (ibu dan ayah) dari balita M/F Atribut ini menginformasikan jenis kelamin balita
Tanggal lahir Atribut ini menginformasikan tanggal lahir balita Umur (bulan) Atribut ini menginformasikan usia/umur balita BB (kg) Atribut ini menginformasikan berat badan balita UDEM Y/N Atribut ini menginformasikan penyakit oodema
H/L Atribut ini menginformasikan tinggi/ rendah kadar gizi balita PB/TB (cm) Atribut ini menginformasikan tinggi badan atau panjang badan balita WHZ Atribut ini menginformasikan nilai indeks berat badan per tinggi badan HAZ Atribut ini menginformasikan nilai indeks tinggi badan per umur WAZ Atribut ini menginformasikan nilai indeks berat badan per umur BMI Atribut ini menginformasikan nilai indeks massa tubuh per umur
e. Fase Evaluasi
Evaluasi dilakukan bertujuan agar pemodelan yang dihasilkan sesuai dengan tujuan awal yang ingin dicapai pada tahapan pemahaman bisnis yaitu menghasilkan informasi yang berguna bagi perbaikan gizi balita
3. HASIL DAN PEMBAHASAN 1. Dataset Awal
Dataset awal merupakan dataset asli dari puskesmas yang belum dilakukan proses seleksi maupun konversi data. Dataset awal belum dapat digunakan karena belum dilakukan seleksi dan konversi atribut. Dataset awal memiliki 9 atribut dengan contoh sebagai berikut
Tabel 2. Contoh Dataset Awal
Nama balita Tanggal
Lahir
L/P Umur
(bulan)
Orang Tua Alamat Hasil Pengukuran Status Gizi
BB (kg) TB(cm) BB/U
Aqilah Inayah 16-2-2015 P 3 Alex Adi/Husnaini Barusari RT 06 5,800 61,9 -0,11 Fahri 22-2-2013 L 26 Anjar/Ani Barusari RT 08 12,100 82,1 -0,42 Yasmin FP 28-1-2012 P 39 Joko/Anggraini Barusari RT 08 11,900 92 -1,57 Daha Ananda 29-11-2012 L 29 Syafii/Rahayu Barusari RT 06 10,900 92 -1,66 Kheisa R 23-7-2012 P 33 Sunoto/Susilowati Barusari RT 06 12,100 87 -0,84 Kirana KL 13-4-2013 P 25 Widianto/Yuni Barusari RT 08 13,800 85,9 1,28 Faizan KN 4-2-2015 L 3 Waskito/Reni Barusari RT 08 6,500 61,4 0.48 Shakila Aisya 12-9-2014 P 8 Reza S/Zulfida Barusari RT 08 8,600 70,3 0,58
2. Preprocessing (Dataset Baru)
Setelah dilakukan proses seleksi dan konversi atribut, contoh dataset baru yang dapat diproses adalah sebagai berikut
Tabel 3. Contoh Dataset Baru
JenisKelamin Kategori Alamat StatusGizi
L Balita Kelurahan Randusari gizi kurang L Balita Kelurahan Randusari gizi kurang L Balita Kelurahan Randusari gizi baik L Balita Kelurahan Randusari gizi baik L Balita Kelurahan Randusari gizi baik L Balita Kelurahan Randusari gizi kurang L Balita Kelurahan Randusari gizi kurang L Batita Kelurahan Randusari gizi baik
3. Implementasi Program Decision Tree
Gambar 2. Interface Halaman Utama
Halaman Utama digunakan untuk melakukan upload data kesehatan balita dalam bentuk file excel berekstensi csv atau xls.
Gambar 3. Interface Halaman Konfigurasi
Halaman Konfigurasi digunakan untuk mengatur role data seperti mengatur atribut mana yang digunakan sebagai label atau id atau sebagai atribut biasa untuk pembentukan pohon keputusan.
Gambar 4. Interface Halaman Klasifikasi
Halaman Klasifikasi berguna untuk menampilkan hasil pohon keputusan serta menampilkan rule. Namun rule ini belum dapat diinformasikan kepada puskesmas karena harus dianalisis berrdasarkan variabel status gizi.
Hasil Decision Tree menunjukkan hasil gambaran pohon penurunan
peta sebaran wilayah gizi bermasalah ataupun gizi normal. Selain itu semua referensi pustaka juga sama-sama menggunakan metode antropometri dengan indeks BB/U, BB/TB, dan TB/U.
Hasil dari aplikasi penulis yaitu model pohon keputusan beserta informasi pola data persebaran kasus balita berstatus gizi tidak baik. Pola data ini dapat digunakan untuk keperluan perbaikan gizi balita oleh puskesmas atau dinas kesehatan terkait. Pola data itu antara lain: a) Balita gizi lebih paling banyak (4 balita) terjadi pada balita laki-laki usia 37-60 di Kelurahan Purwodinatan
b) Balita gizi kurang paling banyak (9 balita) terjadi pada balita perempuan usia 0-36 di Kelurahan Pendrikan Lor
c) Balita gizi buruk paling banyak (3 balita) terjadi pada balita perempuan usia 37-60 di Kelurahan Purwodinatan
d) Kelurahan Pendrikan Lor merupakan wilayah dengan kasus gizi kurang tertinggi yaitu sebanyak 17 balita.
e) Kelurahan Pendrikan Lor merupakan wilayah dengan kasus gizi lebih tertinggi yaitu sebanyak 13 balita.
Dari informasi tersebut, pihak puskesmas terkait dapat mengetahui informasi yang bisa digunakan untuk perbaikan gizi balita dengan media penyuluhan ataupun pemantauan balita menurut usianya. Penyuluhan dapat dilakukan berdasar pada informasi yang dihasilkan misalnya penyuluhan diintensifkan untuk alamat yang paling banyak ditemukan kasus anak balita gizi tidak baik atau berdasar jenis kelamin balita yang paling banyak ditemukan kasus gizi buruk, kurang atau lebih.
Informasi juga dapat berguna untuk antisipasi terjadinya kasus gizi yang tidak baik. Contohnya dari adanya informasi pola data, apabila diketahui bahwa gizi buruk banyak terjadi pada usia 37-60 bulan maka perlu dilakukannya perhatian khusus dan lebih terhadap balita yang akan memasuki usia 37-60 bulan agar kondisi kesehatannya tetap terjaga dan terpantau secara baik sehingga dapat meminimalisasi terjadinya kasus balita yang bergizi buruk
4. KESIMPULAN
Berdasarkan hasil dan pembahasan penelitian, maka dapat diambil kesimpulan sebagai berikut: 1. Metode Decision Tree (ID3) dapat diterima dan diimplementasikan untuk penentuan model
status gizi anak balita pada Puskesmas Poncol kota Semarang.
2. Atribut berat badan, tinggi badan/panjang badan, umur, jenis kelamin, dan alamat merupakan atribut yang paling berpengaruh terhadap tumbuh kembang dan status gizi anak balita.
3. Hasil informasi pola data dapat digunakan untuk membantu perbaikan gizi balita di wilayah kelurahan terkait atau pada rentang usia 0-36 bulan dan 37-60 bulan, misalnya perlunya perbaikan gizi buruk secara khusus pada balita umur 37-60 bulan karena kasus gizi buruk banyak terjadi pada umur 37-60 bulan.
5. SARAN
Saran yang perlu diperhatikan untuk penelitian terkait selanjutnya yaitu:
1. Penelitian terhadap status gizi anak balita dapat dikembangkan lebih lagi dengan menggunakan data wilayah dan atribut yang lebih luas dan mencakup keseluruhan data yang ada di puskesmas, sehingga hasil rekomendasi perbaikan gizi dapat dibuat secara lebih lengkap dan akurat.
2. Penelitian dapat dikembangkan lebih lagi dengan menggunakan metode Decision Tree yang lain seperti C4.5 atau C5.0 ataupun menggunakan bahasa pemrograman lain seperti Java.
UCAPAN TERIMA KASIH
Segala puji syukur penulis panjatkan kepada Tuhan Yesus Kristus Maha Pengasih dan Maha Penyayang, yang telah melimpahkan segala kemurahan, anugrah, dan kasih-Nya kepada
“Implementasi Algoritma Decision Tree (ID3) Untuk Penentuan Model Status Gizi Anak Balita (Studi Kasus Puskesmas Poncol Kota Semarang)” dapat penulis selesaikan dengan rencana dukungan dari berbagai pihak yang tidak ternilai besarnya. Oleh karena itu penulis menyampaikan terima kasih kepada:
1. Dr. Ir Edi Noersasongko, M. Kom, selaku Rektor Universitas Dian Nuswantoro Semarang. 2. Dr. Drs. Abdul Syukur, MM, selaku Dekan Fasilkom Universitas Dian Nuswantoro. 3. Dr. Heru Agus Santoso, Ph.D, selaku Ketua Program Studi Teknik Informatika-S1 Fakultas
Ilmu Komputer Universitas Dian Nuswantoro Semarang.
4. Dr. Y. Tyas Catur Pramudi, SSi, M.Kom selaku pembimbing tugas akhir yang senantiasa baik hati, sabar, memberikan ide penelitian, informasi, semangat dan mengajarkan kerja keras untuk penulis.
5. De Rosal Ignatius Moses Setiadi, M.Kom, selaku Koordinator Tugas Akhir Program Studi Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang 6. Dosen-dosen pengampu di Fakultas Ilmu Komputer Teknik Informatika Universitas Dian
Nuswantoro yang telah memberikan ilmu dan pengalamannya masing-masing, sehingga penulis dapat mengimplementasikan ilmu yang telah disampaikan.
7. Orang tua serta kakak penulis tercinta yang telah memberikan motivasi dan semangat pada penulis dalam pembuatan laporan Tugas Akhir ini.
8. Seluruh sahabat, saudara, dan teman di Universitas Dian Nuswantoro yang selalu memberi dukungan, motivasi, informasi dan semangat pada penulis dalam menyelesaikan penelitian ini.
DAFTAR PUSTAKA