ii
IDENTIFIKASI STATUS GIZI BALITA BERDASARKAN INDEKS ANTROPOMETRI BB/U DAN BB/TB
MENGGUNAKAN JARINGAN SARAF TIRUAN
TESIS
NANI PURWATI 14001006
PROGRAM PASCASARJANA MAGISTER ILMU KOMPUTER SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
NUSA MANDIRI JAKARTA
2015
iii
SURAT PERNYATAAN ORISINALITAS
Yang bertanda tangan di bawah ini:
Nama : Nani Purwati NIM : 14001006
Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua (S2)
Konsentrasi : Management Information System(MIS)
Dengan ini menyatakan bahwa tesis yang telah saya buat dengan judul: “Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB menggunakan Jaringan Saraf Tiruan” adalah hasil karya sendiri, dan semua sumber baik yang kutip maupun yang dirujuk telah saya nyatakan dengan benar dan tesis belum pernah diterbitkan atau dipublikasikan dimanapun dan dalam bentuk apapun.
Demikianlah surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila dikemudian hari ternyata saya memberikan keterangan palsu dan atau ada pihak lain yang mengklaim bahwa tesis yang telah saya buat adalah hasil karya milik seseorang atau badan tertentu, saya bersedia diproses baik secara pidana maupun perdata dan kelulusan saya dari Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri dicabut/dibatalkan.
Bandung, Februari 2015 Yang menyatakan,
Materai Rp. 6.000,-
Nani Purwati
HALAMAN PENGESAHAN
iv Tesis ini diajukan oleh:
Nama : Nani Purwati
NIM : 14001006
Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua(S2)
Konsentrasi : Management Information System
Judul Tesis :”Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB Menggunakan Jaringan Saraf Tiruan”
Telah berhasil dipertahankan dihadapan Dewan Penguji dan diterima sebagai bagian persyaratan yang diperlukan untuk memperoleh gelar Magister Ilmu Komputer (M.Kom) pada Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri (STMIK Nusa Mandiri).
Jakarta, Maret 2015
Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri
Direktur
H. Mochamad Wahyudi, MM, M.Kom
D E W A N P E N G U J I
Penguji I : Romi Satria Wahono, M.Eng, Ph.D ...
Penguji II : Dr. Windu Gata, M.Kom ...
Penguji III / : Ir. Edi Rachman, M.Eng. ...
Pembimbing
KATA PENGANTAR
v
Puji syukur Alhamdullillah, penulis panjatkan kehadirat Allah SWT, yang telah melimpahkan rahmat dan karunia-Nya, sehingga pada akhirnya penulis dapat menyelesaikan tesis ini tepat pada waktunya. Dimana tesis ini penulis sajikan dalam bentuk laporan sederhana. Adapun judul tesis, yang penulis ambil sebagai berikut
“Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB menggunakan Jaringan Saraf Tiruan”.
Tujuan penulisan tesis ini dibuat sebagai salah satu syarat untuk mendapatkan gelar Magister Ilmu Komputer (M.Kom) pada Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri (STMIK Nusa Mandiri).
Tesis ini diambil berdasarkan hasil penelitian atau riset mengenai status gizi balita berdasarkan Indeks Antropometri BB/U dan BB/TB yang penulis lakukan Puskesmas Mranti Purworejo. Penulis juga lakukan mencari dan menganalisa berbagai macam sumber referensi, baik dalam bentuk jurnal ilmiah, buku-buku literatur, internet, dll yang terkait dengan pembahasan pada tesis ini.
Penulis menyadari bahwa tanpa bimbingan dan dukungan dari semua pihak dalam pembuatan tesis ini, maka penulis tidak dapat menyelesaikan tesis ini tepat pada waktunya. Untuk itu ijinkanlah penulis kesempatan ini untuk mengucapkan ucapan terima kasih yang sebesar-besarnya kepada :
1. Bapak Ir. Edi Rakhman, M.Eng selaku pembimbing tesis yang telah menyediakan waktu, pikiran dan tenaga dalam membimbing penulis dalam menyelesaikan tesis ini.
2. Bapak Moch. Wahyudi, MM, M.Kom, M.Pd selaku Direktur STMIK Nusa Mandiri yang telah mengijinkan penulis melakukan riset untuk mendapatkan data atau informasi yang penulis butuhkan.
3. Bapak Ir. Naba Aji Notoseputro selaku Direktur AMIK BSI yang telah mengijinkan penulis untuk menyelesaikan pendidikan S2
4. Seluruh staf pengajar (dosen) Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa
vi
Mandiri yang telah memberikan pelajaran yang berarti bagi penulis selama menempuh studi.
5. Seluruh staf dan karyawan Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri yang telah melayani penulis dengan baik selama kuliah.
6. Suami tercinta, dede bayi yang masih dalam kandungan dan keluarga yang selalu memberikan dukungan dengan sepenuh hati, hingga penulis dapat menyelesaikan tesis ini dengan baik.
Serta semua pihak yang tidak dapat penulis sebutkan satu persatu sehingga terwujudnya penulisan tesis ini. Penulis menyadari bahwa penulisan tesis ini masih jauh sekali dari sempurna, untuk itu penulis mohon kritik dan saran yang bersifat membangun demi kesempurnaan penulisan karya ilmiah yang penulis hasilkan untuk yang akan datang.
Akhir kata semoga tesis ini dapat bermanfaat bagi penulis khususnya dan bagi para pembaca yang berminat pada umumnya.
Bandung, 28 Februari 2015
Nani Purwati Penulis
SURAT PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
vii Yang bertanda tangan di bawah ini : Nama : Nani Purwati NIM : 14001006
Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua (S2)
Konsentrasi : Management Information System(MIS) Jenis Karya : Tesis
Demi pengembangan ilmu pengetahuan, dengan ini menyetujui untuk memberikan ijin kepada pihak Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri (STMIK Nusa Mandiri) Hak Bebas Royalti Non-Eksklusif (Non-exclusive Royalti-Free Right) atas karya ilmiah kami yang berjudul : “Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB menggunakan Jaringan Saraf Tiruan” beserta perangkat yang diperlukan (apabila ada).
Dengan Hak Bebas Royalti Non-Eksklusif ini pihak STMIK Nusa Mandiri berhak menyimpan, mengalih-media atau bentuk-kan, mengelolaannya dalam pangkalan data (database), mendistribusikannya dan menampilkan atau mempublikasikannya di internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari kami selama tetap mencantumkan nama kami sebagai penulis/pencipta karya ilmiah tersebut. Saya bersedia untuk menanggung secara pribadi, tanpa melibatkan pihak STMIK Nusa Mandiri, segala bentuk tuntutan hukum yang timbul atas pelanggaran Hak Cipta dalam karya ilmiah saya ini.
Demikian pernyataan ini saya buat dengan sebenarnya.
Bandung, 28 Februari 2015 Yang menyatakan,
Nani Purwati
ABSTRAK
Nama : Nani Purwati
viii
NIM : 14001006
Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua(S2)
Konsentrasi : Management Information System
Judul Tesis :”Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB Menggunakan Jaringan
Saraf Tiruan”
Kondisi kesehatan dan status gizi balita merupakan tolak ukur cerminan keadaan kondisi masyarakat secara luas. Status gizi balita dapat ditentukan berdasarkan indeks antropometri BB/U dan BB/TB dengan menggunakan standar baku WHO- NCHS. Penelitian ini bertujuan untuk mengklasifikasikan status gizi menggunakan Jaringan Saraf Tiruan Backpropagation berdasarkan indeks antropometri BB/U yang akan menghasilkan status gizi kedalam gizi buruk, kurang, baik, dan lebih, serta mengklasifikasikan status gizi berdasarkan indeks antropometri BB/TB yang akan menghasilkan status sangat kurus, kurus, normal dan gemuk. Variabel yang digunakan dalam penelitian ini yaitu jenis kelamin, umur, berat badan, tinggi badan, dan status ekonomi. Hasil dari uji coba menggunakan JST backpropagation, menghasilkan nilai akurasi sebesar 89,50% dan Kappa 0,711 pada data training, 96,08% dan Kappa 0,907 pada data testing untuk indeks BB/U. Sedangkan, untuk indeks BB/PB menghasilkan akurasi sebesar 88,50% dan Kappa 0,460 untuk data training, dan akurasi sebesar 83,35% dan Kappa 0,419 untuk data testing.
Kata kunci: status gizi balita, indeks antropometri, JST, backpropagation
ABSTRACT
Nama : Nani Purwati
ix
NIM : 14001006
Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua(S2)
Konsentrasi : Management Information System
Judul Tesis :”Toddler Nutrition Status Identification Based On Neural Network Using Anthropometry Index Knockoffs”
The nutritional status and health condition of babies is a benchmark reflecting the State of the condition of the community widely. Toddler nutrition status can Anthropometry index is determined based on w/U and w/TB with raw using standard WHO-NCHS. This research aims to classify the nutritional status using a Backpropagation Artificial Neural network based on Anthropometry index w/U that will produce the nutritional status in poor nutrition, lack of, both, and more, as well as classify nutritional status based on Anthropometry index w/PB status which will produce very skinny, skinny, normal and obese. The variables used in this study i.e., gender, age, weight, height, and economic status. Results from trials using backpropagation, yielding a value of JST accuracy of 89,50% and Kappa 0,711 on data training, 96,08% and Kappa 0,907 on testing data to index w/U. Whereas, in order to index w/TB produces the accuracy of 88,50% and Kappa 0,460 for training, data and accuracy of 83,35% and Kappa 0,419 for testing data.
Keywords:Toddler Nutrition Status, Anthropometry Index, Artificial Neural network, Backpropagation
DAFTAR ISI
Halaman HALAMAN SAMPUL... ...i
x
HALAMAN JUDUL... ii
HALAMAN PERNYATAAN ORISINALITAS... iii
HALAMAN PENGESAHAN... iv
KATA PENGANTAR... v
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS... vii
ABSTRAK... viii
ABSTRACT... ix
DAFTAR ISI... x
DAFTAR TABEL... xii
DAFTAR GAMBAR... xiii
DAFTAR PERSAMAAN ... xiv
BAB I . PENDAHULUAN ... Error! Bookmark not defined. 1.1. Latar Belakang... Error! Bookmark not defined. 1.2. Identifikasi Masalah ... Error! Bookmark not defined. 1.3. Tujuan Penelitian ... Error! Bookmark not defined. 1.4. Manfaat Penelitian ... Error! Bookmark not defined. 1.5. Ruang Lingkup Penelitian ... Error! Bookmark not defined. 1.6. Sistematika Penulisan ... Error! Bookmark not defined. BAB II LANDASAN TEORI ... 5
2.1. Tinjauan Pustaka ... 5
2.1.1. Status Gizi ... 5
2.1.1.1 Status Gizi Balita ... 6
2.1.2. Data Mining ... 7
2.1.3. Jaringan Syaraf Tiruan ... 12
2.1.3.1. Contoh Kasus Neural Network ... Error! Bookmark not defined. 2.1.5. Pengujian Evaluasi dan Validasi... 19
2.1.6. Kerangka Pemikiran ... 21
2.2. Tinjauan Studi ... 23
2.2.1. Keaslian Penelitian ... Error! Bookmark not defined. BAB III METODOLOGI PENELITIAN ... 26
3.1 Desain Penelitian ... 26
3.1.1 Jenis Penelitian ... 26
3.1.2 Pengumpulan Data ... 28
3.2 Experimen ... 28
xi
3.2.2 Metode yang diusulkan ... 33
3.2.3 Eksperimen dan Pengujian Metode ... 34
3.2.4 Evaluasi dan Validasi Hasil ... 35
3.2.5 Jadwal Penelitian ... 35
BAB IV HASIL PENELITIAN DAN PEMBAHASAN ... 36
4.1. Hasil Penelitian ... 36
4.1.1. Neural Network ... 36
4.1.2. Hasil Uji Neural Network ... 38
4.2. Evaluasi dan Validasi Hasil ... 38
4.3. Pembahasan ... 42
4.4. Implikasi Penelitian ... 45
BAB V PENUTUP ... 46
5.1. Kesimpulan ... 46
5.2. Saran ... 46
Daftar Pustaka ...…………. 47
DAFTAR TABEL Halaman Tabel 2.1 Klasifikasi Berdasarkan Indikator BB/U... 6
Tabel 2.2 Klasifikasi Berdasarkan Indikator TB/U... 6
Tabel 2.3 Klasifikasi Berdasarkan Indikator BB/TB... 7
Tabel 2.4 Inisialisasi Input, bobot, dan bias awal...16
Tabel 2.5 Hasil Perhitungan Input dan output...16
Tabel 2.6 Nilai Error ... 17
xii
Tabel 2.7 Bobot dan bias baru ...18
Tabel 2.8 Model Cofusion Matrix ... 19
Tabel 2.9 State Of the Art Research ... 23
Tabel 3.1 Atribut yang digunakan berdasarkan BB/U ...29
Tabel 3.2 Atribut yang digunakan berdasarkan BB/TB...30
Tabel 3.3 Sample Data Balita berdasarkan BB/U...31
Tabel 3.4 Sample Data Balita berdasarkan BB/TB...32
Tabel 3.5 Spesifikasi Hardware dan Software...34
Tabel 3.6 Jadwal Penlitian ... 35
Tabel 4.1 Eksperimen Penentuan Nilai Hiden Laye r...36
Tabel 4.2 Nilai Bobot Akhir...38
Tabel 4.3 Nilai Output Layer ... 38
Tabel 4.4 Model Confusion Matrix untuk Accuracy...40
Tabel 4.5 Model Confusion Matrix untuk Kappa...40
Tabel 4.6 Nilai Akurasi Data Testing ... 41
Tabel 4.7 Nilai Kappa Data Testing ...41
Tabel 4.8 Nilai Akurasi Data Baru...42
Tabel 4.9 Komparasi Akurasi... 42
Tabel 4.10 Nilai Standar Deviasi Pretest... 43
Tabel 4.11 Nilai Standar Deviasi Postest... .43
DAFTAR GAMBAR
Halaman Gambar 2.1 Tahapan Proses Kowledge Management Discovery (KDD) ... Error!
Bookmark not defined.
Gambar 2.2 Multi Layer Feed Forward Neural Network ... Error! Bookmark not defined.
xiii
Gambar 2.3 Contoh Kasus Multi Layer Feed Forward Neural Network ... Error!
Bookmark not defined.
Gambar 2.4 Kerangka Pemikiran ... Error! Bookmark not defined.
Gambar 3.1 Metode yang diusulkan ... Error! Bookmark not defined.
Gambar 4.1 Neural Network Klasifikasi Status Gizi Balita ... Error! Bookmark not defined.
Gambar 4.2 Desain model Validasi ... Error! Bookmark not defined.
Gambar 4.3. Model pengujian cross validation ... Error! Bookmark not defined.
Gambar 4.4 Pengujian Model Menggunakan RapidMiner ... Error! Bookmark not defined.
Gambar 4.5 GUI Sistem Identifikasi Status Gizi balita ... Error! Bookmark not defined.
DAFTAR PERSAMAAN
xiv
Halaman
2.1 Perhitungan Z-Score... 3
2.2 Hitung Input ...14
2.3 Output ... 14
2.4 Hitung Nilai Error ... 14
2.5 Error Pada Hiden Layer ... 14
2.6 Nilai Bobot Relasi ... 15
2.7 Nilai Akurasi ... 19
2.8 Tingkat Negatif Benar ... 19
2.9 Tingkat Negatif Palsu ... 19
2.10 Tingkat Positif Palsu ... 19
2.11 Tingkat Positif Benar ... 19
2.12 Presisi ... 20
3.1 Frekuensi Interval ... 33
4.1 Standar Deviasi ... 43
1
BAB I
PENDAHULUAN 1.1. Latar Belakang
Keberhasilan suatu bangsa sangat bergantung pada keberhasilan dalam menyiapkan generasi penerus bangsa yang berkualitas, cerdas, sehat dan produktif.
Kehidupan Manusia dimulai dari sejak janin dalam rahim ibu. Sejak saat itu manusia kecil sudah memulai perjuangan untuk bertahan hidup, salah satunya dari kemungkinan kurangnya gizi yang diterima dari ibu yang mengandungnya (Prof.dr.Haman Hadi.M.S., 2005). Kondisi kesehatan dan status gizi balita merupakan salah satu tolok ukur cerminan keadaan gizi masyarakat secara luas.
Kasus gizi buruk tidak hanya menjadi beban keluarga tetapi juga menjadi beban Negara (Swastina & Lareno, 2014).
Masalah gizi pada anak balita di Indonesia telah mengalami perbaikan. Hal ini dapat dilihat antara lain dari penurunan prevalensi gizi buruk pada anak balita dari 5,4% tahun 2007 menjadi 4,9% pada tahun 2010. Meskipun terjadi penurunan, tetapi jumlah nominal anak gizi buruk masih relatif besar, oleh karena itu diperlukan tenaga yang mampu mengatasi kasus gizi buruk secara cepat, tepat dan profesional yang diikuti dengan penyiapan sarana dan prasarana yang memadai.
Untuk menyiapkan tenaga kesehatan terampil seperti yang diharapkan selain memberikan peningkatan kapasitas juga diperlukan panduan tatalaksana gizi buruk yang akan digunakan tenaga kesehatan dalam melakukan penanggulangan gizi buruk oleh tim asuhan gizi (dokter, perawat, dan ahli gizi) (Kementerian Kesehatan, 2011).
Tumbuh kembang balita sangat dipengaruhi oleh asupan gizi pada menu makanan yang diberikan. Asupan makanan akan berpengaruh terhadap keaktifan dan kecerdasan balita. Oleh karena itu pada saat proses tumbuh kembangnya, balita harus memperoleh asupan makanan yang sesuai dengan kebutuhan agar pertumbuhan dan perkembangannya optimal. Namun saat ini masih banyak orangtua yang memiliki keterbatasan pengetahuan tentang kebutuhan gizi balita, sehingga menyebabkan balita mengalami masalah gizi. Faktor lain adalah
keterlambatan dalam penanganan penyakit gizi dan kurangnya tenaga ahli atau pakar.
Beberapa penelitian mengenai indentifikasi status gizi telah banyak dilakukan seperti penelitian yang dilakuan oleh Xu De Zhi dan Gamage Upeksha Ganegoda yang berjudul Rule Based Classifiation to Detect Malnutrition in Children. Dalam makalahnya menjelaskan bagaimana Rule Based Clasification digunakan untuk mendeteksi kekurangan gizi pada anak. Sistem yang diusulkan ini diimplementasikan sebagai sistem e-government. Selanjutnya penulis mencoba untuk meneliti apakah ada hubungan antara jumlah aturan yang digunakan dengan optimalitas keputusan akhir. Dan dari penelitian tersebut diperoleh kesimpulan bahwa ada hubungan antara sejumlah aturan dan optimalitas keputusan akhir (Zhi
& Ganegoda, 2011).
Penelitian Selanjutnya dilakukan oleh D.Thangamani dan P.Sudha yang berjudul Identification Of Malnutrition With Use Of Supervised Datamining Techniques – Decision Trees and Artificial Neural Networks. Dalam Penelitian ini mencoba untuk menunjukkan analisis gizi buruk berdasarkan asupan makanan, indeks kaya, kelompok usia, tingkat pendidikan, pekerjaan, dan lain-lain. Tujuan dari penelitian mereka menggunakan supervised machine learning techniques- decision trees and artificial neural networks untuk mengklasifikasikan dataset survai kesehatan keluarga dan untuk menentukan metode yang tepat dan fleksibel untuk memproses sejumlah besar data untuk menentukan deteksi malnutrisi yang akurat dan pencegahannya. Hasil dari supervised data mining techniques dapat memberikan status gizi balita. (D.Thangamani & P.Sudha, 2014).
Selain itu D. Thangamani dan P. Sudha juga melakukan penelitian dengan judul Identification of Various Deficiencies Using Data Mining Techniques – A Survey.
Penelitian ini memberikan identifikasi kekurangan gizi dari anak-anak dan orang tua, menggunakan decision tree, classification methods, artificial neural networks, support vector machines dan statistical methods. (D.Thangamani & P.Sudha, Identification of Various Deficiiencies Using Data Mining Techniques- A Survey, 2014).
Untuk mengidentifikasi status gizi pada balita, maka penulis mencoba melakukan penelitian menggunakan Jaringan Syaraf Tiruan backpropagation berdasarkan indeks antropometri BB/U dan BB/TB.
1.2.Identifikasi Masalah
Berdasarkan latar belakang permasalahan yang telah disebutkan dalam uraian sebelumnya maka dapat diidentifikasikan permasalahan sebagai berikut:
Saat ini, banyak metode yang dapat digunakan untuk identifikasi status gizi, diantaranya metode statistik dan data mining. Dalam metode data mining dikenal salah satu metode yang dapat digunakan untuk identifikasi status gizi, yaitu metode atau model jaringan saraf tiruan (neural network). Model jaringan saraf tiruan ini pun memiliki banyak algoritma yang masing-masing memiliki tingkat akurasi yang berbeda.
1.3. Tujuan Penelitian
Tujuan dari penelitian ini adalah mengidentifikasi status gizi balita berdasarkan indeks antropometri BB/U dan BB/TB dengan menggunakan Jaringan Syaraf Tiruan backpropagation .
1.4. Manfaat Penelitian
a. Manfaat praktis dari hasil penelitian ini adalah dapat digunakan oleh pihak medis untuk penentuan status gizi balita.
b. Manfaat kebijakan dari hasil penelitian ini adalah dapat digunakan sebagai bahan pertimbangan dalam identifikasi status gizi balita.
c. Manfaat teoritis dari penelitian ini yaitu diharapkan dapat memberikan sumbangan untuk pengembangan teori yang berkaitan dengan Jaringan Syaraf Tiruan Backpropagation.
1.5.Ruang Lingkup Penelitian
Penelitian ini membahas Jaringan Syaraf Tiruan dalam pengidentifikasian status gizi pada balita berdasarkan indeks antropometri BB/U dan BB/TB.
1.6. Sistematika Penulisan
BAB I : Pendahuluan. Bab ini membahas latar belakang penelitian, identifikasi masalah, tujuan, manfaat penelitian, ruang lingkup penelitian dan sistematika penulisan.
BAB II : Landasan/Kerangka pemikiran. Pada bab ini dibahas teori yang melandasi penelitian, dalam bab ini juga diuraikan tinjauan pustaka dan objek penelitian.
BAB III: Metode penelitian. Membahas mengenai data dan pengujian algoritma untuk identifikasi status gizi.
BAB IV: Hasil penelitian dan pembahasan. Menampilkan hasil dari pengujian algoritma, baik sebelum diterapkan model maupun setelah diterapkan model. Pada bab ini juga membahas metode mengukur hasil dengan metode statistik.
Ditampilkan hasil uji dalam model statistik.
BAB V: Penutup. Membahas kesimpulan dari penelitian yang dilakukan dan saran untuk penelitian selanjutnya.
BAB II
LANDASAN TEORI 2.1. Tinjauan Pustaka
Dalam makalah ini penulis melakukan tinjauan dengan menggunakan buku dan jurnal yang berhubungan dengan tema yang dipilih secara lebih detail tinjauan dalam penulisan tesis ini dapat dijelaskan sebagai berikut:
2.1.1. Status Gizi
Status gizi adalah suatu ukuran mengenai kondisi tubuh seseorang yang dapat dilihat dari makanan yang dikonsumsi dan penggunaan zat-zat gizi di dalam tubuh.
Status gizi dibagi menjadi tiga kategori, yaitu status gizi kurang, gizi normal, dan gizi lebih (Almatsier, 2005). Menurut (Wahyuningsih, Khamsan, & Ekawidyani, 2014) Status Gizi merupakan tanda-tanda penampilan seseorang akibat keseimabangan antara pemasukan dan pengeluaran zat gizi yang berasal dari pangan yang dikonsumsi pada suatu saat berdasarkan ketegori dan indikator yang digunakan.
Seseorang diidentifikasi status gizi normal apabila terdapat keseimbangan antara jumlah energi yang masuk ke dalam tubuh dan energi yang dikeluarkan dari luar tubuh sesuai dengan kebutuhan individu. Energi yang masuk ke dalam tubuh dapat berasal dari karbohidrat, protein, lemak dan zat gizi lainnya (Nix, 2005).
Status gizi kurang atau yang lebih sering disebut undernutrition merupakan keadaan gizi seseorang dimana jumlah energi yang masuk lebih sedikit dari energi yang dikeluarkan. Hal ini dapat terjadi karena jumlah energi yang masuk lebih sedikit dari anjuran kebutuhan individu (Wardlaw & Hampl, 2007). Sedangkan Status gizi lebih (overnutrition) merupakan keadaan gizi seseorang dimana jumlah energi yang masuk ke dalam tubuh lebih besar dari jumlah energi yang dikeluarkan (Nix, 2005).
2.1.1.1 Status Gizi Balita
Status gizi balita diukur berdasarkan umur, berat badan (BB), dan Tinggi Badan (TB). Variabel BB dan TB tersebut disajikan dalam bentuk tiga indikator antropometri yaitu berat badan menurut umur (BB/U), tinggi badan menurut umur (TB/U), dan berat badan menurut tinggi badan (BB/TB). Angka berat badan dan tinggi badan setiap balita dikonversikan kedalam betuk nilai Z-Score dengan menggunakan buku antropometri WHO 2006 (Depkes RI, 2009).
Dari berbagai jenis indeks tersebut diatas, untuk menginterprestasikannya dibutuhkan ambang batas. Penentuan am
bang batas dapat disajikan kedalam tiga cara yaitu persen terhadap median, persentil dan standar deviasi unit. Rumus perhitungan Z-Score adalah sebagai berikut (Supariasa & Fajar, 2002).
Z-Score= Nilai Individu Subjek – Nilai Median Baku Rujukan (2.1)
Tabel 2.1. Klasifikasi Status Gizi Balita Berdasarkan Indikator BB/U Indekks Status Gizi Ambang Batas
Berat Badan terhadap Umur (BB/U)
Gizi buruk <-3,0 SD
Gizi Kurang <-2,0 SD sampai >=-3,0 SD
Gizi Normal >=-2 SD sampai +2,0 SD Gizi Lebih >+2,0 SDD
Tabel 2.2. Klasifikasi Status Gizi Balita Berdasarkan Indikator TB/U
Nilai Simpangan Baku Rujukan
Indeks Status Gizi Ambang Batas Tinggi Badan terhadap
Umur (TB/U)
Sangat pendek
<-3,0 SD
Pendek >=-3,0 SD sampai <-2,0 SD
Normal >=-2,0 SD
Tabel 2.3. Klasifikasi Status Gizi Balita Berdasarkkan Indikator TB/BB
Indeks Status Gizi Ambang Batas
Tinggi Badan terhadapa Berat Badan (TB/BB)
Sangat kurus <-3,0 SD
Kurus >=-3,0 SD sampai <-2,0 SD
Normal >=-2,0 sd sampai <=2,0 SD
Gemuk >2,0 SD
Indikator BB/U memberikan gambaran tentang status gizi yang sifatnya umum, tidak spesifik. Tinggi rendahnya prevalensi gizi buruk dan kurang mengindikasikan ada tidaknya masalah gizi pada balita, tetapi tidak memberikan indikasi apakah masalah gizi tersebut bersifat kronis atau akut. Indikator TB/U menggambarkan status gizi yang dipengaruhi kondisi-kondisi yang sifatnya kronis (akibat kondisi yang berlangsung sangat lama). Indikator BB/TB menggambarkan status gizi yang sifatnya akut (akibat keadaan yang berlangsung dalam waktu pendek) (Depkes RI, 2009).
2.1.2. Data Mining
Data Mining didefinisikan sebagai proses menemukan dan membaca pola dalam data sehingga dapat digunakan sebagai alat untuk membantu menemukan informasi yang sangat penting dari data tersebut (Witten, Frank, & Hall, 2011).
Data mining juga dapat didefinisikan sebagai proses ekstraksi pengetahuan dari jumlah data yang besar (Han & Kamber, 2006). Data mining juga dapat digunakan untuk mengembangkan model yang bermanfaat untuk memahami fenomena dari analisis data dan prediksi (Maimon & Rokach, 2010).
Secara umum, tugas data mining dapat diklasifikasikan menjadi dua kategori: deskriptif dan prediktif (Han & Kamber, 2006). Tugas mining deskriptif mengungkapkan pola dalam data dan mudah diinterpretasikan oleh pengguna seperti clustering, association rule, dll. Tugas mining prediktif menggunakan beberapa variabel yang ada untuk memprediksi nilai dari variabel lain seperti classification, regression, dll (Gorunescu, 2011). Data mining merupakan bagian dari Knowldge Discovery Data (KDD) yang digunakan untuk menggali informasi yang berguna, yang tidak diketahui sebelumnya, dan masih tersembunyi dari gudang data (Han & Kamber, 2006)
Gambar 2.1 Tahapan Proses Kowledge Management Discovery (KDD) Sumber: (Han & Kamber, 2006)
Tahapan data mining dalam proses penemuan pengetahuan (Han & Kamber, 2006):
1. Database
Koleksi data yang saling berhubungan untuk dipergunakan secara bersama kemudian dirancang untuk memenuhi kebutuhan informasi organisasi.
2. Data Cleaning
Pada umumnya, data yang diperoleh, baik dari database suatu perusahaan maupun eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau hanya sekedar salah ketik. Data-data yang tidak relevan itu juga lebih baik dibuang karena keberadaanya bisa mengurangi mutu atau akurasi dari hasil data mining nantinya. Pembersihan data juga akan mempengaruhi performasi dari system data mining karena data yang akan ditangani akan berkurang jumlah dan kompleksitasnya.
3. Data integration
Integrasi data dilakukan pada attribut-attribut yang mengidentifikasikan entitas- entitas yang unik seperti attribut nama,nomor pegawai, tempat lahir,agama dan lain sebagainya. Integrasi data perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa menghasilkan hasil data yang menyimpang dan bahkan menyesatkan pengambilan aksi nantinya.
4. Data Selection
Merupakan proses seleksi dimana hanya data yang relevan dengan tugas analisis basis data yang akan diambil.
5. Data transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuain untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam database.
6. Data mining
Data mining adalah proses mengeksplorasi dan menganalisa data dalam jumlah yang besar yang bertujuan untuk menemukan suatu pola atau informasi yang menarik dari data yang tersimpan dalam jumlah yang besar dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. Tahap ini merupakan inti dari tahapan KDD yang dilakukan untuk menganalisis data yang telah dibersihkan.
7. Pattern evaluation
Dalam tahap ini, merupakan hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai dengan hipotesa, ada beberapa alternatif yang dapat diambil seperti menjadikannnya umpan balik untuk memperbaiki data mining lain yang lebih sesuai, atau menerima hasilnya sebagi suatu hasil yang diluar dugaan yang mungkin bermanfaat.
8. Knowledge
Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisa yang didapat. Adakalanya hal ini harus melibatkan orang-orang yang tidak paham mengenai data mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data mining.
Dalam presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil data mining.
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat di lakukan, yaitu (Larose, 2006).
1. Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecendrungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecendrungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik dari pada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah:
a. Prediksi harga beras dalam tiga bulan yang akan datang.
b. Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan
estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Model klasifikasi yang populer adalah Decision/classification trees, Bayesian classifiers/Naive Bayes classifiers, Neural networks, Algoritma Genetika, Support vector machines.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
Kluster adalah kumpulan record yang memiliki kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
2.1.3. Jaringan Syaraf Tiruan
JST adalah sistem komputasi dimana arsitektur dan operasi diilhami dari pengetahuan tentang sel syaraf biologis dalam otak. Istilah JST digunakan karena jaringan syaraf ini diimplementasikan dengan menggunakan program komputer yang mampu menyelesaikan sejumlah proses perhitungan selama proses pembelajaran, cara kerja jaringan syaraf tiruan meniru cara kerja otak manusia (Siang 2009). Salah satu contoh pengambilan ide dari jaringan syaraf biologis
adalah adanya elemen-elemen pemrosesan pada JST yang saling terhubung dan beroperasi secara paralel. Ini meniru jaringan syaraf biologis yang tersusun dari sel- sel syaraf (neuron) (Sihombing, 2011).
JST tidak diprogram untuk menghasilkan keluaran tertentu. Semua keluaran atau kesimpulan yang ditarik oleh jaringan didasarkan pada pengalamannya selama mengikuti proses pembelajaran. Pada proses pembelajaran, kedalam JST dimasukkan pola-pola (input dan output) lalu jaringan akan diajari untuk memberikan jawaban yang bisa diterima. Di dalam JST, input akan diproses oleh neuron-neuron JST dengan bobot tertentu. Secara umum cara kerjanya adalah dengan memproses sinyal yang diterima kemudian didistribusikan melewati jaringan dan disimpan sebagai bobot disetiap neuron. Selama proses pelatihan, dilakukan proses penyesuaian bobot dan batas nilai-nilai diperoleh output yang diinginkan (Sihombing, 2011).
JST dibentuk sebagai generalisasi model matematika dari jaringan syaraf biologi dengan asumsi bahwa (Sihombing, 2011) :
a. Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron).
b. Sinyal dikirimkan diantara neuron-neuron melalui penghubung- penghubung.
c. Penghubung antar neuron memiliki bobot yang akan memperkuat atau memperlemah sinyal.
Algoritma neural network yang paling populer adalah Backpropagation, algoritma backpropagation melakukan pembelajaran pada jaringan saraf multi layer feed forward yang terdiri dari tiga lapisan/layer, yaitu: lapisan input, lapisan tersembunyi, dan lapisan keluaran (Han & Kamber, 2006). Pada beberapa diagram neural network dimungkinkan terdapat lebih dari satu lapisan tersembunyi, meskipun kebanyakan hanya mengandung satu lapisan tersembunyi yang dirasa cukup untuk berbagai tujuan (Larose, 2006).
Backpropagation merupakan suatu algoritma yang menggunakan metode pembelajaran terbimbing (supervised learning) yang dikenalkan oleh Rumelhart dkk. Backpropagation merupakan algoritma neural network untuk klasifikasi yang menggunakan gradient descent, backpropagation mencari satu set bobot yang
dapat memodelkan data sehingga dapat meminimalkan jarak kuadrat rata-rata antara prediksi kelas jaringan dan label kelas yang sebenarnya dari tuple data (Han
& Kamber, 2006).
Tiap observasi data training diproses melalui jaringan, nilai output dihasilkan dari node input. Nilai output ini kemudian dibandingkan dengan nilai aktual dari variabel target dan dihitung error yang dihasilkan (Larose, 2006). Backpropagation melakukan proses pembelajaran secara iteratif yang mencoba untuk meminimalkan error dari klasifikasi.
Gambar 2.2 Multi Layer Feed Forward Neural Network Sumber: (Han & Kamber, 2006)
Proses pembelajaran dalam backpropagation dilakukan dengan penyesuaian bobot- bobot neuron dengan arah mundur berdasarkan nilai error dalam proses pembelajaran (Kusrini & Luthfi, 2009). Dalam setiap proses, bobot relasi dalam jaringan dimodifikasi untuk meminimalkan nilai Mean Squared Error (MSE) antara nilai prediksi dari jaringan dengan nilai sesungguhnya. Modifikasi relasi jaringan tersebut dilakukan dalam arah mundur (Kusrini & Luthfi, 2009).
Langkah pembelajaran dalam metode backpropagation adalah sebagai berikut (Myatt, 2007):
1. Inisialisasi semua bobot jaringan secara acak. (Biasanya antara -1.0 hingga 1.0).
2. Untuk setiap data training, hitung input untuk simpul berdasarkan nilai input dan bobot jaringan saat itu. Dengan menggunakan rumus :
Ij=∑𝑖 𝑊𝑖𝑗 𝑂𝑖 + 𝜃𝑖 (2.2)
Keterangan:
Oi = Output simpul i dari layer sebelumnya
wij = bobot relasi dari simpul i pada layer sebelumnya ke simpul j ϴj = bias (sebagai pembatas)
3. Berdasarkan input dari langkah kedua, selanjutnya membangkitkan output untuk simpul menggunakan fungsi aktifitas sigmoid
Output = 1
1+𝑒−𝑖𝑛𝑝𝑢𝑡 (2.3)
4. Hitung nilai error antara nilai yang diprediksi dengan nilai yang sesungguhnya menggunakan rumus :
Errori = outputi * (1-Outputi)*(Targeti – Outputj) (2.4) Keterangan :
Outputi = Output actual dari simpul i
Targeti = nilai target yang sudah diketahui pada data training
5. Setelah nilai error dihitung, selanjutnya dibalik ke layer sebelumnya (backpropagation). Untuk menghitung nilai error pada hidden layer, menggunakan rumus:
Errori = Outputi * (1 – Outputi )*∑ = 1 𝐸𝑟𝑟𝑜𝑟 𝑗 𝑊𝑖𝑗𝑛𝑗 (2.5) Keterangan:
Errori : Error yang dihasilkan dari hidden node Outputi : Nilai output yang dari hidden node
Errorj : Error yang dihasilkan dari simpul j yang terhubung ke output Wij : Bobot pada pada simpul i ke simpul j
6. Nilai error yang dihasilkan dari langkah sebelumnya digunakan untuk memperbarui bobot relasi, dengan menggunakan rumus:
Wij = Wij + l * Errorj * Outputi (2.6) Keterangan :
Wij = bobot relasi dari unit i pada layer sebelumnya ke unit j l = learning rate (konstantan, nilainya 0 sampai dengan 1) Errorj = Error pada output layer simpul j
Outputi = Output dari simpul i.
Jika nilai l kecil, maka perubahan bobot akan sedikit dalam setiap iterasi. Begitu juga sebaliknya.
2.1.3.1. Contoh Kasus Neural Network
Studi kasus berikut ini dapat membantu untuk lebih memahami teori dari algoritma nerual network dengan menggunakan backpropagation. Pada gambar 2.3 menunjukan multilayer feed-forward neural network, diberikan nilai learning rate sebesar 0,9 dengan kasus X = (1, 0, 1) class label adalah 1.
Gambar 2.3 Contoh Kasus Multi Layer Feed Forward Neural Network Sumber: (Han & Kamber, 2006)
Jaringan terdiri dari tiga buah input, satu buah hidden layer dengan dua neuron, dan satu buah output.
Langkah-langkah yang dilakukan dalam proses pembelajaran algoritma backpropagation yaitu:
1. Inisialisasi bobot awal secara acak
Untuk tiap node pada input layer dan hidden layer, diberi nilai acak antara -1.0 hingga 1.0, begitu juga dengan bobot bias yang terhubung dengan hidden layer dan output layer seperti pada tabel 2.4.
Tabel 2.4 Inisialisasi Input, Bobot, dan Bias Awal
Sumber: (Han & Kamber, 2006) 2. Hitung input, output, dan error
Dengan menggunakan persamaan 2.5 dan 2.6 didapat input dan output masing- masing simpul
Input4 = (x1 * w14) + (x2 * w24) + (x3 * w34) + Ɵ4
= (1 * 0.2) + (0 * 0.4) + (1 * -0.5) + -0.4 = 0.2 + 0 – 0.5 – 0.4
= -0.7
Output4 = 1/(1 + e-input4) = 1/(1 + e0.7)
= 0.332
Dengan menggunakan cara yang sama dihitung input untuk node 5 dan 6, sehingga didapat nilai seperti pada tabel 2.5.
Tabel 2. 5 Hasil Perhitungan Input dan Output
Sumber: (Han & Kamber, 2006)
3. Hitung nilai error antara nilai yang diprediksi dengan nilai yang sesungguhnya Dengan menggunakan persamaan 2.5 maka diperoleh nilai error untuk simpul 4, 5, dan 6 seperti tampak pada tabel 2.5
Error6 = Output6 ∙ (1 - Output6) ∙ (Outputtarget - Output6)
= 0.474 * (1 - 0.474) * (1 – 0.474)
= 0.1311
Error5 = Output5 ∙ (1 – Output5) ∙ Error6 ∙ w56
= 0.525 ∙ (1 - 0.525) ∙ 0.1311 ∙ -0.2
= -0.0065
Error4 = Output5 ∙ (1 – Output4) ∙ Error6 ∙ w46
= 0.332 ∙ (1 - 0.332) ∙ 0.1311 ∙ -0.3
= -0.0087
Tabel 2. 6 Nilai Error
Sumber: (Han & Kamber, 2006)
4. Hitung bobot baru untuk semua relasi antara hidden layer dengan output layer, dilanjutkan dengan menghitung bobot relasi antara input layer dengan hidden layer. Sehingga diperoleh nilai bobot baru seperti pada tabel 2.7
Tabel 2.7 Bobot dan Bias Baru
Sumber: (Han & Kamber, 2006) 2.1.5. Pengujian Evaluasi dan Validasi
Akurasi dari sebuah model mengindikasikan kemampuan model tersebut untuk memprediksi class target sehingga sangat penting untuk mengevaluasi akurasi dari model klasifikasi (Vercellis, 2009). Validasi adalah proses mengevaluasi akurasi prediksi dari sebuah model, validasi mengacu untuk mendapatkan prediksi dengan menggunakan model yang ada kemudian membandingkan hasil yang diperoleh dengan hasil yang diketahui (Gorunescu, 2011).
1. Confusion Matrix
Confusion matrix merupakan dataset hanya memiliki dua kelas, kelas yang satu sebagai positif dan kelas yang lain sebagai negatif (Bramer, 2007). Evaluasi kinerja model klasifikasi didasarkan pada pengujian objek yang diprediksi dengan benar dan salah, hitungan ini ditabulasikan Confusion Matrix (Gorunescu, 2011).
Confusion Matrix adalah alat yang berguna untuk menganalisis seberapa baik classifier dapat mengenali tupel dari kelas yang berbeda (Han & Kamber, 2006).
Confusion matrix memberikan rincian klasifikasi, kelas yang diprediksi akan ditampilkan di bagian atas matrix dan kelas yang diobservasi ditampilkan di bagian kiri (Gorunescu, 2011).
Tabel 2.8 Model Confusion Matrix (Vercellis, 2009)
Predictions Total -(Negatif) +(Positif)
Examples -1(Negatif) p q p+q
+1(Positif) u v u+v
Total p+u p+v m
Keterangan:
a. p adalah jumlah prediksi yang tepat bahwa instance bersifat negatif.
b. q adalah jumlah prediksi yang salah bahwa instance bersifat positif.
c. u adalah jumlah prediksi yang salah bahwa instance bersifat negatif.
d. v adalah jumlah prediksi yang tepat bahwa instance bersifat positif.
Berikut adalah persamaan model confusion matrix:
a. Nilai akurasi (acc) adalah proporsi jumlah prediksi yang benar. Dapat dihitung dengan menggunakan persamaan:
acc=
𝑝+𝑣(𝑝+𝑞+𝑢+𝑣)
=
𝑝+𝑣𝑚
(2.7)
b. Tingkat negatif benar (tn) didefinisikan sebagai proporsi kasus negatif yang diklasifikasikan dengan benar, yang dihitung dengan menggunakan
persamaan:
tn=
𝑝𝑝+𝑞
(2.8)
c. Tingkat negatif palsu (fn) adalah proposi kasus positif yang salah diklasifikasikan sebagai negatif, yang dihitng dengan menggunakan persamaan:
fn=
𝑢𝑢+𝑣
(2.9)
d. Tingkat positif palsu (fp) adalah proporsi kasus negatif yang salah diklasifikasikan sebagai positif, yang dihitung dengan menggunakan persamaan:
fp=
𝑞𝑝+𝑞
(2.10)
e. Penarikan kembali (recall) atau tingkat positif benar (tp) adalah proporsi kasus positif yang diklasifikasikan dengan benar, yang dihitung dengan
menggunakan persamaan:
tp=
𝑢𝑢+𝑣
(2.11)
f. Presisi (p) adalah proporsi prediksi kasus positif yang benar, yang dihitung dengan menggunakan persamaan:
prc=
𝑣𝑞+𝑣
(2.12)
2.1.6. Kerangka Pemikiran
Gambar 2.4 Kerangka Pemikiran Mulai
Data Balita Data Pengetahuan
Pakar
Analisa Data
Pemilihan Metode Penyelesaian
Proses JST
Testing JST untuk Indeks BB/U
Validasi
Hasil JST untuk Indeks BB/U
Testing JST untuk Indeks BB/BP
Validasi
Hasil JST untuk Indeks BB/PB
Komparasi Hasil
Kesimpulan
2.2. Tinjauan Studi
Literatur mengenai pembahasan klasifikasi status gizi telah banyak dilakukan dengan beberapa metode. Berikut metode-metode yang pernah digunakan untuk menyelesaikan masalah klasifikasi status gizi:
1. Xu Dezhi dan Gamage Upeksha Ganegoda dalam papernya mengatakan bahwa rule based classification adalah salah satu sub bidang dalam data mining. Dalam makalah ini menjelaskan bagaimana rule based classification digunakan untuk mendeteksi kekurangan gizi pada anak-anak.
Hasil dari penelitian ini bahwa ada hubungan antara sejumlah rule dan optimalitas keputusan akhir. Hanya saja dalam makalah ini belum dijelaskan algoritma klasifikasi yang digunakan (Dezhi & Ganegoa, 2011).
2. D.Thangamani dan P.Sudha dalam Penelitiannya mencoba untuk menunjukkan analisis gizi buruk berdasarkan asupan makanan, indeks kaya, kelompok usia, tingkat pendidikan, pekerjaan, dan lain-lain. Tujuan dari penelitian mereka menggunakan model ID3, Random Forest, dan Multilayer Perception untuk mengklasifikasikan dataset survai kesehatan keluarga dan untuk menentukan metode yang tepat dan fleksibel untuk memproses sejumlah besar data untuk menentukan deteksi malnutrisi yang akurat dan pencegahannya. Hasil dari supervised data mining techniques dapat memberikan status gizi balita (D.Thangamani & P.Sudha, 2014).
3. Eka Larasati Amalia, dkk menggunakan data masukan gejala untuk mendapat jenis status gizi. Dalam penelitian ini sebanyak 453 data menu makanan dibentuk populasi yang merepresentasikan solusi mennu makanan dalam sehari. Sistem Pakar digunakan untuk menganalisa status gizi berdasarkan masukan gejala yang dialami. Sedangkan, Algoritma Genetika untuk penentuan solusi menu (Amalia, Dachlan, & Santoso, 2014).
4. Liliana Swastina dan Bambang Lareno, menentukkan wilayah berpotensi status gizi bermasalah menggunakan Algoritma Decision Tree untuk mengklasifikasikan status wilayah berpotensi gizi bermasalah kedalam status rendah, sedang, dan tinggi berdasarkan nilai kecenderungan (p1,p2,p3,p4,p5) (Swastina & Lareno, 2014).
Tabel 2.9 State Of the Art Research Klasifikasi Status Gizi Balita Menggunakan Jaringan Saraf Tiruan
Peneliti Tahun Masalah Metode Hasil
Xu Dezhi dan Gamage Upeksha Ganegoda
2011 Mendeteksi kekurangan gizi pada anak-anak
Rule based Classification
Hasil dalam makalah ini belum dijelaskan algoritma klasifikasi yang digunakan
D.Thangama ni
Dan P.
Sudha
2014 Melakukan analisa gizi buruk
berdasarkan variabel asupan makanan, status
ekonomi, usia, tingkat
pendidikan, pekeejaan untuk
mengklasifikas ikan kesehatan keluarga dan mendeteksi gizi buruk.
ID3, Random Forest, MLP
Teknik Data Mining Supervised dapat memberikan analisa status gizi dengan perbandingan akurasi:
Eka Larasati Amalia, dkk
2014 Menggunaka
n data
masukan gejala untuk mendapatkan jenis status gizi. Dalam penelitian ini digunakkan 453 data menu
makanan yang telah terkandung jumlah kalori pada tiap-tiap menu
makanannya.
Dari data tersebut dibentuk populasi yang merepresenta sikan solusi menu
makanan dalam sehari.
Sistem Pakar dan
Algoritma Genetika
Sistem pakar
menghasilkan analisa status gizi dengan tingkat keberhasilan 85,7% dan Algoritma Genetika
menghasilkan
penentuan solusi menu dengan tingkat keberhasilan 88%.
Liliana Swastina dan
2014 mengklasifik asikan status wilayah
Decision Tree Menghasilkan nilai akurasi sebesar 90,9%
Bambang Lareno
berpotensi gizi
bermasalah kedalam status rendah, sedang, dan tinggi
berdasarkan nilai
kecenderunga n
(p1,p2,p3,p4, p5)
2.2.1. Keaslian Penelitian
Berdasarkan tinjuan studi diatas disimpilkan bahwa sudah banyak dilakukan penelitian tentan status gizi. Namun, belum ada penelitian yang mengidentifikasikan status gizi balita berdasarkan indeks antropometri BB/U dan BB/TB menggunakkan Jaringan saraf tiruan backpropagation. Dalam penelitian ini akan dibandingkan hasil dari kinerja Algoritma Jaringan Saraf Tiruan backpropagation berdasarkan indeks BB/U dan indeks BB/TB. Dalam tahap pengujian menggunakan model Cross Validation yang akan menghasilkan nilai akurasi, Confusion Matrix dan Kappa Statistic.
BAB III
METODOLOGI PENELITIAN
3.1 Desain Penelitian 3.1.1 Jenis Penelitian
Penelitian dalam akademik mengacu pada aktivitas yang rajin dan penyelidikan sistematis atau investigasi di suatu daerah, dengan tujuan menemukan atau merevisi fakta, teori, aplikasi dan tujuannya adalah untuk menemukan dan menyebarkan pengetahuan baru (Berndtsson, Hansson, Olsson, & Lundell, 2008).
Ada empat metode penelitian yang umum digunakan yaitu tindakan penelitian, eksperimen, studi kasus dan survey (Dawson, 2009). Metode penelitian yang digunakan dalam penelitian ini adalah jenis eksperimen. Metode eksperimen menguji kebenaran sebuah hipotesis dengan statistik dan menghubungkannya dengan masalah penelitian. Metode eksperimen dibagi menjadi dua, yaitu eksperimen absolut dan eksperimen komparatif. Eksperimen absolut mengarah pada dampak yang dihasilkan dari eksperimen, sedangkan eksperimen komparatif membandingkan dua objek yang berbeda (Khothari, 2004). Dalam penelitian ini digunakan metode eksperimen komparatif.
Dalam penelitian ini dilakukan beberapa langkah yang dilakukan dalam proses penelitian.
1. Pengumpulan data
Pada tahap ini ditentukan data yang akan diproses. Mencari data yang tersedia, memperoleh data tambahan yang dibutuhkan, mengintegrasikan semua data kedalam data set, termasuk variabel yang diperlukan dalam proses.
2. Pengolahan data awal
Ditahap ini dilakukan penyeleksian data, data dibersihkan dan ditransformasikan kebentuk yang diinginkan sehingga dapat dilakukan persiapan dalam pembuatan model.
3. Metode yang diusulkan
Pada tahap ini data dianalisis, dikelompokan variabel mana yang berhubungan dengan satu sama lainnya. Setelah data dianalisis lalu diterapkan model-model yang sesuai dengan jenis data. Pembagian data kedalam data latihan (training data) dan data uji (testing data) juga diperlukan untuk pembuatan model.
4. Eksperimen dan pengujian metode
Pada tahap ini model yang diusulkan akan diuji untuk melihat hasil berupa rule yang akan dimanfaatkan dalam pengambilan keputusan.
5. Evaluasi dan validasi
Pada tahap ini dilakukan evaluasi terhadap model yang ditetapkan untuk mengetahui tingkat keakurasian model.
3.1.2 Pengumpulan Data 1. Sumber Data
Berdasarkan sumbernya, pengumpulan data dapat menggunakan data primer dan sekunder. Data primer merupakan data yang dikumpulkan pertama kali, data primer diperoleh melalui observasi, interview, kuisioner, dll. Data sekunder merupakan data yang telah dikumpulkan dan dianalisis oleh orang lain baik yang telah dipublikasikan maupun yang belum dipublikasikan, misanya dari dokumentasi, literatur, buku, jurnal, dan informasi lainnya yang ada hubungannya dengan masalah yang diteliti.
Dalam penelitian ini metode pengumpulan data untuk mendapatkan sumber data yang digunakan adalah metode pengumpulan data sekunder. Data utama diperoleh dari Puskesmas Mranti Purworejo, sedangkan data pendukung didapatkan dari buku, jurnal dan publikasi lainnya.
2. Sampel Penelitian
Sampel dari penelitian ini adalah data balita Puskesmas Mranti tahun 2014, berdasarkan data Laporan Pemantauan Status Gizi (PSG) balita dan data laporan bulanan kasus gizi buruk. Dalam penelitian ini adalah balita dibawah umur 5 tahun (0-59 bulan) yang berjumlah 261 data balita. Dengan atribut dari status gizi balita, nama balita, jenis kelamin, umur (U), berat badan (BB), tinggi badan (TB/PB), status ekonomi, status gizi berdasarkan BB/U dan status gizi berdasarkan BB/TB.
3.2 Experimen
Dalam melakukan eksperimen ini, penulis menggunakan model Cross- Industry Standard Process for Data Mining (CRISP-DM) yang terdiri dari enam tahap, yaitu (Larose, 2006):
1. Tahap Business understanding
Dataset yang berasal dari Puskesmas Mranti masih bersifat manual, beberapa data belum diidentifikasi status gizinya, dan beberapa data hanya diidentifikasi berdasarkan indeks BB/U. Bahkan ada data yang seharusnya teridentifikasi berstatus lebih, tetapi teridentifikasi normal, atau sebaliknya. Oleh karena itu dalam penelitian ini akan dilakukan klasifikasi status gizi berdasarkan indeks BB/U dan BB/TB.
2. Tahap data understanding
Data pasien diperoleh dari Puskesmas Mranti sebanyak 261 record. Berdasarkan indeks BB/U, sebanyak 194 data dinyatakan gizi baik, 11 data dinyatakan gizi buruk, 14 data dinyatakan gizi lebih dan 42 data dinyatakan gizi kurang.
Berdasarkan indeks BB/TB, sebanyak 216 data dinyatakan normal, sebanyak 30 data dinyatakan kurus, sebanyak 7 data dinyatakan sangat kurus, dan sebanyak 8 data dinyatakan gemuk.
3. Tahap data preparation
Beberapa teknik yang dapat dilakukan untuk mendapatkan dataset yang berkualitas tinggi untuk digunakan dalam analisis data mining diantaranya adalah (Vercellis, 2009):
a. Data Validation
Data validation dilakukan untuk mengidentifikasi dan menghapus anomali dan inkonsistensi data. Anomali dan inkonsistensi data dapat terjadi dikarenakan adanya missing values dan juga karena data yang dipakai mengandung nilai-nilai yang salah atau disebut noise atau outlier.
b. Data Integration dan data Transformation
Data Integration dan data Transformation diterapkan pada beberapa dataset untuk meningkatkan akurasi dan efisiensi dari model pembelajaran algoritma yang digunakan.
c. Data Reduction
Teknik ini digunakan untuk mereduksi ukuran data jika dataset yang digunakan cukup besar yang berguna untuk membuat model pembelajaran algoritma menjadi lebih efisien tanpa mengurangi kualitas dari hasil yang diperoleh.
Pada tahap ini data yang masih berupa nilai numerik dan juga continue ditransformasikan kedalam bentuk kategorikal yang telah ditransformasikan kedalam bentuk angka. Atribut yang digunakan untuk indeks BB/U yaitu, Jenis kelamin (JK), berat badan (BB), Umur (U), dan status ekonomi (SE) seperti pada tabel 3.1. Sedangkan untuk indeks BB/TB, atribut yang digunakan Jenis kelamin (JK), berat badan (BB), Tinggai badan (TB), dan status ekonomi (SE) seperti pada tabel 3.2.
Tabel 3.1 Tabel Atribut yang digunakan berdasarkan BB/U
Atribut Nilai Kategori
Jenis Kelamin 1 Laki-laki
0 Perempuan
Umur 0-59 bulan balita
Berat Badan Ukuran berat badan dalam kg
Status Ekonomi
0 Keluarga Miskin
(Gakin)
1 Non Keluarga Miskin
( Non Gakin)
Tabel 3.2 Tabel Atribut yang digunakan berdasarkan BB/PB
Atribut Nilai Kategori
Jenis Kelamin 1 Laki-laki
0 Perempuan
Tinggi Badan Ukuran tinggi badan dalam cm
Berat Badan Ukuran berat badan dalam kg
Status Ekonomi 0 Keluarga Miskin
(Gakin)
1 Non Keluarga Miskin (
Non Gakin)
Data yang digunakan berjumlah 261 record, sebanyak sepuluh record akan digunakan pada tahap deployment sedangkan sisanya sebanyak 251 record akan digunakan untuk data training sebanyak 80% atau 200 record dan 20% atau 51 record digunakan sebagai data testing. Data training digunakan untuk membangun classifier, dan classifier tersebut digunakan untuk memprediksi klasifikasi untuk kasus pada data testing.
Pengambilan data untuk tahap deployment dan data testing menggunakan teknik Systematic Random Sampling atau disebut juga teknik Systematic with random start. Teknik systematic random sampling merupakan modifikasi dari teknik random sampling, dengan cara memilih subjek dari daftar populasi secara
sistematis bukan secara acak. Pemilihan secara acak hanya digunakan untuk memilih data pertama saja. Penentuan data berikutnya dengan cara memanfaatkan interval sampel, yaitu angka yang menunjukan jarak antara nomor-nomor urut yang terdapat dalam kerangka sampling yang dijadikan sebagai patokan dalam menentukan data kedua dan seterusnya hingga data ke-n (Cohen, Manion, &
Morrison, 2005). Untuk menentukan interval sampel menggunakan rumus berikut:
f = N/sn (3.1)
dimana:
f = frekuensi interval N = Jumlah total populasi
sn = Jumlah sample yang diperlukan
Total data testing yang diperlukan sebanyak 20% dari 251 record yaitu 51 record, dengan menggunakan rumus 3.1 untuk mendapatkan interval maka dari 251 record dibagi dengan 51 record sehingga didapat intervalnya adalah 4,9 atau dibulatkan jadi 5. Sehingga untuk pemilihan data berikutnya didasarkan pada nomor kelipatan lima.
Tabel 3.3 dan tabel 3.4 berikut ini menunjukan sample data balita yang yang telah melalui tahapan data preparation. Data balita secara lengkap dapat dilihat pada lampiran.
Tabel 3.3 Sample Data Balita Berdasarkan indeks BB/U
Tabel 3.4 Sample Data Balita Berdasarkan indeks BB/TB
4. Tahap modelling
Pada tahap ini memilih dan menerapkan teknik yang tepat untuk mendapatkan hasil yang optimal, pada penelitian ini model yang digunakan adalah algoritma Neural Network. Tahap modelling dilakukan dengan dua cara yaitu dengan cara manual dan dengan menggunakan software rapidminer. Pembuatan model dengan menggunakan algoritma neural network dilakukan dengan cara memberi bobot awal setiap neuron secara acak dengan nilai antara -1.0 sampai 1.0.
5. Tahap evaluation
Setelah tahap modelling dilakukan maka model-model tersebut dievaluasi kualitas dan efektivitasnya dengan memasukan data testing. Evaluasi dan validasi menggunakan metode Confusion Matrix, dan ROC.
6. Tahap deployment
Pada tahap ini diterapkan model yang memiliki akurasi tinggi atau yang paling baik pada departement kesehatan atau instansi yang relevan untuk mendiagnosa atau memprediksi penyakit jantung dengan menggunakan data baru.
3.2.2 Metode yang diusulkan
Pada tahap modeling ini dilakukan pemprosesan data traning sehingga akan membahas metode algoritma yang diuji dengan memasukan data balita kemudian di analisa dan dikomparasi. Berikut ini bentuk gambaran metode algoritma yang akan diuji.
Pengumpulan Data
Pembentukkan Popolasi Awal
Penentuan Bobot Awal
Penerapan Algoritma JST Backpropagation
Indeks BB/U Indeks BB/PB
Gambar 3.1 Metode yang diusulkan
3.2.3 Eksperimen dan Pengujian Metode Validasi Hasil
selesai
Tahap modeling untuk mengklasifikasikan status gizi balita dengan menggunakan dua metode yaitu algoritma Jaringan Saraf Tiruan Backpropagation.
Pada penelitian kali ini yang digunakan adalah penelitian Experiment.
Penelitian eksperimen melibatkan penyelidikan hubungan kausal menggunakan tes dikendalikan oleh si peneliti itu sendiri. Dalam penelitian eksperimen digunakan spesifikasi software dan hardware sebagai alat bantu dalam penelitian pada Tabel 3.3.
Tabel 3.5 Spesifikasi hardware dan software
Software Hardware
Sistem Operasi: Windows 7 CPU: Intel Atom Data Mining: RapidMiner versi 6.0 Memory: 1 GB
Hardisk: 160 GB
3.2.4 Evaluasi dan Validasi Hasil
Model yang diusulkan pada penelitian tentang klasifikasi status gizi balita adalah dengan menerapkan Jaringan Saraf Tiruan Backpropagation. Penerapan Jaringan Saraf Tiruan Backpropagation dengan menentukan nilai weight terlebih dahulu. Setelah didapatkan nilai akurasi terbesar, nilai weight tersebut akan dijadikan nilai yang akan digunakan untuk mencari nilai akurasi tertinggi. Setelah ditemukan nilai akurasi yang paling ideal dari parameter tersebut langkah selanjutnya adalah menentukan nilai weight. Setelah ditemukan nilai akurasi yang paling ideal dari parameter tersebut langkah selanjutnya adalah menentukan weight sehingga terbentuk struktur algoritma yang ideal untuk pemecahan masalah tersebut. Evaluasi dan validasi menggunakan metode Confusion Matrix.
3.2.5 Jadwal Penelitian
Tabel 3.6 Jadwal kegiatan yang dilakukan penulis dalam pembuatan tesis.
No. Nama Kegiatan Durasi Start Finish 1 Pengajuan Ijin Penelitian 10 hari 1/11/2014 10/11/2014 2 Penelusuran Pustaka 30 hari 1/11/2014 30/11/2014 3 Pengumpulan Data 20 hari 1/12/2014 20/12/2014 4 Pengolahan Data 30 hari 20/12/2014 30/1/2015 5 Penyusunan Naskah
Akhir
58 hari 1/11/2014 28/2/2015
6 Sidang Tesis 1 hari 9/3/2015 9/3/2015
BAB IV
HASIL PENELITIAN DAN PEMBAHASAN
4.1. Hasil Penelitian
Tujuan dari penelitian ini menguji keakuratan klasifikasi status gizi balita dengan menggunakan algoritma Neural Network backpropagation. Dalam penelitian ini menguji keakuratan algoritma Neural Network backpropagation berdasarkan indeks antropometri BB/U dan BB/PB.
4.1.1. Neural Network
Jumlah Neuron dalam Hiden Layer mempengaruhi tingkat akurasi. Berikut ini adalah hasil dari percobaan yang telah dilakukan untuk penentuan nilaiNeuron dalamHiden layer dengan nilai learning rate 0,9:
Tabel 4.1. Eksperiment penentuan nilai Hiden Layer Jumlah
Neuron dalam HL
Learning Rate 0,9 Accuracy Kappa
2 86,00% 0,596
4 86,50% 0,625
6 88,00% 0,666
8 89,50% 0,711
10 87,00% 0,664
Dari hasil eksperimen berdasarkan tabel 4.1 diperoleh kesimpulan bhwa nilai akurasi tertinggi dicapai hingga 89,50% dan kappa 0,771 dengan jumlah neuron 8 dalam hiden layer.
4.1.2. Hasil Uji Neural Network
Berdasarkan eksperimen yang telah diuji Neural network dalam penelitian ini menggunakan satu buah lapisan input yang terdiri dari 5 neuron (4 neuron adalah atribut yang digunakan sebagai predictor dan satu neuron bias), satu buah lapisan tersembunyi yang terdiri dari 8 buah neuron, dan 4 buah lapisan output yang merupakan hasil klasifikasi seperti yang terlihat pada gambar 4.1.
Gambar 4.1 Neural Network Klasifikasi Status Gizi Balita
Langkah dalam membentuk neural network adalah menentukan bobot jaringan untuk setiap lapisan secara acak biasanya berkisar antara -0,1 hingga 1,0.
Setelah bobot untuk setiap lapisan ditentukan, langkah berikutnya adalah menghitung input dari tiap neuron untuk membangkitkan output dengan menggunakan fungsi aktifasi sigmoid.
Langkah selanjutnya adalah menentukan nilai error, kemudian nilai error yang dihasilkan digunakan untuk memperbaharui bobot relasi simpul. Tabel 4.1 berikut ini menunjukan hasil perhitungan bobot akhir dari neural network pada lapisan tersembunyi.
Tabel 4.2 Nilai Bobot Akhir
Tabel 4.2 adalah nilai akhir fungsi aktifasi pada output layer. Kolom pertama pada Tabel 4.2 menyatakan class, yaitu atribut kelas yang dinyatakan dengan simpul pada output layer.
Tabel 4.3 Nilai Output Layer
4.2. Evaluasi dan Validasi Hasil
Hasil dari pengujian model yang dilakukan adalah klasifikasi status gizi balita berdasarkan indeks BB/U dengan Neural Network untuk menentukan nilai accuracy dan kappa.
1. Pembuatan Model dengan data training
Berikut gambar model pengujian menggunakan data training:
Gambar 4.2 Desain model Validasi