IDENTIFIKASI STATUS GIZI BALITA BERDASARKAN INDEKS ANTROPOMETRI BB/U DAN BB/TB MENGGUNAKAN JARINGAN SARAF TIRUAN TESIS NANI PURWATI

(1)

ii

IDENTIFIKASI STATUS GIZI BALITA BERDASARKAN INDEKS ANTROPOMETRI BB/U DAN BB/TB

MENGGUNAKAN JARINGAN SARAF TIRUAN

TESIS

NANI PURWATI 14001006

PROGRAM PASCASARJANA MAGISTER ILMU KOMPUTER SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER

NUSA MANDIRI JAKARTA

2015

(2)

iii

SURAT PERNYATAAN ORISINALITAS

Yang bertanda tangan di bawah ini:

Nama : Nani Purwati NIM : 14001006

Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua (S2)

Konsentrasi : Management Information System(MIS)

Dengan ini menyatakan bahwa tesis yang telah saya buat dengan judul: “Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB menggunakan Jaringan Saraf Tiruan” adalah hasil karya sendiri, dan semua sumber baik yang kutip maupun yang dirujuk telah saya nyatakan dengan benar dan tesis belum pernah diterbitkan atau dipublikasikan dimanapun dan dalam bentuk apapun.

Demikianlah surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila dikemudian hari ternyata saya memberikan keterangan palsu dan atau ada pihak lain yang mengklaim bahwa tesis yang telah saya buat adalah hasil karya milik seseorang atau badan tertentu, saya bersedia diproses baik secara pidana maupun perdata dan kelulusan saya dari Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri dicabut/dibatalkan.

Bandung, Februari 2015 Yang menyatakan,

Materai Rp. 6.000,-

Nani Purwati

HALAMAN PENGESAHAN

(3)

iv Tesis ini diajukan oleh:

Nama : Nani Purwati

NIM : 14001006

Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua(S2)

Konsentrasi : Management Information System

Judul Tesis :”Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB Menggunakan Jaringan Saraf Tiruan”

Telah berhasil dipertahankan dihadapan Dewan Penguji dan diterima sebagai bagian persyaratan yang diperlukan untuk memperoleh gelar Magister Ilmu Komputer (M.Kom) pada Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri (STMIK Nusa Mandiri).

Jakarta, Maret 2015

Pascasarjana Magister Ilmu Komputer STMIK Nusa Mandiri

Direktur

H. Mochamad Wahyudi, MM, M.Kom

D E W A N P E N G U J I

Penguji I : Romi Satria Wahono, M.Eng, Ph.D ...

Penguji II : Dr. Windu Gata, M.Kom ...

Penguji III / : Ir. Edi Rachman, M.Eng. ...

Pembimbing

KATA PENGANTAR

(4)

v

Puji syukur Alhamdullillah, penulis panjatkan kehadirat Allah SWT, yang telah melimpahkan rahmat dan karunia-Nya, sehingga pada akhirnya penulis dapat menyelesaikan tesis ini tepat pada waktunya. Dimana tesis ini penulis sajikan dalam bentuk laporan sederhana. Adapun judul tesis, yang penulis ambil sebagai berikut

“Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB menggunakan Jaringan Saraf Tiruan”.

Tujuan penulisan tesis ini dibuat sebagai salah satu syarat untuk mendapatkan gelar Magister Ilmu Komputer (M.Kom) pada Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri (STMIK Nusa Mandiri).

Tesis ini diambil berdasarkan hasil penelitian atau riset mengenai status gizi balita berdasarkan Indeks Antropometri BB/U dan BB/TB yang penulis lakukan Puskesmas Mranti Purworejo. Penulis juga lakukan mencari dan menganalisa berbagai macam sumber referensi, baik dalam bentuk jurnal ilmiah, buku-buku literatur, internet, dll yang terkait dengan pembahasan pada tesis ini.

Penulis menyadari bahwa tanpa bimbingan dan dukungan dari semua pihak dalam pembuatan tesis ini, maka penulis tidak dapat menyelesaikan tesis ini tepat pada waktunya. Untuk itu ijinkanlah penulis kesempatan ini untuk mengucapkan ucapan terima kasih yang sebesar-besarnya kepada :

1. Bapak Ir. Edi Rakhman, M.Eng selaku pembimbing tesis yang telah menyediakan waktu, pikiran dan tenaga dalam membimbing penulis dalam menyelesaikan tesis ini.

2. Bapak Moch. Wahyudi, MM, M.Kom, M.Pd selaku Direktur STMIK Nusa Mandiri yang telah mengijinkan penulis melakukan riset untuk mendapatkan data atau informasi yang penulis butuhkan.

3. Bapak Ir. Naba Aji Notoseputro selaku Direktur AMIK BSI yang telah mengijinkan penulis untuk menyelesaikan pendidikan S2

4. Seluruh staf pengajar (dosen) Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa

(5)

vi

Mandiri yang telah memberikan pelajaran yang berarti bagi penulis selama menempuh studi.

5. Seluruh staf dan karyawan Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri yang telah melayani penulis dengan baik selama kuliah.

6. Suami tercinta, dede bayi yang masih dalam kandungan dan keluarga yang selalu memberikan dukungan dengan sepenuh hati, hingga penulis dapat menyelesaikan tesis ini dengan baik.

Serta semua pihak yang tidak dapat penulis sebutkan satu persatu sehingga terwujudnya penulisan tesis ini. Penulis menyadari bahwa penulisan tesis ini masih jauh sekali dari sempurna, untuk itu penulis mohon kritik dan saran yang bersifat membangun demi kesempurnaan penulisan karya ilmiah yang penulis hasilkan untuk yang akan datang.

Akhir kata semoga tesis ini dapat bermanfaat bagi penulis khususnya dan bagi para pembaca yang berminat pada umumnya.

Bandung, 28 Februari 2015

Nani Purwati Penulis

SURAT PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

(6)

vii Yang bertanda tangan di bawah ini : Nama : Nani Purwati NIM : 14001006

Program Studi : Magister Ilmu Komputer Jenjang : Strata Dua (S2)

Konsentrasi : Management Information System(MIS) Jenis Karya : Tesis

Demi pengembangan ilmu pengetahuan, dengan ini menyetujui untuk memberikan ijin kepada pihak Program Pascasarjana Magister Ilmu Komputer Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri (STMIK Nusa Mandiri) Hak Bebas Royalti Non-Eksklusif (Non-exclusive Royalti-Free Right) atas karya ilmiah kami yang berjudul : “Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB menggunakan Jaringan Saraf Tiruan” beserta perangkat yang diperlukan (apabila ada).

Dengan Hak Bebas Royalti Non-Eksklusif ini pihak STMIK Nusa Mandiri berhak menyimpan, mengalih-media atau bentuk-kan, mengelolaannya dalam pangkalan data (database), mendistribusikannya dan menampilkan atau mempublikasikannya di internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari kami selama tetap mencantumkan nama kami sebagai penulis/pencipta karya ilmiah tersebut. Saya bersedia untuk menanggung secara pribadi, tanpa melibatkan pihak STMIK Nusa Mandiri, segala bentuk tuntutan hukum yang timbul atas pelanggaran Hak Cipta dalam karya ilmiah saya ini.

Demikian pernyataan ini saya buat dengan sebenarnya.

Bandung, 28 Februari 2015 Yang menyatakan,

Nani Purwati

ABSTRAK

Nama : Nani Purwati

(7)

viii

NIM : 14001006

Konsentrasi : Management Information System

Judul Tesis :”Identifikasi Status Gizi Balita Berdasarkan Indeks Antropometri BB/U dan BB/TB Menggunakan Jaringan

Saraf Tiruan”

Kondisi kesehatan dan status gizi balita merupakan tolak ukur cerminan keadaan kondisi masyarakat secara luas. Status gizi balita dapat ditentukan berdasarkan indeks antropometri BB/U dan BB/TB dengan menggunakan standar baku WHO- NCHS. Penelitian ini bertujuan untuk mengklasifikasikan status gizi menggunakan Jaringan Saraf Tiruan Backpropagation berdasarkan indeks antropometri BB/U yang akan menghasilkan status gizi kedalam gizi buruk, kurang, baik, dan lebih, serta mengklasifikasikan status gizi berdasarkan indeks antropometri BB/TB yang akan menghasilkan status sangat kurus, kurus, normal dan gemuk. Variabel yang digunakan dalam penelitian ini yaitu jenis kelamin, umur, berat badan, tinggi badan, dan status ekonomi. Hasil dari uji coba menggunakan JST backpropagation, menghasilkan nilai akurasi sebesar 89,50% dan Kappa 0,711 pada data training, 96,08% dan Kappa 0,907 pada data testing untuk indeks BB/U. Sedangkan, untuk indeks BB/PB menghasilkan akurasi sebesar 88,50% dan Kappa 0,460 untuk data training, dan akurasi sebesar 83,35% dan Kappa 0,419 untuk data testing.

Kata kunci: status gizi balita, indeks antropometri, JST, backpropagation

ABSTRACT

Nama : Nani Purwati

(8)

ix

NIM : 14001006

Konsentrasi : Management Information System

Judul Tesis :”Toddler Nutrition Status Identification Based On Neural Network Using Anthropometry Index Knockoffs”

The nutritional status and health condition of babies is a benchmark reflecting the State of the condition of the community widely. Toddler nutrition status can Anthropometry index is determined based on w/U and w/TB with raw using standard WHO-NCHS. This research aims to classify the nutritional status using a Backpropagation Artificial Neural network based on Anthropometry index w/U that will produce the nutritional status in poor nutrition, lack of, both, and more, as well as classify nutritional status based on Anthropometry index w/PB status which will produce very skinny, skinny, normal and obese. The variables used in this study i.e., gender, age, weight, height, and economic status. Results from trials using backpropagation, yielding a value of JST accuracy of 89,50% and Kappa 0,711 on data training, 96,08% and Kappa 0,907 on testing data to index w/U. Whereas, in order to index w/TB produces the accuracy of 88,50% and Kappa 0,460 for training, data and accuracy of 83,35% and Kappa 0,419 for testing data.

Keywords:Toddler Nutrition Status, Anthropometry Index, Artificial Neural network, Backpropagation

DAFTAR ISI

Halaman HALAMAN SAMPUL... ...i

(9)

x

HALAMAN JUDUL... ii

HALAMAN PERNYATAAN ORISINALITAS... iii

HALAMAN PENGESAHAN... iv

KATA PENGANTAR... v

HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS... vii

ABSTRAK... viii

ABSTRACT... ix

DAFTAR ISI... x

DAFTAR TABEL... xii

DAFTAR GAMBAR... xiii

DAFTAR PERSAMAAN ... xiv

BAB I . PENDAHULUAN ... Error! Bookmark not defined. 1.1. Latar Belakang... Error! Bookmark not defined. 1.2. Identifikasi Masalah ... Error! Bookmark not defined. 1.3. Tujuan Penelitian ... Error! Bookmark not defined. 1.4. Manfaat Penelitian ... Error! Bookmark not defined. 1.5. Ruang Lingkup Penelitian ... Error! Bookmark not defined. 1.6. Sistematika Penulisan ... Error! Bookmark not defined. BAB II LANDASAN TEORI ... 5

2.1. Tinjauan Pustaka ... 5

2.1.1. Status Gizi ... 5

2.1.1.1 Status Gizi Balita ... 6

2.1.2. Data Mining ... 7

2.1.3. Jaringan Syaraf Tiruan ... 12

2.1.3.1. Contoh Kasus Neural Network ... Error! Bookmark not defined. 2.1.5. Pengujian Evaluasi dan Validasi... 19

2.1.6. Kerangka Pemikiran ... 21

2.2. Tinjauan Studi ... 23

2.2.1. Keaslian Penelitian ... Error! Bookmark not defined. BAB III METODOLOGI PENELITIAN ... 26

3.1 Desain Penelitian ... 26

3.1.1 Jenis Penelitian ... 26

3.1.2 Pengumpulan Data ... 28

3.2 Experimen ... 28

(10)

xi

3.2.2 Metode yang diusulkan ... 33

3.2.3 Eksperimen dan Pengujian Metode ... 34

3.2.4 Evaluasi dan Validasi Hasil ... 35

3.2.5 Jadwal Penelitian ... 35

BAB IV HASIL PENELITIAN DAN PEMBAHASAN ... 36

4.1. Hasil Penelitian ... 36

4.1.1. Neural Network ... 36

4.1.2. Hasil Uji Neural Network ... 38

4.2. Evaluasi dan Validasi Hasil ... 38

4.3. Pembahasan ... 42

4.4. Implikasi Penelitian ... 45

BAB V PENUTUP ... 46

5.1. Kesimpulan ... 46

5.2. Saran ... 46

Daftar Pustaka ...…………. 47

DAFTAR TABEL Halaman Tabel 2.1 Klasifikasi Berdasarkan Indikator BB/U... 6

Tabel 2.2 Klasifikasi Berdasarkan Indikator TB/U... 6

Tabel 2.3 Klasifikasi Berdasarkan Indikator BB/TB... 7

Tabel 2.4 Inisialisasi Input, bobot, dan bias awal...16

Tabel 2.5 Hasil Perhitungan Input dan output...16

Tabel 2.6 Nilai Error ... 17

(11)

xii

Tabel 2.7 Bobot dan bias baru ...18

Tabel 2.8 Model Cofusion Matrix ... 19

Tabel 2.9 State Of the Art Research ... 23

Tabel 3.1 Atribut yang digunakan berdasarkan BB/U ...29

Tabel 3.2 Atribut yang digunakan berdasarkan BB/TB...30

Tabel 3.3 Sample Data Balita berdasarkan BB/U...31

Tabel 3.4 Sample Data Balita berdasarkan BB/TB...32

Tabel 3.5 Spesifikasi Hardware dan Software...34

Tabel 3.6 Jadwal Penlitian ... 35

Tabel 4.1 Eksperimen Penentuan Nilai Hiden Laye r...36

Tabel 4.2 Nilai Bobot Akhir...38

Tabel 4.3 Nilai Output Layer ... 38

Tabel 4.4 Model Confusion Matrix untuk Accuracy...40

Tabel 4.5 Model Confusion Matrix untuk Kappa...40

Tabel 4.6 Nilai Akurasi Data Testing ... 41

Tabel 4.7 Nilai Kappa Data Testing ...41

Tabel 4.8 Nilai Akurasi Data Baru...42

Tabel 4.9 Komparasi Akurasi... 42

Tabel 4.10 Nilai Standar Deviasi Pretest... 43

Tabel 4.11 Nilai Standar Deviasi Postest... .43

DAFTAR GAMBAR

Halaman Gambar 2.1 Tahapan Proses Kowledge Management Discovery (KDD) ... Error!

Bookmark not defined.

Gambar 2.2 Multi Layer Feed Forward Neural Network ... Error! Bookmark not defined.

(12)

xiii

Gambar 2.3 Contoh Kasus Multi Layer Feed Forward Neural Network ... Error!

Bookmark not defined.

Gambar 2.4 Kerangka Pemikiran ... Error! Bookmark not defined.

Gambar 3.1 Metode yang diusulkan ... Error! Bookmark not defined.

Gambar 4.1 Neural Network Klasifikasi Status Gizi Balita ... Error! Bookmark not defined.

Gambar 4.2 Desain model Validasi ... Error! Bookmark not defined.

Gambar 4.3. Model pengujian cross validation ... Error! Bookmark not defined.

Gambar 4.4 Pengujian Model Menggunakan RapidMiner ... Error! Bookmark not defined.

Gambar 4.5 GUI Sistem Identifikasi Status Gizi balita ... Error! Bookmark not defined.

DAFTAR PERSAMAAN

(13)

xiv

Halaman

2.1 Perhitungan Z-Score... 3

2.2 Hitung Input ...14

2.3 Output ... 14

2.4 Hitung Nilai Error ... 14

2.5 Error Pada Hiden Layer ... 14

2.6 Nilai Bobot Relasi ... 15

2.7 Nilai Akurasi ... 19

2.8 Tingkat Negatif Benar ... 19

2.9 Tingkat Negatif Palsu ... 19

2.10 Tingkat Positif Palsu ... 19

2.11 Tingkat Positif Benar ... 19

2.12 Presisi ... 20

3.1 Frekuensi Interval ... 33

4.1 Standar Deviasi ... 43

(14)

1

BAB I

PENDAHULUAN 1.1. Latar Belakang

Keberhasilan suatu bangsa sangat bergantung pada keberhasilan dalam menyiapkan generasi penerus bangsa yang berkualitas, cerdas, sehat dan produktif.

Kehidupan Manusia dimulai dari sejak janin dalam rahim ibu. Sejak saat itu manusia kecil sudah memulai perjuangan untuk bertahan hidup, salah satunya dari kemungkinan kurangnya gizi yang diterima dari ibu yang mengandungnya (Prof.dr.Haman Hadi.M.S., 2005). Kondisi kesehatan dan status gizi balita merupakan salah satu tolok ukur cerminan keadaan gizi masyarakat secara luas.

Kasus gizi buruk tidak hanya menjadi beban keluarga tetapi juga menjadi beban Negara (Swastina & Lareno, 2014).

Masalah gizi pada anak balita di Indonesia telah mengalami perbaikan. Hal ini dapat dilihat antara lain dari penurunan prevalensi gizi buruk pada anak balita dari 5,4% tahun 2007 menjadi 4,9% pada tahun 2010. Meskipun terjadi penurunan, tetapi jumlah nominal anak gizi buruk masih relatif besar, oleh karena itu diperlukan tenaga yang mampu mengatasi kasus gizi buruk secara cepat, tepat dan profesional yang diikuti dengan penyiapan sarana dan prasarana yang memadai.

Untuk menyiapkan tenaga kesehatan terampil seperti yang diharapkan selain memberikan peningkatan kapasitas juga diperlukan panduan tatalaksana gizi buruk yang akan digunakan tenaga kesehatan dalam melakukan penanggulangan gizi buruk oleh tim asuhan gizi (dokter, perawat, dan ahli gizi) (Kementerian Kesehatan, 2011).

Tumbuh kembang balita sangat dipengaruhi oleh asupan gizi pada menu makanan yang diberikan. Asupan makanan akan berpengaruh terhadap keaktifan dan kecerdasan balita. Oleh karena itu pada saat proses tumbuh kembangnya, balita harus memperoleh asupan makanan yang sesuai dengan kebutuhan agar pertumbuhan dan perkembangannya optimal. Namun saat ini masih banyak orangtua yang memiliki keterbatasan pengetahuan tentang kebutuhan gizi balita, sehingga menyebabkan balita mengalami masalah gizi. Faktor lain adalah

(15)

keterlambatan dalam penanganan penyakit gizi dan kurangnya tenaga ahli atau pakar.

Beberapa penelitian mengenai indentifikasi status gizi telah banyak dilakukan seperti penelitian yang dilakuan oleh Xu De Zhi dan Gamage Upeksha Ganegoda yang berjudul Rule Based Classifiation to Detect Malnutrition in Children. Dalam makalahnya menjelaskan bagaimana Rule Based Clasification digunakan untuk mendeteksi kekurangan gizi pada anak. Sistem yang diusulkan ini diimplementasikan sebagai sistem e-government. Selanjutnya penulis mencoba untuk meneliti apakah ada hubungan antara jumlah aturan yang digunakan dengan optimalitas keputusan akhir. Dan dari penelitian tersebut diperoleh kesimpulan bahwa ada hubungan antara sejumlah aturan dan optimalitas keputusan akhir (Zhi

& Ganegoda, 2011).

Penelitian Selanjutnya dilakukan oleh D.Thangamani dan P.Sudha yang berjudul Identification Of Malnutrition With Use Of Supervised Datamining Techniques – Decision Trees and Artificial Neural Networks. Dalam Penelitian ini mencoba untuk menunjukkan analisis gizi buruk berdasarkan asupan makanan, indeks kaya, kelompok usia, tingkat pendidikan, pekerjaan, dan lain-lain. Tujuan dari penelitian mereka menggunakan supervised machine learning techniques- decision trees and artificial neural networks untuk mengklasifikasikan dataset survai kesehatan keluarga dan untuk menentukan metode yang tepat dan fleksibel untuk memproses sejumlah besar data untuk menentukan deteksi malnutrisi yang akurat dan pencegahannya. Hasil dari supervised data mining techniques dapat memberikan status gizi balita. (D.Thangamani & P.Sudha, 2014).

Selain itu D. Thangamani dan P. Sudha juga melakukan penelitian dengan judul Identification of Various Deficiencies Using Data Mining Techniques – A Survey.

Penelitian ini memberikan identifikasi kekurangan gizi dari anak-anak dan orang tua, menggunakan decision tree, classification methods, artificial neural networks, support vector machines dan statistical methods. (D.Thangamani & P.Sudha, Identification of Various Deficiiencies Using Data Mining Techniques- A Survey, 2014).

(16)

Untuk mengidentifikasi status gizi pada balita, maka penulis mencoba melakukan penelitian menggunakan Jaringan Syaraf Tiruan backpropagation berdasarkan indeks antropometri BB/U dan BB/TB.

1.2.Identifikasi Masalah

Berdasarkan latar belakang permasalahan yang telah disebutkan dalam uraian sebelumnya maka dapat diidentifikasikan permasalahan sebagai berikut:

Saat ini, banyak metode yang dapat digunakan untuk identifikasi status gizi, diantaranya metode statistik dan data mining. Dalam metode data mining dikenal salah satu metode yang dapat digunakan untuk identifikasi status gizi, yaitu metode atau model jaringan saraf tiruan (neural network). Model jaringan saraf tiruan ini pun memiliki banyak algoritma yang masing-masing memiliki tingkat akurasi yang berbeda.

1.3. Tujuan Penelitian

Tujuan dari penelitian ini adalah mengidentifikasi status gizi balita berdasarkan indeks antropometri BB/U dan BB/TB dengan menggunakan Jaringan Syaraf Tiruan backpropagation .

1.4. Manfaat Penelitian

a. Manfaat praktis dari hasil penelitian ini adalah dapat digunakan oleh pihak medis untuk penentuan status gizi balita.

b. Manfaat kebijakan dari hasil penelitian ini adalah dapat digunakan sebagai bahan pertimbangan dalam identifikasi status gizi balita.

c. Manfaat teoritis dari penelitian ini yaitu diharapkan dapat memberikan sumbangan untuk pengembangan teori yang berkaitan dengan Jaringan Syaraf Tiruan Backpropagation.

1.5.Ruang Lingkup Penelitian

Penelitian ini membahas Jaringan Syaraf Tiruan dalam pengidentifikasian status gizi pada balita berdasarkan indeks antropometri BB/U dan BB/TB.

(17)

1.6. Sistematika Penulisan

BAB I : Pendahuluan. Bab ini membahas latar belakang penelitian, identifikasi masalah, tujuan, manfaat penelitian, ruang lingkup penelitian dan sistematika penulisan.

BAB II : Landasan/Kerangka pemikiran. Pada bab ini dibahas teori yang melandasi penelitian, dalam bab ini juga diuraikan tinjauan pustaka dan objek penelitian.

BAB III: Metode penelitian. Membahas mengenai data dan pengujian algoritma untuk identifikasi status gizi.

BAB IV: Hasil penelitian dan pembahasan. Menampilkan hasil dari pengujian algoritma, baik sebelum diterapkan model maupun setelah diterapkan model. Pada bab ini juga membahas metode mengukur hasil dengan metode statistik.

Ditampilkan hasil uji dalam model statistik.

BAB V: Penutup. Membahas kesimpulan dari penelitian yang dilakukan dan saran untuk penelitian selanjutnya.

(18)

BAB II

LANDASAN TEORI 2.1. Tinjauan Pustaka

Dalam makalah ini penulis melakukan tinjauan dengan menggunakan buku dan jurnal yang berhubungan dengan tema yang dipilih secara lebih detail tinjauan dalam penulisan tesis ini dapat dijelaskan sebagai berikut:

2.1.1. Status Gizi

Status gizi adalah suatu ukuran mengenai kondisi tubuh seseorang yang dapat dilihat dari makanan yang dikonsumsi dan penggunaan zat-zat gizi di dalam tubuh.

Status gizi dibagi menjadi tiga kategori, yaitu status gizi kurang, gizi normal, dan gizi lebih (Almatsier, 2005). Menurut (Wahyuningsih, Khamsan, & Ekawidyani, 2014) Status Gizi merupakan tanda-tanda penampilan seseorang akibat keseimabangan antara pemasukan dan pengeluaran zat gizi yang berasal dari pangan yang dikonsumsi pada suatu saat berdasarkan ketegori dan indikator yang digunakan.

Seseorang diidentifikasi status gizi normal apabila terdapat keseimbangan antara jumlah energi yang masuk ke dalam tubuh dan energi yang dikeluarkan dari luar tubuh sesuai dengan kebutuhan individu. Energi yang masuk ke dalam tubuh dapat berasal dari karbohidrat, protein, lemak dan zat gizi lainnya (Nix, 2005).

Status gizi kurang atau yang lebih sering disebut undernutrition merupakan keadaan gizi seseorang dimana jumlah energi yang masuk lebih sedikit dari energi yang dikeluarkan. Hal ini dapat terjadi karena jumlah energi yang masuk lebih sedikit dari anjuran kebutuhan individu (Wardlaw & Hampl, 2007). Sedangkan Status gizi lebih (overnutrition) merupakan keadaan gizi seseorang dimana jumlah energi yang masuk ke dalam tubuh lebih besar dari jumlah energi yang dikeluarkan (Nix, 2005).

(19)

2.1.1.1 Status Gizi Balita

Status gizi balita diukur berdasarkan umur, berat badan (BB), dan Tinggi Badan (TB). Variabel BB dan TB tersebut disajikan dalam bentuk tiga indikator antropometri yaitu berat badan menurut umur (BB/U), tinggi badan menurut umur (TB/U), dan berat badan menurut tinggi badan (BB/TB). Angka berat badan dan tinggi badan setiap balita dikonversikan kedalam betuk nilai Z-Score dengan menggunakan buku antropometri WHO 2006 (Depkes RI, 2009).

Dari berbagai jenis indeks tersebut diatas, untuk menginterprestasikannya dibutuhkan ambang batas. Penentuan am

bang batas dapat disajikan kedalam tiga cara yaitu persen terhadap median, persentil dan standar deviasi unit. Rumus perhitungan Z-Score adalah sebagai berikut (Supariasa & Fajar, 2002).

Z-Score= Nilai Individu Subjek – Nilai Median Baku Rujukan (2.1)

Tabel 2.1. Klasifikasi Status Gizi Balita Berdasarkan Indikator BB/U Indekks Status Gizi Ambang Batas

Berat Badan terhadap Umur (BB/U)

Gizi buruk <-3,0 SD

Gizi Kurang <-2,0 SD sampai >=-3,0 SD

Gizi Normal >=-2 SD sampai +2,0 SD Gizi Lebih >+2,0 SDD

Tabel 2.2. Klasifikasi Status Gizi Balita Berdasarkan Indikator TB/U

Nilai Simpangan Baku Rujukan

(20)

Indeks Status Gizi Ambang Batas Tinggi Badan terhadap

Umur (TB/U)

Sangat pendek

<-3,0 SD

Pendek >=-3,0 SD sampai <-2,0 SD

Normal >=-2,0 SD

Tabel 2.3. Klasifikasi Status Gizi Balita Berdasarkkan Indikator TB/BB

Indeks Status Gizi Ambang Batas

Tinggi Badan terhadapa Berat Badan (TB/BB)

Sangat kurus <-3,0 SD

Kurus >=-3,0 SD sampai <-2,0 SD

Normal >=-2,0 sd sampai <=2,0 SD

Gemuk >2,0 SD

Indikator BB/U memberikan gambaran tentang status gizi yang sifatnya umum, tidak spesifik. Tinggi rendahnya prevalensi gizi buruk dan kurang mengindikasikan ada tidaknya masalah gizi pada balita, tetapi tidak memberikan indikasi apakah masalah gizi tersebut bersifat kronis atau akut. Indikator TB/U menggambarkan status gizi yang dipengaruhi kondisi-kondisi yang sifatnya kronis (akibat kondisi yang berlangsung sangat lama). Indikator BB/TB menggambarkan status gizi yang sifatnya akut (akibat keadaan yang berlangsung dalam waktu pendek) (Depkes RI, 2009).

2.1.2. Data Mining

(21)

Data Mining didefinisikan sebagai proses menemukan dan membaca pola dalam data sehingga dapat digunakan sebagai alat untuk membantu menemukan informasi yang sangat penting dari data tersebut (Witten, Frank, & Hall, 2011).

Data mining juga dapat didefinisikan sebagai proses ekstraksi pengetahuan dari jumlah data yang besar (Han & Kamber, 2006). Data mining juga dapat digunakan untuk mengembangkan model yang bermanfaat untuk memahami fenomena dari analisis data dan prediksi (Maimon & Rokach, 2010).

Secara umum, tugas data mining dapat diklasifikasikan menjadi dua kategori: deskriptif dan prediktif (Han & Kamber, 2006). Tugas mining deskriptif mengungkapkan pola dalam data dan mudah diinterpretasikan oleh pengguna seperti clustering, association rule, dll. Tugas mining prediktif menggunakan beberapa variabel yang ada untuk memprediksi nilai dari variabel lain seperti classification, regression, dll (Gorunescu, 2011). Data mining merupakan bagian dari Knowldge Discovery Data (KDD) yang digunakan untuk menggali informasi yang berguna, yang tidak diketahui sebelumnya, dan masih tersembunyi dari gudang data (Han & Kamber, 2006)

(22)

Gambar 2.1 Tahapan Proses Kowledge Management Discovery (KDD) Sumber: (Han & Kamber, 2006)

Tahapan data mining dalam proses penemuan pengetahuan (Han & Kamber, 2006):

1. Database

Koleksi data yang saling berhubungan untuk dipergunakan secara bersama kemudian dirancang untuk memenuhi kebutuhan informasi organisasi.

2. Data Cleaning

Pada umumnya, data yang diperoleh, baik dari database suatu perusahaan maupun eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau hanya sekedar salah ketik. Data-data yang tidak relevan itu juga lebih baik dibuang karena keberadaanya bisa mengurangi mutu atau akurasi dari hasil data mining nantinya. Pembersihan data juga akan mempengaruhi performasi dari system data mining karena data yang akan ditangani akan berkurang jumlah dan kompleksitasnya.

(23)

3. Data integration

Integrasi data dilakukan pada attribut-attribut yang mengidentifikasikan entitas- entitas yang unik seperti attribut nama,nomor pegawai, tempat lahir,agama dan lain sebagainya. Integrasi data perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa menghasilkan hasil data yang menyimpang dan bahkan menyesatkan pengambilan aksi nantinya.

4. Data Selection

Merupakan proses seleksi dimana hanya data yang relevan dengan tugas analisis basis data yang akan diambil.

5. Data transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuain untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam database.

6. Data mining

Data mining adalah proses mengeksplorasi dan menganalisa data dalam jumlah yang besar yang bertujuan untuk menemukan suatu pola atau informasi yang menarik dari data yang tersimpan dalam jumlah yang besar dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. Tahap ini merupakan inti dari tahapan KDD yang dilakukan untuk menganalisis data yang telah dibersihkan.

7. Pattern evaluation

Dalam tahap ini, merupakan hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai dengan hipotesa, ada beberapa alternatif yang dapat diambil seperti menjadikannnya umpan balik untuk memperbaiki data mining lain yang lebih sesuai, atau menerima hasilnya sebagi suatu hasil yang diluar dugaan yang mungkin bermanfaat.

8. Knowledge

(24)

Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisa yang didapat. Adakalanya hal ini harus melibatkan orang-orang yang tidak paham mengenai data mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data mining.

Dalam presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil data mining.

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat di lakukan, yaitu (Larose, 2006).

1. Deskripsi

Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecendrungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecendrungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik dari pada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.

Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah:

(25)

a. Prediksi harga beras dalam tiga bulan yang akan datang.

b. Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan

estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Model klasifikasi yang populer adalah Decision/classification trees, Bayesian classifiers/Naive Bayes classifiers, Neural networks, Algoritma Genetika, Support vector machines.

5. Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

Kluster adalah kumpulan record yang memiliki kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain.

Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.

2.1.3. Jaringan Syaraf Tiruan

JST adalah sistem komputasi dimana arsitektur dan operasi diilhami dari pengetahuan tentang sel syaraf biologis dalam otak. Istilah JST digunakan karena jaringan syaraf ini diimplementasikan dengan menggunakan program komputer yang mampu menyelesaikan sejumlah proses perhitungan selama proses pembelajaran, cara kerja jaringan syaraf tiruan meniru cara kerja otak manusia (Siang 2009). Salah satu contoh pengambilan ide dari jaringan syaraf biologis

(26)

adalah adanya elemen-elemen pemrosesan pada JST yang saling terhubung dan beroperasi secara paralel. Ini meniru jaringan syaraf biologis yang tersusun dari sel- sel syaraf (neuron) (Sihombing, 2011).

JST tidak diprogram untuk menghasilkan keluaran tertentu. Semua keluaran atau kesimpulan yang ditarik oleh jaringan didasarkan pada pengalamannya selama mengikuti proses pembelajaran. Pada proses pembelajaran, kedalam JST dimasukkan pola-pola (input dan output) lalu jaringan akan diajari untuk memberikan jawaban yang bisa diterima. Di dalam JST, input akan diproses oleh neuron-neuron JST dengan bobot tertentu. Secara umum cara kerjanya adalah dengan memproses sinyal yang diterima kemudian didistribusikan melewati jaringan dan disimpan sebagai bobot disetiap neuron. Selama proses pelatihan, dilakukan proses penyesuaian bobot dan batas nilai-nilai diperoleh output yang diinginkan (Sihombing, 2011).

JST dibentuk sebagai generalisasi model matematika dari jaringan syaraf biologi dengan asumsi bahwa (Sihombing, 2011) :

a. Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron).

b. Sinyal dikirimkan diantara neuron-neuron melalui penghubung- penghubung.

c. Penghubung antar neuron memiliki bobot yang akan memperkuat atau memperlemah sinyal.

Algoritma neural network yang paling populer adalah Backpropagation, algoritma backpropagation melakukan pembelajaran pada jaringan saraf multi layer feed forward yang terdiri dari tiga lapisan/layer, yaitu: lapisan input, lapisan tersembunyi, dan lapisan keluaran (Han & Kamber, 2006). Pada beberapa diagram neural network dimungkinkan terdapat lebih dari satu lapisan tersembunyi, meskipun kebanyakan hanya mengandung satu lapisan tersembunyi yang dirasa cukup untuk berbagai tujuan (Larose, 2006).

Backpropagation merupakan suatu algoritma yang menggunakan metode pembelajaran terbimbing (supervised learning) yang dikenalkan oleh Rumelhart dkk. Backpropagation merupakan algoritma neural network untuk klasifikasi yang menggunakan gradient descent, backpropagation mencari satu set bobot yang

(27)

dapat memodelkan data sehingga dapat meminimalkan jarak kuadrat rata-rata antara prediksi kelas jaringan dan label kelas yang sebenarnya dari tuple data (Han

& Kamber, 2006).

Tiap observasi data training diproses melalui jaringan, nilai output dihasilkan dari node input. Nilai output ini kemudian dibandingkan dengan nilai aktual dari variabel target dan dihitung error yang dihasilkan (Larose, 2006). Backpropagation melakukan proses pembelajaran secara iteratif yang mencoba untuk meminimalkan error dari klasifikasi.

Gambar 2.2 Multi Layer Feed Forward Neural Network Sumber: (Han & Kamber, 2006)

Proses pembelajaran dalam backpropagation dilakukan dengan penyesuaian bobot- bobot neuron dengan arah mundur berdasarkan nilai error dalam proses pembelajaran (Kusrini & Luthfi, 2009). Dalam setiap proses, bobot relasi dalam jaringan dimodifikasi untuk meminimalkan nilai Mean Squared Error (MSE) antara nilai prediksi dari jaringan dengan nilai sesungguhnya. Modifikasi relasi jaringan tersebut dilakukan dalam arah mundur (Kusrini & Luthfi, 2009).

Langkah pembelajaran dalam metode backpropagation adalah sebagai berikut (Myatt, 2007):

(28)

1. Inisialisasi semua bobot jaringan secara acak. (Biasanya antara -1.0 hingga 1.0).

2. Untuk setiap data training, hitung input untuk simpul berdasarkan nilai input dan bobot jaringan saat itu. Dengan menggunakan rumus :

Ij=∑𝑖 𝑊𝑖𝑗 𝑂𝑖 + 𝜃𝑖 (2.2)

Keterangan:

Oi = Output simpul i dari layer sebelumnya

wij = bobot relasi dari simpul i pada layer sebelumnya ke simpul j ϴj = bias (sebagai pembatas)

3. Berdasarkan input dari langkah kedua, selanjutnya membangkitkan output untuk simpul menggunakan fungsi aktifitas sigmoid

Output = ¹

1+𝑒^{−𝑖𝑛𝑝𝑢𝑡} (2.3)

4. Hitung nilai error antara nilai yang diprediksi dengan nilai yang sesungguhnya menggunakan rumus :

Errori = outputi * (1-Outputi)*(Targeti – Outputj) (2.4) Keterangan :

Outputi = Output actual dari simpul i

Targeti = nilai target yang sudah diketahui pada data training

5. Setelah nilai error dihitung, selanjutnya dibalik ke layer sebelumnya (backpropagation). Untuk menghitung nilai error pada hidden layer, menggunakan rumus:

Errori = Outputi * (1 – Outputi )*∑ = 1 𝐸𝑟𝑟𝑜𝑟 𝑗 𝑊𝑖𝑗^𝑛_𝑗 (2.5) Keterangan:

Errori : Error yang dihasilkan dari hidden node Outputi : Nilai output yang dari hidden node

Errorj : Error yang dihasilkan dari simpul j yang terhubung ke output Wij : Bobot pada pada simpul i ke simpul j

6. Nilai error yang dihasilkan dari langkah sebelumnya digunakan untuk memperbarui bobot relasi, dengan menggunakan rumus:

(29)

Wij = Wij + l * Errorj * Outputi (2.6) Keterangan :

Wij = bobot relasi dari unit i pada layer sebelumnya ke unit j l = learning rate (konstantan, nilainya 0 sampai dengan 1) Errorj = Error pada output layer simpul j

Outputi = Output dari simpul i.

Jika nilai l kecil, maka perubahan bobot akan sedikit dalam setiap iterasi. Begitu juga sebaliknya.

2.1.3.1. Contoh Kasus Neural Network

Studi kasus berikut ini dapat membantu untuk lebih memahami teori dari algoritma nerual network dengan menggunakan backpropagation. Pada gambar 2.3 menunjukan multilayer feed-forward neural network, diberikan nilai learning rate sebesar 0,9 dengan kasus X = (1, 0, 1) class label adalah 1.

Gambar 2.3 Contoh Kasus Multi Layer Feed Forward Neural Network Sumber: (Han & Kamber, 2006)

Jaringan terdiri dari tiga buah input, satu buah hidden layer dengan dua neuron, dan satu buah output.

Langkah-langkah yang dilakukan dalam proses pembelajaran algoritma backpropagation yaitu:

1. Inisialisasi bobot awal secara acak

(30)

Untuk tiap node pada input layer dan hidden layer, diberi nilai acak antara -1.0 hingga 1.0, begitu juga dengan bobot bias yang terhubung dengan hidden layer dan output layer seperti pada tabel 2.4.

Tabel 2.4 Inisialisasi Input, Bobot, dan Bias Awal

Sumber: (Han & Kamber, 2006) 2. Hitung input, output, dan error

Dengan menggunakan persamaan 2.5 dan 2.6 didapat input dan output masing- masing simpul

Input⁴ = (x¹* w¹⁴) + (x²* w²⁴) + (x³* w³⁴) + Ɵ4

= (1 * 0.2) + (0 * 0.4) + (1 * -0.5) + -0.4 = 0.2 + 0 – 0.5 – 0.4

= -0.7

Output4 = 1/(1 + e-input4) = 1/(1 + e^0.7)

= 0.332

Dengan menggunakan cara yang sama dihitung input untuk node 5 dan 6, sehingga didapat nilai seperti pada tabel 2.5.

Tabel 2. 5 Hasil Perhitungan Input dan Output

Sumber: (Han & Kamber, 2006)

3. Hitung nilai error antara nilai yang diprediksi dengan nilai yang sesungguhnya Dengan menggunakan persamaan 2.5 maka diperoleh nilai error untuk simpul 4, 5, dan 6 seperti tampak pada tabel 2.5

Error6 = Output6 ∙ (1 - Output6) ∙ (Outputtarget - Output6)

= 0.474 * (1 - 0.474) * (1 – 0.474)

= 0.1311

(31)

Error⁵= Output⁵∙ (1 – Output5) ∙ Error6 ∙ w56

= 0.525 ∙ (1 - 0.525) ∙ 0.1311 ∙ -0.2

= -0.0065

Error4 = Output5 ∙ (1 – Output4) ∙ Error6 ∙ w46

= 0.332 ∙ (1 - 0.332) ∙ 0.1311 ∙ -0.3

= -0.0087

Tabel 2. 6 Nilai Error

Sumber: (Han & Kamber, 2006)

4. Hitung bobot baru untuk semua relasi antara hidden layer dengan output layer, dilanjutkan dengan menghitung bobot relasi antara input layer dengan hidden layer. Sehingga diperoleh nilai bobot baru seperti pada tabel 2.7

Tabel 2.7 Bobot dan Bias Baru

(32)

Sumber: (Han & Kamber, 2006) 2.1.5. Pengujian Evaluasi dan Validasi

Akurasi dari sebuah model mengindikasikan kemampuan model tersebut untuk memprediksi class target sehingga sangat penting untuk mengevaluasi akurasi dari model klasifikasi (Vercellis, 2009). Validasi adalah proses mengevaluasi akurasi prediksi dari sebuah model, validasi mengacu untuk mendapatkan prediksi dengan menggunakan model yang ada kemudian membandingkan hasil yang diperoleh dengan hasil yang diketahui (Gorunescu, 2011).

1. Confusion Matrix

Confusion matrix merupakan dataset hanya memiliki dua kelas, kelas yang satu sebagai positif dan kelas yang lain sebagai negatif (Bramer, 2007). Evaluasi kinerja model klasifikasi didasarkan pada pengujian objek yang diprediksi dengan benar dan salah, hitungan ini ditabulasikan Confusion Matrix (Gorunescu, 2011).

Confusion Matrix adalah alat yang berguna untuk menganalisis seberapa baik classifier dapat mengenali tupel dari kelas yang berbeda (Han & Kamber, 2006).

Confusion matrix memberikan rincian klasifikasi, kelas yang diprediksi akan ditampilkan di bagian atas matrix dan kelas yang diobservasi ditampilkan di bagian kiri (Gorunescu, 2011).

Tabel 2.8 Model Confusion Matrix (Vercellis, 2009)

(33)

Predictions Total -(Negatif) +(Positif)

Examples -1(Negatif) p q p+q

+1(Positif) u v u+v

Total p+u p+v m

Keterangan:

a. p adalah jumlah prediksi yang tepat bahwa instance bersifat negatif.

b. q adalah jumlah prediksi yang salah bahwa instance bersifat positif.

c. u adalah jumlah prediksi yang salah bahwa instance bersifat negatif.

d. v adalah jumlah prediksi yang tepat bahwa instance bersifat positif.

Berikut adalah persamaan model confusion matrix:

a. Nilai akurasi (acc) adalah proporsi jumlah prediksi yang benar. Dapat dihitung dengan menggunakan persamaan:

acc=

^𝑝+𝑣

(𝑝+𝑞+𝑢+𝑣)

=

^𝑝+𝑣

𝑚

^(2.7)

b. Tingkat negatif benar (tn) didefinisikan sebagai proporsi kasus negatif yang diklasifikasikan dengan benar, yang dihitung dengan menggunakan

persamaan:

tn=

^𝑝

𝑝+𝑞

^(2.8)

c. Tingkat negatif palsu (fn) adalah proposi kasus positif yang salah diklasifikasikan sebagai negatif, yang dihitng dengan menggunakan persamaan:

fn=

^𝑢

𝑢+𝑣

^(2.9)

d. Tingkat positif palsu (fp) adalah proporsi kasus negatif yang salah diklasifikasikan sebagai positif, yang dihitung dengan menggunakan persamaan:

fp=

^𝑞

𝑝+𝑞

(2.10)

(34)

e. Penarikan kembali (recall) atau tingkat positif benar (tp) adalah proporsi kasus positif yang diklasifikasikan dengan benar, yang dihitung dengan

menggunakan persamaan:

tp=

^𝑢

𝑢+𝑣

(2.11)

f. Presisi (p) adalah proporsi prediksi kasus positif yang benar, yang dihitung dengan menggunakan persamaan:

prc=

^𝑣

𝑞+𝑣

^(2.12)

(35)

2.1.6. Kerangka Pemikiran

Gambar 2.4 Kerangka Pemikiran Mulai

Data Balita Data Pengetahuan

Pakar

Analisa Data

Pemilihan Metode Penyelesaian

Proses JST

Testing JST untuk Indeks BB/U

Validasi

Hasil JST untuk Indeks BB/U

Testing JST untuk Indeks BB/BP

Validasi

Hasil JST untuk Indeks BB/PB

Komparasi Hasil

Kesimpulan

(36)

2.2. Tinjauan Studi

Literatur mengenai pembahasan klasifikasi status gizi telah banyak dilakukan dengan beberapa metode. Berikut metode-metode yang pernah digunakan untuk menyelesaikan masalah klasifikasi status gizi:

1. Xu Dezhi dan Gamage Upeksha Ganegoda dalam papernya mengatakan bahwa rule based classification adalah salah satu sub bidang dalam data mining. Dalam makalah ini menjelaskan bagaimana rule based classification digunakan untuk mendeteksi kekurangan gizi pada anak-anak.

Hasil dari penelitian ini bahwa ada hubungan antara sejumlah rule dan optimalitas keputusan akhir. Hanya saja dalam makalah ini belum dijelaskan algoritma klasifikasi yang digunakan (Dezhi & Ganegoa, 2011).

2. D.Thangamani dan P.Sudha dalam Penelitiannya mencoba untuk menunjukkan analisis gizi buruk berdasarkan asupan makanan, indeks kaya, kelompok usia, tingkat pendidikan, pekerjaan, dan lain-lain. Tujuan dari penelitian mereka menggunakan model ID3, Random Forest, dan Multilayer Perception untuk mengklasifikasikan dataset survai kesehatan keluarga dan untuk menentukan metode yang tepat dan fleksibel untuk memproses sejumlah besar data untuk menentukan deteksi malnutrisi yang akurat dan pencegahannya. Hasil dari supervised data mining techniques dapat memberikan status gizi balita (D.Thangamani & P.Sudha, 2014).

3. Eka Larasati Amalia, dkk menggunakan data masukan gejala untuk mendapat jenis status gizi. Dalam penelitian ini sebanyak 453 data menu makanan dibentuk populasi yang merepresentasikan solusi mennu makanan dalam sehari. Sistem Pakar digunakan untuk menganalisa status gizi berdasarkan masukan gejala yang dialami. Sedangkan, Algoritma Genetika untuk penentuan solusi menu (Amalia, Dachlan, & Santoso, 2014).

4. Liliana Swastina dan Bambang Lareno, menentukkan wilayah berpotensi status gizi bermasalah menggunakan Algoritma Decision Tree untuk mengklasifikasikan status wilayah berpotensi gizi bermasalah kedalam status rendah, sedang, dan tinggi berdasarkan nilai kecenderungan (p1,p2,p3,p4,p5) (Swastina & Lareno, 2014).

(37)

Tabel 2.9 State Of the Art Research Klasifikasi Status Gizi Balita Menggunakan Jaringan Saraf Tiruan

Peneliti Tahun Masalah Metode Hasil

Xu Dezhi dan Gamage Upeksha Ganegoda

2011 Mendeteksi kekurangan gizi pada anak-anak

Rule based Classification

Hasil dalam makalah ini belum dijelaskan algoritma klasifikasi yang digunakan

D.Thangama ni

Dan P.

Sudha

2014 Melakukan analisa gizi buruk

berdasarkan variabel asupan makanan, status

ekonomi, usia, tingkat

pendidikan, pekeejaan untuk

mengklasifikas ikan kesehatan keluarga dan mendeteksi gizi buruk.

ID3, Random Forest, MLP

Teknik Data Mining Supervised dapat memberikan analisa status gizi dengan perbandingan akurasi:

(38)

Eka Larasati Amalia, dkk

2014 Menggunaka

n data

masukan gejala untuk mendapatkan jenis status gizi. Dalam penelitian ini digunakkan 453 data menu

makanan yang telah terkandung jumlah kalori pada tiap-tiap menu

makanannya.

Dari data tersebut dibentuk populasi yang merepresenta sikan solusi menu

makanan dalam sehari.

Sistem Pakar dan

Algoritma Genetika

Sistem pakar

menghasilkan analisa status gizi dengan tingkat keberhasilan 85,7% dan Algoritma Genetika

menghasilkan

penentuan solusi menu dengan tingkat keberhasilan 88%.

Liliana Swastina dan

2014 mengklasifik asikan status wilayah

Decision Tree Menghasilkan nilai akurasi sebesar 90,9%

(39)

Bambang Lareno

berpotensi gizi

bermasalah kedalam status rendah, sedang, dan tinggi

berdasarkan nilai

kecenderunga n

(p1,p2,p3,p4, p5)

2.2.1. Keaslian Penelitian

Berdasarkan tinjuan studi diatas disimpilkan bahwa sudah banyak dilakukan penelitian tentan status gizi. Namun, belum ada penelitian yang mengidentifikasikan status gizi balita berdasarkan indeks antropometri BB/U dan BB/TB menggunakkan Jaringan saraf tiruan backpropagation. Dalam penelitian ini akan dibandingkan hasil dari kinerja Algoritma Jaringan Saraf Tiruan backpropagation berdasarkan indeks BB/U dan indeks BB/TB. Dalam tahap pengujian menggunakan model Cross Validation yang akan menghasilkan nilai akurasi, Confusion Matrix dan Kappa Statistic.

(40)

BAB III

METODOLOGI PENELITIAN

3.1 Desain Penelitian 3.1.1 Jenis Penelitian

Penelitian dalam akademik mengacu pada aktivitas yang rajin dan penyelidikan sistematis atau investigasi di suatu daerah, dengan tujuan menemukan atau merevisi fakta, teori, aplikasi dan tujuannya adalah untuk menemukan dan menyebarkan pengetahuan baru (Berndtsson, Hansson, Olsson, & Lundell, 2008).

Ada empat metode penelitian yang umum digunakan yaitu tindakan penelitian, eksperimen, studi kasus dan survey (Dawson, 2009). Metode penelitian yang digunakan dalam penelitian ini adalah jenis eksperimen. Metode eksperimen menguji kebenaran sebuah hipotesis dengan statistik dan menghubungkannya dengan masalah penelitian. Metode eksperimen dibagi menjadi dua, yaitu eksperimen absolut dan eksperimen komparatif. Eksperimen absolut mengarah pada dampak yang dihasilkan dari eksperimen, sedangkan eksperimen komparatif membandingkan dua objek yang berbeda (Khothari, 2004). Dalam penelitian ini digunakan metode eksperimen komparatif.

Dalam penelitian ini dilakukan beberapa langkah yang dilakukan dalam proses penelitian.

1. Pengumpulan data

(41)

Pada tahap ini ditentukan data yang akan diproses. Mencari data yang tersedia, memperoleh data tambahan yang dibutuhkan, mengintegrasikan semua data kedalam data set, termasuk variabel yang diperlukan dalam proses.

2. Pengolahan data awal

Ditahap ini dilakukan penyeleksian data, data dibersihkan dan ditransformasikan kebentuk yang diinginkan sehingga dapat dilakukan persiapan dalam pembuatan model.

3. Metode yang diusulkan

Pada tahap ini data dianalisis, dikelompokan variabel mana yang berhubungan dengan satu sama lainnya. Setelah data dianalisis lalu diterapkan model-model yang sesuai dengan jenis data. Pembagian data kedalam data latihan (training data) dan data uji (testing data) juga diperlukan untuk pembuatan model.

4. Eksperimen dan pengujian metode

Pada tahap ini model yang diusulkan akan diuji untuk melihat hasil berupa rule yang akan dimanfaatkan dalam pengambilan keputusan.

5. Evaluasi dan validasi

Pada tahap ini dilakukan evaluasi terhadap model yang ditetapkan untuk mengetahui tingkat keakurasian model.

3.1.2 Pengumpulan Data 1. Sumber Data

Berdasarkan sumbernya, pengumpulan data dapat menggunakan data primer dan sekunder. Data primer merupakan data yang dikumpulkan pertama kali, data primer diperoleh melalui observasi, interview, kuisioner, dll. Data sekunder merupakan data yang telah dikumpulkan dan dianalisis oleh orang lain baik yang telah dipublikasikan maupun yang belum dipublikasikan, misanya dari dokumentasi, literatur, buku, jurnal, dan informasi lainnya yang ada hubungannya dengan masalah yang diteliti.

Dalam penelitian ini metode pengumpulan data untuk mendapatkan sumber data yang digunakan adalah metode pengumpulan data sekunder. Data utama diperoleh dari Puskesmas Mranti Purworejo, sedangkan data pendukung didapatkan dari buku, jurnal dan publikasi lainnya.

2. Sampel Penelitian

(42)

Sampel dari penelitian ini adalah data balita Puskesmas Mranti tahun 2014, berdasarkan data Laporan Pemantauan Status Gizi (PSG) balita dan data laporan bulanan kasus gizi buruk. Dalam penelitian ini adalah balita dibawah umur 5 tahun (0-59 bulan) yang berjumlah 261 data balita. Dengan atribut dari status gizi balita, nama balita, jenis kelamin, umur (U), berat badan (BB), tinggi badan (TB/PB), status ekonomi, status gizi berdasarkan BB/U dan status gizi berdasarkan BB/TB.

3.2 Experimen

Dalam melakukan eksperimen ini, penulis menggunakan model Cross- Industry Standard Process for Data Mining (CRISP-DM) yang terdiri dari enam tahap, yaitu (Larose, 2006):

1. Tahap Business understanding

Dataset yang berasal dari Puskesmas Mranti masih bersifat manual, beberapa data belum diidentifikasi status gizinya, dan beberapa data hanya diidentifikasi berdasarkan indeks BB/U. Bahkan ada data yang seharusnya teridentifikasi berstatus lebih, tetapi teridentifikasi normal, atau sebaliknya. Oleh karena itu dalam penelitian ini akan dilakukan klasifikasi status gizi berdasarkan indeks BB/U dan BB/TB.

2. Tahap data understanding

Data pasien diperoleh dari Puskesmas Mranti sebanyak 261 record. Berdasarkan indeks BB/U, sebanyak 194 data dinyatakan gizi baik, 11 data dinyatakan gizi buruk, 14 data dinyatakan gizi lebih dan 42 data dinyatakan gizi kurang.

Berdasarkan indeks BB/TB, sebanyak 216 data dinyatakan normal, sebanyak 30 data dinyatakan kurus, sebanyak 7 data dinyatakan sangat kurus, dan sebanyak 8 data dinyatakan gemuk.

3. Tahap data preparation

Beberapa teknik yang dapat dilakukan untuk mendapatkan dataset yang berkualitas tinggi untuk digunakan dalam analisis data mining diantaranya adalah (Vercellis, 2009):

(43)

a. Data Validation

Data validation dilakukan untuk mengidentifikasi dan menghapus anomali dan inkonsistensi data. Anomali dan inkonsistensi data dapat terjadi dikarenakan adanya missing values dan juga karena data yang dipakai mengandung nilai-nilai yang salah atau disebut noise atau outlier.

b. Data Integration dan data Transformation

Data Integration dan data Transformation diterapkan pada beberapa dataset untuk meningkatkan akurasi dan efisiensi dari model pembelajaran algoritma yang digunakan.

c. Data Reduction

Teknik ini digunakan untuk mereduksi ukuran data jika dataset yang digunakan cukup besar yang berguna untuk membuat model pembelajaran algoritma menjadi lebih efisien tanpa mengurangi kualitas dari hasil yang diperoleh.

Pada tahap ini data yang masih berupa nilai numerik dan juga continue ditransformasikan kedalam bentuk kategorikal yang telah ditransformasikan kedalam bentuk angka. Atribut yang digunakan untuk indeks BB/U yaitu, Jenis kelamin (JK), berat badan (BB), Umur (U), dan status ekonomi (SE) seperti pada tabel 3.1. Sedangkan untuk indeks BB/TB, atribut yang digunakan Jenis kelamin (JK), berat badan (BB), Tinggai badan (TB), dan status ekonomi (SE) seperti pada tabel 3.2.

Tabel 3.1 Tabel Atribut yang digunakan berdasarkan BB/U

Atribut Nilai Kategori

Jenis Kelamin 1 Laki-laki

0 Perempuan

Umur 0-59 bulan balita

Berat Badan Ukuran berat badan dalam kg

Status Ekonomi

0 Keluarga Miskin

(Gakin)

1 Non Keluarga Miskin

( Non Gakin)

(44)

Tabel 3.2 Tabel Atribut yang digunakan berdasarkan BB/PB

Atribut Nilai Kategori

Jenis Kelamin 1 Laki-laki

0 Perempuan

Tinggi Badan Ukuran tinggi badan dalam cm

Berat Badan Ukuran berat badan dalam kg

Status Ekonomi 0 Keluarga Miskin

(Gakin)

1 Non Keluarga Miskin (

Non Gakin)

Data yang digunakan berjumlah 261 record, sebanyak sepuluh record akan digunakan pada tahap deployment sedangkan sisanya sebanyak 251 record akan digunakan untuk data training sebanyak 80% atau 200 record dan 20% atau 51 record digunakan sebagai data testing. Data training digunakan untuk membangun classifier, dan classifier tersebut digunakan untuk memprediksi klasifikasi untuk kasus pada data testing.

Pengambilan data untuk tahap deployment dan data testing menggunakan teknik Systematic Random Sampling atau disebut juga teknik Systematic with random start. Teknik systematic random sampling merupakan modifikasi dari teknik random sampling, dengan cara memilih subjek dari daftar populasi secara

(45)

sistematis bukan secara acak. Pemilihan secara acak hanya digunakan untuk memilih data pertama saja. Penentuan data berikutnya dengan cara memanfaatkan interval sampel, yaitu angka yang menunjukan jarak antara nomor-nomor urut yang terdapat dalam kerangka sampling yang dijadikan sebagai patokan dalam menentukan data kedua dan seterusnya hingga data ke-n (Cohen, Manion, &

Morrison, 2005). Untuk menentukan interval sampel menggunakan rumus berikut:

f = N/sn (3.1)

dimana:

f = frekuensi interval N = Jumlah total populasi

sn = Jumlah sample yang diperlukan

Total data testing yang diperlukan sebanyak 20% dari 251 record yaitu 51 record, dengan menggunakan rumus 3.1 untuk mendapatkan interval maka dari 251 record dibagi dengan 51 record sehingga didapat intervalnya adalah 4,9 atau dibulatkan jadi 5. Sehingga untuk pemilihan data berikutnya didasarkan pada nomor kelipatan lima.

Tabel 3.3 dan tabel 3.4 berikut ini menunjukan sample data balita yang yang telah melalui tahapan data preparation. Data balita secara lengkap dapat dilihat pada lampiran.

Tabel 3.3 Sample Data Balita Berdasarkan indeks BB/U

(46)

Tabel 3.4 Sample Data Balita Berdasarkan indeks BB/TB

4. Tahap modelling

Pada tahap ini memilih dan menerapkan teknik yang tepat untuk mendapatkan hasil yang optimal, pada penelitian ini model yang digunakan adalah algoritma Neural Network. Tahap modelling dilakukan dengan dua cara yaitu dengan cara manual dan dengan menggunakan software rapidminer. Pembuatan model dengan menggunakan algoritma neural network dilakukan dengan cara memberi bobot awal setiap neuron secara acak dengan nilai antara -1.0 sampai 1.0.

(47)

5. Tahap evaluation

Setelah tahap modelling dilakukan maka model-model tersebut dievaluasi kualitas dan efektivitasnya dengan memasukan data testing. Evaluasi dan validasi menggunakan metode Confusion Matrix, dan ROC.

6. Tahap deployment

Pada tahap ini diterapkan model yang memiliki akurasi tinggi atau yang paling baik pada departement kesehatan atau instansi yang relevan untuk mendiagnosa atau memprediksi penyakit jantung dengan menggunakan data baru.

3.2.2 Metode yang diusulkan

Pada tahap modeling ini dilakukan pemprosesan data traning sehingga akan membahas metode algoritma yang diuji dengan memasukan data balita kemudian di analisa dan dikomparasi. Berikut ini bentuk gambaran metode algoritma yang akan diuji.

Pengumpulan Data

Pembentukkan Popolasi Awal

Penentuan Bobot Awal

Penerapan Algoritma JST Backpropagation

Indeks BB/U Indeks BB/PB

(48)

Gambar 3.1 Metode yang diusulkan

3.2.3 Eksperimen dan Pengujian Metode Validasi Hasil

selesai

(49)

Tahap modeling untuk mengklasifikasikan status gizi balita dengan menggunakan dua metode yaitu algoritma Jaringan Saraf Tiruan Backpropagation.

Pada penelitian kali ini yang digunakan adalah penelitian Experiment.

Penelitian eksperimen melibatkan penyelidikan hubungan kausal menggunakan tes dikendalikan oleh si peneliti itu sendiri. Dalam penelitian eksperimen digunakan spesifikasi software dan hardware sebagai alat bantu dalam penelitian pada Tabel 3.3.

Tabel 3.5 Spesifikasi hardware dan software

Software Hardware

Sistem Operasi: Windows 7 CPU: Intel Atom Data Mining: RapidMiner versi 6.0 Memory: 1 GB

Hardisk: 160 GB

3.2.4 Evaluasi dan Validasi Hasil

Model yang diusulkan pada penelitian tentang klasifikasi status gizi balita adalah dengan menerapkan Jaringan Saraf Tiruan Backpropagation. Penerapan Jaringan Saraf Tiruan Backpropagation dengan menentukan nilai weight terlebih dahulu. Setelah didapatkan nilai akurasi terbesar, nilai weight tersebut akan dijadikan nilai yang akan digunakan untuk mencari nilai akurasi tertinggi. Setelah ditemukan nilai akurasi yang paling ideal dari parameter tersebut langkah selanjutnya adalah menentukan nilai weight. Setelah ditemukan nilai akurasi yang paling ideal dari parameter tersebut langkah selanjutnya adalah menentukan weight sehingga terbentuk struktur algoritma yang ideal untuk pemecahan masalah tersebut. Evaluasi dan validasi menggunakan metode Confusion Matrix.

3.2.5 Jadwal Penelitian

Tabel 3.6 Jadwal kegiatan yang dilakukan penulis dalam pembuatan tesis.

(50)

No. Nama Kegiatan Durasi Start Finish 1 Pengajuan Ijin Penelitian 10 hari 1/11/2014 10/11/2014 2 Penelusuran Pustaka 30 hari 1/11/2014 30/11/2014 3 Pengumpulan Data 20 hari 1/12/2014 20/12/2014 4 Pengolahan Data 30 hari 20/12/2014 30/1/2015 5 Penyusunan Naskah

Akhir

58 hari 1/11/2014 28/2/2015

6 Sidang Tesis 1 hari 9/3/2015 9/3/2015

BAB IV

HASIL PENELITIAN DAN PEMBAHASAN

4.1. Hasil Penelitian

Tujuan dari penelitian ini menguji keakuratan klasifikasi status gizi balita dengan menggunakan algoritma Neural Network backpropagation. Dalam penelitian ini menguji keakuratan algoritma Neural Network backpropagation berdasarkan indeks antropometri BB/U dan BB/PB.

4.1.1. Neural Network

Jumlah Neuron dalam Hiden Layer mempengaruhi tingkat akurasi. Berikut ini adalah hasil dari percobaan yang telah dilakukan untuk penentuan nilaiNeuron dalamHiden layer dengan nilai learning rate 0,9:

Tabel 4.1. Eksperiment penentuan nilai Hiden Layer Jumlah

Neuron dalam HL

Learning Rate 0,9 Accuracy Kappa

2 86,00% 0,596

(51)

4 86,50% 0,625

6 88,00% 0,666

8 89,50% 0,711

10 87,00% 0,664

Dari hasil eksperimen berdasarkan tabel 4.1 diperoleh kesimpulan bhwa nilai akurasi tertinggi dicapai hingga 89,50% dan kappa 0,771 dengan jumlah neuron 8 dalam hiden layer.

4.1.2. Hasil Uji Neural Network

Berdasarkan eksperimen yang telah diuji Neural network dalam penelitian ini menggunakan satu buah lapisan input yang terdiri dari 5 neuron (4 neuron adalah atribut yang digunakan sebagai predictor dan satu neuron bias), satu buah lapisan tersembunyi yang terdiri dari 8 buah neuron, dan 4 buah lapisan output yang merupakan hasil klasifikasi seperti yang terlihat pada gambar 4.1.

Gambar 4.1 Neural Network Klasifikasi Status Gizi Balita

(52)

Langkah dalam membentuk neural network adalah menentukan bobot jaringan untuk setiap lapisan secara acak biasanya berkisar antara -0,1 hingga 1,0.

Setelah bobot untuk setiap lapisan ditentukan, langkah berikutnya adalah menghitung input dari tiap neuron untuk membangkitkan output dengan menggunakan fungsi aktifasi sigmoid.

Langkah selanjutnya adalah menentukan nilai error, kemudian nilai error yang dihasilkan digunakan untuk memperbaharui bobot relasi simpul. Tabel 4.1 berikut ini menunjukan hasil perhitungan bobot akhir dari neural network pada lapisan tersembunyi.

Tabel 4.2 Nilai Bobot Akhir

Tabel 4.2 adalah nilai akhir fungsi aktifasi pada output layer. Kolom pertama pada Tabel 4.2 menyatakan class, yaitu atribut kelas yang dinyatakan dengan simpul pada output layer.

Tabel 4.3 Nilai Output Layer

(53)

4.2. Evaluasi dan Validasi Hasil

Hasil dari pengujian model yang dilakukan adalah klasifikasi status gizi balita berdasarkan indeks BB/U dengan Neural Network untuk menentukan nilai accuracy dan kappa.

1. Pembuatan Model dengan data training

Berikut gambar model pengujian menggunakan data training:

Gambar 4.2 Desain model Validasi