• Tidak ada hasil yang ditemukan

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita.

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita."

Copied!
13
0
0

Teks penuh

(1)

commit to user

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier

dalam Menentukan Status Gizi Balita

Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu

Jurusan Informatika

Disusun Oleh:

Apriliya Fitri Cahyanti

NIM. M0510009

JURUSAN INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET

(2)

commit to user

ii SKRIPSI

Penentuan Model Terbaik pada Metode

Naïve Bayes Classifier

dalam Menentukan Status Gizi Balita

Disusun Oleh:

Apriliya Fitri Cahyanti

M0510009

Skripsi ini telah disetujui untuk dipertahankan di hadapan dewan penguji,

Pada tanggal : 30 Januari 2015

PERSETUJUAN PEMBIMBING

Tugas Akhir ini telah disetujui oleh :

Pembimbing 1,

Ristu Saptono S.Si, M.T NIP. 19790210 200212 1 001

Pembimbing 2,

(3)

commit to user

iii SKRIPSI

Penentuan Model Terbaik pada Metode

Naïve Bayes Classifier

dalam Menentukan Status Gizi Balita

Disusun Oleh:

Apriliya Fitri Cahyanti

M0510009

Telah dipertahankan di hadapan Dewan Penguji

Pada tanggal : 30 Januari 2015

Susunan Dewan Penguji

1. Ristu Saptono, S.Si, M.T. ( )

NIP. 19790210 200212 1 001

2. Sari Widya Sihwi, S.Kom., M. T. I ( )

NIP. 19830412 200912 2 003

3. Hasan Dwi Cahyono, S.Kom., M.Kom ( )

NIP. 19820524 201404 1 001

4. Afrizal Doewes, S.Kom., M.Sc ( )

NIP. 19850831 201212 1 004

Disahkan oleh:

Ketua Jurusan Informatika

Drs. Bambang Harjito, M.App.Sc., Ph.D

(4)

commit to user

iv MOTTO

“Do not pray for an easy life, pray for the strength to endure a difficult one.”

(Bruce Lee)

“Hidup adalah perjuangan, kebahagiaan harus direngkuh dengan banyak

pengorbanan”

(5)

commit to user

v

PERSEMBAHAN

Kaya ini penulis persembahkan untuk:

“Bapak Ahmad Sairi dan Ibu Supriyati, kedua orang tua yang selalu memberikan doa dan kasih sayang tak terhingga”

“Kurnia Rahmawati dan Anggita Tantri Utami, kakak dan adik tercinta yang selalu memberikan doa dan dukungan”

“Viko Basmalah Wicaksono, yang selalu mendampingi dan memberi

dukungan”

“Teman-teman Informatika UNS 2010 khususnya Cerren, Lydia, Diannita,

Hedik, Adit, Taufik, Aji, Ashar, Miftah”

(6)

commit to user

vi

KATA PENGANTAR

Puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya karena

rahmat dan karunia-Nya, penulis dapat menyelesaikan Tugas Akhir dengan judul

“Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam

Menentukan Status Gizi Balita dengan Mempertimbangkan Independensi Antar

Parameter”. Penulis menyadari akan keterbatasan yang dimiliki. Begitu banyak

bantuan dan bimbingan yang diberikan dalam penyusunan Tugas Akhir ini. Oleh

karena itu, penulis mengucapkan terima kasih kepada :

1. Ayah, ibu, kakak, dan adik yang senantiasa selalu memberikan motivasi,

doa dan dukungannya.

2. Bapak Ristu Saptono, S.Si., M.T. Selaku Dosen Pembimbing I yang telah

memberikan pengarahan selama proses penyusunan Tugas Akhir ini,

3. Ibu Sari Widya Sihwi, S.Kom., M.T.I. selaku Dosen Pembimbing II yang

telah memberikan masukan, kritik dan saran yang membangun,

4. Bapak Ibu dosen Informatika FMIPA UNS,

5. Viko Basmalah Wicaksono yang selalu memberikan doa dan dukungan,

6. Seluruh teman – teman informatika 2010 yang telah memberikan

kebersamaannya dan membantu selama ini,

7. Semua pihak yang tidak dapat disebutkan satu persatu.

Semoga Tugas Akhir ini bermanfaat dan memberikan inspirasi bagi semua

pihak yang berkepentingan.

Surakarta, 22 Januari 2015

(7)

commit to user

vii

Determination the Best Model in Naïve Bayes Classifier Methods in Determine

of Under-F ive Children's Nutritional Status

Apriliya Fitri Cahyanti

Informatics Department. F aculty of Mathematics and Natural Science.

Sebelas Maret University

ABSTRACT

Naïve Bayes Classifier method has assumption to be optimal when its

parameters are independent. But in the reality, this assumption is often ignored.

An independent parameters can be determined from value of correlation between

each parameters. This study discusses about the determination of the best model

using Naive Bayes Classifier method in the case study of assessment of under-five

children's nutritional status. To make the data model, it used Backward Feature

Selection with correlation testing using Cosine Similarity. The correlation testing

is applied for knowing the relation of parameters between classes of classification

and independence each parameter.

The determination of the best model can be shown from accuracy,

simplicity, time, and data acquisition. In the 60%:40% scenario data, the best

model consist of weight, BMI, and age that resulting 94.4% for the accuracy.

While in the 80%:20% scenario data, the best model shown in model which

consist of weight, BMI, height, age, and gender that resulting 94.8% for the

accuracy. This study shows that correlation of parameters affect the classification

results, whereas the use of the independent parameters is not necessarily produce

an optimal accuracy. In fact, the best model in this study consist of the dependent

parameters.

Keyword— Cosine Similarity, Naïve Bayes Classifier, Determining Nutritional

(8)

commit to user

viii

Penentuan Model Terbaik pada Metode Naïve Bayes Classifier dalam Menentukan Status Gizi Balita

Apriliya Fitri Cahyanti

Jurusan Informatika. Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas Maret

ABSTRAK

Metode Naïve Bayes Classifier memiliki asumsi parameter yang saling independen. Padahal pada kenyataannya asumsi ini sering dilangggar. Suatu parameter dikatakan sebagai parameter independen dapat dilihat dari korelasi antar parameter tersebut. Artikel ini membahas mengenai penentuan model terbaik menggunakan Naive Bayes dalam studi kasus penilaian status gizi balita. Pembentukan model data menggunakan Backward Feature Selection, dengan melakukan uji korelasi menggunakan Cosine Similarity. Uji korelasi dilakukan untuk mengetahui hubungan antara parameter dengan kelas klasifikasi, dan independensi antar parameter.

Penentuan model terbaik dilihat dari akurasi, kesederhanaan, waktu, dan akuisisi data. Pada skenario data 60%:40%, model terbaik terdiri dari parameter berat, BMI, dan umur, dengan akurasi sebesar 94.4%. Sedangkan pada skenario

data 80%:20% model terbaik terdiri dari parameter berat, BMI, tinggi, umur, dan

jenis kelamin, dengan akurasi 94,8%. Penelitian ini menunjukkan bahwa kolerasi

parameter dengan kelas klasifikasi lebih mempengaruhi hasil klasifikasi,

sedangkan penggunaan parameter independen belum tentu menghasilkan akurasi

yang optimal. Bahkan, model terbaik pada penelitian ini terdiri dari parameter

dependen.

(9)

commit to user

ix DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PERSETUJUAN ... ii

HALAMAN PENGESAHAN ... iii

MOTTO ... iv

HALAMAN PERSEMBAHAN ...v

KATA PENGANTAR ... vi

ABSTRACT ... vii

ABSTRAK ... viii

DAFTAR ISI ... ix

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

DAFTAR LAMPIRAN ... xiii

BAB I ...1

1.1. Latar Belakang ...1

1.2. Rumusan Masalah ...2

1.3. Batasan Masalah ...2

1.4. Tujuan Penelitian ...2

1.5. Manfaat Penelitian ...3

1.6. Sistematika Penulisan ...3

BAB II ...4

TINJAUAN PUSTAKA ...4

2.1. Landasan Teori ...4

2.1.1. Naïve Bayesian Classifier ...4

2.1.2. Backward Feature Selection ...6

2.1.3. Korelasi ...7

2.1.4. Cosine Similarity ...7

2.1.5. Holdout atau Stratified Random Sampling ...8

2.1.6. Penilaian Status Gizi Balita ...8

2.2. Penelitian Terkait ...10

2.3. Kerangka Pemikiran ...12

(10)

commit to user

x

3.1. Analisa Kasus dan Pengumpulan Data ...14

3.2. Analisis dan Perancangan ...15

3.3. Pengembangan Aplikasi ...18

3.4. Pengujian ...18

BAB IV ...19

4.1. Deskripsi Data ...19

4.2. Pemodelan Data ...19

4.2.1. Uji Korelasi Parameter dengan Cosine Similarity ...19

4.2.2. Pembentukan Model Data dengan Backward Feature Selection ...22

4.3. Hasil dan Evaluasi ...26

4.3.1. Pengujian Sistem Penentuan Model Terbaik...26

4.3.2. Pengujian WEKA ...30

BAB V ...32

5.1. KESIMPULAN ...32

5.2. SARAN ...33

(11)

commit to user

xi

DAFTAR TABEL

Tabel 2.1. Contoh Dataset Perhitungan Naïve Bayes Classifier ...5

Tabel 2.2. Simulasi Backward Feature Selection...6

Tabel 2.3. Kategori Ambang Batas Kategori Berat Badan ...9

Tabel 2.4. Kategori Ambang Batas Tinggi Badan ...9

Tabel 2.5. Kategori Ambang Batas BMI ...10

Tabel 2.6. Keterkaitan Penelitian dengan Penelitian Sebelumnya ...13

Tabel 3.1. Nilai Parameter untuk Penilaian Status Gizi ...15

Tabel 3.2. Prosedur Percobaan ...18

Tabel 4.1. Uji Korelasi Status Gizi Dengan Parameter pada Skenario 60%:40% .20 Tabel 4.2. Uji Korelasi Antar Parameter pada Skenario 60%:40% ...20

Tabel 4.3. Uji Korelasi Status Gizi Dengan Parameter pada Skenario 80%:20% .21 Tabel 4.4. Uji Korelasi Antar Parameter pada Skenario 80%:20% ...22

Tabel 4.5. Model Data pada Skenario 60%:40% ...23

Tabel 4.6. Model Data pada Skenario 80%:20% ...25

Tabel 4.7. Model Data pada Skenario 60%:40% ...27

Tabel 4.8. Model Data pada Skenario 80%:20% ...29

(12)

commit to user

xii

DAFTAR GAMBAR

Gambar 3.1. Alur Penelitian ...16

(13)

commit to user

xiii

DAFTAR LAMPIRAN

LAMPIRAN A Data Gizi Balita dari Posyandu...36

LAMPIRAN B Data Gizi Balita Sebelum Pendiskritan ...62

LAMPIRAN C Data Gizi Balita Sesudah Pendiskritan ...68

LAMPIRAN D Hasil Pengujian Skenario Data 60%:40% ...74

LAMPIRAN E Hasil Pengujian Skenario Data 80%:20% ...80

Gambar

Gambar 3.2. Alur Pembentukan Model Backward ................................................17

Referensi

Dokumen terkait

Secara terperinci kaidah yang harus dipenuhi dalam penyusunan rancangan skripsi adalah sampul depan dan halaman judul, halaman persetujuan, halaman pengesahan

Penelitian yang dilakukan oleh Yenti (2013) menunjukan bahwa aspek sosial memiliki pengaruh pada citra perusahaan, hal ini menunjukan bahwa dengan adanya bantuan dana yag

dengan pengaruh kedua variabel makroekonomi terhadap return LQ 45, dengan hasil ini diharapkan bagi para investor yang melakukan investasinya pada dua indeks

Secara umum dilihat dari jumlah jenis, maka ketiga titik sampling didominasi oleh genus Chaetoceros , masing-masing 11, 9, dan 7 jenis berturut-turut pada Teluk Nare, Labuhan

yang (sudah) diterima umum sebagai betul dan sah….dan seterusnya dapat dijadikan asas perbandingan”. Pembakuan merujuk kepada proses pengekodan bahasa. Biasanya

Karakteristik followers akun Twitter @EHIndonesia yang terdiri dari jenis kelamin, usia, tingkat pendidikan, jenis pekerjaan, tingkat pemasukan, dan tempat tinggal tidak

Variabel pendidikan seseorang berpengaruh terhadap besarnya nilai WTP yang dibayarkan dalam upaya perbaikan lingkungan. Dengan koefisien yang positif menunjukkan bahwa, semakin

Artinya bahwa dalam pembentukan konsep diri pada peserta didik, penanaman dan pemahaman tentang nilai-nilai yang terdapat dalam pendidikan karakter akan