PREDIKSI JUMLAH ANAK BERISIKO STUNTING MENGGUNAKAN ALGORITMA NAÏVE BAYES

(1)

PREDIKSI JUMLAH ANAK BERISIKO STUNTING MENGGUNAKAN ALGORITMA NAÏVE BAYES

Nurussakinah Yufita, Fatayat

Mahasiswa Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia

[email protected], [email protected] ABSTRACT

The Government of the Republic of Indonesia in 2017 established the National Strategy (STRANAS) as a form of government effort in accelerating the reduction of stunting in Indonesia. Through the STRANAS, the government succeeded in reducing the stunting rate in Indonesia with the prevalence of stunting from 32.7% in 2013 to 27.67% in 2019. The government has targeted that in 2024 the stunting prevalence rate in Indonesia can decrease to 14 percent. It means that the government should be able to reduce the prevalence rate every year by 2.7%. Based on data from the Pekanbaru City Health Office, in 2021 the area with the highest stunting locus is in Lima Puluh Subdistrict with a stunting prevalence of 7.29%. In this case, the Lima Puluh Health Center, which is responsible for the main health services in handling stunting problems in Lima Puluh District, has made efforts to monitor the nutritional health conditions of toddlers in accordance with the program provided by the government by opening posyandu services every month. However, problems were found, namely delays in data delivery by posyandu cadres and data input by puskesmas health workers making monitoring of the nutritional health of children under five too late. Therefore, this study was conducted to predict children at risk of stunting using the nave Bayes algorithm and the accuracy of the algorithm was measured using a confusion matrix. Training data and testing data are divided using K-fold cross validation. Based on the results of research using 830 data, the best accuracy is found in fold 5 with an accuracy presentation of 73% and is implemented in a web-based programming system.

Keywords : Malnutrition, Naïve Bayes, Prediction..

ABSTRAK

Pemerintah Republik Indonesia pada tahun 2017 menetapkan Strategi Nasional (STRANAS) sebagai bentuk upaya pemerintah dalam percepatan penurunan stunting yang ada di Indonesia. Melalui STRANAS tersebut pemerintah berhasil menurunkan angka stunting di indonesia dengan prevalensi stunting dari 32,7% pada tahun 2013 menjadi 27,67% pada tahun 2019. Pemerintah telah menargetkan bahwa pada tahun 2024 nantinya angka prevalensi stunting di indonesia dapat mengalami penurunan menjadi 14 persen. Hal tersebut dapat diartikan bahwa pemerintah harus bisa menurunkan angka pravelensi setiap tahunnya sebesar 2,7%. Berdasarkan data Dinas

(2)

Kesehatan Kota Pekanbaru, pada tahun 2021 daerah yang menjadi lokus stunting tertinggi yaitu pada Kecamatan Lima Puluh dengan prevalensi stunitntg sebesar 7,29%.

Puskesmas Lima Puluh pada hal ini yang bertanggung jawab atas layanan Kesehatan utama dalam penanganan permasalahan stunting pada Kecamatan Lima Puluh, telah berupaya dalam memantau kondisi kesehatan gizi balita sesuai dengan program yang diberikan pemerintah dengan membuka layanan posyandu setiap bulannya. Namun ditemukan permasalahn yaitu keterlambatan pengantaran data oleh kader posyandu dan penginputan data oleh tenaga kesehatan puskesmas membuat pemantauan kesehatan gizi balita juga ikut terlambat. Oleh sebab itu, penelitian ini dilakukan untuk memprediksi anak berisiko stunting dengan menggunakan algoritma naïve bayes dan tingkat akurasi algoritma diukur menggunakan confusion matrix. Data training dan data testing dibagi menggunakan K-fold cross validation. Berdasarkan hasil penelitian menggunakan 830 data, akurasi terbaik terdapat pada fold 5 dengan presentasi akurasi sebesar 73% dan diimplementasikan pada sistem pemrograman berbasis web.

Kata Kunci : Naïve bayes, Prediksi, Stunting.

PENDAHULUAN

Permasalahan stunting ini termasuk dalam kategori penting dan harus diselesaikan, sebab stunting akan sangat berpengaruh pada potensi sumber daya manusia serta erat kaitannya dengan tingkat kesehatan hingga kematian. Pemerintah Republik Indonesia pada tahun 2017 menetapkan Strategi Nasional (STRANAS) sebagai bentuk upaya pemerintah dalam percepatan penurunan stunting yang ada di Indonesia. Berdasarkan data dari Dinas Kesehatan Kota Pekanbaru, pada tahun 2021 daerah yang menjadi lokus stunting tertinggi yaitu pada Kecamatan Lima Puluh.

Puskesmas Lima Puluh pada hal ini sebagai layanan Kesehatan utama pada Kecamatan Lima Puluh, telah berupaya dalam memantau kondisi kesehatan balita sesuai dengan program yang diberikan pemerintah dengan membuka layanan posyandu setiap bulannya. Namun demikian, keterlambatan pengantaran data oleh kader posyandu serta keterlambatan penginputan data pada aplikasi yang telah disediakan pemerintah oleh tenaga kesehatan puskesmas membuat pemantauan kesehatan balita juga ikut terlambat.

Oleh karena itu dilakukan penelitian untuk memprediksi anak berisiko stunting sehingga masyarakat di wilayah Kecamatan Lima Puluh dapat mengetahui anak yang berisiko stunting dan melakukan penanganan dengan cepat. Penelitian ini merupakan menguji metode yang sudah ada untuk di terapkan pada Kecamatan Lima Puluh Kota Pekanbaru.

METODE PENELITIAN

a. Tahapan Penelitian

Tahapan Penelitian ini terdiri dari delapan tahapan. Adapun tahapan-tahapan pada penelitian ini adalah sebagai berikut:

(3)

1. Studi Literatur

Tahap ini merupakan tahapan awal pada saat melakukan penelitian melakukan pencarian informasi dari berbagai sumber referensi mengenai permasalahan serta proses yang akan diteliti, mulai dari mencari buku, jurnal, dan artikel-artikel yang terkait.

2. Persiapan Data

Tahap ini merupakan tahap mengumpulkan data stunting di Puskesmas Lima Puluh Kota Pekanbaru. Penelitian ini menggunakan data sekunder yang diperoleh dari pihak Puskesmas Lima Puluh.

3. Preprocessing Data

Pada tahap ini merupakan tahap untuk membersihkan data dari noise sehingga data tersebut siap untuk tahap selanjutnya. Pada preprocessing data terdapat 2 tahapan yaitu:

a. Pembersihan Data

Tahap ini melakukan pembersihan data dari data yang tidak akan digunakan pada proses selanjutnya.

b. Tranformasi Data

Pada tahap ini dilakukan pengubahan data agar sesuai dengan kriteria yang diinginkan untuk proses selanjutnya.

c. Pembagian data

Tahap ini dilakukan pembagian data training dan data testing menggunakan metode k-fold Cross Validation dengan skema k berjumlah 3, 5, dan 10 fold.

4. Proses Naïve Bayes Classification

Pada tahap ini akan dilakukan pengolahan dataset yang sudah siap digunakan untuk mencari pola prediksi dengan mengklasifikasikan dataset tersebut menggunakan metode Naïve Bayes.

5. Proses Confusion Matrix

Tahapan ini merupakan tahap untuk evaluasi dari model prediksi yang dihasilkan dari proses sebelumnya. Fold dengan hasil akurasi tertinggi yang akan diambil sebagai model prediksi dalam implementasi kedalam system berbasis web.

6. Perancangan Sistem

Tahap ini merupakan tahap untuk menggambarkan segala rancang bangun implementasi yang berupa pembuatan sketsa dari beberapa elemen kedalam satu kesatuan yang utuh. Tahapan yang dilakukan adalah membuat Use Case diagram, Activity diagram, class diagram, dan sequence diagram

7. Hasil Implementasi Sistem

Tahapan ini merupakan tahap membangun sistem berbasis web sesuai dengan tahapan perancangan sebelumnya. Pada tahap ini juga mengimplemenntasikan model prediksi yang dihasilkan pada tahap sebelumnya sehingga dapat melakukan prediksi

b. Peralatan yang Digunakan

Peralatan yang digunakan pada proses penelitian ini adalah sebagai berikut

1. Adapun perangkat lunak (Software) yang membantu pembuatan sistem ini meliputi:

(4)

a. MacbookAir (11-inch) 1.6 GHz dual-core Intel Core i5, 4 GB 1600 MHz DDR3 Model A1465 EMC 2924 Rated 14.85V, FCC ID:QDS-BRCM 1072, IC:4342A-BRCM1072 CAN ICES-3 (B)/NMB-3(B) Serial C02QGGQPGFWM

b. Komputer Lenovo Core i5 8^th Generation 2.800GHz 2.81 GHz 8.00 GB c. Printer EPSON L3150 sebagai alat untuk mencetak laporan

2. Adapun perangkat lunak (Software) yang membantu pembuatan sistem ini meliputi:

a. 64-bit Sistem Operasi macOS Catallina version 10.15.17 b. Sistem Operasi Windows 10 pro 64-bit

c. Microsoft Word 2016 untuk pembuatan penulisan skripsi d. Microsoft Excel untuk menginput data lapangan

e. Visual Studio Code sebagai text editor pembuatan program

f. XAMPP 7.4.10-0 digunakan untuk sebagai web server dalam menjalankan sistem.

g. Google Chrome untuk menjalankan dan menampilkan system h. Anaconda sebagai alat pembuatan program pyhton

i. Draw.io digunakan sebagai alat untuk membuat diagram perancangan sistem.

c. Stunting

Permasalahan anak yang mendapat status gizi stunting merupakan akibat dari kurangnya asupan unsur-unsur pembangun tubuh (defisiensi nutrien). Berdasarkan Peraturan Kementrian Kesehatan Republik Indoensia Nomor 2 Tahun 2020 (Kemenkes, 2020) mengenai standar antropometri anak menjelaskan bahwa seorang anak mendapat status stunting dapat dilihat dari angka Tinggi badan menurut umur (TB/U) dengan ketetapan perhitungan ambang batas (z-Score) -3SD sampai dengan <- 2SD. Berdasarkan (Atikah et al., 2018), stunting harus dapat terdeteksi secara dini sebelum anak menginjak umur 2 tahun.

d. Naïve Bayes

Metode naïve bayes merupakan metode yang sederhana dalam mengolah data yang besar karena mempunya nilai akurasi yang tinggi (Sulastri & Nugroho, 2017).

Pada naïve bayes, nilai numerik dipetakan ke nilai nominal dalam bentuk interval dengan memperhatikan kleas tiap nilai numerik. Persamaan dari algoritma naïve bayes sebagai berikut.

𝑃(𝐶|𝑋1 … 𝑋𝑛) = 𝑃(𝑋1..𝑋𝑛|𝐶).𝑃(𝐶)

𝑃(𝑋1…𝑋𝑛) ... (1)

Variabel C merepresentasikan kelas, sementara variabel X1 ... Xn merepresentasikan karakteristik petunjuk yang dibutuhkan untuk melakukan klasifikasi atau kriteria. Maka rumus tersebut menjelaskan bahwa peluang masuknya sampel karakteristik tertentu dalam kelas C (Posterior) adalah peluang munculnya kelas C (sebelum masuknya sampel tersebut, seringkali disebut prior), dikali dengan peluang kemunculan karakteristik- karakteristik sampel pada kelas C (disebut juga likelihood), dibagi dengan peluang kemunculan karakteristik-karakteristik sampel secara global

(5)

(disebut juga evidence). Nilai evidence selalu tetap untuk setiap kelas pada satu sampel sehingga rumus tersebut dapat disederhanakan sebagai berikut.

𝑃(𝐶|𝑋1 … 𝑋𝑛) =𝑃(𝑋1..𝑋𝑛|𝐶).𝑃(𝐶)

𝑃(𝑋1…𝑋𝑛) ...(2) Alur perhitungan pada algoritma naïve bayes adalah sebagai berikut:

1. Menentukan probabilitas masing-masing kelas dengan menggunakan rumus umum probabilitas dan dapat dilihat pada persamaan berikut.

𝑃(𝐴) = 𝑏𝑎𝑛𝑦𝑎𝑘 𝑎𝑛𝑔𝑔𝑜𝑡𝑎 𝑑𝑎𝑡𝑎 𝐴

𝑏𝑎𝑛𝑦𝑎𝑘 𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑑𝑎𝑡𝑎...(3)

2. Menentukan probabilitas atribut dari setiap kelas. Jika data numerik, maka tentukan terlebih dahulu nilai mean dan standar devisiasi. Rumus mencari mean dapat dilihat pada persamaan di bawah ini.

𝜇 =𝐽𝑢𝑚𝑙𝑎ℎ 𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑑𝑎𝑡𝑎

𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎 ...(4)

Sedangkan rumus untuk menentukan standar Deviasi mengggunkan rumus pada persamaan berikut.

𝜎 = √^∑^𝑖=1^(𝑥^𝑖^{− 𝜇)}²

𝑛 ...(5) Keterangan:

𝜎 = Standar Deviasi 𝑥_𝑖 = Data ke i

𝜇 = Rata-rata Populasi 𝑛 = Jumlah data

3. Menghitung probabilitas kelas baru. Data dengan bentuk numerik perhitungan probabilitas kelas digantikan dengan densitas gauss dengan rumus pada persamaan berikut.

𝑃 = (𝑋_{𝑖= 𝑥}_𝑖|𝑌 = 𝑦_𝑗 ) = ¹

√2𝜋𝜎𝑖𝑗× 𝑒

(𝑥𝑖 −𝜇𝑖𝑗)2

2𝜎2𝑖𝑗 ...(6) Keterangan

𝑃 = Peluang 𝑋_𝑖 = Atribut ke-i 𝑥_𝑖 = Nilai atribut ke-i 𝑌 = Kelas yang dicari 𝑦_𝑗 = Sub kelas Y yang dicari 𝜇 = Mean

4. Membandingkan nilai antar kelas baru untuk menentukan kedalam kelas apa suatu sampel akan diklasifikasikan.

e. Confusion Matrix

Confusion matrix adalah metode atau cara yang digunakan untuk mengukur kinerja suatu model dan mengandung informasi yang membandingkan hasil yang telah di proses oleh sistem dengan hasil yang seharusnya (Karsito & Susanti, 2019). Dalam confusion matrix terdapat beberapa performance matrics yang umum digunakan untuk mengukur performa sebuah model yaitu akurasi, presisi, dan recall. Akurasi merupakan tingkat kedekatan nilai prediksi dengan nilai yang sebenarnya. Rumus menghitung akurasi adalah sebagai berikut:

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = ^{𝑇𝑃+𝑇𝑁}

𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁× 100%...(7)

(6)

Presisi merupakan perbandingan prediksi benar dengan seluruh hasil yang diprediksi positif untuk menghitung ketepatan model. Rumus menghitung presisi adalah sebagai berikut.

𝑃𝑟𝑒𝑠𝑖𝑠𝑖 = ^𝑇𝑃

𝑇𝑃+𝐹𝑃× 100%...(8)

Recall meupakan perbandingan prediksi benar positif dengan seluruh data benar positif. Rumus menghitung recall adalah sebagai berikut.

𝑅𝑒𝑐𝑎𝑙𝑙 = ^𝑇𝑃

𝑇𝑃+𝐹𝑁× 100%...(9)

HASIL DAN PEMBAHASAN

a. Studi Literatur

Pada tahap ini dilakukan pengumpulan segala referensi terkait dengan penelitian yaitu seperti jurnal penelitian yang berkaitan dengan Naïve Bayes, stunting, dan lain sebagainya. Referensi terkait dalam dilihat pada bagian Daftar Pustaka yang tertera.

b. Persiapan Data

Pada proses ini dilakukan pengambilan data pada bagian layanan gizi di Puskesmas Lima Puluh Kota Pekanbaru. Proses untuk mendapatkan informasi lebih lanjut dilakukan dengan wawancarai Petugas Kesehatan pada Layanan Gizi dengan narasumber bu Isra Marefta, S.Gz pada 31 Januari 2022 dan mewawancarai dokter pada bagian layanan tumbuh kembang anak yaitu dr. Sri Hartati pada 16 Maret 2022.

Wawancara ini bertujuan untuk mendapat informasi apa saja hal yang harus dipatuhi dalam pengambilan data dan data apa saja yang bisa digunakan dalam penelitian ini.

Data diambil oleh petugas gizi dari e-PPBGM dan berbentuk file excel. Data yang diambil adalah data status gizi balita di Kecamatan Lima Puluh berjumlah 830 data yang terdiri 16 kolom yaitu Nama, Jenis Kelamin, tanggal lahir, Nama Orang Tua, Desa/Kel, Posyandu, RT, RW, Alamat, Tanggal Pengukuran, Umur (bulan), Berat Badan, Tinggi Badan, BB/U, TB/U, dan BB/TB. Tampilan data dapat dilihat pada Tabel 1 berikut.

.

Tabel 1. Data Awal.

No. … Tanggal Pengukuran

Umur

(Bln) Berat Tinggi BB/U TB/U BB/TB

1 … 8/6/2021 31 12 86 Berat Badan

Normal Normal Gizi Baik

2 … 8/6/2021 26 11 84 Berat Badan

3 … 8/28/2021 33 0:00 93 Berat Badan

4 … 8/6/2021 56 12.4 95 Kurang Pendek Gizi

Baik

5 … 8/25/2021 31 15 87 Risiko Lebih Normal Gizi

Lebih

… … … … … … … … …

830 … 2/15/2021 11 8.7 62 Berat Badan

Normal

Sangat

Pendek Obesitas

(7)

c. Preprocessing Data

Pada preprocessing data terdapat tiga tahapan yaitu sebagai berikut:

1. Pembersihan Data

Berdasarkan Tabel 2 jumlah data berkurang menjadi 259 data. Variabel yang tersisa untuk digunakan pada proses naïve bayes ada empat yaitu Nama, Jenis Kelamin, Umur (bulan), Tinggi Badan, Berat Badan, dan sebagai label kelas yaitu variabel TB/U.

Tabel 2 Pembersihan Data

No. Nama JK Umur

(Bln) Berat Tinggi TB/U

1 AISYAH P 56 12.4 95 Pendek

2 ASOFA P 36 9.5 87 Pendek

3 CLAUDIA P 40 12.2 89 Pendek

4 ZEYA P 47 12 93 Pendek

5 AKBAR L 18 9 74.5 Pendek

6 HAMUKA L 37 11 88.5 Pendek

7 HASYA P 42 10.25 89.5 Pendek

8 KHALID P 28 8.5 79 Sangat Pendek

9 KHAULA P 34 9 80 Sangat Pendek

… … … … … … …

259 ADRIAN L 11 8.7 62 Sangat Pendek

2. Transformasi Data

Pada tahap ii, variabel nama akan diinisialisasikan menjadi Balita 1, Balita 2, Balita 3, …. dst. Variabel TB/U yang menjadi label kelas akan ditransformasikan menjadi label Stunting untuk data Pendek dan Sangat Pendek serta label Normal untuk data Normal dan Tinggi. Hasil transformasi data pada Tabel 4.2 akan dijadikan sebagai dataset untuk proses selanjutnya. Dataset dapat dilihat pada Tabel 3 berikut.

Tabel 3 Dataset

No. Nama JK Umur (Bln) Berat Tinggi TB/U

1 Balita 1 P 56 12.4 95 Stunting

4 Balita 4 P 47 12 93 Stunting

5 Balita 5 L 18 9 74.5 Stunting

6 Balita 6 L 37 11 88.5 Stunting

7 Balita 7 P 42 10.25 89.5 Stunting

… … … … … … …

259 Balita 259 L 11 8.7 62 Stunting

(8)

3. Pembagian Data

Proses ini memisahkan data training dan data testing menggunakan K-fold Cross Validation dengan skema k berjumlah 3, 5, dan 10 fold. Jika nilai k sebanyak 10 maka artinya sebanyak 259 dataset akan dibagi menjadi 10 partisi yang sama besar. Setelah dibagi menjadi 10 bagian sama besar, fold-1 akan digunakan sebagai data testing untuk validasi model dan fold-2 hingga fold-10 digunakan sebagai data training untuk melatih model. Proses tersebut diulang sebanyak 10 kali sampai semua bagian (fold) mendapat jatah untuk menjadi data testing. Begitu pula untuk jumlah k sebanyak 3 dan 5.

d. Proses Naïve Bayes Classification

Pada contoh perhitungan ini digunakan data training pada k-fold 10 iterasi pertama.

Tabel 4 Data Training

No. Nama JK Umur (Bln) Berat Tinggi TB/U

1 Balita 27 L 21 9 74 Stunting

2 Balita 28 L 29 11.2 81.5 Stunting

… … … … … … …

Tabel 4 menunjukkan data training k-fold 10 pada iterasi pertama. Data training tersebut sebanyak 233 data dari jumlah keseluruhan dataset. Selanjutnya melakukan proses perhitungan naïve bayes. Adapun tahapannya adalah sebagai berikut:

1. Menentukan nilai probabilitas setiap kelas pada data latih. Nilai Probabilitas yang dihitung adalah jumlah kelas stunting dan kleas normal yang ada pada data latih.

Banyak masing-masing kelas dapat dilihat pada Tabel 6 berikut.

Tabel 6 Banyak Masing-masing Kelas

No. Kelas Jumlah

1 Stunting 117

2 Normal 116

Jumlah keseluruhan = 233

Berdasarkan Jumlah Kelas pada Tabel 6 di atas, jumlah kelas stunting adalah 117 dan jumlah jumlah kelas normal adalah 116. Kemudian menghitung probabilitas masing-masing kelas menggunakan persamaan 3.

P(Stunting)= ∑¹¹⁷

233= 0,502 P(Normal)= ∑¹¹⁶

233= 0,497

2. Langkah berikutnya adalah menentukan nilai probabilitas fitur jenis kelamin perempuan (kelas stunting dan normal) dan laki-laki (kelas stunting dan normal) yang terdapat pada data latih.

(9)

Tabel 7 Banyak Fitur Jenis Kelamin

No. Jenis Kelamin Stunting Normal

1 L 54 53

2 P 63 63

Jumlah 117 116

Tabel 7 menampilkan banyak data masing-masing fitur jenis kelamin. Berdasarkan Tabel 7 kemudian dilakukan perhitungan probabilitas.

P(L|stunting) = ∑ ⁵⁴

117 = 0,461 P(Pr|stunting) = ∑ ⁶³

117= 0,538 P(L|normal) = ∑ ⁵³

116= 0,456 P(Pr|normal) = ∑ ⁶³

116= 0,543

3. Langkah ketiga yaitu menghitung Mean dan menghitung Standar Deviasi pada fitur Umur, Berat, dan Tinggi pada setiap kelas.

Tabel 8 Banyak Keseluruhan Data Masing-Masing fitur

No. Fitur Stunting Normal

1 Umur 3768 3940

2 Berat 1305 1437

3 Tinggi 9455 10527

Tabel 8 menunjukkan jumlah keselurahan data masing-masing fitur Berat, Umur, dan Tinggi setiap kelas yang terdapat pada dataset. Berikut perhitungan Mean masing-masing fitur Umur, Berat, dan Tinggi menggunakan persamaan 4.

• Umur (stunting) 𝜇 =³⁷⁶⁸

117 = 32,205

• Berat (stunting) 𝜇 =¹³⁰⁵

117 = 11,159

• Tinggi (stunting) 𝜇 =⁹⁴⁵⁵

117 = 80,812

• Umur (normal) 𝜇 =³⁹⁴⁰

116 = 33,965

• Berat (normal) 𝜇 =¹⁴³⁷

116 = 12,388

• Tinggi (normal) 𝜇 =¹⁰⁵²⁷

116 = 90,577

Berikut perhitungan Standar Deviasi fitur Umur, Berat, dan Tinggi menggunakan persamaan 5.

• Umur (stunting)

𝜎 = √(21−32,205)²+(29−32,205)²+..+(11−32,205)²

117 = 15,075

(10)

• Berat (stunting)

𝜎 = √^(9−11,159)²+(11.2−11,159)²+..+(8.7−11,159)²

117 = 3,162

• Tinggi (stunting)

𝜎 = √(74−80,812)²+(81.5−80,812)²+..+(62−80,812)²

117 = 10,864

• Umur (normal)

𝜎 = √(54−33,965)²+(43−33,965)²+..+(32−33,965)²

116 = 15,354

• Berat (normal)

𝜎 = √(15.5− 12,388)²+(17− 12,388)²+..+(11− 12,388)²

116 = 3,312

• Tinggi (normal)

𝜎 = √(102−90,577)²+(101−90,577)²+..+(85−90,577)²

116 = 12,248

4. Menentukan probabilitas setiap fitur dari salah satu data uji menggunakan persamaan 6. Data uji yang ditampilkan pada contoh perhitungan ini adalah data pertama iterasi pertama pada k-fold 10 yang ada pada dataset. Data uji yang akan dihitung dapat dilihat pada Tabel 4.9 berikut.

Tabel 4.9 Data Uji

No. Nama JK Umur (Bln) Berat Tinggi

1 Balita 1 P 56 12.4 95

• Menghitung probabilitas fitur Umur setiap kelas P(“56”|stunting) = ¹

√2𝜋15,075× 𝑒

(56−32,205)2

2×(56−15,075)2= 0,029 P(“56”|normal) = ¹

√2𝜋15,354× 𝑒

(56−33,965)2

2×(15,534)2 = 0,036

• Menghitung probabilitas fitur Berat setiap kelas P(“12,4”|stunting) = ¹

√2𝜋3,162× 𝑒

(12.4−11,159)2

2×(3,162)2 = 0,207 P(“12,4”|normal) = ¹

√2𝜋3,312× 𝑒

(12.4−12,388)2

2×(3,312)2 = 0,219

• Menghitung probabilitas fitur Tinggi setiap kelas P(“95”|stunting) = ¹

√2𝜋10,864× 𝑒

(95−80,812)2

2×(10,864)2 = 0,051 P(“95”|normal) = ¹

√2𝜋12,248× 𝑒

(95−90,577)2

2×(12,248)2 = 0,106

5. Menghitung probabilitas Kelas akhir data uji menggunakan persamaan 2. berikut perhitungan probabilitas kelas akhir.

• Probabilitas Kelas Stunting

P(Stunting|X) = 0,502 * 0,538 * 0,029 * 0,207 * 0,051 P(Stunting|X) = 0.00008

(11)

• Probabilitas Kelas Normal

P(Normal|X) = 0,497 * 0,543 * 0,036 * 0,219 * 0,106 P(Normal|X) = 0.0002

6. Tahapan terakhir adalah menetukan kelas baru pada data uji dengan cara membandingkan nilai kelas Stunting dan nilai kelas Normal. Pada hasil pehitungan probabilitas kelas (tahapan nomor 5), nilai kelas Stunting adalah 0,00008 dan nilai kelas Normal adalah 0,0002 maka data tersebut masuk kedalam kelas Normal dikarenakan nilai kelas Normal lebih besar dari kelas Stunting. Langkah-langkah di atas (1-6) diterapkan pada masing-masing iterasi setiap k-fold (10, 5 dan 3) pada dataset.

e. Confusion Matrix

Perhitungan confusion matrix merupakan tahapan untuk mengevaluasi model dengan menemukan banyak data yang termasuk TP, FP. TN, dan FN pada data uji yang telah diproses pada tahap sebelumnya. Tabel 10 berikut menampilkan banyak TP, FP.

TN, dan FN pada data uji.

Tabel 4.10 confusion matrix iterasi-1

Confusion Matrix Nilai Sebenarnya Positive Negative Nilai

Prediksi

Positive TP=8 FP=6

Negative FN=5 TN=7

Berdasarkan Tabel 4.10 dilakukan perhitungan confusion matrix sebagai berikut:

1. Akurasi

Menghitung akurasi berdasarkan rumus 2.7 Akurasi = ⁸⁺⁷

8+7+6+5× 100%

Akurasi = 57,692%

2. Presisi

Menghitung Presisi berdasarkan rumus 2.8 Presisi = ⁸

8+6× 100%

Presisi = 57,142%

3. Recall

Menghitung Recall berdasarkan rumus 2.9 Recall = ⁸

8+5× 100%

Recall = 61,538%

Semua tahapan perhitungan akurasi, presisi, dan recall dilanjutkan pengimplementasiannya untuk setiap iterasi pada k-fold 10, k-fold 3, dan 5.

(12)

Tabel 4.11 Hasil Confusion Matrix

No. Jumlah k Iterasi - n Akurasi Presisi Recall

1. 3 Iterasi – 1 58% 51% 87%

Iterasi – 2 56% 28% 55%

2. 5 Iterasi – 2 59% 18% 57%

Iterasi – 3 63% 36% 75%

3. 10 Iterasi – 5 73% 54% 75%

Iterasi - 10 65% 100% 65%

Tabel 11 menampilkan hasil dua perhitungan tertinggi confusion matrix setiap iterasi pada k-fold 3, 5 dan 10. Akurasi tertinggi terdapat pada k-fold 10 iterasi ke-5 yaitu sebesar 73%. Hal ini dapat menunjukkan bahwa jumlah k pada cross validation mempengaruhi hasil kinerja model dari naïve bayes classification. Semakin banyak jumlah k yang diimplementasikan, maka dapat menghasilkan akurasi yang lebih tinggi.

.

f. Perancangan sistem

Use Case Diagram merupakan diagram yang mendeskripsikan interaksi antar pengguna sebuah sistem dengan sistem itu sendiri (Kurniawan, T. Bayu, 2020).

Diagram ini berfungsi untuk mengetahui dan menjabarkan kebutuhan fungsional dari sebuah sistem. Pada perancangan ini terdapat dua tipe pengguna yang menggunakan sistem ini yaitu petugas gizi, pimpinan puskesmas dan masyarakat. Untuk Use Case Diagram dari sistem yang akan dibangun dapat dilihat pada Gambar 1 berikut.

Gambar 1 Use Case

g. Hasil Implenetasi Sistem

Setelah dilakukan perancangan sistem, kemudian dilakukan tahap mengimplementasikan model prediksi dan semua perancangan kedalam sistem berbasis web. Berikut hasil tampilan dari sistem prediksi berbasis web yang telah dibuat:

(13)

1. Tampilan Halaman Login

Pada halaman ini terdapat form login untuk masuk kedalam menu utama atau home pada sistem prediksi. User petugas, pimpinan dan masyarakat harus memasukkan username dan password terlebih dahulu, kemudian menekan tombol login. Tampilan login dapat dilihat pada Gambar 2 berikut.

Gambar 2 Tampilan Login 2. Tampilan Halaman Home

Setelah melakukan login, user akan langsung masuk kedalam halaman home sebagai menu utama pada sistem. Pada bar sebelah kiri terdapat list menu yang bisa diakses oleh user yaitu menu data user, menu prediksi, serta menu untuk keluar dari sistem. Tampilan menu home dapat dilihat pada Gambar 3 berikut.

Gambar 3 Halaman Home 3. Tampilan Halaman Hasil Prediksi

Pada halaman ini ditampilkan hasil prediksi data balita. User yang dapat mengaksesnya adalah user Petugas dan Pimpinan. Petugas dapat memilih menu Prediksi data pada list bar di sebelah kiri. Kemudian akan ditampilkan tabel hasil dari prediksi stunting balita. Tampilan halaman form dapat dilihat pada Gambar 4 berikut.

(14)

Gambar 4 Halaman Tambah Data

KESIMPULAN

Berdasarkan pembahasan sebelumnya, kesimpulan penelitian ini adalah sebagai berikut:

1. Proses pembuatan model prediksi stunting Kecamatan Lima Puluh (Puskesmas Lima Puluh) dengan menggunakan Naïve bayes yaitu persiapan data, preprocessing data, proses naive bayes classficiation, dan confusion matrix untuk menghitung hasil kinerja dari naïve bayes tersebut. Data yang digunakan merupakan data status kesehatan gizi balita pada tahun 2021. Pada proses naïve bayes classification, pembagian data training dan data testing menggunakan teknik k-fold cross validation dengan skema jumlah k sebesar 3, 5 dan 10 untuk menemukan posisi data yang tepat sehingga dapat menghasilkan akurasi yang baik.

2. Pada Penelitian ini Naïve bayes menghasilkan akurasi tertinggi pada jumlah k sebanyak 10 pada iterasi ke-5 dengan hasil akurasi sebesar 73%, presisi sebesar 54%, dan recall sebesar 75%. Berdasarkan hasil prediksi, menggunakan 86 data hasil pengukuran antropometri balita pada bulan Februari, sebanyak 17 balita terprediksi stunting dan sebanyak 69 balita terprediksi tidak stunting.

SARAN

Setelah penulis menyampaikan hasil dari penelitian yang telah dilakukan, berikut penulis memberikan beberapa saran yang dapat dijadikan sebagai referensi untuk penelitian selanjutnya yaitu sebagai berikut:

1. Memperbanyak data agar hasil yang didapatkan dari prediksi akan lebih akurat.

2. Menambahkan faktor-faktor risiko stunting sebagai variabel tambahan.

3. Menerapkan algoritma lain untuk membandingkan hasil prediksi yang terbaik.

4. Pada pengembangan sistem prediksi selanjutnya diharapkan dapat dioperasikan tidak hanya berbasis web saja, melainkan juga bisa dioperasikan berbasis mobile.

(15)

UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada ibu Fatayat M.Kom. yang telah membimbing, memotivasi serta membantu penelitian dan penulisan karya ilmiah ini.

DAFTAR PUSTAKA

Atikah, R., Yulidasari, F., Ocktaviana, A., & Anggraini, L. (2018). Stunting dan Upaya Pencegahannya (Hadianor (ed.)). CV. Mine.

Karsito, & Susanti, S. (2019). Klasifikasi Kelayakan Peserta Pengajuan Kredit Rumah Dengan Algoritma Naïve Bayes Di Perumahan Azzura Residencia. Jurnal Teknologi Pelita Bangsa, 9, 43–48.

Kemenkes, R. (2020). Peraturan Kementrian Kesehatan Republik Indonesia Nomor 2 Tahun 2020 Tentang Standar Antropometri Anak. 68(1), 1–12.

http://dx.doi.org/10.1016/j.ndteint.2014.07.001%0Ahttps://doi.org/10.1016/j.ndtein t.2017.12.003%0Ahttp://dx.doi.org/10.1016/j.matdes.2017.02.024

Kurniawan, T. Bayu, S. (2020). Perancangan Sistem Aplikasi Pemesanan Makanan dan Minuman Pada Cafetaria NO Caffe di TAnjung Balai Karimun Menggunakan Bahasa Pemrograman PHP dan My.SQL. Journal of Chemical Information and Modeling, 53(9), 1689–1699.

Sulastri, & Nugroho, Y. S. (2017). Penerapan Data Mining Untuk Prediksi Rating Penjualan Buku Menggunakan Metode Naive Bayes. Duta.Com, 12(2), 57–72.