JOISIE Journal Of Information System And Informatics Engineering Vol. 6, No.2 Desember 2022, Hlm 69-77
p- ISSN: 2503-5304 e- ISSN: 2527-3116
PENERAPAN METODE NAÏVE BAYES DALAM MENGKLASIFIKASI TINGKAT OBESITAS PADA PRIA
Juan Veron Wie1, Muhammad Siddik2*
1,2 Prodi Teknik Informatika, Fakultas Ilmu Komputer, Institut Bisnis dan Teknologi Pelita Indonesia e-mail: 1[email protected], 2[email protected]
Abstract
Obesity is a disease caused by abnormal excess fat in adipose tissue. The results of basic health research in 2018 said that the population aged over 18 years who were obese had increased from 14.8% to 21.8%. Obesity can also increase the risk of critical illnesses such as heart disease and stroke, therefore, it is quite important to predict whether someone is obese or not so that obesity can be treated early. Here the data taken is only anthropometric data measurements on male subjects, this is because the composition of body fat in men has a higher level of muscle mass in the body, men are also more likely to have adipose tissue in the abdominal area. In this study, secondary data was used which was taken from kaggle.com. This data has 15 variables and 252 data with 2 classifications, namely (Obesity or Non Obesity). From the results of the classification test at a ratio of 70% training and 30%
testing using naïve Bayes, the results obtained were Accuracy 88%, Precision (Obesity) 73%, Precision (Non Obesity) 98%, Recall (Obesity) 96% with Recall (Non Obesity) 85% and the F1-Score result is 0.830188679. These results show an average scale above 80% so that it can be said that the Naïve Bayes Classifier (NBC) algorithm is able to classify obesity in men well.
Keywords: Classification, Naïve Bayes, Obesity Abstrak
Obesitas merupakan salah satu penyakit yang disebabkan kelebihan lemak yang tidak normal pada jaringan adiposa. Hasil riset kesehatan dasar pada tahun 2018 mengatakan penduduk yang berumur lebih dari 18 tahun yang mengalami obesitas meningkat dari 14.8% menjadi 21.8%. Penyakit obesitas juga dapat meningkatkan risiko penyakit kritis seperti penyakit jantung dan stroke, oleh karena itu, cukup penting dilakukan prediksi terhadap seseorang terkena obesitas atau tidak agar obesitas dapat ditangani lebih awal. Disini data yang diambil hanyalah pengukuran data antropometri pada subjek pria hal ini dikarenakan komposisi lemak tubuh pada pria memiliki tingkat massa otot pada tubuh yang lebih tinggi, pria juga lebih cenderung untuk memiliki jaringan adiposa pada area abdomen. Pada penelitian ini digunakan data sekunder yang diambil dari kaggle.com. Data ini memiliki 15 variabel dan 252 data dengan 2 klasifikasi yaitu (Obesitas atau Non Obesitas). Dari hasil pengujian klasifikasi pada rasio 70% training dan 30% testing menggunakan naïve bayes didapatkan hasil Accuracy 88%, Precision (Obesitas) 73%, sedangkan Precision (Non Obesitas) 98%, Recall (Obesitas) 96% dengan Recall (Non Obesitas) 85% dan hasil F1-Score sebesar 0.830188679. Hasil tersebut menunjukkan skala rata-rata diatas 80% sehingga dapat dikatakan bahwa algoritma Naïve Bayes Classifier (NBC) mampu mengklasifikasi obesitas pada pria dengan baik.
Kata kunci: Klasifikasi, Naïve Bayes, Obesitas
1. PENDAHULUAN
Obesitas adalah sebuah kondisi kronis yang diakibatkan karena konsumsi kalori berlebihan, obesitas dapat ditandai dengan adanya penumpukan lemak dalam tubuh yang sangat tinggi. Obesitas terjadi karena asupan
kalori yang lebih banyak dibanding aktivitas membakar kalori atau dalam kata lain kalori yang masuk tidak sebanding dengan kalori yang dikeluarkan. (dr. Tjin Willy, 2018). Di Indonesia, menurut Riset Kesehatan Dasar
(Riskesdas) tahun 2007 melaporkan bahwa 11,7% orang dewasa berumur ≥18 tahun mengalami obesitas dan berdasarkan Riset Kesehatan Dasar (Riskesdas) tahun 2010 meningkat 11,65%. (Listiyana et al., 2013)
Gizi lebih dan obesitas merupakan faktor risiko terjadinya penyakit jantung koroner disamping faktor risiko lainnya, seperti hipertensi, diabetes melitus, merokok, stres, dan kurang olahraga. (Sandjaja, 2014).
Menurut Seidell dan Halberstadt dalam jurnal (Septiyanti & Seniwati, 2020) menjelaskan bahwa obesitas juga berhubungan dengan peningkatan inflamasi dan metabolisme tubuh yang abnormal, sehingga meningkatkan risiko resistensi insulin, diabetes melitus tipe 2, stroke, dan penyakit kardiovaskular. (Patonah et al., 2019). Obesitas dapat ditentukan melalui pemeriksaan secara antropometri. Pengukuran antropometri untuk usia dewasa sekarang ini menggunakan perhitungan Indeks Massa Tubuh (IMT), dengan perbandingan (rasio) berat badan / tinggi badan2 yang sering digunakan untuk menilai status gizi orang dewasa.(Nyoman et al., 2017)
Dataset antropometri 252 pria didapat dari (Garth Fisher, 2021) yang meliputi beberapa pengukuran antropometri pada pria dilihat dari beberapa variabel seperti densitas tubuh, persen lemak tubuh, usia, berat badan (pon), tinggi badan (inci), lingkar leher (cm), lingkar dada (cm), lingkar perut (cm), lingkar pinggang (cm), lingkar paha (cm), lingkar mata kaki (cm), lingkar lutut (cm), lingkar mata kaki (cm), lingkar bisep (cm), lingkar lengah bawah (cm), lingkar pergelangan tangan (cm). Dimana setelah dilihat dari hasil data tersebut terdapat 65 pria dengan persen lemak tubuh yang sangat tinggi yaitu melebihi 25% yang sudah diklasifikasikan sangat tinggi atau sudah mencapai tingkat obesitas, walaupun mayoritas hasil dari klasifikasi IMT 65 pria ini menunjukkan status gizi pada ambang normal dan pre-obesitas namun ternyata tingkat persen lemak tubuh pada sejumlah pria ini sudah diambang obesitas.
Disini data yang diambil hanyalah pengukuran data antropometri pada subjek pria hal ini dikarenakan komposisi lemak tubuh pada pria dan pada wanita berbeda, dengan pria memiliki tingkat massa otot pada tubuh yang lebih tinggi dibanding wanita, pria juga lebih cenderung untuk memiliki jaringan adiposa pada area abdomen, sedangkan pada wanita
lebih banyak dilihat pada bagian paha dan panggul. (Tina et al., 2021).
Dari permasalahan yang didapat diatas peneliti ingin memprediksi obesitas menggunakan algoritma Naïve Bayes dengan beberapa kriteria yang didapat dari pengukuran antropometri pada pria beserta perhitungan Indeks Massa Tubuh (IMT) dan digunakanlah perhitungan persen lemak tubuh berdasarkan perhitungan lingkar perut dan lingkar leher sebagai kriteria utama, dengan mengimplementasian algoritma Naïve Bayes diharapkan dapat melakukan perhitungan persentase lemak tubuh sehingga bisa mengklasifikasi dan memprediksi tingkat obesitas pada pria. Kemudian hasil dari klasifikasi tersebut akan menghasilkan dua buah kategori yaitu kategori obesitas dan tidak obesitas berdasarkan variabel yang telah ditentukan sebelumnya.
2. METODE PENELITIAN
Pada penelitian ini penulis menggunakan metode klasifikasi algoritma Naïve Bayes. Menurut Jiawei dalam jurnal (Miranda & Julisar, 2018) menjelaskan bahwa keunggulan menggunakan metode naïve bayes classifier dibandingkan metode lainnya adalah merupakan metode pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan dari suatu kelas, selain itu terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database yang besar. Ciri utama dari Naïve Bayes Classifier (NBC) adalah asumsi yang sangat kuat (naïf) akan independensi dari masing-masing kondisi atau kejadian. (Syarli
& Muin, 2016).
Dimana metode ini akan diterapkan dengan dataset yang sudah tersedia dan mengolah dataset berdasarkan kebutuhan untuk menentukan obesitas pada pria.
sehingga dihasilkan bentuk data pada gambar di bawah ini.
Siddik, Penerapan Metode Naïve Bayes Dalam Mengklasifikasi Tingkat Obesitas Pada Pria, 69-77
|
71Gambar 1. Potongan data selection diambil dari kaggle.com 252 data.
Ini 15 variabel yang meliputi pengukuran antropometri pada pria.
WG : Berat Badan (kg) H : Tinggi Badan (m) N : Lingkar Leher (inci) C : Lingkar Dada (inci) AB : Lingkar Perut (inci) HP : Lingkar Pinggang (cm) T : Lingkar Paha (cm) K : Lingkar Lutut (cm) AK : Lingkar Mata Kaki (cm) B : Lingkar Bisep (cm)
F : Lingkar Lengan Bawah (cm) W : Lingkar Pergelangan Tangan (cm) BMI : Indeks Massa Tubuh
BF : Persen Lemak Tubuh (%) BFC : Klasifikasi (Obesitas atau Non
Obesitas)
Kerangka penelitian dapat dilihat pada gambar di bawah ini
Gambar 2. Kerangka Penelitian
Identifikasi permasalahan perlu dilakukan untuk menggambarkan masalah yang terjadi, sehingga didapatkan rumusan masalah, tujuan dan manfaat penelitian.
Kemudian mencari teori–teori untuk melengkapi sumber kajian yang bersumber dari jurnal, buku, dan internet. Memcari sumber data yang diperlukan pada penelitian ini data yang digunakan adalah data pengukuran antropometri yang didapat dari Kaggle Machine Learning and Data Science Community dengan alamat web https://www.kaggle.com/, dari 252 data perlu dilakukan proses cleaning sehingga dihasilkan 251 record data dengan 1 record data outlier, penghapusan record ini harus dilakukan karena dapat mengganggu hasil akhir klasifikasi obesitas. Pembagian data training dan data testing digunakan rasio 70% training dan 30%
testing (175 record data training dan 76 record data testing). Data yang didapat akan diolah ke format yang dibutuhkan, pengelompokan dan penentuan variabel dari data awal. Data training yang digunakan dalam melatih algoritma Naïve Bayes perhitungan ini menghasilkan nilai keluaran yang diinginkan.
Pengujian yang dilakukan dan menampilkan hasil prediksi, sehingga nantinya dapat disimpulkan berdasarkan dari hasil yang didapat.
2.1 Indeks Massa Tubuh
Menurut (Apriyanti et al., 2018) Indeks Massa Tubuh (IMT), tidak lain angka yang menunjukan apakah seseorang terlalu berat untuk tinggi mereka. IMT juga dapat digunakan untuk menentukan seberapa besar resiko dapat terkena resiko penyakit tertentu yang terkait karena berat badan. Klasifikasi berat badan pada orang dewasa berdasarkan IMT menurut WHO 2000 dapat dilihat pada tabel berikut:
Tabel 1. Klasifikasi Berat Badan Pada Orang Dewasa
Kategori BMI (Body Mass Index) Underweight
Batas normal Overweight Pre-obese Obese I Obese II
< 18,5 kg/m2 18,5 – 24,9 kg/m2
> 25 kg/m2 25,0 – 29,9 kg/m2 30,0 – 39,9 kg/m2 35,0 – 39,9 kg/m2
Obese III > 40,0 kg/m2
IMT dihitung dengan menggunakan rumus sebagai berikut:
𝐼𝑀𝑇 = [𝑇𝑖𝑛𝑔𝑔𝑖(𝑚)]𝐵𝑜𝑏𝑜𝑡(𝑘𝑔)2 (1)
2.2 Persen Lemak Tubuh
Berdasarkan dari pengukuran antropometri tubuh untuk mendapatkan pengukuran lingkar perut, lingkar leher dan tinggi badan. Persen lemak tubuh untuk pria dapat diestimasi dengan kalkulasi menggunakan rumus dari US Navy Body Fat Formula yaitu :
𝐵𝐹 (%) = 86.010 𝑥 𝐿𝑜𝑔10(𝐿𝑃 − 𝐿𝐿) − 70.041 𝑥 𝐿𝑜𝑔10(𝑇𝐵) + 36.76 (2)
2.3 Naïve Bayes Classifier
Naïve Bayes merupakan sebuah pengklasifikasian probabilistik sederhana yang menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan kombinasi nilai dari dataset yang diberikan (Siddik et al., 2019)
Teorema Bayes memiliki bentuk umum sebagai berikut (Muslehatin et al., 2017):
𝑃(𝐻|𝑋) =𝑃(𝑋|𝐻)𝑃(𝐻)
𝑃(𝑋) (3)
Keterangan:
X = Data dengan class yang belum diketahui H = Hipotesis data X merupakan suatu class spesifik
P(H|X) = Probabilitas hipotesis H berdasarkan kondisi X (posteriori prob.)
P(H) = Probabilias hipotesis H (prior prob.) P(X|H) = Probabilitas X berdasarkan kondisi tersebut
P(X) = Probabilitas dari X
Langkah-langkah yang ada dalam metode Naïve Bayes Classifier menurut (Guntur et al., 2018) adalah sebagai berikut : 1. Baca data training
2. Hitung jumlah dan probabilitas
a. Jika terdapat data numerik, maka rumus yang digunakan untuk menghitung nilai rata-rata hitung (mean) dapat dilihat sebagai berikut:
𝜇 = ∑𝑛𝑖=1𝑋𝑖 (4) 𝑎𝑡𝑎𝑢
𝜇 =𝑋1+𝑋2+𝑋3+𝑋4+⋯+𝑋𝑛
𝑛 (5) Dimana :
𝜇 : rata-rata hitung (mean) 𝑋𝑖 : nilai sample ke -i 𝑛 : jumlah sampel
b. Jika tidak, hitung nilai probabilitas tiap kategori yang sama, dengan jumlah data yang sesuai dari kategori yang sama dibagi dengan jumlah data pada kategori tersebut untuk menemukan nilai probabilistik.
3. Menghitung nilai simpangan baku (standar deviasi) dapat dilihat dibawah ini:
𝜎 = √∑𝑛𝑖=1𝑛−1(𝑥𝑖−𝜇)2 (6) Dimana :
𝜎 : standar deviasi 𝑥𝑖 : nilai x ke -i 𝜇 : rata-rata hitung 𝑛 : jumlah sampel
4. Menghitung data uji, jika terdapat data numerik cari nilai distribusi gaussian masing-masing fitur. Jika tidak langsung ke langkah selanjutnya. Persamaan untuk menghitung nilai gaussian Naïve bayes dapat dilihat dibawah ini :
𝑃(𝑋𝑖= 𝑥𝑖|𝑌 = 𝑦𝑖) = 1
√2𝜋𝜎𝑖𝑗𝑒
(𝑥𝑖−𝜇𝑖𝑗)2 2𝜎𝑖𝑗2
(7) Dimana :
𝑃 : Peluang 𝑋𝑖 : Atribut ke -i 𝑥𝑖 : Nilai Atribut ke -i 𝑌 : Kelas yang dicari 𝑦𝑖 : Sub-kelas yang dicari
𝜇 : mean, menyatakan rata-rata dari seluruh atribut
𝜎 : Standar Deviasi, menyatakan varian dari seluruh atribut 5. Probabilitas akhir tiap kelas,
memasukkan dan menghitung semua data probabilitas ke dalam satu kelas yang sama.
6. Probabilitas akhir, mengalikan probabilitas tiap kelas dengan probabilitas akhir tiap kelas.
Berikut Persamaan untuk perhitungan berdasarkan probabilitas :
𝑃(𝑋1, … , 𝑋𝑘|𝐶) = 𝑃(𝑋1|𝐶)𝑋 … 𝑋 𝑃(𝑋𝑘|𝐶) (8)
Jika atribut ke-i bersifat diskret, maka 𝑃(𝑋𝑖 |𝐶) diestimasi sebagai frekuensi
Siddik, Penerapan Metode Naïve Bayes Dalam Mengklasifikasi Tingkat Obesitas Pada Pria, 69-77
|
73 relatif dari sampel yang memiliki nilai xisebagai atribut ke i dalam kelas C.
Namun, jika atribut ke-i bersifat kontinu, maka 𝑃(𝑋𝑖 |𝐶) diestimasi dengan fungsi densitas Gauss.
2.4 Pengujian Naïve Bayes
Penelitian ini melakukan evaluasi dengan menggunakan beberapa metrik yang diperlukan untuk menggambarkan performa dari sebuah model atau algoritma secara spesifik menggunakan beberapa persamaan Persamaan ini memiliki bentuk sebagai berikut (Saputro & Sari, 2020):
1. Akurasi
Adalah total keseluruhan seberapa sering model benar mengklasifikasi. Formula akurasi yaitu menggunakan persamaan dibawah ini.
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑇𝑃 + 𝑇𝑁
𝑇𝑃 + 𝐹𝑃 + 𝑇𝑁 + 𝐹𝑁 (8) Keterangan:
𝑇𝑃 = True Positive (jumlah data positif yang terklasifikasi dengan benar oleh sistem) 𝑇𝑁 = True Negative (jumlah data negatif yang terklasifikasi dengan benar oleh sistem) 𝐹𝑃 = False Positive (jumlah data positif namun terklasifikasi salah oleh sistem) 𝐹𝑁 = False Negative (jumlah data positif
namun terklasifikasi salah oleh sistem) 2. Precision
Ketika model memprediksi positif atau negatif, seberapa sering prediksi itu benar.
Formula Precision yaitu menggunakan persamaan dibawah ini.
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃
𝑇𝑃+𝐹𝑃 (9) 3. Recall
Ketika kelas aktualnya positif, seberapa sering model memprediksi positif. Formula recall yaitu menggunakan persamaan dibawah ini.
𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃
𝑇𝑃+𝐹𝑁 (10) 4. F1-Score
Merupakan rata-rata harmonik dari Precision dan Recall. Formula F1-Score yaitu menggunakan persamaan dibawah ini.
𝐹1 − 𝑆𝑐𝑜𝑟𝑒 = 2 ∗ 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛∗𝑟𝑒𝑐𝑎𝑙𝑙
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑟𝑒𝑐𝑎𝑙𝑙 (11)
3. HASIL DAN PEMBAHASAN
Hasil dan pembahasan penelitian yang tergambar dari perhitungan pengujian Naïve Bayes sebagai berikut :3.1 Data Training
Data training adalah data latih yang digunakan dalam melatih algoritma Naïve Bayes Classifier dalam mengolah perhitungan dalam menghasilkan nilai keluaran yang diinginkan terdiri dari data testing dengan rasio 70% training dan 30% testing. Data training yang digunakan adalah data yang sudah dikumpulkan sebelumnya, yakni 175 record data training dan 76 record data testing.
a. Mencari Nilai Mean dan Standar Deviasi Mencari nilai mean dan standar deviasi variabel obesitas dan non obesitas berdasarkan klasifikasi pada data training. Untuk menghitung nilai mean dengan klasifikasi obesitas, dihitung jumlah obesitas yang terdapat pada tabel data training yaitu sebanyak 30 data. Nilai dari 30 data tadi dijumlahkan, lalu dibagi dengan jumlah data obesitas. Kemudian menggunakan rumus untuk mencari mean untuk atribut BERAT dengan hasil di klasifikasi obesitas sebesar :
𝜇 =83.56 + 93.08 + 112.13 + 86.96 + ⋯ + 102.83 30
𝜇 (𝑜𝑏𝑒𝑠𝑖𝑡𝑎𝑠) = 94.54
Kemudian setelah nilai 𝜇 pada masing- masing atribut telah didapatkan maka selanjutnya kita mencari nilai standar deviasi.
Untuk menghitung nilai standar deviasi klasifikasi obesitas, jumlah data terdapat 30 data untuk klasifikasi obesitas, lalu dipangkat 2, setelah itu dijumlahkan dan dibagi dengan jumlah data dikurangi 1, lalu diakarkan.
Dengan menggunakan rumus standar deviasi maka didapatkan :
𝜎 = √(83.56 − 95.54)2+ (93.08 − 95.54)2+ ⋯ + (102.83 − 95.54)2 30 − 1
𝜎(𝑜𝑏𝑒𝑠𝑖𝑡𝑎𝑠) = 16.18
b. Nilai Probabilitas Fitur Setiap Kelas
Setelah menghitung nilai mean dan standar deviasi untuk fitur dengan data angka, maka selanjutnya mencari probabilitas setiap fitur pada kelas. Jumlah data yang digunakan adalah sebanyak 175 data. Data obesitas ada 30 dan data non obesitas ada 138. Sehingga untuk menghitung nilai probabilitasnya adalah sebagai berikut :
𝑃(𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠) = 30
175= 0.171428571 𝑃(𝑁𝑜𝑛 𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠) =145
175= 0.828571429 Setelah mencari nilai probabilitas tiap fitur, maka didapat tabel untuk nilai mean, standar deviasi dan probabilitas, bisa dilihat pada tabel berikut.
Tabel 2. Tabel Probabilitas Probabilitas Iya
Nilai Mean Std Std^2
Berat 81.74 11.7 136.8
Tinggi 1.78 0.06 0
Leher 15.55 1.06 1.11
Dada 108.89 7.79 60.66
Perut 41.42 3.73 13.95
Pinggang 106.82 9.1 82.83
Paha 64.47 5.59 31.27
Lutut 40.33 2.31 5.34
Mata Kaki 23.74 1.56 2.43
Bisep 34.32 2.84 8.06
Lengan 29.52 2.09 4.35
Pergelangan 18.68 0.97 0.94
IMT 25.91 4.27 18.23
Lemak Tubuh 28.82 3.8 14.43
Probabilitas Tidak
Nilai Mean Std Std^2
Berat 80.24 0.07 0.75
Tinggi 1.79 0.86 35.32
Leher 14.73 5.94 7.89
Dada 97.58 2.81 26.42
Perut 34.59 5.14 19.29
Pinggang 97.82 4.39 3.82
Paha 58.06 1.95 3.37
Lutut 37.89 1.84 7.83
Mata Kaki 22.96 2.8 3.59
Bisep 31.6 1.9 0.73
Lengan 28.42 0.86 20.07
Pergelangan 18.04 4.48 18.02
IMT 25.13 4.25 0
Lemak Tubuh 18.71 0 0
Klasifikasi O 0.21
NO 0.79
c. Nilai Distribusi Gaussian
Untuk menghitung nilai distribusi gaussian, menggunakan rumus sebagai berikut:
𝑃(𝐵𝐸𝑅𝐴𝑇 = 68.48 |𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠)
= 1
√2𝜋11.85732.7183−(68.48−81.7)2 2∗140.6
𝑃(𝐵𝐸𝑅𝐴𝑇 = 68.48 | 𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠 ) = 0.0620334 Nilai diatas adalah nilai distribusi gaussian untuk atribut BERAT hasil obesitas yang didapat dengan memasukkan nilai data uji BERAT, nilai 𝜇 dan nilai 𝜎 BERAT.
Dihitung juga nilai distribusi gaussian pada atribut atribut lainnya dengan langkah yang sama.
d. Probabilitas Akhir Setiap Kelas
Menghitung probabilitas akhir untuk setiap kelas dengan memasukan semua data nilai distribusi gaussian yang ada ke dalam satu kelas yang sama, seperti dibawah ini.
𝑃(𝐵𝐸𝑅𝐴𝑇 | 𝑂) = 𝑃(𝐵𝐸𝑅𝐴𝑇 = 68.48| 𝑂) 𝑥 𝑃(𝐻1
= 67|𝑂) 𝑥 … 𝑃(𝐵𝐹 = 18.57|𝑂
𝑃(𝐵𝐸𝑅𝐴𝑇 |𝑂) = 1.83111879094468𝐸 − 17 Nilai diatas adalah probabilitas akhir untuk kelas dengan hasil obesitas. Untuk mencari probabilitas kelas dengan hasil non obesitas, langkah-langkah nya sama seperti menghitung probabilitas akhir kelas dengan hasil obesitas
e. Probabilitas Akhir
Probabilitas akhir didapat melalui perhitungan nilai probabilitas akhir kelas.
Perhitungan probabilitas akhir adalah sebagai berikut.
𝑃(𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠|𝐵𝐸𝑅𝐴𝑇) = 0.211428571428571
∗ 1.83111879094468𝐸 − 17
𝑃(𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠|𝐵𝐸𝑅𝐴𝑇) = 3.87150830085446𝐸
−18
Siddik, Penerapan Metode Naïve Bayes Dalam Mengklasifikasi Tingkat Obesitas Pada Pria, 69-77
|
75 Setelah mendapatkan probabilitas akhir,dilakukan normalisasi untuk memperoleh nilai sama dengan 1, dengan cara sebagai berikut:
𝑃(𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠)
= 3.87150830085446𝐸 − 18
3.87150830085446𝐸 − 18 + 0.999999997748201
𝑃(𝑂𝑏𝑒𝑠𝑖𝑡𝑎𝑠) = 2.25179888570916𝐸 − 09 Hasil diatas adalah hasil probabilitas akhir untuk kelas obesitas. Kemudian data uji yang diolah sebanyak 76 data. Berikut data uji yang diujikan.
Tabel 3. Hasil Klasifikasi No P Normalisasi
O | NO
Klasifikasi Data Riil
1 9E-09 1E+00 NO NO
2 1E+00 4E-15 O O
3 1E-01 9E-01 NO NO
4 1E+00 9E-11 O NO
5 1E+00 6E-07 O O
6 4.-15 1E+00 NO NO
7 3E-09 1E+00 NO NO
8 7E-08 1E+00 NO NO
9 2E-07 1E+00 NO NO
10 9E-09 1E+00 NO NO
11 1E+00 1E-11 O O
12 1E+00 2E-03 O NO
13 1E+00 4E-03 O NO
14 9E-01 5E-02 O O
15 5E-11 1E+00 NO NO
16 1E+00 1E-14 O O
17 1E-01 9E-01 NO NO
18 1E+00 6E-07 O O
19 1E-08 1E+00 NO NO
20 9E-02 9E-01 NO NO
21 2E-07 1E+00 NO NO
22 5E-07 1E+00 NO NO
23 8E-11 1E+00 NO NO
24 4E-04 1E+00 NO NO
25 5E-05 1E+00 NO NO
26 2E-09 1E+00 NO NO
27 1E+00 2E-03 O O
28 1E-05 1E+00 NO NO
29 1E+00 6E-12 O O
30 9E-01 1E-01 O NO
31 5E-04 1E+00 NO NO
32 9E-01 1E-01 O NO
33 4E-09 1E+00 NO NO
34 4E-09 1E+00 NO NO
35 4E-11 1E+00 NO NO
36 1E+00 3E-06 O O
37 7E-07 1E+00 NO NO
38 8E-01 2E-01 O NO
39 2E-08 1E+00 NO NO
40 1E+00 4E-18 O O
41 2E-10 1E+00 NO NO
42 3E-10 1E+00 NO NO
43 1E+00 9E-03 O NO
44 7E-09 1E+00 NO NO
45 2E-05 1E+00 NO NO
46 1E+00 6E-13 O O
47 5E-07 1E+00 NO NO
48 4E-10 1E+00 NO NO
49 4E-02 1E+00 NO NO
50 2E-12 1E+00 NO NO
51 2E-04 1E+00 NO NO
52 7E-01 3E-01 O NO
53 9E-05 1E+00 NO NO
54 3E-04 1E+00 NO NO
55 4E-08 1E+00 NO NO
56 6E-03 1E+00 NO NO
57 1E-06 1E+00 NO NO
58 4E-06 1E+00 NO O
59 3E-06 1E+00 NO NO
60 3E-04 1E+00 NO NO
61 1E-01 9E-01 NO NO
62 1E+00 4E-12 O O
63 9E-09 1E+00 NO NO
64 1E+00 1E-03 O O
65 1E-11 1E+00 NO NO
66 1E+00 3E-16 O O
67 1E+00 2E-12 O O
68 1E+00 2E-13 O O
69 1E+00 8E-06 O O
70 8E-09 1E+00 NO NO
71 1E+00 1E-10 O O
72 4E-10 1E+00 NO NO
73 1E+00 1E-05 O O
74 1E+00 9E-05 O O
75 9E-01 6E-02 O O
76 1E+00 6E-09 O O
Berdasarkan hasil klasifikasi yang terdapat pada tabel 3 menjelaskan bahwa penentuan obesitas maupun non obesitas dapat dilihat pada bagian P Normalisasi yaitu nilai probabilitas akhir untuk (O) Obesitas dan
(NO) Non Obesitas. Jika nilai probabilitas akhir obesitas (O) lebih besar dari probabilitas akhir non obesitas (NO) maka hasil yang diperoleh berada pada kelas klasifikasi obesitas (O) dan jika nilai probabilitas akhir kelas non obesitas (NO) lebih besar maka diperoleh hasil kelas klasifikasi non obesitas (NO).
Kemudian dilakukan pengujian Naïve Bayes dengan cara menghitung akurasi, precision, recall dan f1-scor pengujian model algoritma naïve bayes classifier pada tabel berikut :
Tabel 4. Hasil Pengujian
80-20 True O True NO
Pred O 9 7
Pred NO 1 33
Accuracy 84%
Precision 56% 97%
Recall 90% 83%
f1 Score 0.692307692
70-30 True O True NO
Pred O 22 8
Pred NO 1 45
Accuracy 88%
Precision 73% 98%
Recall 96% 85%
f1 Score 0.830188679
60-40 True O True NO
Pred O 26 6
Pred NO 6 62
Accuracy 88%
Precision 81% 91%
Recall 81% 91%
f1 Score 0.8125
Dari hasil pengujian klasifikasi pada rasio 70% training dan 30% testing menggunakan naïve bayes pada Ms.Excel didapatkan hasil Accuracy 88%, Precision (Obesitas) 73%, sedangkan Precision (Non Obesitas) 98%, Recall (Obesitas) 96% dengan Recall (Non Obesitas) 85% dan hasil F1-Score sebesar 0.830188679. Hasil tersebut menunjukkan skala rata-rata diatas 80%
sehingga dapat dikatakan bahwa algoritma Naïve Bayes Classifier (NBC) mampu
mengklasifikasi obesitas pada pria dengan baik.
Dari hasil pengujian yang terlihat pada tabel 4 dilakukan 3 kali pengujian sehingga dapat disimpulkan bahwa semakin besar rasio data testing yang digunakan maka ada juga peningkatan jumlah kesalahan data yang diprediksi oleh sistem namun tingkat kesalahan yang diprediksi sistem tidak terlalu besar karena pada percobaan ketiga dengan rasio 60% training dan 40% testing tingkat akurasi masih diatas 80% dengan adanya total kesalahan prediksi sebesar 12 pada data obesitas dan non obesitas
4. SIMPULAN
Pengujian menggunakan 60% data training dan 40% data testing menghasilkan akurasi lebih tinggi sebesar 84.15%. Disini nilai akurasi yang didapat lebih tinggi dikarenakan pada split data 60:40 adanya lebih banyak data testing untuk pria Obesitas (O) yang digunakan sehingga jumlah data obesitas yang ada lebih besar jumlahnya dan karena dataset yang digunakan lebih dominan terhadap pria yang Non Obesitas (NO) maka nilai akurasi yang didapat bisa lebih besar.
Penerapan algoritma Naïve Bayes dalam memprediksi tingkat obesitas pada pria dapat diterapkan dengan menghasilkan tingkat akurasi yang memuaskan sebesar 84.15% pada rasio split data 60:40.
5. DAFTAR PUSTAKA
Apriyanti, L., Rahayu, M. I., & Suseno, N. M.
(2018). Aplikasi mobile pengelolaan kalori harian untuk penderita obesitas. Jurnal Teknologi Informasi Dan Komunikasi, 7(2), 16–23.
dr. Tjin Willy. (2018). Obesitas - Gejala, penyebab dan mengobati - Alodokter.
Garth Fisher, D. A. (2021). Body Fat Prediction Dataset. 2021.
Guntur, M., Santony, J., & Yuhandri, Y. (2018).
Prediksi Harga Emas dengan Menggunakan Metode Naïve Bayes dalam Investasi untuk Meminimalisasi Resiko. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi),
2(1), 354–360.
https://doi.org/10.29207/resti.v2i1.276 Listiyana, A. D., Mardiana, M., & Prameswari, G.
N. (2013). Obesitas sentral dan kadar kolesterol darah total. Jurnal Kesehatan
Siddik, Penerapan Metode Naïve Bayes Dalam Mengklasifikasi Tingkat Obesitas Pada Pria, 69-77
|
77Masyarakat, 9(1), 37–43.
Miranda, E., & Julisar. (2018). DATA MINING DENGAN METODE KLASIFIKASI
NAÏVE BAYES UNTUK
MENGKLASIFIKASIKAN PELANGGAN Eka Miranda , Julisar Program Sistem Informasi , Program Studi Sistem Informasi , Universitas Bina Nusantara. Infotech, 4(9), 6–12.
Muslehatin, W., Ibnu, M., & Mustakim. (2017).
Penerapan Naïve Bayes Classification untuk Klasifikasi Tingkat Kemungkinan Obesitas Mahasiswa Sistem Informasi UIN Suska Riau. Seminar Nasional Teknologi Informasi, Komunikasi Dan Industri (SNTIKI), 250–
256.
Nyoman, N., Yuliani, S., Subagio, H. W., &
Murbawani, E. A. (2017). Korelasi Lingkar Leher Dengan Persentase Lemak Tubuh Pada Obesitas. Journal of Nutrition and Health,
5(3), 1–8.
https://doi.org/10.14710/jnh.5.3.2017.138- 145
Patonah, P., Marliani, L., & Mulyani, Y. (2019).
Edukasi Pola Hidup Sehat Kepada Masyarakat Di Kelurahan Manjahlega Kota Bandung Dalam Menanggulangi Obesitas Sebagai Faktor Resiko Penyakit Kardiovaskular. Amaliah: Jurnal Pengabdian Kepada Masyarakat, 3(2), 354–
361.
https://doi.org/10.32696/ajpkm.v3i2.290 Sandjaja, S. (2014). Prevalensi Gizi Lebih Dan
Obesitas Penduduk Dewasa Di Indonesia.
Gizi Indonesia, 28(2), 1–7.
https://doi.org/10.36457/gizindo.v28i2.21 Saputro, I. W., & Sari, B. W. (2020). Uji Performa
Algoritma Naïve Bayes untuk Prediksi Masa Studi Mahasiswa. Creative Information Technology Journal, 6(1), 1.
https://doi.org/10.24076/citec.2019v6i1.178 Septiyanti, S., & Seniwati, S. (2020). Obesity and
Central Obesity in Indonesian Urban Communities. Jurnal Ilmiah Kesehatan
(JIKA), 2(3), 118–127.
https://doi.org/10.36590/jika.v2i3.74 Siddik, M., Desnelita, Y., & Gustientiedina.
(2019). Penerapan Naïve Bayes untuk Memprediksi Tingkat Kepuasan Mahasiswa Terhadap Pelayanan Akademis. Jurnal Infomedia, 2(4), 89–93.
Syarli, S., & Muin, A. (2016). Metode Naive Bayes Untuk Prediksi Kelulusan (Studi Kasus: Data Mahasiswa Baru Perguruan Tinggi). Jurnal Ilmiah Ilmu Komputer, 2(1), 22–26.
Tina, A. R., Kurniawan, L. B., Bahrun, U., Pascasarjana, P., Biomedik, I., Pascasarjana,
S., Hasanuddin, U., Klinik, D. P., Kedokteran, F., Hasanuddin, U., Perintis, J., No, K., & Selatan, S. (2021). Analisis Hubungan Berbagai Indeks Obesitas dengan Interleukin-6 pada Subjek Obesitas dan Non Obesitas Sentral Kadar Association Between Obesity Indices and Interleukin-6 Levels in Subjects with Central and Non-Central Obesity. 3(2), 104–113.