314| Universitas Multi Data Palembang
PERBANDINGAN AKURASI KLASIFIKASI KADAR DAGING SAPI PADA BAKSO DENGAN SVM DAN KNN
M. Bemby Putra Mansyah1*) Derry Alamsyah2, Hafiz Irsyad3
1,2,3
Program Studi Informatika, Fakultas Ilmu Komputer dan Rekayasa, Universitas Multi Data Palembang.
1[email protected], 2[email protected], 3[email protected]
Kata kunci:
bakso; daging sapi; GLCM;
KNN; SVM
Abstract: Meatballs are preparations that contain animal protein, many processed meatballs are made from beef, chicken and even fish. But what is often found is processed meatballs with beef. Meatballs are usually served with gravy and other accompaniments such as caisin and noodles. Every processed meatball made by different people has a different texture, as a layman usually knows by its texture, like the elasticity and the fiber in the meatballs, but can also be known through artificial intelligence. This study was conducted to determine the content of beef in meatballs with four types of comparison levels, namely the first 1.5 meat 1 flour, second 1 meat 1 flour, third 1 meat 2 flour, and fourth 2 meat 1 flour. The classification method used is KNN with 3 neighbors and SVM with GLCM feature extraction, the results are obtainedoverall accuracy for KNN 3 neighbors is 77.50% and SVM is 55%.
Abstrak: Bakso adalah olahan yang mengandung protein hewani, banyak olahan bakso yang dibuat mulai dari daging sapi, ayam bahkan ikan. Namun yang seringkali dijumpai adalah olahan bakso dengan daging sapi. Bakso biasanya disajikan dengan kuah dan ditambah pelengkap lain seperti sayur sawi dan mie. Setiap olahan bakso yang dibuat orang yang berbeda memiliki tekstur kekenyalan berbeda, sebagai orang awam biasanya mengetahui melalui teksturnya seperti kekenyalannya dan serat daging yang ada pada bakso tetapi dapat juga diketahui melalui kecerdasan buatan. Penelitian dilakukan untuk mengetahui kadar daging sapi pada bakso dengan empat jenis kadar perbandingan yakni kadar pertama 1.5 daging 1 tepung, kadar kedua 1 daging 1 tepung, kadar ketiga 1 daging 2 tepung, dan kadar keempat 2 daging 1 tepung.
Metode klasifikasi yang digunakan adalah KNN dengan 3 tetangga dan SVM dengan ekstraksi fitur GLCM, didapatkan hasil overall akurasi untuk KNN 3 tetangga sebesar 77.50% sedangkan untuk SVM sebesar 55%.
Mansyah, Derry, & Hafiz. (2023). Perbandingan Akurasi Klasifikasi Kadar Daging Sapi Pada Bakso Dengan SVM Dan KNN. MDP Student Conference 2023
PENDAHULUAN
Latar Belakang
Bakso adalah salah satu olahan yang mengandung protein hewani. Bahan baku bakso adalah daging, bahan pengisi, bahan pengikat, dan bahan–bahan tambahan lainnya. Jenis daging yang biasa digunakan adalah daging sapi meskipun dapat juga digunakan daging ayam, daging kelinci atau daging dari ternak yang lain [1]. Namun yang seringkali dijumpai adalah olahan bakso dengan daging sapi, penggunaan daging sapi dalam olahan bakso memberikan kandungan gizi yang cukup baik karenan di setisp 100 gram daging sapi memiliki kandungan Protein sebanyak 26 gram, Kalsium yang bermanfaat untuk kesehatan tulang dan gigi sebanyak 18 miligram, Zat besi yang dapat membantu mengatasi anemia sebanyak 2,6 miligram, serta terdiri
Universitas Multi Data Palembang | 315 dari Vitamin D 7 IU, Vitamin B6 0,4 miligram, Vitamin B12 2,6 µg. dan juga Magnesium sebanyak 21 miligram [2]. Mengkonsumsi daging sapi dapat memberikan banyak manfaat salah satunya adalaha mencegah anemia, memelihara sistem kekebalan tubuh [3].
Bakso diolah dari campuran daging sapi yang telah digiling halus kemudian dicampurkan tepung sagu dan beberapa bumbu penyedap untuk memberikan rasa lalu selanjutnya adonan dibentuk bulat dan direbus hingga matang, bakso biasanya disajikan dengan kuah kaldu dan ditambah pelengkap lain seperti sayur sawi dan mie tergantung selera. Setiap olahan bakso yang dibuat orang yang berbeda memiliki tekstur kekenyalan berbeda, dan sebagai orang awam biasanya mengetahui melalui teksturnya ketika bakso dimakan seperti kekenyalannya dan serat daging yang ada pada bakso tetapi dapat juga diketahui melalui kecerdasan buatan. Kecerdasan buatan yang dimaksud dalam penelitian kali ini ialah memproses sebuah citra gambar yang kemudian diekstraksi menggunakan metode ekstraksi GLCM dilanjutkan ke proses pengklasifikasian menggunakan metode KNN dengan 3 Tetangga dan metode SVM. Metode yang bekerja pada klasifikasi K- Nearest Neighbors (KNN) ini adalah dengan cara mencari beberapa nilai k model yang mendekati model input, kemudian menentukan kelas keputusan menurut jumlah model yang paling banyak diantara k model.
Pada contoh untuk suatu kasus khusus pengklasifikasian akan diprediksikan berdasarkan data latih dengan jarak terdekat (dengan kata lain, k=1) yang biasanya disebut dengan algoritma Nearest Neighbor [4].
Penelitian serupa menggunakan metode KNN dengan ekstraksi GLCM, yang diberi judul Klasifikasi Pneumonia Menggunakan Metode K Nearest Neighbor Dengan Ekstraksi Gray Level Co-Occurrence Matrix (GLCM), pada penelitian yang sudah dilaksanakan didapatkan akurasi terbaik untuk per kelas adalah sebesar 66,20% untuk nilai k = 5. Adapun proses yang dilakukan terlebih dahulu sebelum dilakukan pengklasifikasian yakni cropping, resizing, contrast stretching, dan thresholding [5].
Selanjutnya penelitian dengan judul KNN Dan Gabor Filter Serta Wiener Filter Untuk Mendiagnosis Penyakit Pneumonia Citra X-RAY Pada Paru-Paru, yang mana pada penelitian yang dikerjakan tahapan pertama yang dilakukan pada citra sebelum dilakukan pengklasifikasian yaitu melakukan proses resize, dilanjutkan proses ekstraksi menggunakan Gabor Filter, Image Enhancement menggunakan Wiener Filter dan terakhir diklasifikasi dengan penggunaan metode K-Nearest Neighbor (KNN). Dari hasil penelitian didapatkan akurasi terbaik sebesar 79,62% [6]. Teknik pengklasifikasian dengan metode K- Nearest Neighbors (KNN) termasuk dalam pembelajaran mesin lazy learning. Klasifikasi K-Nearest Neighbor (KNN) merupakan metode yang dapat digunakan untuk proses klasifikasi atau mengelompokkan data citra uji yang sudah ditentukan kelasnya pada data latih yang sudah disimpan pada data store [7].
Pengujian dengan melakukan penerapan algoritma K-Nearest Neighbor ketika mengidentifikasi citra jenis bunga mendapat hasil nilai akurasi terbesar 71% dengan nilai K-7 yang digunakan [8].
Lalu penelitian berjudul Klasifikasi Tumor Jinak Dan Tumor Ganas Pada Citra Mammogram Menggunakan Gray Level Co-Occurrence Matrix (GLCM) dan Support Vector Machine (SVM), yang mana pada penelitian yang sudah dikerjakan dengan database DDSM yang digunakan dan dengan total citra abnormal sebanyak 256 (95 citra untuk tumor jinak dan 161 citra untuk tumor ganas) didapatkan persentase nilai sebesar 83.59% disertai nilai sensitivitas sebesar 87.58% dan nilai spesifisitas sebesar 76.84% [9].
Selain itu, metode Support Vector Machine (SVM) merupakan salah satu teknik pembelajaran mesin. Yang mana metodenya bekerja berdasarkan prinsip Structural Risk Minimization (SRM) yang bertujuan untuk menemukan hyperplane paling baik untuk memisahkan dua kelas dalam ruang input, serta untuk meminimalkan error. Keunggulan lain yang didapatkan ketika SVM digunakan sebagai metode klasifikasi yakni dapat dianalisis secara teoritis dengan konsep konsep teori pembelajaran komputasi. Pengujian menggunakan metode SVM seperti pada pengenalan citra mobil memiliki hasil akurasi yang optimal yaitu 82,5% [10].
Berdasarkan dari beberapa penggunaan metode ekstraksi Gray Level Co-occurrence Matrix (GLCM) dan metode klasifikasi K-Nearest Neighbor (KNN) dan Support Vector Machine (SVM) dalam penelitian yang telah dilakukan peneliti sebelumnya dan beberapa hasil yang ada menunjukkan persentase yang cukup baik maka, penelitian ini akan menggunakan ekstraksi ciri GLCM dan klasifikasi KNN dan SVM. Namun, tingkat akurasi pengenalan juga dapat dipengaruhi oleh banyak faktor lainnya. Sehingga masih belum
316| Universitas Multi Data Palembang
diketahui apakah dengan menggunakan metode ekstraksi GLCM dan melakukan perbandingan antara metode klasifikasi KNN dan SVM akan mendapatkan hasil akurasi yang baik untuk keduanya atau salah satunya bahkan tidak sama sekali dalam pengenalan kadar daging sapi pada olahan bakso.
METODE
Metode yang digunakan dalam penelitian ini yaitu metode klasifikasi KNN (K Nearest Neighbor) dan SVM (Support Vector Machine) dengan metode ekstraksi GLCM (Gray Level Co-Occurrence Matrix).
Pada Gambar 1 dibawah ini merupakan gambar tahapan dalam penelitian.
Gambar 1. Tahapan Penelitian
Identifikasi Masalah
Pada tahap pertama ini adalah melakukan identifikasi masalah penelitian mengenai identifikasi kadar daging sapi pada olahan bakso menggunakan metode K-Nearest Neighbor (KNN) dan dengan ekstraksi Gray Level Co-Occurrence Matrix (GLCM) yang belum pernah diteliti oleh siapapun sebelumnya.
Studi Literatur
Studi literatur merupakan proses mempelajari dan mencari penelitian terkait yang dilakukan melalui buku-buku maupun jurnal penelitian terdahulu, dari studi literatur penulis dapat memahami dan mengetahui cara bagaimana pengumpulan data atau informasi yang bisa digunakan dalam penelitian ini.
Pembuatan Dataset
Dataset yang diambil berupa gambar dari bakso yang dibuat dari campuran daging sapi yang telah digiling dengan tepung sagu. Olahan bakso yang dibuat memiliki 4 jenis perbandingan antara daging sapi giling dengan tepung sagu mulai dari perbandingan 1.5:1, 1:1, 1:2, dan 2:1. Yang pertiap 1 bandingnya dihitung seberat 200 gram. Setelah bakso direbus, bakso diangkat dan dibersihkan menggunakan kain bersih untuk mengurangi kadar air dari rebusan, dan dibelah menjadi 2 (dua) bakso akan dipotret dengan jarak potret yang digunakan yakni 7 cm. Pengambilan gambar menggunakan kamera handphone Xiaomi Poco X3 GT dengan resolusi kamera belakang yang digunakan sebesar 64 MP.
Universitas Multi Data Palembang | 317 Dataset
Setelah tahap pembuatan dataset dan pengambilan gambar selanjutnya dataset akan dibagi menjadi data latih dan data uji, dimana untuk total data latih sebanyak 240 citra dan total data uji sebanyak 80. Citra untuk ukuran pertiap gambar yang dijadikan dataset yakni sebesar 100 × 100 pixel.
Implementasi
Setelah dilakukan pembagian dataset antara data latih dan data uji keduanya dilakukan ekstraksi dan ekstraksi yang digunakan yakni ekstraksi GLCM untuk mendapatkan nilai energi, kontras, korelasi dan homogenitas. Setelah dilakukan ekstraksi untuk data latih dilanjutkan dengan proses pemodelan dan dilanjutkan ke proses klasifikasi menggunakan SVM dan KNN dari lanjutan proses data uji dari proses ekstraksi. Dan setelah itu didapatkan hasil.
Pengujian
Setelah proses implementasi dilanjutkan dengan proses pengujian citra latih dan citra uji secara acak.
Hasil yang akan didapatkan berupa nilai akurasi yang berasal dari perhitungan rata-rata pada pengujian yang dilakukan.
Hasil Pengujian
Hasil pengujian akan dihitung untuk melihat nilai akurasi yang didapatkan dengan menggunakan rumus pada persamaan 1:
∑
∑ 100% (1)
Selanjutnya untuk mengetahui tingkat keberhasilan pengenalan akan dihitung nilai Accuracy, Precision, dan Recall menggunakan Confusion Matrix. Rumus yang digunakan dapat dilihat pada Persamaan 2, 3 dan 4:
Accuracy =
% (2)
Precision = % (3)
Recall =
% (4) Pembuatan Laporan
Hasil yang didapatkan selama penelitian akan dibuat menjadi sebuah laporan.
HASILDANPEMBAHASAN
Hasil yang ada didapatkan melalui dua klasifikasi yang berbeda yakni K-Nearest Neighbors (KNN) dengan 3 tetangga dan Support Vector Machine (SVM) berdasarkan classifier yang sesuai antara nilai fitur vector data latih dan nilai fitur vector data uji yang sudah didapatkan sebelumnya dengan fitur Gray Level Co-occurrence Matrix (GLCM). Setelah dilakukan pengujian didapatkan nilai Confusion matrix yang terdiri dari TP, FP, FN, dan TN. Hasil didapatkan dari dua Confussion Matrix dengan metode yang berbeda yakni Confussion Matrix dengan 3 dan Confussion Matrix Support Vector Machine (SVM) Berikut pada Gambar 2 Confussion Matrix KNN 3 tetangga dan Gambar 3 Confussion Matrix SVM.
318| Universitas Multi Data Palembang
Gambar 2. Confusion Matrix KNN 3 Tetangga
Pada Gambar 2, dapat dilihat cell yang berwarna biru menunjukkan jumlah nilai yang dapat dikenali dengan fitur K-Nearest Neighbors (KNN) sedangkan cell yang berwarna orange menunjukkan jumlah nilai yang tidak dapat dikenali. Pada Gambar 2 menunjukkan pada cell berwarna biru memiliki 4 cell yang berbeda dengan nilai masing masing 16, 18, 16 dan 12 yang mana adalah menunjukkan jumlah nilai yang dapat dikenali dengan fitur K-Nearest Neighbors (KNN) dengan perhitungan 3 tetangga.
.
Gambar 3. Confusion Matrix SVM
Pada gambar di atas Gambar 3 menunjukkan pada cell berwarna biru memiliki 3 nilai dari cell yang berbeda yakni 13, 20, dan 11 adalah menunjukkan jumlah nilai yang dapat dikenali.Setelah didapat nilai dari confusion matrix selanjutnya dilakukan perhitungan untuk mendapatkan hasil akhir dari confusion matrix ini berupa nilai Accuracy, Precision, dan Recall. Accuracy merupakan rasio prediksi benar dengan keseluruhan data, Precision merupakan rasio prediksi benar positif dibandingkan dengan keseluruhan hasil yang diprediksi positif.
Universitas Multi Data Palembang | 319 Tabel 1. Hasil Accuracy, Precision dan Recall KNN 3 Tetangga
Kelas TP TN FP FN Accuracy Precision Recall Kadar 1
Perbandingan (1.5:1) 16 55 4 5
88,75% 80% 76%
Kadar 2
Perbandingan (1:1) 18 53 2 7
88.75% 90% 72%
Kadar 3
Perbandingan (1:2) 16 59 4 1
93.75% 80% 94%
Kadar 4
Perbandingan (2:1) 12 55 8 5
83.75% 60% 71%
Tabel 2. Hasil Accuracy, Precision dan Recall SVM
Kelas TP TN FP FN Accuracy Precision Recall Kadar 1
Perbandingan (1.5:1) 13 57 7 3 87.50% 65% 81%
Kadar 2
Perbandingan (1:1) 0 0 60 20 0 0% 0%
Kadar 3
Perbandingan (1:2) 20 20 34 0 26 100% 43%
Kadar 4
Perbandingan (2:1) 11 11 53 9 7 55% 61%
Pada Tabel 1 dan Tabel 2 diatas merupakan tabel yang berisikan nilai TP TN FP dan FN yang didapatkan dari confusion matrix yang kemudian dihitung untuk mendapatkan nilai Accuracy, Precision Dan Recall. Berikut pada Gambar 4 merupakan grafik yang menunjukkan hasil perbandingan akurasi dari 2 metode yang digunakan dalam penelitian yakni K-Nearest Neighbors (KNN) dengan 3 tetangga dan Support Vector Machine (SVM)
Gambar 4. Grafik Akurasi KNN 3 Tetangga dan SVM
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
Kadar 1
Kadar 2
Kadar 3 Kadar 4
KNN 3 Tetangga SVM
320| Universitas Multi Data Palembang
Setelah didapat nilai Accuracy, maka dilakukan perhitungan akurasi identifikasi citra yang dikenali atau Overall akurasi dengan rumus berikut:
∑
∑ 100% (5) Nilai Overall akurasi untuk Confusion Matrix KNN 3 tetangga:
!" 100% 77.50% (6)
Nilai Overall akurasi untuk Confusion Matrix SVM
&&
!" 100% 55% (7)
Setelah dilakukan perhitungan menggunkan rumus diatas maka didapatkan nilai overall akurasi, nilai overall akurasi merupakan total keseluruhan nilai akurasi yang didapatkan dari tiap metode yang digunakan dalam melakukan pengklasifikasian terhadap keempat kadar. Dan untuk Confusion Matrix KNN 3 tetangga didapatkan akurasi sebesar 77.5% sedangkan untuk Confusion Matrix SVM yakni sebesar 55%.
SIMPULAN
Penelitian yang dilakukan menggunakan dataset citra 4 jenis perbandingan kadar daging sapi pada bakso yakni perbandingan 1.5:1, perbandingan 1:1, perbandingan 1:2, dan perbandingan 2:1, dengan total citra latih sebanyak 240 dan total citra uji sebanyak 80. Dengan fitur ekstraksi yang digunakan adalah fitur ekstraksi GLCM didapatkan bahwa hasil klasifikasi menggunakan metode KNN denagn 3 tetangga mendapatkan overall akurasi Sebesar 77.50% sedangkan untuk metode SVM mendapatkan overall akurasi sebesar 55%. Terdapat selisih nilai sebesar 22.50% dimana akurasi menggunakan metode KNN dengan 3 tetangga jauh lebih tinggi dibandingkan metode SVM.
DAFTARPUSTAKA
[1] Wibowo., S, 2004, Pembuatan Bakso Ikan dan Daging, Cetakan 7, Penebar Swadaya, Jakarta.
[2] Halodoc.com. 14 Agustus 2018, Nutrisi yang Terkandung Dalam Daging Sapi dan Daging Kambing, Diakses pada 8 Maret 2022, dari https://www.halodoc.com/artikel/nutrisi-yang-terkandung-dalam- daging-sapi-dan-daging-kambing.
[3] Azmi, Nabila, 8 September 2021, Manfaat Daging Sapi, Daging Merah yang Kaya akan Protein, Diakses pada 8 Maret 2022, dari https://hellosehat.com/nutrisi/fakta-gizi/manfaat-daging-sapi/.
[4] Liantoni ,Febri,dkk, 2015, Klasifikasi Daun Dengan Perbaikan Fitur Citra Menggunakan Metode K- Nearest Neighbor.”Teknik Informatika. ISSN 2085-4552.
[5] Wijaya, Chandra., Hafiz Irsyad dan Wijang Widhiarso, 2020, Klasifikasi Pneumonia Menggunakan Metode K-Nearest Neighbor Dengan Ekstraksi GLCM, Jurnal Algoritme. Vol. 1, No. 1.
[6] Antony, Felix., Hafiz Irsyad dan Muhammad Ezar Al Rivan, 2021, KNN dan Gabor Filter Serta Wiener Filter Untuk Mendiagnosis Penyakit Pneumonia Citra X-RAY pada Paru-paru, Jurnal Algoritme. Vol. 1, No. 2.
Universitas Multi Data Palembang | 321 [7] Prasetyo, E., 2012, Data Mining Konsep dan Aplikasi Menggunakan Matlab, Andi Offset. Yogyakarta.
[8] Bilqis Salsabila, Alifa Puteri., Rika Desma Yunita dan Chaerur Rozikin, 2021, Identifikasi Citra Jenis Bunga Menggunakan Algoritma KNN Dengan Ekstrasi Warna HSV dan Tekstur GLCM, Technomedia Journal (TMJ). Vol. 6 No. 1. p-ISSN: 2655 8807. e-ISSN: 2656-8888.
[9] Wisudawati, Lulu Mawaddah, 2021, Jurnal Ilmiah Informatika Komputer, 2021 - ejournal.gunadarma.ac.id.
[10] Alamsyah, Derry, 2017, Pengenalan Mobil pada Citra Digital Menggunakan HOG-SVM, Jatisi. ISSN:
1978-1520.