Jln. Khatib Sulaiman Dalam, No. 1, Padang, Indonesia, Telp. (0751) 7056199, 7058325 Website: ijcs.stmikindonesia.ac.id | E-mail: [email protected]
Penerapan Metode K-Nearest Neighbor (Knn) Untuk Klasifikasi Kematangan Buah Kopi
Nerlys Amelia1, Melki Garonga’2, Juprianus Rusman3
[email protected], [email protected], [email protected] Program Studi Teknik Informatika, Universitas Kristen Indonesia Toraja
Informasi Artikel Abstrak Diterima : 9 Mar 2023
Direview : 30 Mar 2023 Disetujui : 20 Apr 2023
Perkebunan kopi di Indonesia berperan penting bagi masyarakat sebagai lapangan pekerjaan. Penentuan tingkat kematangan buah kopi yang masih dilakukan secara manual, baik secara racutan atau rampasan berdasarkan pengamatan secara subjektif. Kematangan buah kopi dapat dilihat dari tiga tingkatan yaitu matang, setengah matang dan mentah sehingga warna buah kopi dapat menjadi tolak ukur untuk mengenali tingkat kematangan serta kualitas buah kopi. Ekstraksi fitur warna merupakan salah satu teknik yang dapat digunakan untuk memperoleh informasi tingkat kematangan buah kopi dengan cara memunculkan ciri dari sebuah citra menggunakan fitur warna serta segmentasi tresholding. Total citra buah kopi yang digunakan dalam penelitian ini sebanyak 300, yang terdiri dari 100 citra buah kopi matang, 100 citra buah kopi setengah matang dan 100 citra buah kopi mentah. Dengan menggunakan fitur warna RGB dan HSV serta algoritma KNN untuk pengklasifikasian tingkat kematangan buah kopi, diperoleh hasil akurasi tertinggi dengan nilai k = 3 sebesar 95 %.
Kata Kunci
Buah Kopi, Klasifikasi, HSV, Ekstraksi, K- Nearest
Keywords Abstract
Coffee Fruit, Classification, HSV, Extraction, K-Nearest Neighbor
Coffee plantations in Indonesia play an important role for the community as jobs. Determination of the maturity level of coffee cherries is still done manually , either by grinding or spoiling based on subjective observations. The ripeness of the coffee cherries can be seen from three levels, namely ripe, half ripe and unripe so that the color of the cherries can be used as a benchmark to identify the level of maturity and quality of the cherries. Color feature extraction is a technique that can be used to obtain information on the maturity level of coffee beans by displaying the characteristics of an image using color features and threshold segmentation. The total cffee cherries used in this study were 300, consisting of 100 ripe coffee cherries, 100 half-ripe coffee cherries and 100 unripe coffee cherries. By using the RGB and HSV color features and the KNN algorithm to classify the level of maturity of coffee cherries, the highest accuracy results are obtained with a k = 3 value of 95%.
A. Pendahuluan
Kopi merupakan salah satu tanaman perkebunan yang dibutuhkan oleh masyarakat serta memiliki nilai ekonomi yang tinggi. Kopi banyak diminati oleh masyarakat lokal maupun mancanegara. Kopi berperan sebagai sumber devisa negara, selain itu kopi juga menjadi sumber penghasilan utama bagi petani-petani kopi di Indonesia dan menjadi penyedia lapangan kerja bagi masyarakat[1][2].
Produksi kopi di Indonesia saat ini masih terhambat oleh rendahnya kualitas/mutu buah kopi yang dihasilkan sehingga berpengaruh pada cita rasa atau hasil akhir produksi kopi. Kualitas kopi tidak hanya didasarkan pada bentuk fisik maupun variates kopi saja, namun juga ditentukan berdasarkan tingkat kematangannya. Penentuan panen buah kopi berdasarkan warna dari kulit buah, kematangan buah kopi dapat dilihat dari tiga tingkatan yaitu matang, setengah matang dan mentah sehingga warna pada buah kopi dapat menjadi tolak ukur untuk mengenali tingkat kematangan buah kopi. Untuk mendapatkan buah kopi yang berkualitas proses pemanenan secara selektif sangat dianjurkan. Para petani kopi selama ini melakukan proses sortasi biji kopi berdasarkan pengamatan visual seperti memilih biji kopi yang telah matang satu-persatu sehingga memerlukan tenaga dan waktu yang cukup lama sehingga menimbulkan rasa jenuh, kelelahan serta tidak konsistenya kematangan buah kopi. Seiring dengan berkembangnya teknologi, berbagai metode dapat digunakan untuk melakukan sortarsi salah satunya dengan memanfaatkan teknologi kecerdasan buatan. Kecerdasan buatan sudah banyak digunakan dalam berbagai bidang penelitian mengklasifikasikan tingkat kematangan buah[3][4].
Pengolahan citra merupakan salah satu cabang dari ilmu komputer (informatika) untuk mengolah citra atau image melalui sebuah proses komputasi.
Teknologi ini akan mengolah informasi inputan berupa citra dan keluaran juga berupa citra. Pengolahan citra berhubungan dengan perbaikan kualitas gambar seperti transformasi warna, peningkatan kontras, dan lain-lain. Untuk memperoleh informasi dari sebuah citra terdapat beberapa tahap yang dilakukan yakni:
pembersihan data (croping dan resize) setelah itu dilakukan segmentasi menggunakan metode thresholding. Ekstaksi merupakan proses untuk memperoleh informasi berupa fitur warna pada citra yang nantinya nilai yang didapatkan akan di analisis untuk proses klasifikasi[5].
Berdasarkan prinsinya algoritma KKN melakukan klasifikasi data baru berdasarkan kemiripan atau memilih jarak terdekat. Jarak eucludien distance digunakan untuk menghitung jarak. K-Nearest Neighbor (KNN) merupakan salah satu algoritma yang berkembang khususnya dalam pengolahan citra untuk klasifikasi kematangan buah[3]. Metode K-Nearest Neighbor (KNN) dipilih karena dalam penelitian pengolahan citra sebelumnya metode ini memiki kinerja yang baik. Selain itu metode K-Nearest Neighbor (KNN) tahan terhadap data training yang noisy dan efektif jika menggunakan data latih dalam jumlah besar. Penelitian yang dilakukan oleh Duwen Imantata Muhammad dkk dengan judul Penggunaan K- Nearest Neighbor (KNN) untuk mengklasifikasi citra Belimbing Berdasarkan Fitur Warna dengan tingkat akurasi sebesar 93,33% [3][4]. Penelitian ini bertujuan untuk melakukan pemodelan pada algoritma KNN untuk klasifikasi tingkat kematangan buah kopi.
B. Metode Penelitian
Adapun tahapan penelitian mengenai penerapan metode K-Nearest Neighbor (KNN) untuk klasifikasi kematangan buah kopi yaitu:
Gambar 1. Alur Penelitian 1. Pengumpulan Data
Pengumpulan data dilakukan dengan cara melakukan observasi dan wawancara ke lokasi perkebunan kopi arabika yang berada di Batutumonga Kabupaten Toraja Utara. Wawancara dilakukan dengan petani kopi untuk mengambil buah kopi yang akan digunakan sebagai sampel dalam penelitian, sampel buah kopi yang digunakan dalam penelitian ini terdiri atas tiga (3) tingkatan, yaitu mentah, setengah matang dan matang, jumlah data untuk setiap tingkatan berjumlah 100 citra, total data yang digunakan sebanyak 300 citra.
Gambar 2. Citra Buah Kopi (a) Matang (b) Setengah Matang (c) Mentah Beberapa tahapan yang dilakukan dalam image processing seperti dilakukan proses cropping guna menghilangkan bagian yang tidak dibutuhkan kemudian dilakukan resize 200 x 200 untuk menyamakan ukuran citra. Dilakukan segmentasi mengunakan metode tresholding_binary_inv dengan nilai batas bawah sebesar 127 dan batas atas sebesar 255. Kemudian dilakukan penyamaan ruang warna dari ruang warna RGB ke ruang warna HSV guna mendapatkan nilai pada setiap lapisnya.
Gambar 3. Hasil Konversi RGB KE HSV (a) Citra Matang (b) Citra Matang RGB (c) Citra Matang HSV
2. Estraksi Fitur Warna
Ciri yang menjadi pembeda pada penelitian ini terdapat pada warna. Fitur warna yang akan digunakan yaitu RGB dan HSV, nilai rata-rata dari setiap lapisan red, green dan blue serta nilai rata-rata dari hue, saturation, dan value akan diambil kemudian digunakan dalam model KNN[6][7][8][9]. Nilai tersebut diperoleh menggunkan persamaan berikut :
Cmax = max (R,G,B) (1)
Cmin = min (R,G,B) (2)
C = Cmax - Cmin (3)
Untuk mengkonversi ruang warna RGB menjadi HSV dapat menggunakan persamaan berikut :
H = 60 ( G – B ) / C if Cmax = R (4) H = 120 + 60 ( B – R ) / C, if Cmax = G (5) H = 240 + 60 ( R – G ) / C, if Cmax = B (6)
S = C / Cmax (7)
V = Cmax (8)
3. Pembagian Data set
Data set kemudian dibagi menjadi 2 bagian 80% data training dan 20% data testing dari keseluruhan citra.
Tabel 1. Pembagian Citra Data Training dan Citra Data Testing
Class training testing
Matang 80 20
Setengah Matang 80 20
Mentah 80 20
Jumlah 240 60
4. Klasifikasi KNN
KNN merupakan salah satu metode yang menggunakan algoritma supervised dimana hasil query instance diklasifikasikan berdasarkan mayoritas dari kategori k-tetangga terdekat. Algoritma ini bertujuan untuk mengklasifikasikan objek baru menurut atribut dan sampel dari training data. Proses klasifikasi dilakukan dengan mencari tetangga terdekat dari sampel data uji baru. Dekat atau jauhnya tetangga dihitung berdasarkan euclidean distance[10]. Dapat dihitung menggunakan persamaan berikut:
Dist (x.y) = √∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖)2 (9) Keterangan:
xi : data uji atau data training yi : data latih atau data testing i : record (baris) ke i dari tabel n : jumlah data training
5. Confusion Matrix
Proses pengujian tingkat akurasi menggunakan confusion matrix. Confusion matriks merupakan metode yang dapat digunakan untuk perhitungan akurasi.
Confusion matriks menghasilkan evaluasi nilai cacuration, precision, recall dan f- measure[4][7].
Akurasi = 𝑇𝑃+𝑇𝑁
𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 (10)
Presisi prediksi = 𝑇𝑃
𝑇𝑃+𝐹𝑃 (11)
Recall= 𝑇𝑃
𝑇𝑃+𝐹𝑁 (12)
F1Score = 2 𝑥 𝑅𝑒𝑐𝑎𝑙𝑙×𝑃𝑟𝑒𝑠𝑖𝑠𝑖𝑜𝑛
𝑅𝑒𝑐𝑎𝑙𝑙+𝑃𝑟𝑒𝑠𝑖𝑠𝑖𝑜𝑛 (13)
C. Hasil dan Pembahasan Analisis Ekstrasi Fitur
Data yang digunakan dalam penelitian ini merupakan data citra berupa hasil ekstraksi fitur warna. Dimana data yang dianalisis berupa fitur-fitur yang terdiri dari fitur RGB dan HSV.
Terdapat beberapa tahapan yang dapat dilakukan untuk menghitung ekstraksi ciri warna RGB ke HSV. Berikut contoh ekstraksi ciri warna RGB ke HSV, digunakan matriks 4 x 4 sebagai contoh perhitungan.
Gambar 4. Matriks RGB 4x4
a. Langkah pertama yang dilakukan adalah mencari nilai rata-rata dari setiap lapisan R,G,B kemudian dibagi 255.
R = 201/16 = 12.5625 R = 12.5625 / 255 R = 0.049265 G = 138/16 = 8.625 G = 8.625 / 255 G = 0.0338235 B = 133/16 = 0.3125 B = 0.3125 / 255 B = 0.032598
b. Setelah nilai dari RGB didapatkan, langkah selanjutnya adalah mencari nilai C Cmax = max (R,G,B)
= 0.049265 Cmin = min (R,G,B)
= 0.032598 C = Cmax – Cmin C = 0.016667
c. Langkah selajutnya adalah mencari nilai HSV, dengan menggunakan persamaan:
H = 60 (G - B) / C if Cmax = R
H = 60 * (0.0338235 - 0.032598) / 0.016667 H = 4.411765 H = 4.411765 / 6
H = 0.735294 S = C / Cmax
S = 0.016667 / 0.049265 = 0.338308 V = Cmax
V = 0.049265
d. Dari perhitungan konversi RGB dan HSV dihasilkan nilai : H = 0.735294 S = 0.338308 V= 0.049265
Gambar 5. Hasil Tampilan Codingan Ekstraksi Fitur Analisis Hasil Klasifikasi
Data dari setiap fitur yang telah diperoleh kemudian diklasifikasikan menggunakan algoritma KNN menggunakan fungsi kneighborsclassifier dari model selection. Proporsi data training yang digunakan sebesar 80% dan data testing sebesar 20%.
Dilakukan beberapa kali percobaan dengan mengubah nilai K. Diperoleh akurasi tertinggi sebesar 95% dengan nilai k = 3 dan akurasi terendah 85% dengan nilai k = 15.
Tabel 2. Hasil Akurasi
Nilai k 3 5 7 9 11 15
Akurasi 95% 93% 92% 90% 87% 85%
Gambar 6. Grafik Hasil Akurasi
Langkah selanjutnya yaitu melihat tingkat akurasi dari model yang telah dibentuk menggunakan confusion matrix, dengan nilai k = 3 pada tabel berikut:
Tabel 3. Confusion Matriks k = 3 Class Prediksi Class
Aktual Mtg Mth Sm
Mtg 20 0 0
Mth 0 19 1
Sm 0 2 18
Untuk mengukur kinerja model dilakukan beberapa perhitungan yakni akurasi, precision, recall, dan f1-score.
Gambar 7. Hasil Pengujian k = 3
Dari gambar di atas dilakukan percobaan dengan nilai k = 3 diperoleh akurasi sebesar 95%. Citra buah kopi matang yang terdiri dari 20 citra testing diprediksi 20 citra matang benar semua, citra mentah diprediksi 19 citra benar dan 1citra diprediksi setengah matang, citra setengah matang 18 diprediksi benar setengah matang dan 2 diprediksi mentah.
Simpulan
Berdasarkan pengamatan selama melakasanakan penelitian dengan melakukan beberapa tahapan maka diperoleh kesimpulan:
1. Model KNN yang digunakan dalam penelitian ini menggunakan model selection.
2. Dengan menggunakan algoritma k-nearest neighbor (KNN) untuk klasifikasi kematangan buah kopi di peroleh akurasi sebesar 95% dengan nilai k = 3.
3. Nilai k memiliki pengaruh terhadap akurasi, semakin besar nilai k maka akurasi yang didapatkan semakin rendah.
D. Ucapan Terima Kasih
Penulis menyampaikan terima kasih kepada Program Studi Teknik Informatika Universitas Kristen Indonesia Toraja yang telah memberi dukungan serta fasilitas untuk kelancaran penelitian ini.
E. Referensi
[1] M. Rioarda, B. Fatkhurrozi, And I. Setyowati, “Klasifikasi Tingkat Kematangan Buah Kopi Menggunakan Algoritma Fuzzy C – Means,” 2021.
[2] W. A. Pulungan, Y. Mulyani, And W. E. Sulistiono, “Identifikasi Kematangan Buah Kopi Menggunakan Jaringan Syaraf Tiruan Learning Vector Quantization 1,” Vol. 4, No. 2, Pp. 217–219, 2019.
[3] E. H. Rachmawanto Et Al., “Pengukuran Tingkat Kematangan Kopi Robusta Menggunakan Algoritma K-Nearest Neighbor 1,2,” Pp. 978–979, 2018.
[4] D. A. N. Pca, “Klasifikasi Tingkat Kematangan Buah Kopi Berdasarkan Deteksi Warna Menggunakan Metode Knn Dan Pca,” Vol. 8, No. 2, Pp. 88–95, 2021.
[5] F. T. Elektro, U. Telkom, G. Level, And C. M. Extraction, “Perbandingan Klasifikasi Tingkat Kematangan Buah Kopi Menggunakan Metode Fuzzy Logic Dan K-Nearest Neighbor Dengan Ekstraksi Ciri Gray Level Co- Occurrence Matrix Comparison Of Coffee Cherries Ripeness Using Fuzzy Logic And K- Nearest Neighbor Method With Gray Level Co-Occurrence Matrix Feature Extraction,” Vol. 7, No. 2, Pp. 4060–4073, 2020.
[6] A. B. Kaswar, A. Akram, And N. Risal, “Pengolahan Citra Digital,” Vol. 01, No.
May, Pp. 1–8, 2020.
[7] J. Elektronika, T. Informasi, H. Khotimah, And N. Nafi, “Klasifikasi Kematangan Buah Mangga Berdasarkan Citra Hsv Dengan Knn,” Vol. 1, No. 2, Pp. 4–7, 2019.
[8] M. Arief, “Klasifikasi Kematangan Buah Jeruk Berdasarkan Fitur Warna Menggunakan Metode SVM,” Vol. 4, Pp. 9–16, 2019.
[9] N. Arifin And I. S. Areni, “Klasifikasi Kematangan Stroberi Berbasis Segmentasi Warna Dengan Metode Hsv,” Vol. 23, No. 2, Pp. 113–116, 2019, Doi: 10.25042/Jpe.112019.03.
[10] Yusra, D. Olivita, And Y. Vitriani, “Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier Dan K-Nearest Neighbor,” J. Sains, Teknol. Dan Ind., Vol. 14, No. 1, Pp. 79–85, 2016.