PENENTUAN KUALITAS SAYURAN BERDASARKAN WARNA DENGAN PENERAPAN METODE K-NEAREST NEIGHBOR (K-NN)

(1)

30 PENENTUAN KUALITAS SAYURAN BERDASARKAN WARNA

DENGAN PENERAPAN METODE K-NEAREST NEIGHBOR (K-NN)

Setyaji Catur Maulana¹⁾, Nurhayati²⁾, Husnul Khair³⁾

Program Studi Teknik Informatika, STMIK KAPUTAMA

Jl. Veteran No. 4A-9A, Binjai 20714, Sumatera Utara e-mail: info@kaputama.ac.id

ABSTRACT

In this research, the process of applying the K-Nearst Neighbor (KNN) method will be carried out, which is a classification method for a set of data based on the majority of categories and the goal is to classify new objects based on attributes and sample samples from training data. So that the desired output target is close to the accuracy in conducting learning testing. The results of the test of the K-Nearest Neighbor method. It can be seen that from the K values of 1 to 10, the percentage of the results of the analysis of the K-NN method is higher than the results of the analysis of the K-NN method. And from the K value that has been tested, the K 2 value and the K 9 value have the largest percentage so that the accuracy is also more precise. As for the results of testing the K-Nearest Neighbor method in data classification. As for the author's test using a variation of the K value of K- Nearest Neighbor 3,4,5,6,7,8,9. Has a very good percentage of accuracy compared to only K-NN.

The test results show the K-Nearest Neighbor method in data classification has a good percentage accuracy when using random data. The percentage of variation in the value of K K-Nearest Neighbor 3,4,5,6,7,8,9 has a percentage of 100%.

Keywords: K-Nearest Neighbor,_ Vegetables

ABSTRAK

Dalam penelitian ini akan dilakukan proses menerapkan metod K-Nearst Neighbor (KNN) merupakan salah satu metode klasifikasi terhadap sekumpulan data yang berdasarkan mayoritas dari kategori dan tujuannya untuk mengklasifikasikan obyek baru berdasarkan atribut dan sample sample dari training data. Sehingga target output yang diinginkan mendekati ketepatan dalam melakukan pengujian pembelajaran. Hasil pengujian metode K-Nearest Neighbor Adapun terlihat bahwa dari nilai K 1 hingga 10 yang di uji persentase dari hasil analisis metode K-NN lebih tinggi dari hasil analisis metode K-NN. Dan dari nilai K yang telah di ujikan nilai K 2 dan nilai K 9 memiliki persentasi terbesar sehingga keakuratanya juga semakin tepat. Adapun dari hasil pengujian metode K-Nearest Neighbor dalam klasifikasi data. Adapun pengujian penulis menggunakan variasi nilai K K-Nearest Neighbor 3,4,5,6,7,8,9. Memiliki persentase akurasi yang sangat baik di dibandingkan hanya K-NN. Hasil pengujian menunjukan metode K-Nearest Neighbor dalam klasifikasi data memiliki akurasi persentase yang baik ketika menggunakan data random. Persentase variasi nilai K K-Nearest Neighbor 3,4,5,6,7,8,9 memiliki persentase 100 % .

Kata Kunci: K-Nearest Neighbor,_ Sayuran

(2)

31 1. PENDAHULUAN

Citra atau gambar dapat didefinisikan sebagai fungsi dua dimensi yang disimbolkan dengan f (x, y) di mana x dan y adalah koordinat spasial (bidang), dan amplitude f pada setiap pasangan koordinat (x, y) disebut intensitas atau tingkat keabu-abuan gambar.Nilai intensitas x, y, dan jumlah diskrit disebut sebagai gambar digital (digital image).Bidang pemrosesan gambar (image processing) mengacu pada pemrosesan dengan menggunakan komputer digital, yang selanjutnya citra dapat diklasifikasi untuk mendapatkan suatu informasi atau pengetahuan baru.

Image processing banyak digunakan dalam bidang kecerdasan buatan (artificial intelligence) untuk mengambil suatu keputusan, salah satunya adalah untukmengklasifikasikan tingkat kematangan buah. Eliyani et al. (2013) dalam penelitiannya tentang pengenalan tingkat kematangan buah pepaya berdasarkan warna RGB (red, green, dan blue) dengan K-Means Clustering membagi hasil klasifikasimenjadi 3 yaitu pepaya muda (mentah), pepaya mengkal, dan pepaya matang.Sedangkan Mulyani et al.

(2017) dalam penelitiannya tentang klasifikasi kematanganbuah apel fuji dengan logika fuzzy juga menggunakan atribut warna yaitu mengubahgambar RGB menjadi skala abu-abu (grayscale).

Proses klasifikasi citra ini mengacu pada metode kecerdasan buatan yang memfokuskan pada pembelajaran mesin (machine learning). Banyak metode lain dalam pembelajaran mesin (machine learning) yang digunakan untuk proses klasifikasi diantaranya K-Nearest Neighbor dan Naïve Bayes Classifier. Klasifikasi merupakan pengelompokkan suatu objek ke dalam kelas-kelas berdasarkan ciri-ciri persamaan maupun perbedaan.

Adege et al. (2018) dalam penelitiannya tentang Indoor Localization menggunakan metode K-Nearest Neighbor (k-

NN) dan Backpropagation

mendapatkan hasil bahwa metode k-NN

menghasilkan akurasi yang lebih baik dibandingkan metode Backpropagation.

Sedangkan Jaafar et al. (2016) dalam penelitiannya menggunakan metode k-NN untuk mengklasifikasi basis data gambar biometrik berbasis tangan (hand-based biometric) yang merupakan basis data sidik jari (fingerprint) dan vena jari (finger vein), serta melakukan optimasi pada metode kNN untuk mendapatkan persentase yang lebih baik.

Dengan menggunakan metode K-Nearst Neighbor (KNN) merupakan salah satu metode klasifikasi terhadap sekumpulan data yang berdasarkan mayoritas dari kategori dan tujuannya untuk mengklasifikasikan obyek baru berdasarkan atribut dan sample sample dari training data. Sehingga target output yang diinginkan mendekati ketepatan dalam melakukan pengujian pembelajaran.

2. METODE PENELITIAN

Pada bab ini menjelaskan tahapan penelitian yang dilakukan, terhadap penelitian akan dijelaskan dalam beberapa proses dan data yang akan digunakan adalah citra sayuran yang diuraikan dalam beberapa proses dan data yang digunakan adalah citra sayuran. Adapun tahapan dari penelitian ini dapat dilihat pada flowchart gambar 1.

(3)

32 Gambar 1. Flowchart Peneliti

2.1 Pengumpulan Data

Data yang dikumpulkan untuk penelitian ini yaitu file image (citra) dengan format Portable Network Graphics (PNG) yang diperoleh dengan menggunakan kamera digital. Citra yang menjadi inputan adalah citra sayuran sawi, kol.

Data sampel yang digunakan adalah sebanyak 3 data pada masing-masing sampel

citra, dengan masing-masing memiliki 3 atribut yaitu red, green, blue. Dataset tersebut adalah hasil ekstraksi citra yang akan menjadi sumber data untuk klasifikasi citra sayuran dengan metode K-Nearest Neighbor.

2.2 Data Sayuran

Sayur umumnya merupakan segala sesuatu yang berasal dari tumbuhan yang dapat (tapi tidak harus) dimasak, atau dengan kata lain disayur. Istilah "sayur" tidak diberi batasan secara ilmiah. Sebagian besar sayur mencakup bagian-bagian vegetatif dari

tumbuhan, yang umumnya berupa daun (dan biasanya beserta tangkainya), tetapi dapat pula berupa batang muda (mis. rebung), umbi batang (mis. kentang) atau umbi akar (mis.

wortel ). Sementara yang lainnya berasal dari organ generatif, yang umumnya berupa polong-polongan (mis. buncis dan kapri), tetapi dapat juga berupa bunga (mis.

kecombrang dan turi) atau buah utuh (misalnya terung dan tomat). Terdapat pula bagian- bagian khas dari beberapa tumbuhan yang juga tergolong sebagai sayur-sayuran, seperti tongkol jagung muda (baby corn) dan jantung pisang. Selain itu, cendawan atau jamur besar yang dapat dimakan juga digolongkan sebagai sayur, meskipun secara taksonomi bukan tumbuhan.

3. HASIL DAN PEMBAHASAN

Data yang dikumpulkan untuk penelitian ini yaitu file image (citra) dengan format Portable Network Graphics (PNG) dan JPG Joint Photograpic group yang diperoleh dengan menggunakan kamera digital. Citra yang menjadi inputan adalah citra Kualitas Sayuran.Data sampel yang digunakan adalah sebanyak 3 data pada masing-masing sampel citra, dengan masing-masing memiliki 3 atribut yaitu red, green, blue. Dataset tersebut adalah hasil ekstraksi citra yang akan menjadi sumber data untuk klasifikasi citra buah denganmetode K-Nearest Neighbor.

Gambar 2. Interface proses 3.1 Pemrosesan Citra Sayuran

Start

Citra

Resize citra 100 x 100 pixcel

Ekstraksi Citra

Hasil Resize dan Ekstraksi

Metode K-NN

Hasil Klasifikasi Citra K-NN

End

(4)

33 Pada pemrosesan citra (image

processing) akan dilakukan menjadi 2 tahap yaitu resize citra dan proses ekstraksi yang juga diuraikan dalam bentuk pseudo-code.

Resize Citra

Citra yang digunakan dalam sampel ini adalah Sayuran yang akan di-resize menjadi ukuran 100 x 100 piksel, tujuannya agar proses klasifikasi lebih mudah dilakukan dikarenakan keseragaman dalam ukuran citra.

Ekstraksi Citra

Setelah citra di-resize menjadi ukuran 100 x 100 piksel, selanjutnya citra diekstraksi menjadi 3 atribut yaitu, red, green, dan blue.

3.2 Penerapan Metode K-Nearest Neighbor Pada penelitian ini menggunakan metode K-Nearest Neighbor dengan perhitungan jarak yang paling sering digunakan dalam proses machine learning (Viriyavisuthisakul et al, 2015). Rumus Euclidean Distance adalah hasil dari akar kuadrat perbedaan dua buah vektor.

Keterangan :

dij = jarak perhitungan kemiripan n = jumlah vektor

xik = vektor citra input

xjk = vektor citra pembanding Dari persamaan 2.2 pola dari Euclidean Distance adalah lingkaran yang ditunjukkan pada gambar 3.2

Gambar 3.2 Pola Euclidean Distance Keterangan :

a = x2 – x1

b = y2 – y1

Rumus Pytagoras a²+ b² = d²

d² = (x2 – x1)2 + (y2 – y1)²

Penyelesaian :

Setelah citra diekstraksi menjadi 3 atribut red, green, blue. Selanjutnya adalah mengklasifikasikan citra berdasarkan tingkat warnanya dengan metode K-NN. Berikut tahapan dalam penerapan metode K-NN pada citra:

1) Ditentukan nilai k = 6.

2) Hitung jarak Euclidean citra uji dengan citra latih pada dataset.

Untuk mendapatkan jarak Euclidean menggunakan

Persamaan (2.12). Selengkapnya lihat pada Lampiran 4.

Adapun berikut merupakan proses perhitungan metode K-Nearest Neighbor.

Pada proses ini ini sayuran yang telah dilakukan proses citra akan dilakukan proses K-Nearest Neighbor dimana dalam proses ini ditentukan terlebih dahulu nilai K kemudian dilakukan proses perhitungan dengan menentukan Euclidean Distance dari nilai dengan titik K.

d1 = √ (0.35408 - 0.53257)² + (0.48939 - 0.35004)²+ (0.15653 - 0.11739)²+

(84.39029 - 266.37838)²+ (0.68015 - 0.77958)²+ (0.48939 - 0.53257)2

+ (83.2006 - 101.0545)² + (53.25366 - 66.59021)²+ (- 0.43179 - (-

0.6906))² + (2.58143 - 1.87833)² + (0.075 - 0.09128)²= 183.34917

d2 = √ (0.35408 - 0.60723)² + (0.48939 - 0.35474)²+ (0.15653 - 0.03803)²+

(84.39029 - 266.61529)²+ (0.68015 - 0.93737)²+ (0.48939 - 0.60723)2

+ (83.2006 - 85.9337)² + (53.25366 - 58.02468)²+ (- 0.43179 - (-

0.72193))² + (2.58143 - 1.69682)² + (0.075 - 0.10388)²= 182.3108

d3 = √ (0.35408 - 0.53084)² + (0.48939 - 0.36686)²+ (0.15653 - 0.1023)²+

(84.39029 - 262.95879)²+ (0.68015 - 0.80729)²+ (0.48939 - 0.53084)2

+ (83.2006 - 95.8148)² + (53.25366 - 61.07852)²+ (- 0.43179 - (-

0.65001))² + (2.58143 - 2.12882)² + (0.075 - 0.07818)²= 179.18531

(X1,Y1) (X2,Y2)

a d b

(5)

34

…

d60 = √ (0.35408 - 0.31352)² + (0.48939 - 0.42338)²+ (0.15653 - 0.2631)²+

(84.39029 - 101.12541)²+ (0.68015 - 0.37857)²+ (0.48939 - 0.42338)2

+ (83.2006 - 107.6414)² + (53.25366 - 75.82154)²+ (- 0.43179 - (-

0.63988))² + (2.58143 - 1.54679)² + (0.075 - 0.11228)²= 37.25525

3) Ambil jarak terkecil sejumlah k:

d59 = 6.20946 à

Raw (Sayuran pigmen hijau)

d57 = 10.41017 à

Raw (Sayuran pigmen hijau)

d27 = 13.64874 à

Medium (Sayuran pigmen ungu)

d46 = 16.06358 à

Raw (Sayuran pigmen ungu)

d29 = 16.4265 à

Medium (Sayuran pigmen merah)

d24 = 16.51974 à

Medium (Sayuran pigmen merah) 4) Hasil klasifikasi citra dengan metode

k-NN:

Kelas “Raw (Hijau)” = 3 Kelas “Medium (Ungu)” = 3 Kelas “Mature (Merah)” = 0

Dari proses klasifikasi citra sayuran dengan metode k-NN di atas, tidak dapat disimpulkan bahwa citra yang diproses masuk ke dalam kelas yang mana dikarenakan terdapat jumlah kelas yang sama antara sayuran pigmen hijau dan sayuran pigmen ungu yaitu masing- masing berjumlah 3 data. Hal tersebut menunjukkan kemungkinan sampel sayuran yang diujikan adalah sebesar 50% sayuran dan 50% sayuran hijau.

3.3 Proses Klasifikasi Citra

Aplikasi yang dirancang dapat diimplementasikan dalam klasifikasi citra sayuran berdasarkan tingkat Warna dengan metode yang telah dimasukkan ke dalam

algoritmanya. Adapun analisis metode K- Nearest Neighbor dalam klasifikasi citra sayuran yang telah diimplementasikan ke dalam aplikasi dapat dijabarkan sebagai berikut

Sebelum melakukan pengujian, terlebih dahulu harus disiapkan data latih yang berupadataset hasil ekstraksi citra yang disimpan ke dalam database. Gambar berikut menunjukkan aplikasi yang dikembangkan untuk mengekstraksi citra latih dan menyimpan hasil ekstraksinya ke dalam database.

Gambar 3. Ekstraksi Citra Latih Pada Gambar diatas dapat dilihat proses pengolahan citra untuk mendapatkan dataset.

Terdapat proses resize, extract, dan save data.

Proses resize digunakan untuk mengubah ukuran atau resolusi citra menjadi seragam, yaitu dalam kasus ini 100 x 100 piksel. Setelah citra di-resize, selanjutnya diekstrak untuk mendapatkan nilai atribut red, green, blue, hue, saturation, value, mean, variance, skewness, kurtosis, dan energy.

Pada aplikasi juga ditampilkan grafik nilai red, green, blue, dan histogram pada citra yang nantinya nilai-nilai tersebut diproses untuk mendapatkan nilai atribut yang telah ditentukan. Hasil ektraksi tersebut selanjutnya akan disimpan ke dalam database dengan memberikan label target yang sesuai dengan tingkat warna bunga yang nantinya akan digunakan sebagai data uji.

(6)

35 3.4 Hasil Pembahasan

Pada penelitian ini penulis menganalisis pengujian dengan variasi nilai (K) K-NN. Dari hasil analisis menunjukkan Pada pengujian ini penulis juga menganalisis variasi nilai K dari bunga. Adapun ditunjukkan sebagai berikut.

Dalam pengujian ini menggunakan 30 data uji dengan 4 atribut dan 3 species dalam klasifikasi data.

Tabel 1. Hasil Variasi Nilai K Metode K-NN

Data Sayuran

Jumlah Nilai (K) K-NN

Hasil Analisis Metode K-

NN 3, 5, 7, 8, 9 85%

3, 5, 7, 8, 9 86%

3, 5, 7, 8, 9 77.3%

3, 5, 7, 8, 9 77%

3, 5, 7, 8, 9 81%

3, 5, 7, 8, 9 73.6%

3, 5, 7, 8, 9 68%

3, 5, 7, 8, 9 73%

3, 5, 7, 8, 9 83%

3, 5, 7, 8, 9 92%

Adapun analisis dari Tabel 1 menyajikan informasi tingkat akurasi specitivity algoritma K-Nearest Neighbor.

Analisis dilakukan dengan melakukan perhitungan Jumlah benar / jumlah data * 100%.

Akurasi adalah presentase dari jumlah total prediksi yang benar pada proses klasifikasi (Deng et al, 2016). Hal ini dilakukan berdasarkan table of Confusion tiap-tiap kelas pada Confusion Matrix yang diperoleh pada hasil pelatihan dan pengujian.

Gambar 4 Hasil Pengujian Variasi Nilai K Metode K-NN dengan 30 Data Uji

Pada gambar 4 diatas terlihat bahwa dari nilai K 1 hingga 10 yang di uji persentase dari hasil analisis metode K-NN lebih tinggi dari hasil analisis metode K-NN. Dan dari nilai K yang telah di ujikan nilai K 2 dan nilai K 9 memiliki persentasi terbesar sehingga keakuratanya juga semakin tepat.

Adapun dari hasil pengujian metode K-Nearest Neighbor dalam klasifikasi data. Adapun pengujian penulis menggunakan variasi nilai K K-Nearest Neighbor 3,4,5,6,7,8,9. Memiliki persentase akurasi yang sangat baik di dibandingkan hanya K-NN. Hasil pengujian menunjukan metode K-Nearest Neighbor dalam klasifikasi data memiliki akurasi persentase yang baik ketika menggunakan data random. Persentase variasi nilai K K-Nearest Neighbor 3,4,5,6,7,8,9 memiliki persentase 100 % .

4. KESIMPULAN

Dari penulisan skripsi yang berjudul Penentuan Kualitas Sayuran Berdasarkan Warna Dengan Penerapan Metode K- Nearest Neighbor (K-NN), kesimpulan yang di dapat sebagai berikut:

1. Sistem yang dibangun dapat

memudahkan dalam proses K-Nearest Neighbor untuk mengetahui kinerja dan peningkatan akurasi dalam klasifikasi citra.

Hasil pengujian metode K-Nearest Neighbor Adapun terlihat bahwa dari nilai K 1 hingga 10 yang di uji persentase dari hasil analisis metode K-NN lebih tinggi

(7)

36 dari hasil analisis metode K-NN. Dan dari

nilai K yang telah di ujikan nilai K 2 dan nilai K 9 memiliki persentasi terbesar sehingga keakuratanya juga semakin tepat. Adapun dari hasil pengujian metode K-Nearest Neighbor dalam klasifikasi data. Adapun pengujian penulis menggunakan variasi nilai K K-Nearest Neighbor 3,4,5,6,7,8,9. Memiliki persentase akurasi yang sangat baik di dibandingkan hanya K-NN. Hasil pengujian menunjukan metode K-Nearest Neighbor dalam klasifikasi data memiliki akurasi persentase yang baik ketika menggunakan data random. Persentase variasi nilai K K-Nearest

5. Saran

Dari penulisan skripsi yang berjudul Penentuan Kualitas Sayuran Berdasarkan Warna Dengan Penerapan Metode K-Nearest Neighbor (K-NN), adapun penulis memberikan saran untuk dapat dikembangkan untuk masa yang akan datang sebagai berikut:

1. Diharapkan kedepannya perlu dilakukan perbandingan terhadap algoritma lain, untuk menguji sejauh mana algoritma K- Nearest Neighbor masih dapat diandalkan untuk memproses dan menemukan pola hubungan asosiasi antar item pada database skala besar.

2. Diharapkan kedepannya adanya pengembangan baik berupa penambahan fitur-fitur aplikasi yang sesuai dibutuhkan dan anti virus yang berguna mengamankan sistem untuk melindungi data-data yang berada di dalam database.

3. Diharapkan sebaiknya ditambahkan fasilitas untuk backup data. Jadi, jika terjadi kerusakan pada server data tidak akan terhapus.

DAFTAR PUSTAKA

[1]. Angga Aditya Indra

Wiratpmaka,Imam Fahrur Rozi,Rosa Andrie Asmara,2017,klasifikasi

kualitas tanamn cabai menggunakan metode fuzzy k-nearest neighbor (FKNN)( ISSN: 2407-070X)

[2]. Febri Liantoni,2015 Klasifikasi Daun Dengan Perbaikan Fitur Citra Menggunakan Metode K-Nearest Neighbor (ISSN 2085-4552)

[3]. Jurnal Pengembangan IT (JPIT), Vol.04, No.1, Januari 2019 ISSN:

2477-5126 Cinantya Paramita,2019, Klasifikasi Jeruk Nipis Terhadap Tingkat Kematangan Buah Berdasarkan Fitur Warna Menggunakan K-Nearest Neighbor [4]. Joan Angelina Widians,

2019,Klasifikasi Jenis Bawang Menggunakan Metode KNearest Neighbor Berdasarkan Ekstraksi Fitur Bentuk dan Tekstur

[5]. JURTI, Vol.3 No.2, Desember 2019, ISSN: 2579-8790 Joan Angelina Widians,2019,Klasifikasi Jenis Bawang Menggunakan Metode K- Nearest Neighbor Berdasarkan Ekstraksi Fitur Bentuk dan Tekstur [6]. M. Rhifky Wayahdi,2020,

EVALUATION OF THE K-

NEAREST NEIGHBOR MODEL

WITH K-FOLD CROSS

VALIDATION ON IMAGE

CLASSIFICATION

[7]. Okfalisa, 2017, Comparative Analysis of K-Nearest Neighbor and Modified K-Nearest Neighbor Algorithm for Data Classification

[8]. Vasile Lucian Boiculese, Gabriel Dimitriu, Mihaela Moscalu, 2013, Improving Recall ofk-Nearest Neighbor Algorithm for Classes of Uneven Size