Klasifikasi Penyakit Daun Padi Menggunakan KNN dengan GLCM dan Canny Edge Detection

(1)

Klasifikasi Penyakit Daun Padi Menggunakan KNN dengan GLCM dan Canny Edge Detection

Ike Verawati^*, Ridwan Al Akhyar Aunurrohim

Fakultas Ilmu Komputer, Program Studi Informatika, Universitas Amikom Yogyakarta, Yogyakarta, Indonesia Email: ^1,*[email protected], ²[email protected]

Email Penulis Korespondensi: [email protected]

Abstrak−Tanaman padi memiliki peranan penting dalam keberlangsungan hidup manusia, terutama di Indonesia dimana tanaman padi menjadi sumber makanan pokok sebagian besar masyarakatnya. Badan Pusat Statistik melaporkan konsumsi beras di Indonesia mencapai 28,69 juta ton pada tahun 2019. Pada tahun yang sama, produksi beras di Indonesia mencapai 31,31 juta ton. Akan tetapi, hasil produksi tersebut mengalami penurunan dibanding tahun sebelumnya yang berjumlah 33,94 juta ton. Salah satu faktor penyebab menurunnya kualitas bahkan kematian tanaman padi adalah hama dan penyakit. Menurut International Rice Research Institute, setiap tahun petani kehilangan rata-rata 37 persen hasil panen dikarenakan serangan hama dan penyakit. Hal serupa juga dilaporkan oleh Food and Agriculture Organization dimana 20 hingga 40 persen kegagalan produksi pangan dunia disebabkan oleh hama dan penyakit. Kurangnya pengetahuan petani dan terbatasnya jumlah tenaga ahli berakibat pada diagnosa penyakit menjadi tidak efektif. Oleh sebab itu, diperlukan sebuah langkah atau metode agar proses deteksi penyakit pada tanaman padi menjadi lebih efektif. Penelitian ini menggunakan algoritma klasifikasi K-Nearest Neighbor dengan Gray Level Co-Occurrence Matrix dan Canny Edge Detection untuk melakukan klasifikasi penyakit pada tanaman padi. Hasilnya Canny Edge Detection memberikan pengaruh positif pada performa metode dengan accuracy mencapai 91,67%, precision 87,37% dan recall 87,50% pada k=7.

Kata Kunci: Canny Edge Detection; GLCM; Klasifikasi; KNN; Penyakit Padi

Abstract−Rice plants have an important role in human survival, especially in Indonesia where rice plants are the staple food source for most of the population. The Central Statistics Agency reported that rice consumption in Indonesia reached 28.69 million tons in 2019. In the same year, rice production in Indonesia reached 31.31 million tons. However, production results decreased compared to the previous year, which amounted to 33.94 million tons. One of the factors causing the decline in quality and even death of rice plants is pests and disease. According to the International Rice Research Institute, every year farmers lose an average of 37 percent of their harvest due to pest and disease attacks. The Food and Agriculture Organization also reported a similar thing, where 20 to 40 percent of world food production failures were caused by pests and diseases.

Farmers' lack of knowledge and the limited number of experts result in ineffective disease diagnosis. Therefore, a step or method is needed so that the disease detection process in rice plants becomes more effective. This research uses the K-Nearest Neighbor classification algorithm with Gray Level Co-Occurrence Matrix and Canny Edge Detection to classify diseases in rice plants. The result is that Canny Edge Detection has a positive influence on method performance with accuracy reaching 91.67%, precision 87.37% and recall 87.50% at k=7.

Keywords: Canny Edge Detection; GLCM; Classification; KNN; Rice Disease

1. PENDAHULUAN

Tanaman padi atau Oryza sativa memegang peranan penting dalam kelangsungan hidup manusia, terutama di Indonesia dimana tanaman padi menjadi sumber makanan pokok sebagian besar masyarakatnya [1]. Tanaman padi menghasilkan beras yang berfungsi untuk memberikan energi pada tubuh manusia karena mengandung sumber kalori dan protein utama. Berdasarkan data dari Badan Pusat Statistik (BPS) konsumsi beras masyarakat Indonesia mencapai 28.692.107 ton pada tahun 2019. Hal ini membuat beras menjadi komoditi yang memiliki pengaruh yang cukup besar terhadap stabilitas ekonomi di Indonesia [2].

Dengan tingginya kebutuhan masyarakat terhadap beras, maka harus diimbangi dengan jumlah produksi yang memadai. Badan Pusat Statistik (BPS) melaporkan produksi padi pada tahun 2019 sebesar 31,31 juta ton.

Meski terlihat lebih besar dari jumlah kebutuhan konsumsi beras pada tahun yang sama, nyatanya produksi beras menurun sebesar 2,63 juta ton (7,75 persen) dibandingkan tahun sebelumnya yang berjumlah 33,94 juta ton. Hal ini berbanding lurus dengan luas panen padi seluas 10,68 juta hektar yang juga mengalami penurunan sebesar 700,05 ribu hektar (6,15 persen) dibanding tahun sebelumnya [3].

Penyakit pada tanaman padi termasuk faktor yang mempengaruhi kualitas tanaman padi dan bahkan bisa mengakibatkan kematian pada tanaman padi [4]. Menurut International Rice Research Institute (IRRI), setiap tahunnya petani kehilangan rata-rata 37 persen hasil panen padi diakibatkan serangan hama dan penyakit [5]. Hal serupa juga dilaporkan oleh Food and Agriculture Organization (FAO) bahwa 20 sampai 40 persen kegagalan produksi pangan dunia disebabkan oleh hama dan penyakit [6]. Kurangnya pengetahuan petani tentang penyakit tanaman padi dan terbatasnya tenaga ahli berakibat pada diagnosa penyakit menjadi tidak efektif [7]. Jika permasalahan ini tidak segera diatasi, besar kemungkinan akan menjadi salah satu faktor penyebab dari kekurangan pangan global pada tahun 2050 seperti yang diperkirakan oleh Food and Agriculture Organization (FAO) [8].

Solusi dari permasalahan ini salah satunya adalah dengan menerapkan algoritma klasifikasi pada pengolahan citra digital. Pengolahan citra digital merupakan salah satu bidang ilmu yang mempelajari pemrosesan, analisis, dan pembentukan citra sehingga menghasilkan sebuah informasi demi mencapai suatu tujuan [9].

(2)

Sementara itu, klasifikasi citra merupakan salah satu penerapan dari pengolahan citra digital dimana citra digital dikelompokkan ke dalam suatu kelas berdasarkan ciri masing-masing [10]. Tujuan dari klasifikasi citra adalah untuk membuat komputer mampu mengenali dan memahami informasi dari suatu citra digital [11].

Pada penelitian sebelumnya, A. Purnamawati et al. membandingkan algoritma Decision Tree, Random Forest, Naïve Bayes, Support Vector Machine dan K-Nearest Neighbor untuk mendeteksi penyakit daun pada tanaman padi. Dengan menggunakan fitur dari hasil ekstraksi menggunakan Resnet50, kesimpulan yang diperoleh adalah algoritma K-Nearest Neighbor termasuk dalam kategori Good Models yang mana algoritma K-Nearest Neighbor tidak mengalami kendala overfitting maupun undefitting dengan akurasi sebesar 87 persen [12].

Penelitian yang dilakukan oleh Isman et al. juga membandingkan Algoritma K-Nearest Neighbor dengan algoritma lain, yaitu Local Binary Pattern Histogram dalam klasifikasi jenis daun herbal. Hasil yang diperoleh juga menujukkan bahwa kinerja dari algoritma K-Nearest Neighbor masih lebih unggul dari algoritma Local Binary Pattern Histogram dengan akurasi mencapai 97,5 persen [13].

Pada penelitian lain yang dilakukan oleh B. Sandy et al., algoritma K-Nearest Neighbor dikombinasikan dengan algoritma Gray Level Co-occurrence Matrix untuk klasifikasi citra wayang. Algoritma Gray Level Co- occurrence Matrix disini digunakan sebagai ekstraktor fitur dari citra wayang sedangkan algoritma K-Nearest Neighbor digunakan untuk melakukan klasifikasi. Dari penelitian tersebut diperoleh kesimpulan bahwa algoritma K-Nearest Neighbor dengan Gray Level Co-occurrence Matrix memiliki tingkat keberhasilan rata-rata dalam mendeteksi citra wayang sebesar 77,5 persen dan termasuk dalam kategori baik. Akan tetapi, terdapat satu kelas dengan tingkat akurasi cukup rendah yaitu 60 persen yang mungkin disebabkan oleh proses pengambilan sampel citra kelas tersebut yang kurang sempurna [14]. Algoritma K-Nearest Neighbor dan Gray Level Co-occurrence Matrix juga digunakan oleh D. Pamungkas untuk melakukan klasifikasi terhadap jenis anggrek. Pengujian dilakukan dengan nilai parameter k yang bervariasi yaitu 1, 5, 9 dan 13. Tingkat keberhasilan klasifikasi mencapai 80 persen pada k bernilai 1 dan 5. Sedangkan k 9 dan 13 memperoleh 73 persen dan tingkat keberhasilan rata-rata secara keseluruhan mencapai 77 persen. Sehingga bisa diketahui bahwa nilai k pada K-Nearest Neighbor cukup mempengaruhi hasil klasifikasi [15].

Penelitian dari R. Andrian et al. menggunakan algoritma K-Nearest Neighbor dan Canny Edge Detection untuk mengidentifikasi jenis kupu-kupu dengan fitur yang digunakan untuk proses klasifikasi adalah area, perimeter dan eccentricity. Uji coba dilakukan dengan parameter k bernilai 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 dan 23 dan memperoleh akurasi 80% pada k 5. Terdapat satu kelas dengan hasil terburuk, diduga karena pada saat proses pengambilan citra, kondisi pencahayaan kurang sehingga pada saat diproses menggunakan Canny Edge Detection, tepi kurang terdeteksi dengan jelas [16].

Berdasarkan uraian diatas, penulis mencoba untuk menerapkan algoritma Canny Edge Detection, Gray Level Co-Occurrence Matrix dan K-Nearest Neighbor untuk melakukan klasifikasi penyakit pada daun padi. Pada penelitian sebelumnya, algoritma klasifikasi K-Nearest Neighbor sering digunakan bersamaan dengan algoritma Gray Level Co-Occurrence Matrix untuk mendapatkan fitur dari dataset berupa citra grayscale. Sedangkan pada penelitian lainnya, ketika algoritma K-Nearest Neighbor digunakan bersamaan dengan Canny Edge Detection, fitur yang digunakan berupa area, perimeter dan eccentricity. Oleh sebab itu, pada penelitian ini algoritma klasifikasi K-Nearest Neighbor akan dipakai untuk menentukan kelas dari citra daun padi berdasarkan ekstraksi fitur dari Gray Level Co-Occurrence Matrix yang mana citra yang diekstrak merupakan citra hasil dari proses Canny Edge Detection.

Dari paparan yang telah dijelaskan, penelitian ini bertujuan untuk menguji algoritma K-Nearest Neighbor dengan ekstraksi fitur Gray Level Co-occurrence Matrix dan algoritma Canny Edge Detection untuk klasifikasi penyakit daun padi serta membandingkan akurasinya saat Canny Edge Detection digunakan maupun ketika Canny Edge Detection tidak digunakan.

2. METODOLOGI PENELITIAN

2.1 Tahapan Penelitian

Tahapan penelitian bisa dilihat pada Gambar 1.

Gambar 1. Langkah-langkah Penelitian

(3)

Tahapan yang dilakukan yaitu pengumpulan data, membagi dataset menjadi data training dan data testing, melakukan preprocessing, merubah citra RGB menjadi citra grayscale, menerapkan Canny Edge Detection, ekstraksi fitur menggunakan Gray Level Co-Occurrence Matrix, klasifikasi menggunakan K-Nearest Neighbor dan evaluasi pengujian dengan Confusion Matrix. Pada percobaan pertama, algoritma Canny Edge Detection tidak diterapkan, akan tetapi diterapkan pada percobaan kedua. Hal tersebut dilakukan untuk mengetahui seberapa besar akurasi yang diperoleh jika menggunakan Canny Edge Detection dan tanpa Canny Edge Detection.

2.2 Pengumpulan Data

Dataset berupa 120 citra daun padi dengan format JPG. Dataset terbagi menjadi 3 kelas, yaitu bacterial leaf blight, brown spot, dan leaf smut. Dataset citra diperoleh dari website UCI Machine Learning Repository (diakses pada 1 Oktober 2023) [17]. Citra dari dataset penelitian ini terlihat pada gambar 2.

Gambar 2. Sampel citra daun padi

Gambar 2 menampilkan 3 sampel citra penyakit tanaman padi. Untuk rincian dari dataset ditampilkan pada tabel 1.

Tabel 1. Jumlah citra penyakit daun padi

Kelas Jumlah Citra

Bacterial Leaf Blight 40

Brown Spot 40

Leaf Smut 40

Tabel 1 menampilkan nama-nama kelas beserta jumlah citra pada setiap kelas yang mana masing-masing kelas terdapat 40 citra.

2.3 Split Dataset

Dataset dibagi menjadi data latih (training) dan data uji (testing). Data latih adalah data yang digunakan algoritma klasifikasi untuk memahami pola dan karakteristik data untuk melakukan klasifikasi yang akurat pada data baru.

Sedangkan data uji adalah data yang digunakan untuk mengukur model yang sudah dilatih pada proses training [18]. Pembagian data pada penelitian ini menggunakan perbandingan 80:20 dengan detail ditunjukkan pada tabel 2.

Tabel 2. Pembagian data latih dan data uji

Kelas Jumlah Citra

Data Latih (80%) Data Uji (20%)

Bacterial Leaf Blight 32 8

Brown Spot 32 8

Leaf Smut 32 8

Pada tabel 2, pembagian data latih dan data uji dilakukan dengan data latih berjumlah 32 citra pada setiap kelas dan data uji dengan jumlah 8 citra untuk setiap kelasnya. Dengan demikian, secara keseluruhan terdapat 96 citra data latih dan 24 citra data uji.

2.4 Preprocessing

Tahap preprocessing bertujuan untuk memastikan agar citra yang digunakan sudah memiliki kualitas yang baik dan sesuai dengan tujuan penelitian [19]. Pada penelitian ini, penulis menggunakan crop, resize dan rotate.

a. Rotate

Citra daun dengan posisi selain horizontal diputar ke posisi yang dimaksud. Hal ini bertujuan agar arah posisi daun seragam. Proses ini dilakukan menggunakan perangkat lunak Adobe Photoshop.

b. Crop

Proses ini bertujuan untuk menghilangkan bagian yang tidak dibutuhkan serta mempersempit batasan agar fokus pada bagian gambar yang ingin dideteksi [20][21]. Penulis menggunakan aplikasi Adobe Photoshop untuk memotong citra dengan rasio 3 : 1.

(4)

c. Resize

Citra yang dihasilkan dari proses rotate dan crop memiliki ukuran yang bervariasi. Oleh sebab itu ukuran citra diubah menjadi 600 x 200 pixel. Selain agar seragam, tujuan dari mengubah ukuran citra adalah untuk mempercepat proses komputasi [22]. Proses ini menggunakan library OpenCV pada Google Colab.

2.5 RGB to Grayscale

Pada tahap ini, citra daun padi diubah menjadi grayscale atau keabu-abuan. Hal ini bertujuan agar citra dapat diproses menggunakan Canny Edge Detection dan Gray Level Co-Occurrence Matrix. Selain itu, proses grayscale bertujuan agar model citra lebih sederhana [14]. Penulis menggunakan library OpenCV untuk melakukan proses ini.

2.6 Canny Edge Detection

Operator Canny adalah metode deteksi tepi yang optimal yang menggunakan kernel turunan Gaussian untuk mengurangi noise pada citra awal dan menghasilkan tepi yang halus. Dibandingkan dengan metode Laplacian Of Gaussian, Canny menghasilkan tepi yang lebih jelas, memungkinkan perbedaan yang lebih nyata antara tepi dan latar belakang citra [23]. Dalam penelitian ini, Penulis menggunakan library Sci-kit Image dan diimplementasikan menggunakan Google Colab.

2.7 Ekstraksi Fitur GLCM

GLCM (Gray-Level Co-Occurrence Matrix) adalah metode ekstraksi tekstur citra yang menggunakan perhitungan statistik untuk memeriksa bagaimana piksel dalam citra berhubungan spasial. Ini melibatkan langkah-langkah seperti mengurangi level abu-abu dalam citra, memindai intensitas piksel dan tetangga dengan dislokasi dan sudut tertentu, serta membentuk matriks GLCM yang mencerminkan hubungan antara piksel dalam citra [24]. Penulis menggunakan bantuan library Sci-kit Image dan Sklearn pada proses ini dengan parameter distances bernilai 5, angles bernilai 0 dan levels bernilai 256. Fitur yang diekstraksi pada penelitian ini adalah sebagai berikut [25].

a. Contrast

Kontras dalam fitur GLCM mencerminkan ukuran penyebaran (moment of inertia) elemen matriks suatu citra.

Semakin jauh jarak dari diagonal utama, nilai kontrasnya akan tinggi [25]. Perhitungan nilai kontras ditunjukkan pada persamaan 1.

∑_i=1∑_j=1P(i, j)(i − j)² (1)

b. Homogeneity

Homogenitas GLCM merujuk pada keseragaman intensitas abu-abu dalam citra, yang merupakan kebalikan dari kontras GLCM [25]. Nilai homogenitas dapat dihitung menggunakan persamaan 2.

∑ ∑ ^{p(i,j)}

1+(i,j)² j=1

i=1 (2)

c. Energy

Energi juga dapat disebut sebagai keseragaman atau Angular Second Moment (ASM). ASM ini mengukur sejauh mana keseragaman dalam citra. Nilai ASM akan tinggi ketika citra memiliki tingkat keseragaman yang baik atau ketika piksel-pikselnya sangat mirip satu sama lain [25]. Persamaan 3 menunjukan perhitungan energy.

∑_i=1∑_j=1(P)²(i, j) (3)

d. Correlation

Korelasi mengindikasikan sejauh mana terdapat ketergantungan linear antara tingkat keabuan dari piksel-piksel yang berdekatan [25]. Perhitungan korelasi ditampilkan pada persamaan 4.

∑ [(i−μi)(j−μj)Pi,j

√(σi²)(σj²) ]

N−1i,j=0 (4)

e. Entropy

Entropi mencerminkan sejauh mana ketidakteraturan tingkat keabuan dalam citra dan nilai entropi akan tinggi jika elemen-elemen dalam GLCM memiliki tingkat keabuan yang serupa secara relative [26]. Entropi dapat dihitung dengan persamaan 5.

− ∑_i=1∑_j=1P(i, j) log P(i, j) (5)

2.8 K-Nearest Neighbor

Salah satu algoritma yang biasa digunakan untuk menyelesaikan masalah klasifikasi adalah algoritma K-Nearest Neighbor (KNN). Algoritma ini bekerja dengan cara menghitung jarak terdekat antara data uji dengan tetangga terdekat pada data latih [27]. Langkah-langkah algoritma KNN adalah sebagai berikut [28].

a. Tentukan berapa banyak jumlah tetangga terdekat sebagai parameter k.

(5)

b. Hitung jarak data uji dengan semua data latih menggunakan Euclidean Distance yang ditunjukkan pada persamaan 6.

d_i= √∑^p_i=1(X_2i− X_1i)² (6)

Dimana d merupakan jarak, p adalah dimensi data, X1 data latih, X2 data uji dan i sebagai variabel data.

c. Urutkan data latih berdasarkan jarak minimum dan tetapkan tetangga terdekat sebanyak k.

d. Cek kategori atau kelas yang dimiliki oleh tetangga terdekat.

e. Hitung kelas mayoritas dari tetangga terdekat sebagai prediksi kelas data uji.

2.9 Evaluasi

Evaluasi pada penelitian ini menggunakan Confusion Matrix. Confusion Matrix digunakan untuk mengevaluasi kinerja model algoritma klasifikasi. Nilai yang ada di Confusion Matrix meliputi TP (True Positive), TN (True Negative), FP (False Positive) dan FN (False Negative). Pengujian dilakukan pada tiap kelas (X) dimana TP adalah jumlah data uji yang terklasifikasi dengan benar ke dalam kelas (X), TN merupakan jumlah uji kelas selain (X) yang terklasifikasikan dengan benar, FP adalah jumlah data uji yang bukan kelas (X) terklasifikasikan sebagai kelas (X) dan FN adalah jumlah data uji dari kelas (X) yang terklasifikasikan ke dalam kelas lain [16]. Confusion matrix menggunakan table matriks seperti yang ditunjukkan pada tabel 3.

Tabel 3. Tabel Confusion Matrix

Prediksi : TRUE Prediksi : FALSE

Aktual : TRUE TP FN

Aktual : FALSE FP TN

Dari tabel 3, hasil evaluasi dihitung dan menghasilkan nilai accuracy, precision dan recall. Nilai dari accuracy, precision dan recall dihitung menggunakan persamaan 7, 8 dan 9.

accuracy = ^∑

TPi + TNi TPi + TNi + FPi + FNi ni=1

n x 100% (7)

precision = ^∑

TPi ( TPi + FPi ) ni=1

n x 100% (8)

recall = ^∑

TPi ( TPi + FNi ) ni=1

n x 100% (9)

Dimana n adalah jumlah kelas, TPi adalah TP pada kelas ke-i, TNi adalah TN pada kelas ke-i, FPi adalah FP pada kelas ke-I dan FNi adalah FN pada kelas ke-i.

3. HASIL DAN PEMBAHASAN

3.1 Persiapan Dataset

Sebelum di load ke Google Colab, seluruh dataset terlebih dahulu melalui proses crop dan rotate dengan bantuan aplikasi Adobe Photoshop hingga memperoleh citra dengan rasio 3 : 1. Hasil pemotongan dan rotasi citra ditunjukkan pada gambar 3.

Gambar 3. Sampel citra (a) asli, (b) setelah proses crop dan rotate

Pada gambar 3, citra sebelah kiri (a) merupakan citra asli dari daun padi dengan penyakit masing-masing dari atas adalah bacterial leaf blight, brown spot dan leaf smut. Sedangkan citra sebelah kanan (b) merupakan hasil crop dan rotate dari citra asli sesuai dengan rasio yang sudah ditentukan. Selanjutnya seluruh citra di import ke dalam Google Colab dengan bantuan library Matplotlib dan kemudian masing-masing citra di resize menjadi

(6)

ukuran 600 x 200 piksel. Tahap selanjutnya adalah merubah citra menjadi citra grayscale. Hasil dari proses ini ditunjukkan pada gambar 4.

Gambar 4. Sampel citra grayscale

Gambar 4 menampilkan citra grayscale atau abu-abu yang sudah di crop dan rotate pada tahap sebelumnya.

Kelas dari masing-masing citra berurutan dari kiri yaitu bacterial leaf blight, brown spot dan leaf smut. Setelah menjadi citra grayscale, langkah selanjutnya adalah mendeteksi tepi objek pada citra menggunakan Canny Edge Detection. Proses ini dilakukan di Google Colab menggunakan library Sci-kit Image. Citra dari hasil deteksi tepi ditampilkan pada gambar 5.

Gambar 5. Sampel citra setelah diolah dengan Canny Edge Detection

Dari gambar 5 bisa dilihat citra hasil dari tahap pengolahan Canny Edge Detection dimana latar belakang citra menjadi gelap dan hanya menampilkan bagian tepi dari objek atau pola yang terdeteksi. Proses selanjutnya adalah melakukan ekstraksi fitur menggunakan GLCM. Karena tujuan penelitian ini adalah melakukan perbandingan hasil dengan Canny Edge Detection dan tanpa Canny Edge Detection, maka tahap ini dilakukan dua kali ekstraksi fitur. Label dari masing-masing kelas yang ditampilkan adalah bacterial leaf blight (blb), leaf smut (ls) dan brown spot (bs). Hasil dari ekstraksi fitur GLCM tanpa deteksi tepi ditampilkan pada tabel 4 dan tabel 5.

Tabel 4. Fitur GLCM data latih tanpa deteksi tepi

Nama File Fitur GLCM

Label Contrast Homogeneity Energy Correlation Entropy

bs_33.jpg 9,726185 0,353980 0,057616 0,961518 3,703873 bs blb_31.jpg 16,286303 0,307249 0,049620 0,975100 4,025791 blb

bs_10.jpg 27,333134 0,289995 0,028061 0,988070 4,774944 bs bs_37.jpg 52,986261 0,191811 0,036168 0,798441 3,822405 bs ls_13.jpg 20,288445 0,266929 0,059429 0,769650 3,280799 ls

… … … …

Tabel 4 menampilkan sebagian hasil ekstraksi fitur GLCM dari data latih yang berjumlah 96 citra grayscale (yang mana Canny Edge Detection tidak diterapkan) beserta nama file dan kelas atau labelnya. Demikian juga seperti yang ditunjukkan pada tabel 5, yang mana menampilkan hasil ekstraksi fitur GLCM dari citra data uji berjumlah 24 citra dan merupakan hasil dari proses grayscale, bukan citra dari hasil Canny Edge Detection.

Tabel 5. Fitur GLCM data uji tanpa deteksi tepi

Label Contrast Homogeneity Energy Correlation Entropy

bs_32.jpg 11,024126 0,339729 0,065994 0,977055 3,640854 bs ls_21.jpg 21,108765 0,260152 0,051438 0,896832 3,598327 ls blb_16.jpg 19,780445 0,269050 0,038367 0,984514 4,303483 blb

bs_35.jpg 11,465218 0,351963 0,074787 0,909379 3,251845 bs ls_10.jpg 31,045395 0,257789 0,055910 0,836961 3,480639 ls

… … … …

Tabel 5 menampilkan sebagian hasil ekstraksi fitur GLCM dari data uji yang berjumlah 24 citra hasil dari tahap grayscale (tanpa Canny Edge Detection) beserta nama file dan kelas atau labelnya. Sedangkan untuk hasil ekstraksi fitur GLCM dengan menggunakan deteksi tepi dapat dilihat pada tabel 6 dan tabel 7.

Tabel 6. Fitur GLCM data latih dengan deteksi tepi

Label Contrast Homogeneity Energy Correlation Entropy

bs_33.jpg 0,001076 0,999462 0,998370 0,507214 0,008593 bs blb_31.jpg 0,027958 0,986021 0,947202 0,630343 0,165500 blb

bs_10.jpg 0,044571 0,977714 0,910205 0,654341 0,251521 bs bs_37.jpg 0,062899 0,968550 0,895529 0,547768 0,266217 bs

(7)

ls_13.jpg 0,003395 0,998303 0,996255 0,170430 0,014634 ls

… … … …

Tabel 6 menunjukkan sebagian hasil ekstraksi fitur GLCM dari data latih yang berjumlah 96 citra hasil dari tahap Canny Edge Detection beserta nama file dan kelas atau labelnya. Sama halnya dengan yang ditunjukkan pada tabel 7, dimana tabel 7 menampilkan hasil ekstraksi fitur GLCM dari citra data uji berjumlah 24 citra dan merupakan hasil dari proses citra menggunakan Canny Edge Detection.

Tabel 7. Fitur GLCM data uji dengan deteksi tepi

bs_32.jpg 0,005731 0,997134 0,992875 0,325862 0,027359 bs ls_21.jpg 0,008672 0,995664 0,989072 0,339981 0,039715 ls blb_16.jpg 0,038479 0,980761 0,938558 0,531373 0,176536 blb

bs_35.jpg 0,004891 0,997555 0,993092 0,450564 0,028626 bs ls_10.jpg 0,016966 0,991517 0,980003 0,259633 0,063268 ls

… … … …

Pada tabel 7 disajikan sebagian hasil ekstraksi fitur GLCM dari data uji yang berjumlah 24 citra hasil dari tahap Canny Edge Detection beserta nama file dan kelas atau labelnya.

3.2 Klasifikasi dan Evaluasi

Pada pengujian pertama, penulis menggunakan data ekstraksi fitur GLCM tanpa Canny Edge Detection. Data yang digunakan adalah data ekstraksi GLCM yang ditunjukkan pada tabel 4 untuk data latih, sedangkan data uji ditampilkan pada tabel 5. Percobaan dilakukan menggunakan parameter k pada KNN dengan nilai 1, 2, 3, 4, 5, 6, 7, 8, 9 dan 10. Kemudian hasil dari klasifikasi KNN dievaluasi menggunakan Confusion Matrix. Tabel Confusion Matrix untuk setiap nilai k ditunjukkan pada gambar 6.

Gambar 6. Hasil Confusion Matrix tanpa deteksi tepi

Gambar 6 menunjukan hasil dari klasifikasi data uji tanpa Canny Edge Detection untuk masing-masing nilai k dan terlihat untuk setiap nilai k memiliki hasil yang berbeda. Sebagai contoh pada nilai k=9, dimana terdapat 3 citra yang sebenarnya masuk dalam kelas (bs) tapi diprediksi sebagai anggota kelas (blb). Terdapat pula 1 citra

(8)

yang merupakan kelas (bs) akan tetapi diklasifikasikan sebagai (ls). Sedangkan prediksi yang sesuai untuk kelas (bs) ada 4 citra. Hal berbeda ditunjukkan pada nilai k=10, dimana ada 6 citra yang merupakan kelas (bs) diprediksi dengan benar. Sedangkan ada 1 citra kelas (bs) diprediksi sebagai kelas (blb) dan 1 citra sebagai kelas (ls). Setelah tabel confusion matrix diperoleh, kemudian dapat dihitung nilai accuracy, precision dan recall. Hasil perhitungan dapat dilihat pada tabel 8.

Tabel 8. Hasil evaluasi pengujian tanpa deteksi tepi Nilai K Accuracy (%) Precision (%) Recall (%)

1 75,00 65,19 62,50

2 66,67 61,39 50,00

3 72,22 64,27 58,33

4 72,22 67,62 58,33

5 72,22 67,06 58,33

6 66,67 58,57 50,00

7 61,11 49,44 41,67

8 55,56 40,48 33,33

9 66,67 53,39 50,00

10 63,89 45,56 45,83

Dari tabel 8 dapat dilihat bahwa untuk setiap k dari pengujian tanpa Canny Edge Detection, accuracy tertinggi diperoleh pada k=1 dengan nilai 75 persen, sedangkan accuracy terendah terjadi pada k=8 dengan 55,56 persen. Nilai precision tertinggi ada pada k=4 dengan 67,62 persen dan terendah pada k=8 dengan angka 40,48 persen. Untuk nilai recall, nilai tertinggi diperoleh pada pengujian dengan k=1 dengan 62,50 persen, sedangkan nilai terendah pada k=8 senilai 33,33 persen.

Pengujian selanjutnya menggunakan data ekstraksi fitur GLCM dengan Canny Edge Detection. Data latih ditunjukkan pada tabel 6 dan data uji ditampilkan pada tabel 7. Pengujian menggunakan nilai k yang sama seperti pada pengujian pertama, yaitu 1, 2, 3, 4, 5, 6, 7, 8, 9 dan 10. Hasil dari pengujian dengan Canny Edge Detection ditunjukkan dengan tabel Confusion Matrix pada gambar 7.

Gambar 7. Hasil confusion matrix dengan deteksi tepi

Gambar 7 menampilkan confusion matrix dari pengujian menggunakan Canny Edge Detection. Berbeda dari pengujian tanpa menggunakan Canny Edge Detection yang ditunjukkan pada gambar 6 dimana untuk setiap nilai k tidak ada tabel confusion matrix yang serupa, pada pengujian kali ini terdapat tabel confusion matrix yang

(9)

identik, yaitu pada nilai k=9 dengan k=10 dan k=4 dengan k=6. Dari gambar 7, kemudian accuracy, precision dan recall bisa dihitung. Hasil dari perhitungan tersebut bisa dilihat pada tabel 9.

Tabel 9. Hasil evaluasi pengujian dengan deteksi tepi Nilai K Accuracy (%) Precision (%) Recall (%)

1 80,56 72,38 70,83

2 80,56 72,22 70,83

3 80,56 71,85 70,83

4 88,89 83,81 83,33

5 86,11 79,44 79,17

6 88,89 83,81 83,33

7 91,67 87,37 87,50

8 86,11 79,05 79,17

9 83,33 75,91 75,00

10 83,33 75,91 75,00

Pengujian dengan menggunakan Canny Edge Detection menghasilkan nilai accuracy tertinggi pada k=7 dengan nilai 91,67 persen, sedangkan untuk nilai terendah yaitu 80,56 persen ada pada k=1, k=2 dan k=3. Untuk precision, hasil tertinggi ada pada k=7 dengan 87,37 persen dan nilai terendah sebesar 71,85 persen ada di k=3.

Nilai recall pada pengujian ini mencapai nilai tertinggi pada k=7 dengan 87,50 persen dan terendah ada di k=1, k=2 dan k=3 dengan nilai 70,83 persen.

Dari dua pengujian yang sudah dilakukan, pengujian dengan menggunakan Canny Edge Detection cenderung mempunyai hasil yang lebih baik daripada pengujian tanpa menggunakan Canny Edge Detection. Salah satu parameter pembandingnya adalah nilai accuracy. Pengujian dengan Canny Edge Detection memiliki nilai accuracy lebih besar dibanding pengujian tanpa menggunakan Canny Edge Detection. Perbandingan hasil accuracy dari kedua pengujian bisa dilihat pada gambar 8.

Gambar 8. Perbandingan nilai accuracy

Pada gambar 8 terlihat bahwa nilai accuracy pada pengujian dengan Canny Edge Detection cenderung naik saat nilai k semakin besar. Berbanding terbalik dengan pengujian tanpa Canny Edge Detection dimana nilai accuracy nya cenderung menurun. Hal serupa juga terjadi pada precision dimana pengujian dengan Canny Edge Detection selalu lebih baik pada setiap parameter k yang diuji. Grafik perbandingan precision ditunjukkan pada gambar 9.

Gambar 9. Perbandingan nilai precision

Pada gambar 9, bisa dilihat bahwa pengujian dengan Canny Edge Detection menghasilkan nilai precision yang cenderung meningkat sesuai dengan kenaikan nilai k. Sedangkan untuk pengujian tanpa Canny Edge Detection, nilai precision justru mengalami penurunan untuk setiap kenaikan nilai k. Untuk recall, hasil yang

(10)

diperoleh cukup serupa dengan dua nilai evaluasi sebelumnya. Berikut grafik perbandingan nilai recall ditampilkan pada gambar 10.

Gambar 10. Perbandingan nilai recall

Gambar 10 menampilkan nilai recall untuk kedua pengujian yang dilakukan. Ketika pengujian menggunakan Canny Egde Detection, ada kecenderungan peningkatan nilai recall saat nilai k semakin bertambah.

Sedangkan pada pengujian tanpa Canny Edge Detection, nilai recall justru mengalami penurunan yang cukup signifikan ketika nilai k ditingkatkan.

4. KESIMPULAN

Pada penelitian ini, percobaan klasifikasi penyakit daun padi menggunakan metode K-Nearest Neighbor (KNN) dengan ekstraksi fitur menggunakan Gray-Level Co-occurrence Matrix (GLCM) dan Canny Edge Detection memperoleh hasil yang cukup baik. Hasil terbaik tercatat saat menggunakan nilai K=7, dengan tingkat accuracy mencapai 91,67%, precision sebesar 87,37% dan recall sebesar 87,50%. Hal ini menunjukkan baiknya kemampuan model dalam mengidentifikasi penyakit daun padi. Pentingnya pemilihan nilai K yang optimal juga terbukti, di mana K=7 menghasilkan performa tertinggi. Terlebih lagi, terdapat peningkatan pada hasil evaluasi ketika Canny Edge Detection diterapkan dibanding tanpa menerapkan Canny Edge Detection. Dengan demikian, dapat disimpulkan bahwa kombinasi KNN, GLCM, dan Canny Edge Detection merupakan pendekatan yang efektif dalam klasifikasi penyakit daun padi, dan memiliki potensi dalam mendukung pemantauan dan diagnosis penyakit pada tanaman padi. Penelitian ini menggunakan Google Colab dan masih berupa kode program untuk pengujian metode saja sehingga kurang efektif untuk dipakai secara langsung di lapangan. Oleh sebab itu disarankan untuk penelitian berikutnya untuk melakukan implementasi metode menggunakan teknologi yang tersedia dan pengujian dilakukan menggunakan data real secara langsung. Selain itu, dapat dipertimbangkan pengembangan antarmuka pengguna yang ramah dan mudah digunakan untuk para petani atau pemangku kepentingan di bidang pertanian.

Hal ini akan membuat metode ini lebih dapat diakses dan berguna dalam konteks yang lebih luas.

REFERENCES

[1] S. Sopialena, S. Suyadi, S. Sofian, D. Tantiani, and A. N. Fauzi, “EFEKTIVITAS CENDAWAN ENDOFIT SEBAGAI PENGENDALI PENYAKIT BLAST PADA TANAMAN PADI (Oryza sativa),” Agrifor, vol. 19, no. 2, p. 355, 2020.

[2] BPS, “Kajian Konsumsi Bahan Pokok 2019,” Badan Pusat Statistik, 2019. [Online]. Available:

https://www.bps.go.id/publication/2021/11/25/68b1b04ce68c7d6a1c564165/konsumsi-bahan-pokok-2019.html.

[Accessed: 02-Oct-2023].

[3] BPS, “Luas Panen dan Produksi Padi di Indonesia 2019 (Hasil Survei Kerangka Sampel Area),” BPS, Statistics Indonesia, 2020. [Online]. Available: https://www.bps.go.id/. [Accessed: 02-Oct-2023].

[4] S. A. M. Harun, M. I. Pradhipta, and U. Achmad, “Perubahan Sosial Masyarakat Akibat Penurunan Kualitas Padi Di Desa Wonojati Kecamatan Jenggawah Kabupaten Jember,” SOCA J. Sos. Ekon. Pertan., vol. 13, no. 1, p. 38, 2019.

[5] E. L. Mique and T. D. Palaoag, “Rice pest and disease detection using convolutional neural network,” ACM Int. Conf.

Proceeding Ser., pp. 147–151, 2018.

[6] J. Boulent, S. Foucher, J. Théau, and P. L. St-Charles, “Convolutional Neural Networks for the Automatic Identification of Plant Diseases,” Front. Plant Sci., vol. 10, no. July, 2019.

[7] M. J. Hasan, S. Mahbub, M. S. Alom, and M. Abu Nasim, “Rice Disease Identification and Classification by Integrating Support Vector Machine with Deep Convolutional Neural Network,” 1st Int. Conf. Adv. Sci. Eng. Robot. Technol. 2019, ICASERT 2019, no. December 2020, 2019.

[8] A. Rahmawati and D. Fitrianingsih, “Aplikasi Bioteknologi pada Tanaman sebagai Alternatif Pencegahan Krisis Pangan,” Agritechpedia J. Agric. Technol., vol. 1, no. 01 SE-Articles, pp. 57–63, Jun. 2023.

[9] R. Silvia, “Pengolahan citra digital dan histogram dengan phyton dan text editor phycharm,” Technol. J. Ilm., vol. 11, no. 3, pp. 181–186, 2020.

[10] R. I. Borman, I. Ahmad, and Y. Rahmanto, “Klasifikasi Citra Tanaman Perdu Liar Berkhasiat Obat Menggunakan Jaringan Syaraf Tiruan Radial Basis Function,” Bull. Informatics Data Sci., vol. 1, no. 1, pp. 6–13, 2022.

[11] I. Wulandari, H. Yasin, and T. Widiharih, “Klasifikasi Citra Digital Bumbu Dan Rempah Dengan Algoritma

(11)

Convolutional Neural Network (Cnn),” J. Gaussian, vol. 9, no. 3, pp. 273–282, 2020.

[12] A. Purnamawati, W. Nugroho, D. Putri, and W. F. Hidayat, “Deteksi Penyakit Daun pada Tanaman Padi Menggunakan Algoritma Decision Tree, Random Forest, Naïve Bayes, SVMdan KNN,” InfoTekJar J. Nas. Inform. dan Teknol. Jar., vol. 5, no. 1, pp. 212–215, 2020.

[13] Isman, Andani Ahmad, and Abdul Latief, “Perbandingan Metode KNN Dan LBPH Pada Klasifikasi Daun Herbal,” J.

RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 3, pp. 557–564, 2021.

[14] B. Sandy, J. K. Siahaan, P. Permana, and M. Muhathir, “Klasifikasi Citra Wayang Dengan Menggunakan Metode k-NN

& GLCM,” in Semantika (Seminar Nasional Teknik Informatika), 2019, vol. 2, no. November, pp. 71–77.

[15] D. P. Pamungkas, “Ekstraksi Citra menggunakan Metode GLCM dan KNN untuk Identifikasi Jenis Anggrek (Orchidaceae),” Innov. Res. Informatics, vol. 1, no. 2, 2019.

[16] R. Andrian, S. Anwar, M. A. Muhammad, and A. Junaidi, “Identifikasi Kupu-Kupu Menggunakan Ekstraksi Fitur Deteksi Tepi (Edge Detection) dan Klasifikasi K-Nearest Neighbor (KNN),” J. Tek. Inform. dan Sist. Inf., vol. 5, no. 2, 2019.

[17] J. Shah, H. Prajapati, and V. Dabhi, “Rice Leaf Diseases,” UCI Machine Learning Repository, 2019. [Online]. Available:

https://archive.ics.uci.edu/dataset/486/rice+leaf+diseases. [Accessed: 01-Oct-2023].

[18] D. Luthfy, C. Setianingsih, and M. W. Paryasto, “Indonesian Sign Language Classification Using You Only Look Once,”

vol. 10, no. 1, pp. 454–459, 2023.

[19] A. N. Zulfa, Jasril, M. Irsyad, F. Yanto, and S. Sanjaya, “Optimasi Convolutional Neural Network NASNetLarge Menggunakan Augmentasi Data untuk Klasifikasi Citra Penyakit Daun Padi,” J. MEDIA Inform. BUDIDARMA, vol. 7, no. April, pp. 696–706, 2023.

[20] K. Azmi, S. Defit, and S. Sumijan, “Implementasi Convolutional Neural Network ( CNN ) Untuk Klasifikasi Batik Tanah Liat Sumatera Barat,” J. UNITEK, vol. 16, no. 1, pp. 28–40, 2023.

[21] D. Efendi, Jasril, S. Sanjaya, F. Syafria, and E. Budianita, “Penerapan Algoritma Convolutional Neural Network Arsitektur ResNet-50 untuk Klasifikasi Citra Daging Sapi dan Babi,” JURIKOM (Jurnal Ris. Komputer), vol. 9, no. 3, pp. 607–614, 2022.

[22] R. Prabowo, A. Afifah, and A. Roudhoh, “Klasifikasi Image Tumbuhan Obat Sirih dan Binahong Menggunakan Metode Convolutional Neural Network (CNN),” J. Komputasi, vol. 10, no. 2, pp. 48–54, Oct. 2022.

[23] N. B. Tsani and H. Harliana, “Implementasi Deteksi Tepi Canny Dengan Transformasi Powerlaw Dalam Mendeteksi Stadium Kanker Serviks,” J. Ilm. Intech Inf. Technol. J. UMUS, vol. 1, no. 01, pp. 22–33, 2019.

[24] Johan Wahyudi and Ihdahubbi Maulida, “PENGENALAN POLA CITRA KAIN TRADISIONAL MENGGUNAKAN GLCM DAN KNN,” J. Teknol. Inf. Univ. Lambung Mangkurat, vol. 4, no. 2, pp. 43–48, Oct. 2019.

[25] L. Safira, B. Irawan, and C. Setianingsih, “K-Nearest Neighbour Classification and Feature Extraction GLCM for Identification of Terry’s Nail,” in 2019 IEEE International Conference on Industry 4.0, Artificial Intelligence, and Communications Technology (IAICT), 2019, pp. 98–104.

[26] M. Ramadhani, S. Suprayogi, and H. B. Dyah, “Klasifikasi Jenis Jerawat Berdasarkan Tekstur Dengan Menggunakan Metode Glcm,” eProceedings Eng., vol. 5, no. 1, 2018.

[27] I. A. Nikmatun and I. Waspada, “IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR,” Simetris J. Tek. Mesin, Elektro dan Ilmu Komput., vol. 10, no. 2, pp. 421–432, 2019.

[28] P. Putra, A. M. H. Pardede, and S. Syahputra, “ANALISIS METODE K-NEAREST NEIGHBOUR (KNN) DALAM KLASIFIKASI DATA IRIS BUNGA,” JTIK (Jurnal Tek. Inform. Kaputama), vol. 6, no. 1, pp. 297–305, 2022.