Klasterisasi Jenis Tanah pada Tanaman Cabai Menggunakan Algoritma K-Means

(1)

DOI: 10.30865/mib.v7i3.6132

Klasterisasi Jenis Tanah pada Tanaman Cabai Menggunakan Algoritma K-Means

Ike Verawati^*, Agnes Lucky Rebecca

Fakultas Ilmu Komputer, Informatika, Univ. Amikom Yogyakarta, Indonesia Email: ^1,*[email protected], ²[email protected]

Email Penulis Korespondensi: [email protected]

Abstrak−Cabai merupakan salah satu bahan pokok bumbu dapur yang banyak digunakan di Indonesia. Peluang penjualan di pasar juga sangat luas sehingga banyak yang berlomba menanam cabai dengan kualitas terbaik. Ada beberapa parameter yang dapat meningkatkan kualitas cabai, salah satunya adalah tanah. Dimana jika dilihat oleh mata, tanah yang cocok ataupun tidak dapat dibedakan dari warna dan juga tekstur, namun tidak banyak orang yang mengetahui perbedaan tersebut sehingga menanam cabai ditanah sembarang yang penting tumbuh. Oleh karena itu, dalam penelitian ini akan dilakukan penelitian tentang clustering citra tanah yang berdasarkan pada fitur warna dan fitur tekstur dengan menggunakan algoritma K-Means yang sebelumnya akan di seleksi fiturnya menggunakan seleksi fitur information gain. Tahapan awal yang dilakukan dalam penelitian ini adalah mengakuisisi citra dan kemudian hasilnya akan di pra-pengolahan. Dari hasil pra-pengolahan akan dilakukan ekstraksi ciri warna RGB dan ciri tekstur orde pertama yang kemudian dilanjutkan dengan seleksi fitur menggunakan information gain yang diharapkan dapat menghasilkan fitur terbaik yang kemudian akan dilanjutkan ke clustering menggunakan algoritma K-Means. Tahapan terakhir yang dilakukan adalah menganalisis untuk mendapatkan hasil dari penelitian ini. Hasil yang diperoleh dari clustering yang telah dilakukan dapat disimpulkan bahwa algoritma K -Means dapat melakukan clustering citra tanah yang cocok dan yang tidak cocok dengan seleksi fitur information gain menghasilkan 63 citra tanah yang cocok dan 37 data citra tanah yang tidak cocok dari 100 citra.

Kata Kunci: K-Means; Information Gain; Cabai; Klasterisasi; Jenis Tanah

Abstract−Chili is one of the ingredients of spices that are widely used in Indonesia. Sales opportunities in the market are also very wide so that many are competing to grow chili with the best quality. There are several parameters that can improve the quality of chili, one of which is soil. Where if seen by the eye, soil that is suitable or unsuitable can be distinguished from color and texture, but not many people know the difference. Therefore, in this study, research will be conducted on the clustering of soil images based on color features and texture features using the K-Means algorithm which previously selected features using information gain feature selection. The first stage in this research is image acquisition and then the results will be processed first. From the results of pre-processing, RGB color feature extraction and first-order texture feature extraction will be carried out which is then followed by feature selection using information gain which is expected to produce the best features which will then proceed to clustering using the K-Meaning algorithm. The final step is to conduct an analysis to obtain the results of this study. The results obtained from the clustering that have been carried out can be obtained that the K-Means algorithm can cluster suitable and unsuitable soil images with information gain, resulting in 63 suitable soil images and 37 unsuitable soi l images from 100.

Keywords: K-Means; Information Gain; Chili, Clusterization; Soil Type

1. PENDAHULUAN

Cabai, merupakan, salah satu bumbu maupun sayuran yang memiliki daya minat yang tinggi, terutama di Indonesia, dikarenakan masyarakat Indonesia menggunakan cabai sebagai bumbu pokok pada masakan sehari- hari[1]. Selain penggunaan di sektor pangan, kebutuhan cabai juga diperlukan dalam produksi obat dan kosmetik[2]. Cabai menghasilkan cita rasa yang pedas dan memberikan sensasi panas, selain hal tersebut cabai juga memiliki berbagai macam senyawa yang baik bagi kesehatan manusia, seperti Lasparaginase dan Capsaicin yang berperan aktif sebagai anti kanker pada tubuh manusia[3]. Cabai juga memiliki vitamin C yang cukup tinggi[4], sehingga dapat memenuhi kebutuhan harian setiap orang, namun jika dikonsumsi secara berlebihan dapat mengakibatkan penyakit perut[5].

Didaerah tropis cabai tumbuh sebagai tanaman tahunan, sedangkan dalam subtropic kedalam tanaman musiman, sehingga di Indonesia seringkali dijumpai tanaman cabai tiap tahunnya[6]. Cabai sudah banyak dibudidayakan di Indonesia dan memiliki nilai jual yang tinggi dan penanaman tanaman yang terbilang cukup mudah. Menurut Nawangsih bahwa tanaman cabai dapat ditanam pada tanah sawah maupun tegalan yang gembur, subur, tidak terlalu liat dan cukup air[7]. Namun para petani, terutama petani yang ada pada daerah Temanggung, Jawa Tengah, menanam tanaman cabai di berbagai lahan yang kosong, bahkan tanah yang sebelumnya ditanami tanaman lainnya seperti, padi, jagung, tembakau ataupun kopi untuk meningkatkan produktivitas. Sehingga dari hal tersebut ada tanaman yang berhasil tumbuh dan tidak karena sering berganti-ganti tanaman dalam satu lahan tanah.

Tanah adalah salah satu faktor yang dapat mempengaruhi keberhasilan dalam menanam tanaman cabai.

Tanah yang ideal untuk menanam cabai adalah tanah yang memiliki PH nettral 6 sampai 7 dan mengandung bahan organik kurang lebih 1,5% dengan ketinggian tanah 0-1.200 mdpl[8], namun daerah dataran tinggi yang berkabut dan memiliki kelembapan yang tinggi dapat mempengaruhi tanaman cabai sehingga mudah terserang penyakit[5].

Secara visual, tanah dapat dibedakan dari warna dan tekstur tanah. Sehingga dari hal tersebut dapat dilakukan

(2)

pengolahan citra tanah sebagai calon media tanaman cabai untuk menentukan apakah tanah tersebut cocok untuk menanam cabai atau bahkan tidak cocok untuk menanam cabai.

Pengolahan citra adalah proses dalam mengolah suatu citra dengan berbagai teknik tertentu yang diproses oleh computer yang bertujuan untuk menghasilkan suatu citra dengan kualitas yang lebih baik[9]. Pengambilan objek dilakukan dengan menggunakan kamera dapat menghasilkan citra digital[10]. Sehingga pola sangat berperan dalam pengolahan citra digital, diantaranya mereduksi ukuran citra yang terlalu besar atau menghilangkan objek- objek yang mengganggu proses pengenalan pola[11]. Tujuan dari pengenalan pola untuk memasukkan data yang ada kedalam berbagai kelas-kelas data[12].

Pengenalan pola dibedakan menjadi dua yaiu, klasifikasi dan clustering. Klasifikasi memasukkan data yang ada kedalam kelas yang sudah ada informasi mengenai data yang akan dikelompokkan[13], sedangkan clustering pengelompokkan data menurut kesamaan karakteristik yang dimiliki oleh data dan belum ada informasi mengenai data yang akan dikelompokkan[14]. Dalam penelitian ini pengenalan pola dilakukan untuk mengelompokkan citra tanah yang cocok untuk tanaman cabai secara visual menggunakan algoritma clustering, yaitu algoritma K-Means.

Dengan algoritma K-Means, dapat dilakukan clustering berdasarkan pada ciri warna dan ciri tekstur yang didapat dari ekstraksi ciri. Data akan dikelompokkan berdasarkan dengan karakteristik yang dimiliki. Dari hasil ekstraksi ciri tersebut, akan dilakukan seleksi fitur menggunakan information gain. Information gain adalah metode yang memberikan nilai untuk setiap fitur dan dapat dilakukan eliminasi fitur yang memiliki nilai rendah[15], hal ini dilakukan karena memungkinkan fitur yang dihasilkan dari proses ekstraksi ciri memberikan fitur yang beragam[16]. Setelah melakukan seleksi fitur maka hasil yang diperoleh akan digunakan untuk proses clustering.

Oky Dwi melakukan identifikasi jenis telur ayam dengan menggunakan algoritma K-Means clustering, dimana proses yang dilakukan dengan pengolahan citra dengan ekstraksi ciri statistik orde pertama dengan menghitung nilai mean, enteropy, skewness variansi dan kurtosis. Penelitian ini bertujuan untuk membedakan kedua jenis ayam Lehorn dan Omega-3 yang melibatkan teknik pengolahan citra K-Means dan PCA. Hasil dari penelitian ini berupa grafik plot ciri mean dan enteropy setelah rotasi kedua menunjukan bahwa metode ekstraksi ciri orde pertama dan metode PCA dapat digunakan unutk membedakan jenis citra telur ayam Lehorn dan Omega- 3 secara signifikan[17].

Frisma, dkk melakukan klasifikasi citra makanan dengan menggunakan ekstraksi ciri warna Hue, Saturation dan Value (HSV) dan ekstraksi ciri tekstur Gray Level Co-Occurrence Matrix (GLCM). Berdasarkan citra yang sudah dilakukan ekstraksi ciri warna dan tekstur kemudia dilakukan seleksi fitur menunggunakan Information Gain untuk mengambil fitur yang rekavan guna meningkatkan akurasi dan mengurangi beban kerja sistem. Hasil dari seleksi fitur kemudian dilakukan klasifikasi dengan K-Nearest Neighbor yang menghasilkan akurasi sebesar 95,24% pada fitur HSV sajja dengan seleksi fitur nilai k=1. Pada kombinasi HSV dan GLCM mampu meningkatkan akurasi menjadi 87,61% dari 57,14% tanpa menggunakan seleksi fitur, demikian pula dengan fitur GLCM meningkat menjadi 74,28% dengan menggunakan Information Gain. Dengan demikian seleksi fitur Information Gain sangat berperan dalam meningkatkan akurasi dan mampu mendapatkan fitur-fitur yang relavan apabila fitur berjumlah banyak. Sedangkan apabila jumlah fitur sedikit, peningkatan akurasi tidaklah terlalu signifikan namun tetap mengurangi beban kerja[18].

Pada penelitian Maulana dan Oke menggunakan ekstraksi ciri warna dan juga ekstraksi ciri bentuk untuk pengenalan objek bunga, untuk pengklasifikasi menggunakan algoritma Naive Bayes dengan tujuan agar mendapatkan akurasi terbaik dalam proses klasifikasi. Citra yang digunakan sebanyak 285 data dengan 19 spesies bunga yang berbeda pada. Data citra yang digunakan dibagi dua bagian, yaitu 228 data tes dan 57 data latih. Hasil dari ekstraksi fitur dan warna menggunakan Morfologi dan Naive Bayes dan pengujian menggunakan metode Cofusion Matrix menghasilkan tingkat akurasi sebesar 71,1% dengan kategori klasifikasi yang baik[19].

Harto Rahmat H. dan Setyawan Widyato, melakukan perbandingan algoritma antara K-Means, Fuzzy C- Means, dan KNN. Data yang digunakan adalah citra lokasi padang rumput, bandara udara, pertambangan, lahan terbuka, hutan, dan rawa. Hasil yang dapat disimpulkan dari penelitian ini adalah akurasi paling baik dengan menggunakan K-Means yang mencapai 94% sedangkan untuk FuzzyC-Means menghasilkan akurasi 88%, dan KNN dengantingkat akurasi sebesar 70%[12].

Pada peneliatian ini akan dilakukan clustering citra tanah yang cocok untuk tanaman cabai, yang sebelumnya akan di seleksi fitur terlebih dahulu untuk meihat apakah penggunaan information gain mempengaruhi hasil dari clustering K-Means.

2. METODOLOGI PENELITIAN

2.1 Tahapan Penelitian

Tahapan penelitian yang akan dilakukan dapat dilihat pada Gambar 1.

(3)

DOI: 10.30865/mib.v7i3.6132

Gambar 1. Alur Penelitian

Terlihat pada Gambar 1 ada enam tahapan yang dilakukan, dimulai dari akuisisi citra yang digunakan sebagai data, dilanjutkan dengan pengolahan data, ekstraksi fitur yang akan digunakan sebagai data, seleksi fitur, clustering menggunakan algoritma K-Means, serta diakhiri dengan analisis dari hasil yang dilakukan dalam penelitian.

2.2 Pengumpulan Data

Pengumpulan data dilakukan dengan mengakuisisi citra menggunakan kamera dengan standarisasi pengaturan kamera dan jarak pengambilan yang kurang lebih 30cm dari permukaan tanah agar citra yang dibuat menghasilkan kualitas yang sama. Proses akuisisi citra dilakukan di wilayah Temanggung, Jawa Tengah. Penentuan pengambilan citra dilakukan didasarkan pada pakar.

2.3 Pra-Pengolahan

Pra-pengolahan yang dilakukan dalam penelitian ini adalah mengolah hasil citra yang sudah diperoleh dan kemudian di proses dengan cropping atau pemotongan citra menjadi lebih kecil[20]. Proses ini dilakukan agar semua citra memiliki ukuran yang sama dan citra tidak besar untuk memudahkan peoses selanjutnya[21]. Standar pemotongan citra yang digunakan adalah 1 : 1 dengan perangkat lunak yang digunakan adalah Microsoft Photos.

2.4 Ekstraksi Ciri

Tahapan selajutnya adalah ekstraksi ciri dari citra tanah. Ekstraksi ciri yang digunakan adalah ekstraksi ciri warna RGB (red, green, blue) karena keseluruh citra tanah yang diambil menggunakan model warna RGB, sehingga tidak perlu dilakukan konversi ke model warna yang lain sehingga dapat menyingkat waktu dalam melakukan ekstraksi ciri. Dan ekstraksi ciri yang kedua adalah ekstraksi ciri tekstur orde pertama (mean, variance, kurtosis sweknees, entropy). Pemilihan menggunakan tekstur orde pertama karena dalam melakukan proses ekstraksi tekstur orde pertama tidak memakan biaya komputasi yang besar, karena perhitungan ekstraksi tekstur orde pertama berdasarkan pada histogram citra[16].

2.5 Seleksi Fitur

Seleksi fitur dilakukan untuk menyeleksi setiap fitur, atribut mana yang nantinya yang akan dipakai atau dibuang[22], dan algoritma yang digunakan adalah information gain. Information gain adalah salah satu algoritma yang dgunakan untuk menentukan batasan dari kepentingan sebuah atribut. Nilai information gain diperoleh dari nilai entropy yang belum dipisah dengan atributnya dikurangi dengan entropy yang telah dipisah dengan atributnya[23]. Atribut yang terpenuhi kriteria pembobotan akan digunakan dalam proses clustering nantinya.

Pemilihan fitur dengan information gain memiliki tiga tahapan, yaitu[24]:

1) Menghitung nilai information gain untuk setiap fitur dalam dataset asli.

2) Menentukan batasan atau threshold yang diinginkan. Dalam hal ini akan memungkinkan sebuah atribut berbobot yang sama dan atau lebih besar dari batas akan dipertahankan dan atribut yang berbeda dibawah batas akan dibuang.

3) Datset yang ada diperbaiki dengan adanya pengaruh atribut. Perhitungan nilai information gain sebagai berikut[24]:

a. Menghitung entropy sebelum atribut dipisah

info(D) = -Σ_i=1^k pilog_2(pi) (1)

Dimana dalam persamaan D adalah jumlah dataset, k jumlah kelas D, dan pi merupakan proposi Di terhadap D.

b. Menghitung entropy setelah atribut dipisah

Pengumpulan Data

Pra- Pengolahan Ekstraksi Ciri

Seleksi Fitur Clustering

K-Means Analisis

(4)

info_A(D) = −Σ_j=1^v ^|Dj|_|D|XInfo(Dj) (2) Dari persamaan (2) A adalah atribut v nilai yang mungkin untuk atribut A, |Dj| merupakan jumlah sampel untuk nilai j, sedangkan |D| jumlah seluruh sampel pada data D, dan info (Dj) adalah total entropy yang memiliki nilai j.

c. Menghitung nilai information gain

Gain(𝐴) = 𝐼𝑛𝑓𝑜(𝐷) − 𝐼𝑛𝑓𝑜_𝐴(𝐷) (3)

Persamaan 3 diperoleh dari pengurangan hasil persamaan 1 dengan persamaan 2. Dengan hasil information gain tersebut akan digunakan sebagai threshold, setiap fitur dirangking sehingga menghasilkan fitur yang terbaik. Dari hasil yang diperoleh maka akan digunakan untuk clustering.

2.6 Clustering K-Means

Algoritma yang digunakan dalam clustering ini adalah algoritma K-means. Pengertian dari K-means adalah K yang dimaksud sebagai konstanta jumlah cluster yang diinginkan, sedangkan Means adalah nilai dari rata-rata suatu grup data atau yang disebut dengan cluster[25]. Sehingga K-means adalah metode penganalisaan data atau metode data mining yang melakukan proses pemodelan tanpa supevisi atau sering dikenal dengan unsupervised dan algoritma K-means adalah salah satu algoritma yang melakukan pengelompokkan dengan system partisi[26].

Data yang diperoleh dari tahapan seleksi fitur akan digunakan dalam proses clustering yang akan dibagi menjadi dua cluster, cluster1 adalah cluster citra yang cocok dan cluster2 adalah cluster yang tidak cocok untuk tanaman cabai. Dalam prosses clustering menggunakan algoritma K-means ada beberapa Langkah yang harus diperhatikan, seperti[27]:

1) Menentukan berapa jumlah K dari data.

2) Menganalisis nilai K pusat cluster (centroid) yang dibangkitkan secara acak.

3) Menghitung jarak setiap data ke masing-masing centroid dengan menggunakan persamaan Euclidean Distance, yaitu [28]:

𝐷(𝑖, 𝑗) = √𝛴_𝑗=1^𝑝 (𝑋_𝑘𝑖− 𝑋_𝑘𝑗)² (4)

Dalam persamaan (4), D(i,j) adalah jarak data ke i ke pusat cluster j, Xki adalah data ke i pada atribut data ke k, sedangkan Xkj adalah data ke j pada atribut data ke k.

4) Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroid.

5) Hitung Kembali centroid baru dengan anggota cluster yang baru.

6) Ulangi Langkah ketiga dan seterusnya hingga mencapai kestabilan dimana tidak ada perubahan pada nilai centroid.

3. HASIL DAN PEMBAHASAN

Tahapan awal dari penelitian ini mengakuisisi citra, hasil dari akuisisi yang dilakukan menghasilkan 100 citra tanah yang dibagi 50 citra yang cocok dengan tanaman cabai dan 50 citra tanah yang tidak cocok dengan tanaman cabai. [pada Gambar 2 merupakan contoh hasil akuisisi citra, dimana Gambar (a) adalah citra tanah yang cocok untuk tanaman cabai dan Gambar (b) adalah citra yang tidak cocok untuk tanaman cabai.

(a) (b)

Gambar 2. Contoh hasil akuisisi citra

Kemudian dari hasil akuisisi tersebut dilakukan pra-pengolahan dengan pemotongan citra. Pemotongan dilakukan dengan skala 1:1 menjadi 1000x1000 piksel. Gambar 3 menunjukkan tahapan pra-pengolahan.

Gambar 3. Hasil pra-pengolahan

Dari hasil cropping tersebut dilanjutkan dengan ekstraksi ciri warna RGB dan ekstraksi ciri orde pertama.

Hasil dari ekstraksi ciri warna dapat dilihat di Tabel 1 dan hasil dari ekstraksi ciri tekstur dapat diliht pada Tabel 2 dibawah ini.

(5)

DOI: 10.30865/mib.v7i3.6132

Tabel 1. Contoh hasil ekstraksi ciri warna Citra Red Green Blue C 01.JPG 0.49 0.41 0.32 C 02.JPG 0.41 0.36 0.34 T 01.JPG 0.54 0.47 0.34 T 02.JPG 0.50 0.43 0.33 Tabel 2. Contoh hasil ekstraksi ciri tekstur

Citra Mean Ent Var Skew Kur

C 01.JPG 108 7 912 0.5 1.1

C 02.JPG 96 7 645 -0.4 0.7

T 01.JPG 122 7 1330 -0.2 -0.9

T 02.JPG 112 8 3608 0.1 -1.10

Dari hasil ekstraksi ciri tersebut, selanjutnya dilakukan seleksi fitur dengan information gain. Dari tahap seleksi fitur ini akan dihasilkan nilai untuk setiap fitur yang dapat diguanakan sebagai threshold dalam proses eliminasi. Hasil dari seleksi fitur dapat dilihat pada Tabel 3.

Tabel 3. Hasil perhitungan information gain No Fitur Information Gain

1 Blue 0,12

2 Entropy 0,14

3 Red 0,15

4 Mean 0,15

5 Kurtosis 0,15

6 Green 0,22

7 Skewness 0,23

8 Variance 0,26

Dari hasil tersebut dapat ditentukan nilai threshold untuk melakukan eliminasi fitur erdasarkan nilai information gain, yaitu 0,12, 0,14, 0,15, 0,22, dan 0,23. Selain melakukan clustering dengan melakukan nilai threshold yang diperoleh dari nilai information gain, dilakukan juga clustering dengan menggunakan nilai threshold 0, yaitu tanpa seleksi fitur sehingga semua fitur yang ada akan digunakan untuk clustering. Sudah ditentukan nilai threshold, maka dilanjutkan dengan proses clustering dengan algoritma K-Means berdasarkan pada warna dan tekstur.

3.1 Implementasi Aplikasi (bila ada) | Proses Clustering

Proses clustering dilakukan dengan parameter yang sama dengan jumlah cluster 2 dengan percobaan pertama dengan seluruh fitur atau threshold adalah 0 akan digunakan. Proses awal dari clustering adalah mencari nilai centroid awal yang diperoleh dengan rata-rata pada data yang ada, nilai centroid dapat dilihat pada Tabel 4.

Tabel 4. Nilai centroid awal Fitur Centroid

Cluster1 Cluster2

Red 0.54 0.53

Green 0.45 .047

Blue 0.36 0.41

Mean 119.36 122.76 Entropy 7.12 7.54 Variance 1496.26 2525.72 Skewness -0.10 -0.15

Kurtosis 0.10 -0.29

Proses yang selanjutnya setelah mengetahui centroid awal maka dilakukan dengan menghitung jarak tiap centroid dengan tiap data dan kemudian akan dialokasikan data tersebut masuk ke dalam cluster mana. Hasil ada pada Tabel 5.

Tabel 5. Hasil iterasi pertama No Cluster1 Cluster2 Alokasi

1 584.37161 1613.7883 c 2 851.58074 1880.9107 c 3 623.0537 411.79733 t

(6)

No Cluster1 Cluster2 Alokasi

… … … …

100 324.35046 1353.7268 c

Setelah melakukan alokasi data, maka didapat hasil iterasi pertama mendapatkan data yang masuk kedalam cluster1 sebanyak 56 data dan pada cluster2 sebanyak 44 data.

Maka dilakukan kembali pencarian nilai centroid yang baru dan dibandingkan dengan nilai centroid sebelumnya, jika berbeda maka dilanjutkan menjadi jarak ke setiap data, jika nilai centroid udah sama maka proses perulangan berhenti. Sehingga pada percobaan ini berhenti pada iterasi yang ke-6 dengan hasil cluster1 memperoleh 63 data dan untuk cluster2 mendapat 37 data. Pada Tabel 6 adalah hasil nilai centroid akhir dengan menggunakan nilai threshold = 0.

Tabel 6. Hasil centroid akhir

Fitur Centroid

Iterasi Cluster1 Cluster2

Red 0.5368254 0.532973

6 Green 0.4515873 0.47891892 Mean 118.873016 0.42432432 Entropy 7.03174603 124.783784 Variance 1338.25397 3156.45946 Skewness -0.0428571 -0.2702703 Kurtosis 0.10952381 -0.4459459

Percobaan kedua dengan menggunakan threshold 0,12 dimana fitur blue tereliminasi sehingga hanya 7 fitur yang digunakan dalam clustering. Langkah-langkah clustering yang dilakukan sama dengan sebelumnya sehingga pada percobaan ini akan ditampilkan hasil akhir. Hasil yang diperoleh dapat dilihat pada Tabel 7.

Tabel 7. Hasil clustering dengan threshold 0,12

Red 0.5368254 0.53297297

6 Green 0.4515873 0.47891892

Mean 118.873016 124.783784 Entropy 7.03174603 7.83783784 Variance 1338.25397 3156.45946 Skewness -0.0428571 -0.2702703 Kurtosis 0.10952381 -0.4459459

Berdasarkan hasil pengamatan pada Tabel 7, tidak ada perubahan centroid maupun iterasi. Percobaan ketiga dengan menggunakan threshold 0,14, dimana data yang digunakan dalam clustering sebanyak 6 data dengan fitur yang terliminasi adalah blue dan entropy. Hasil yang diperoleh tersedia pada Tabel 8.

Red 0.5368254 0.53297297

6 Green 0.4515873 0.47891892

Mean 118.873016 124.783784 Variance 1338.25397 3156.45946 Skewness -0.0428571 -0.2702703 Kurtosis 0.10952381 -0.4459459

Berdasarkan hasil pengamatan Tabel 8 dapat dilihat bahwa tidak ada perubahan data dan iterasi. Dan data yang masuk pada cluster1 sebanyak 63 data citra dan 37 data citra masuk kedalam cluster2. Percobaan yang keempat dengan menggunakan nilai threshold 0,15 dengan data yang digunakan sebanyak 3, yaitu green, variance, dan skewness. Hasil yang diperoleh dapat dilihat pada Tabel 9.

Green 0.4515873 0.47891892 Variance 1338.25397 3156.45946 6

(7)

DOI: 10.30865/mib.v7i3.6132

Skewness -0.0428571 -0.2702703

Hasil yang diperoleh mendapat perulangan sebanyak 6 kali. Percobaan kelima yang dilakukan adalah percobaan clustering dengan nilai threshold 0,22 dengan menggunakan fitur variance dan skewness. Hasil yang diperoleh dapat dilihat di Tabel 10.

Variance 1338.25397 3156.45946 Skewness -0.0428571 -0.2702703 6

Dari tabel 10 tidak ada perubahan yang terjadi, hasil masih sama dengan sebelumnya dengan perulangan 6 kali.

Percobaan terakhir atau percobaan yang keenam dengan threshold 0,23, fitur yang digunakan hanya dengan variance. Dengan hasil tertera pada Tabel 11.

Variance 1338.25397 3156.45946 6

Pada percobaan keenam pun tidak ada perubahan centroid dan hasil iterasi yang terjadi sebanyak 6 kali perulangan. Data yang masuk pada cluster1 sebanyak 63 data dan 37 data masuk kedalam cluster2.

Dari semua percobaan yang telah dilakukan dapat dibuat tabel untuk menjadi pembanding dari percobaan pertama hingga keenam. Sehingga dapat dianalisis hasil percobaan yang telah dilakukan.

Tabel 12. Analisis hasil clustering

Threshold Fitur Iterasi Jumlah data

Cluster1 Cluster2 Tanpa seleksi

fitur

Semua fitur 6 63 37

0,12 Red, Green, Mean, Entropy, Variance, Skewness, Kurtosis

6 63 37

0,14 Red, Green, Mean, Variance, Skewness, Kurtosis 6 63 37

0,15 Green, Variance, Skewness 6 63 37

0,22 Variance, Skewness 6 63 37

0,23 Variance 6 63 37

Dari Tabel 12, terlihat tidak ada perubahan data maupun iterasi, ini terjadi karena nilai centroid awal tidak ada perubahan sehingga jumlah iterasi juga tidak ada perubahan. Tidak ada perubahan data pada cluster1 dan cluster2 karena hasil dari nilai centroid akhir tidak ada perbedaan pada semua percobaan. Dari percobaan yang terjadi seleksi fitur menggunakan information gain tidak berpengaruh karena tidak adanya perpindahan data ataupun perubahan hasil. Seberapa banyak fitur yang digunakan tidak mempengaruhi hasil bahkan tidak mempengaruhi nilai centroid, karena K-Means merupakan algoritma yang mencari nilai centroid dengan rata-rata pada setiap fitur bukan rata-rata semua data sehingga jika satu fitur tidak digunakan maka tidak akan merubah nilai centroid dan hasil akhir.

Hasil akhir dari clustering adalah terdapat 63 data yang masuk kedalam cluster1 dimana cluster1 adalah kelompok citra tanah yang cocok untuk tanaman cabai dan 37 data yang masuk kedalam cluster2, dimana cluster2 adalah kelompok data citra tanah yang tidak cocok untuk tanaman cabai. Karena hasil setiap percobaan menghasilkan data yang sama sehingga dari centroid terakhir dapat digunakan untuk menentukan jenis tanah yang seperti apa yang cocok untuk tanaman cabai.

Sedangkan dari segi tekstur bahwa parameter mean pada cluster1 lebih rendah diandingkan dengan cluster2, begitu juga dengan entropy nilai pada cluster1 lebih rendah dari cluster2, dan pada parameter variance juga lebih rendah cluster1 daripada cluster2. Namun berbeda dengan parameter skewness dan kurtosis, cluster1 lebih tinggi daripada cluster2.

Sehingga dari semua parameter tersebut dapat digunakan untuk mengetahui tanah seperti apa yang cocok untuk tanaman cabai dilihat dari teksturnya. Tanah yang cocok untuk tanaman cabai adalah tanah yang partikelnya cenderung lebih rapi bahkan tersusun atau bisa dibilang nilai entropy lebih rendah daripada citra tanah yang tidak cocok untuk tanaman cabai yang partikelnya cenderung tidak teratur dibuktikan dengan nilai entropy yang lebih

(8)

tinggi. Dari parameter variance, citra tanah yang cocok untuk tanaman cabai adalah tanah yang memiliki partikel saling berdekatan terlihat dari nilai variance untuk tanah yang cocok lebih rendah dibanding dengan variance tanah yang tidak cocok untuk tanaman cabai yang partikelnya cenderung tersebar. Sehingga dapat dikatakan bahwa dari segi tekstur, citra tanah yang cocok untuk tanaman cabai memiliki tekstur yang halus atau partikel yang kecil dan padat, sedangkan untuk citra tanah yang tidak cocok untuk tanaman cabai adalah sebaliknya yaitu kasar atau partikel yang cenderung lebih besar dan tidak terlalu padat.

4. KESIMPULAN

Bersumber pada percobaan dan telah dianalisis semua percobaan yang ada sehingga dapat disimpulkan bahwa pada penelitian ini sleeksi fitur dengan information gain tidaklah berpengaruh pada algoritma K-Means, terlihat dari tidak adanya perubahan nilai centroid dan hasil dari clustering. Hasil dari clustering mendapatkan 63 data yang mesuk kedalam cluster1, dimana cluster1 adalah citra tanah yang cocok dengan tanaman cabai dan 37 data yang masuk kedalam cluster2 yaitu cluster citra tanah yang tidak cocok untuk tanaman cabai. Dilihat dari segi warna, citra yang cocok untuk tanaman jenis cabai adalah citra yang memiliki warna coklat yang lebih gelap sedangkan dari segi tekstur, tanah yang cocok untuk menanam tanaman cabai adalah tanah yang memiliki tekstur yang halus atau partikel yang kecil dan padat, sedangkan untuk citra tanah yang tidak cocok untuk tanaman cabai adalah sebaliknya yaitu kasar atau partikel yang cenderung lebih besar dan tidak terlalu padat.

REFERENCES

[1] A. A. Cahya dan R. H. Br Bangun, “Karakteristik Petani dan Kelayakan Usahatani Cabai Besar (Capsiccum Annum L) dan Cabai Rawit (Capsiccum Frutescens L) di Sumatera Utara,” Agricore J. Agribisnis dan Sos. Ekon. Pertan. Unpad, vol. 5, no. 1, hal. 49–58, 2020, doi: 10.24198/agricore.v5i1.27139.

[2] N. Chesaria, Sobir, dan M. Syukur, “Analisis Keragaan Cabai Rawit Merah (Capsicum frutescens ) Lokal Asal Kediri dan Jember,” Bul. Agrohorti, vol. 6, no. 3, hal. 388–396, 2018, doi: 10.29244/agrob.v6i3.21107.

[3] I. Nuraeni dan T. Rostinawati, “Perkembangan Produksi Hasil Metabolisme Sekunder Capsaicin Dengan Berbagai Metode in Vitro,” Farmaka, vol. 16, no. 1, hal. 231–239, 2018, [Daring]. Tersedia pada:

http://journal.unpad.ac.id/farmaka/article/view/17457.

[4] F. Prajnanta, Agribisnis Cabai Hibrida, Cet.14. Jakarta: Penebar Swadaya, 2007.

[5] M. A. Tatengkeng, “Kadar Vitamin C Cabai Rawit (Capsicum frutescens L) Hasil Ozonasi Selama Penyimpanan Suhu Ruang,” Pas. Food Technol. J., vol. 6, no. 2, hal. 102–104, Jul 2019, doi: 10.23969/pftj.v6i2.1296.

[6] Zulkarnain, Budidaya Sayuran Tropis, Cet.3. Jakarta: Bumi Aksara, 2018.

[7] A. A. Nawangsih, H. P. Imdad, dan A. Wahyudi, Cabai Hot Beauty, 1 ed. Jakarta: Penebar Swadaya, 1999.

[8] D. T. Hapsari, Tiada Henti Panen Cabai : Panduan Budidaya Cabai Sepanjang Musim di Sawah dan Pot, 1 ed.

Yogyakarta: Trimedia Pustaka, 2011.

[9] P. S. A. P. Wulandari, K. T. Martono, dan I. P. Windasari, “Pengembangan Sistem Pendeteksi Gesture Angka pada Tangan secara Realtime Berbasis Android,” Edu Komputika J., vol. 7, no. 1, hal. 1–9, Jun 2020, doi:

10.15294/edukomputika.v7i1.38655.

[10] R. Kuswandhie, J. Na’am, dan Yuhandri, “Pengukuran Tinggi Sebenarnya Objek pada Foto Digital Menggunakan Euclidean Distance,” J. Resti (Rekayasa Sist. dan Teknol. Informasi), vol. 2, no. 1, hal. 367–374, Apr 2018, doi:

10.29207/resti.v2i1.334.

[11] M. H. Purnomo dan A. Muntasa, Konsep Pengolahan Citra Digital dan Ekstraksi Fitur. Yogyakarta: Graha Ilmu, 2010.

[12] H. R. Harbelubun dan S. Widyarto, “Menentukan Lahan Tanaman Apel dengan Clustering Citra Digital Tanah,” Proc.

Informatics Conf., vol. 6, no. 11, hal. 41–44, 2020, [Daring]. Tersedia pada:

https://ojs.journals.unisel.edu.my/index.php/icf/article/view/75?articlesBySameAuthorPage=4.

[13] D. T. Worung, S. R. U. A. Sompie, dan A. Jacobus, “Implementasi K-Means dan K-NN pada Pengklasifikasian Citra Bunga,” J. Tek. Inform., vol. 15, no. 3, hal. 217–222, 2020, [Daring]. Tersedia pada:

https://ejournal.unsrat.ac.id/v3/index.php/informatika/article/view/31965.

[14] I. K. Fauzia, B. A. Dermawan, dan T. N. Padilah, “Penerapan K-Means Clustering pada Penyakit Infeksi Saluran Pernapasan Akut (ISPA) di Kabupaten Karawang,” J. Sist. dan Inform., vol. 15, no. 1, hal. 81–87, Nov 2020, doi:

10.30864/jsi.v15i1.350.

[15] M. R. Hasibuan dan Marji, “Pemilihan Fitur dengan Information Gain untuk Klasifikasi Penyakit Gagal Ginjal menggunakan Metode Modified K-Nearest Neighbor (MKNN),” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no.

11, hal. 10435–10443, 2019, [Daring]. Tersedia pada: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/6691.

[16] D. A. Bimantoro dan S. Uyun, “Pengaruh Penggunaan Information Gain untuk Seleksi Fitur Citra Tanah dalam Rangka Menilai Kesesuaian Lahan pada Tanaman Cengkeh,” J. Inform. Sunan Kalijaga, vol. 2, no. 1, hal. 42–52, 2017, doi:

10.14421/jiska.2017.21-06.

[17] O. D. Nurhayati, “Pengolahan Citra untuk Identifikasi Jenis Telur Ayam Lehorn dan Omega-3 Menggunakan K-Mean Clustering dan Principal Component Analysis,” J. Sist. Inf. BISNIS, vol. 10, no. 1, hal. 84–93, Jun 2020, doi:

10.21456/vol10iss1pp84-93.

[18] F. Y. Nabella, Y. A. Sari, dan R. C. Wihandika, “Seleksi Fitur Information Gain Pada Klasifikasi Citra Makanan Menggunakan Hue Saturation Value dan Gray Level Co-Occurrence Matrix,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 2, hal. 1892–1900, 2019, [Daring]. Tersedia pada: https://j-ptiik.ub.ac.id/index.php/j- ptiik/article/view/4605.

(9)

DOI: 10.30865/mib.v7i3.6132

[19] M. Fansyuri dan O. Hariansyah, “Pengenalan Objek Bunga dengan Ekstraksi Fitur Warna dan Bentuk Menggunakan Metode Morfologi dan Naïve Bayes,” J. Sist. dan Inform., vol. 15, no. 1, hal. 70–80, Nov 2020, doi:

10.30864/jsi.v15i1.338.

[20] D. Putra, Pengolahan Citra Digital, 1 ed. Yogyakarta: Andi, 2010.

[21] M. Hamid, A. A. H. Usman, S. Lutfi, A. Fuad, dan A. Mubrak, “Penerapan Metode Peningkatan Kualitas Citra Contrast Stretching dan Histogram Equalization untuk Identifikasi Keaslian Citra Sertipikat Hak atas Tanah,” Jiko (Jurnal Inform.

dan Komputer), vol. 5, no. 2, hal. 92–98, Agu 2022, doi: 10.33387/jiko.v5i2.4635.

[22] U. Mutmainnah, B. D. Setiawan, dan C. Dewi, “Pengaruh Seleksi Fitur Information Gain pada K-Nearest Neighbor untuk Klasifikasi Tingkat Kelancaran Pembayaran Kredit Kendaraan,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no.

9, hal. 8882–8888, 2019, [Daring]. Tersedia pada: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/6296.

[23] R. K. Dinata, H. Novriando, N. Hasdyna, dan S. Retno, “Reduksi Atribut Menggunakan Information Gain untuk Optimasi Cluster Algoritma K-Means,” J. Edukasi dan Penelit. Inform., vol. 6, no. 1, hal. 48–53, Apr 2020, doi:

10.26418/jp.v6i1.37606.

[24] Z. N. Syarif, “Penerapan Information Gain Dan Algoritma K-Means Untuk Klasterisasi Kedisiplinan Pegawai Menggunakan Rapidminer,” TeknoIS J. Ilm. Teknol. Inf. dan Sains, vol. 13, no. 1, hal. 1–12, Feb 2023, doi:

10.36350/jbs.v13i1.165.

[25] R. Helilintar dan I. N. Farida, “Penerapan Algoritma K-Means Clustering Untuk Prediksi Prestasi Nilai Akademik Mahasiwa,” J. Sains dan Inform., vol. 4, no. 2, hal. 80–87, Nov 2018, doi: 10.34128/jsi.v4i2.140.

[26] A. Triningsih dan H. Supriyono, “Aplikasi Data Mining Berbasis Web Menggunakan Metode K-Means Clustering Untuk Pengelompokan Penjualan,” J. Insypro (Information Syst. Process., vol. 4, no. 1, hal. 1–7, 2019, [Daring]. Tersedia pada:

https://journal.uin-alauddin.ac.id/index.php/insypro/article/view/6889.

[27] B. Harahap, “Penerapan Algoritma K-Means Untuk Menentukan Bahan Bangunan Laris (Studi Kasus Pada UD. Toko Bangunan YD Indarung),” Reg. Dev. Ind. Heal. Sci. Technol. Art Life, vol. 2, no. 1, hal. 394–403, 2019, [Daring].

Tersedia pada: https://ptki.ac.id/jurnal/index.php/readystar/article/view/82.

[28] D. Praseptian M, A. Fadlil, dan Herman, “Penerapan Clustering K-Means untuk Pengelompokan Tingkat Kepuasan Pengguna Lulusan Perguruan Tinggi,” J. MEDIA Inform. BUDIDARMA, vol. 6, no. 3, hal. 1693–1700, Jul 2022, doi:

10.30865/mib.v6i3.4191.