KLASIFIKASI TANAH HUMUS BERDASARKAN CITRA
RBG
MENGGUNAKAN METODE
K-NEAREST
NEIGHBOR (K-NN)
Danang Aji Bimantoro
Program Studi Teknik Informatika, Fakultas Sains dan Teknologi,
UIN Sunan Kalijaga Yogyakarta
e-mail :
13651060@student.uin-suka.ac.id
Abstrak
Tanah merupakan suatu elemen penting dalam kehidupan. Tanah memiliki jenis yang sangat beraneka ragam dan terkadang beberapa orang awam bingung dalam membedakan jenis tanah tersebut, terutama tanah humus yang sering digunakan untuk bercocok tanam ataupun berkebun. Dengan klasifikasi yang dilakukan ini akan mempermudah membedakan khususnya tanah humus dengan jenis tanah lain. Penelitian ini memanfaatkan fitur warna yang dimiliki tanah. Sedangkan untuk metode klasifikasinya menggunakan K-Nearest Neighbor. Aplikasi klasifikasi dikembangkan dengan menggunakan PHP5 dan MariaDB. Akurasi klasifikasi dengan presentase 67% data sampel dan 33% data uji adalah 100%.
Kata kunci – K-Nearest Neighbor, tanah humus, citra RGB, image processing
1. PENDAHULUAN
ndonesia merupakan negara terdiri dari jutaan gugusan pulau, dan tentunya banyak sekali sekali kekayaan sumber daya alam didalamnya, mulai dari flora, fauna, hasil tambang, dan lain sebagainya. Salah satu elemen kekayaan alam yang ada di Indonesia adalah tanah. Jenis tanah yang berada di Indonesia sangatlah bervariasi, salah satunya adalah tanah humus. Tanah humus merupakan tanah yang sangat subur, tanah ini terbentuk oleh pelapukan daun, batang pohon dan bahan organik lainnya (seperti bangkai binatang). Bahan organik tersebut dirombak oleh organisme dalam tanah. Tanah humus memiliki karakteristik yaitu berwarna coklat kehitaman, tanah ini banyak mengandung senyawa fenol, asam karboksilat, dan alifatik hidroksida, tanah ini juga memiliki daya serap air yang baik. Tanah ini sangat mudah ditemui di hutan hujan tropis yang lebat[1]
.
Tanah humus sangat baik untuk pertumbuhan tanaman, karena mengandung banyak senyawa yang dibutuhkan tanaman. Namun terjadi problematika untuk menentukan apakah tanah tersebut termasuk tanah humus atau bukan, munculah sebuah pertanyaan“Bagaimana menentukan suatu tanah termasuk tanah humus atau tidak tanpa harus melakukan uji lab terlebih dahulu ?”. Salah satu solusi yang dapat digunakan adalah melakukan klasifikasi tanah humus menggunakan metode K-Nearest Neighbor memanfaatkan citra RGB dari tanah tersebut.
Klasifikasi adalah teknik data mining yang digunakan untuk memprediksi kategori dari objek yang belum memiliki kategori. ada beberapa metode yang dapat digunakan, salah satunya adalah klasifikasi yang secara langsung menggunakan data pembelajaran untuk menentukan kategori dari data baru yang ingin ditentukan kategorinya. metode ini dikenal dengan namaK-Nearest Neighbor (K-NN).
Metode K-Nearest Neighbor merupakan metode yang banyak digunakan untuk klasifikasi. Beberapa penelitian yang memanfaatkan metode K-NN untuk klasifikasi menunjukkan hasil yang bagus, akurasi yang dihasilkan cukup akurat dikisaran 80% sampai 95%. Penelitian yang menggunakan metode K-NN salah satunya adalah “Klasifikasi Daun dengan Perbaikan Fitur Citra Menggunakan Metode K-Neares Neighbor”penelitian tersebut menggunakan ekstraksi fiturInvariant Moment, dan hasil penelitian tersebut menunjukkan akurasi sebesar 86,67%. Penelitian lainnya yang menggunakan metode K-NN adalah “Pengenalan Wajah Menggunakan K-Nearest Neighbor Dengan Praproses Transformasi Wavelet”. Penelitian tersebut menggunakan praproses transformasi wavelet untuk mendapatkan fitur yang dibutuhkan dari sebuah citra wajah, penelitian ini memiliki akurasi sebesar 95 %.
Berdasarkan hasil dari beberapa penelitian yang menunjukkan akurasi yang cukup tinggi menggunakan metode K-Nearest Neighbor, maka dalam penelitian kali ini diputuskan untuk menggunakan metode tersebut sebagai metode untuk klasifikasi tanah humus.
2. LANDASAN TEORI
Beberapa teori yang menjadi landasan dalam pengerjaan penelitian ini adalah sebagai berikut :
2.1. Pengolahan Citra
Pengolahan citra adalah pemrosesan citra atau image processing, khususnya dengan menggunakan komputer menjadi citra yang kualitasnya lebih baik. Dengan kata lain pengolahan citra adalah kegiatan memperbaiki kualitas citra agar mudah diinterpretasi oleh manusia atau mesin (komputer)[2].
2.2. Representasi Warna
Representasi warna terdiri dari tiga unsur utama yaitu merah (red),hijau (green),dan biru (blue). Gabungan tiga warna ini membentuk warna-warna lainnya berdasarkan intensitas dari masing-masing warna tersebut dengan intesitas maksimal, dan warna hitam merupakan gabungan dari ketiga warna tersebut dengan intensitas minimal.
2.3. Histogram Warna
Histogram warna atau color histogram adalah representasi distribusi warna dalam sebuah gambar yang didapatkan dengan menghitung jumlah pixel dari setiap bagian range warna, secara tipikal dalam dua dimensi atau tiga dimensi. Dalam pembuatan histogram, nilai RGB mempunyai range dari 0 sampai 255 akan punya kemungkinan kombinasi warna sebesar 16777216 (didapat dari: 255 x 255 x 255)[2].
2.4. K-Nearest Neighbor (K-NN)
AlgoritmaK-Nearest Neighbor (K-NN)adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing – masing dimensi merepresentasikan fitur dari data[3].
K-Nearest Neighbor termasuk kedalam metode yang menggunakan supervised learning. Supervised learning merupakan algoritma yang bertujuan untuk menemukan pola baru dari data dengan cara mengubungkan dengan pola data yang sudah ada.
3. METODE PENELITIAN
Metodologi dalam pengerjaan penelitian ini adalah sebagai berikut :
Gambar 1 Diagram alur penelitian
3.1Studi Literatur
Studi ini dilakukan untuk mengetahui fitur-fitur yang dimiliki oleh tanah secara keseluruhan, studi ini menjadi landasan pemilihan fitur yang akan digunakan untuk proses klasifikasi tanah humus. Berdasarkan studi yang sudah dilakukan setiap jenis tanah memiliki warna yang berbeda-beda, oleh karena itu fitur yang digunakan adalah warna(RGB).
Selain studi tentang tanah, studi literatur yang dilakukan adalah studi tentang image processingdan juga metode K-Nearest Neighbor.
3.2Pra Proses
Proses ini adalah proses yang dilakukan sebelum melakukan proses klasifikasi. Didalam praproses ini hal yang dilakukan adalah sebagai berikut :
2.1.1Pengumpulan Data
Data yang dikumpulkan adalah citra tanah yang didapatkan dengan cara observasi langsung ke lapangan. Dalam pengumpulan data ini terdapat standarisasi terhadap teknis pengambilan citra, yaitu masalah alat, konfigurasi kamera, pencahayaan, dan waktu.
Pengolahan citra yang dilakukan adalah proses cropping, yaitu memotong citra menjadi ukuran yang lebih kecil, tepatnya 300 x 300. Hal ini dilakukan agar proses klasifikasi tidak memakan terlalu lama karena data pikses terlalu banyak.
2.1.3Histogram Warna
Dalam tahapan ini dibuat histrogram warna dari citra untuk mendapatkan data warna (RGB), yang sebenarnya akan digunakan dalam klasifikasi adalah data dari histrogram warna ini.
3.3Proses Klasifikasi Tanah Humus
Setelah mendapatkan data dari citra, proses yang selanjutnya dilakukan adalah melakukan klasifikasi dengan menggunakan metode K-Nearest Neighbor. Alur dari pada klasifikasi ini adalah sebagai berikut :
1. Menentukan parameter k (jumlah tetangga paling dekat).
2. Menghitung kuadrat jarak euclidean (euclidean distance) masing-masing obyek terhadap
data sampel yang diberikan.
3. Mengurutkan objek-objek tersebut ke dalam kelompok yang mempunyai jarak euclidean
terkecil.
4. Mengumpulkan kategori y (klasifikasi nearest neighbor)[4].
4. HASIL DAN PEMBAHASAN 4.1Pengumpulan Data
Data yang dikumpulkan adalah citra tanah yang didapatkan dengan cara observasi langsung ke lapangan yaitu di daerah Dukuh, Gerbosari,Samigaluh, Kulon Progo). Data diambil dengan menggunakan kamera smartphone 13 megapiksel dalam kurun waktu yang berdekatan. Pengambilan data citra tanah ini dilakukan pada hari senin 24 Okbober 2016.
Hasil dari pengambilan data citra ini adalah sebagai berikut :
Gambar 3 Data citra tanah nonhumus
4.2Pengolahan Citra
Setelah didapatkan data citra, proses selanjutnya adalah pengolahan terhadap citra tersebut. Dalam proses ini citra mengalami crop atau pemotongan. Pemotongan citra ini dilakukan untuk memperkecil area dari citra tersebut sehingga komputasi yang dilakukan oleh mesin akan lebih cepat.
Proses pemotongan citra dilakukan secara manual menggunakan aplikasi pengolah citra (GIMP). Citra dipotong menjadi ukuran 300px * 300px dari ikuran aslinya yaitu 4192px * 3104px;
4.3Histogram Warna
Citra yang sudah melewati proses pemotongan menjadi 300px * 300px selanjutnya akan dilakukan ekstraksi fitur, yaitu menggunakan histogram warna. Proses ini akan menghasilkan nilai R, G, dan B dari setiap citra. Untuk perhitungannya menggunakan rumus berikut :
Keterangan :
(R, G, B)i = NilaiR, G,danBpada piksel ke -i n = Jumlah keseluruhan piksel pada citra
Berikut ini adalah hasil dari ekstraksi fitur (histogram warna) dari citra yang sudah dikumpulkan :
a. Citra Tanah Humus
No Citra Nama File Rata-Rata Warna Normalisasi Warna
No Citra Nama File Rata-Rata Warna Normalisasi Warna
Tabel 1 Histogram warna citra tanah humus
b. Citra Tanah Nonhumus
No Citra Nama File Rata-Rata Warna Normalisasi Warna
No Citra Nama File Rata-Rata Warna Normalisasi Warna
4.4Klasifikasi K-Nearest Neighbor
Setelah mengetahui nilai R, G dan B dari proses ekstraksi fitur tahapan selanjutnya adalah melakukan klasifikasi. Dalam penelitian ini proses metode K-Nearest Neighbor diterapkan dalam bahasa pemrograman php, sehingga insfrastruktur yang dibutuhkan adalah web server, PHP5, dan DBMS (Database Management System). Dalam penelitian ini, web server yang digunakan adalahApache2danDBMSyang digunakan adalahMariaDB.
Dalam penelitian ini, data yang sudah dikumpulkan akan dibagi menjadi dua, yaitu data sampel dan data uji. Data sampel adalah data yang akan digunakan oleh K-Nearest Neighbor sebagi referensi dalam melakukan klasifikasi, sedangkan data uji adalah data yang digunakan untuk pengujian klasifikasi. Dari 22 data citra (9 humus dan 13 nonhumus) tidak akan digunakan seluruhnya. Untuk penelitian ini akan menggunakan 10 data sample (5 humus dan 5 nonhumus) sebagai berikut :
Citra Tanah Humus Citra Tanah Nonhumus
Humus1.jpg Nonhumus2.jpg
Humus2.jpg Nonhumus3.jpg
Humus3.jpg Nonhumus7.jpg
Humus4.jpg Nonhumus8.jpg
Humus5.jpg Nonhumus10.jpg
Tabel 3 Daftar data sampel
Sedangkan data uji dalam penelitian ini menggunakan 5 data citra yang dipilih secara acak dan bukan merupakan anggota data sampel. Data uji yang digunakan adalah sebagai berikut :
Citra Tanah Jenis
Tabel 4 Daftar data uji
Berikut ini adalah tampilan dari aplikasi yang sudah dibuat untuk penelitian ini :
Gambar 4 Menu utama aplikasi
Gambar 5 Halaman manajemen data sampel (datatraining)
Sebelum digunakan nilai dari masing-masing R, G, dan B sudah dibulatkan menjadi bilangan bulat terlebih dahulu, berikut ini adalah data sampel yang digunakan:
Kode Citra R G B Jenis
ds1 Humus1.jpg 101 90 86 Humus
ds2 Humus2.jpg 141 128 124 Humus
ds3 Humus3.jpg 130 116 109 Humus
ds4 Humus4.jpg 155 143 130 Humus
ds5 Humus5.jpg 105 92 83 Humus
ds6 Nonhumus2.jpg 198 186 166 Nonhumus
ds7 Nonhumus3.jpg 206 190 157 Nonhumus
ds8 Nonhumus7.jpg 221 191 113 Nonhumus
ds9 Nonhumus8.jpg 237 181 124 Nonhumus
ds10 Nonhumus10.jpg 233 175 116 Nonhumus
Tabel 5 Kode dan nilai warna data sampel
Data citra yang akan di lakukan pengujian adalah sebagai berikut :
Kode Citra R G B Jenis
du1 humus6.jpg 165 155 148 humus
du2 nonhumus13.jpg 222 180 135 nonhumus
du3 humus7.jpg 114 107 99 humus
du4 nonhumus9.jpg 239 175 104 nonhumus
du5 nonhumus12.jpg 197 163 130 nonhumus
Tabel 6 Kode dan nilai warna pada data uji
a. Data uji 1 (du1)
No Data Jarak Jenis
1 du1 - ds4 23.83275058 humus
2 du1 - ds2 43.37049688 humus
3 du1 - ds6 48.72371086 nonhumus
4 du1 - ds7 54.65345369 nonhumus
5 du1 - ds3 65.32227798 humus
Data uji 1 (du1) = Humus
Tabel 7 data jarak terdekat data uji 1
b. Data uji 2 (du2)
No Data Jarak Jenis
1 du2 - ds9 18.62793601 nonhumus
2 du2 - ds10 22.5166605 nonhumus
3 du2 - ds8 24.61706725 nonhumus
4 du2 - ds7 28.98275349 nonhumus
5 du2 - ds6 39.66106403 nonhumus
Data uji 2 (du2) = Nonhumus
Tabel 8 data jarak terdekat data uji 2
c. Data uji 3 (du3)
No Data Jarak Jenis
1 du3 - ds3 20.90454496 humus
2 du3 - ds5 23.70653918 humus
3 du3 - ds1 25.03996805 humus
4 du3 - ds2 42.36744033 humus
5 du3 - ds4 62.75348596 humus
Data uji 3 (du3) = Humus
d. Data uji 4 (du4)
No Data Jarak Jenis
1 du4 - ds10 13.41640786 nonhumus
2 du4 - ds9 20.97617696 nonhumus
3 du4 - ds8 25.70992026 nonhumus
4 du4 - ds7 64.21059103 nonhumus
5 du4 - ds6 75.13986958 nonhumus
Data uji 4 (du4) = Nonhumus
Tabel 10 data jarak terdekat data uji 4
e. Data uji 5 (du5)
No Data Jarak Jenis
1 du5 - ds7 39.23009049 nonhumus
2 du5 - ds10 40.44749683 nonhumus
3 du5 - ds8 40.60788101 nonhumus
4 du5 - ds6 42.73172124 nonhumus
5 du5 - ds9 44.27188724 nonhumus
Data uji 5 (du5) = Nonhumus
Tabel 11 data jarak terdekat data uji 5
hasil dari klasifikasi yang dilakukan terhadap data sampel adalah sebagai berikut :
Kode Citra Jenis Hasil Klasifikasi Status
du1 humus6.jpg humus humus Benar
du2 nonhumus13.jpg nonhumus nonhumus Benar
du3 humus7.jpg humus humus Benar
du4 nonhumus9.jpg nonhumus nonhumus Benar
du5 nonhumus12.jpg nonhumus nonhumus Benar
Tabel 12 Hasil klasifikasi data uji
Berdasarkan hasil klasifikasi dapat diketahui bahwa seluruh data uji yang dimasukkan dapat dikenali, sehingga akurasi dari klasifikasi ini adalah :
5. KESIMPULAN
Berdasarkan penelitian yang sudah dilakukan dan beberapa penelitian lain yang sejenis, dapat diambil kesimpulan bahwa metode K-Nearest Neighbor sangat baik digunakan untuk metode klasifikasi khususnya untuk yang menggunakan fitur warna. Beberapa penelitian yang menggunakan metodeK-Nearest Neighboruntuk fitur warna menunjukkan akurasi yang cukup tinggi.
6. SARAN
Dalam penelitian yang bertemakan klasifikasi, sebaiknya jumlah data yang dikumpulkan cukup banyak (dalam penelitian ini termasuk sedikit), khususnya yang digunakan untuk data sampel agar data lebih bervariasi.
Selain itu, standarisasi pengambilan data harus diperhatikan, khususnya untuk data citra sebaiknya konfigurasi seperti aperture, exposure time, focal length dan ISO seharusnya disamakan.
DAFTAR PUSTAKA [1] https://id.wikipedia.org/wiki/Humus
[2] Deswari Dila, Hendrick, Derisma. Identifikasi Kematangan Buah Tomat Menggunakan Metoda Backpropagation. Padang : Politeknik Negeri Padang.
[3] Liantoni Febri. Klasifikasi Daun dengan Perbaikan Fitur Citra Menggunakan Metode K-Nearest Neighbor. Surabaya: Institut Teknologi Adhi Tama Surabaya.