IDENTIFIKASI DAUN SHOREA MENGGUNAKAN
K-NEAREST NEIGHBOR DENGAN CIRI
STATISTICAL TEXTURES
AOKIRINDUAN HAYYI AOKO QOYYIMA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
ABSTRAK
AOKIRINDUAN HAYYI AOKO QOYYIMA. Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures. Dibimbing oleh AZIZ KUSTIYO.
Berbagai jenis pohon kelompok Shorea dari suku Dipterocarpaceae mendominasi hutan hujan dataran rendah di Indonesia. Tiap jenis Shorea memiliki kegunaan yang berbeda-beda dan merupakan penghasil kayu berkualitas tinggi dalam industri konstruksi. Penelitian ini membangun suatu sistem identifikasi daun Shorea menggunakan ekstraksi ciri teksur statistik dengan k -nearest neighbor sebagai alat pengklasifikasi. Metode statistik menganalisis distribusi spasial dari nilai keabuan, dengan menghitung fitur lokal pada setiap titik di dalam citra dan menurunkan kumpulan nilai statistik dari distribusi fitur lokal tersebut. Perhitungan nilai-nilai level keabuan menghasilkan enam parameter, yaitu mean, standar deviasi, smoothness, third moment, uniformity, dan entropy. Penelitian ini menggunakan 10 jenis daun Shorea. Akurasi terbesar dari penelitian ini yaitu sebesar 90%.
Kata kunci: k-nearest neighbor, Shorea, statistical textures
ABSTRACT
AOKIRINDUAN HAYYI AOKO QOYYIMA. Shorea Leaves Identification Using K-Nearest Neighbor with Statistical Textures Feature. Supervised by AZIZ KUSTIYO.
Various species of Shorea from Dipterocarpaceae family are dominating the lowland rain forests in Indonesia. Each species of Shorea has a unique function and can produce a high qualified timber in the construction industry. This research built an identification system of Shorea leaves using the statistical textures feature extraction with k-nearest neighbor as classifier. Statistical methods were utilized to analyze the spatial distribution of gray level values, by computing local features at each point in the image and deriving a set of statistical values from the distribution of the local features. The calculation of gray level values resulted in six parameters, namely mean, standard deviation, smoothness, third moment, uniformity, and entropy. A highest accuracy of 90% was obtained for the identification of 10 species of Shorea.
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada
Departemen Ilmu Komputer
IDENTIFIKASI DAUN SHOREA MENGGUNAKAN
K-NEAREST NEIGHBOR DENGAN CIRI
STATISTICAL TEXTURES
AOKIRINDUAN HAYYI AOKO QOYYIMA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Penguji:
1 Mushtofa, SKom, MSc
Judul Skripsi : Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures
Nama : Aokirinduan Hayyi Aoko Qoyyima
NIM : G64096010
Disetujui oleh
Aziz Kustiyo, SSi, MKom Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi, MKom Ketua Departemen
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas limpahan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan Oktober 2011 ini ialah Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures.
Terima kasih penulis ucapkan kepada seluruh pihak yang telah membantu dalam penelitian ini, di antaranya yaitu:
1 Ayahanda H Rusmawi Baksin, Ibunda Hj Tri Hastuti, dan Kakak Karinduan Sitti Hayyu Koyyumi yang telah memberikan cinta, kasih sayang, doa, serta dukungan yang tidak terkira.
2 Yudi Esa Febriadi yang telah memberikan dukungan, doa, motivasi, dan kasih sayang kepada penulis.
3 Bapak Aziz Kustiyo, SSi, MKom selaku pembimbing yang telah banyak memberikan saran, ide, dan motivasi.
4 Dosen penguji, Bapak Mushtofa, SKom, MSc dan Ibu Karlina Khiyarin Nisa, SKom, MT atas saran dan bimbingannya.
5 Pihak Kebun Raya Bogor atas pemberian sampel daun Shorea.
6 Sahabat-sahabat, Agung Tresna, Anela Febrid Yunita, Dewi Susanti, Hasrul Adiputra, Haswanti, dan Nina Maria yang telah memberikan bantuan, dukungan, doa, dan saran selama penelitian ini berlangsung.
7 Teman-teman satu bimbingan, Alita Wulan Dini, Iman Akbar Ramadhan, Lina Herlina, dan Yuni Purnamasari, terima kasih atas kerjasamanya.
8 Teman-teman Alih Jenis Ilmu Komputer angkatan 4, atas kerjasamanya selama penelitian.
Semoga karya ilmiah ini bermanfaat.
DAFTAR ISI
Pembagian Data Latih dan Data Uji 7
KNN 7
Pembagian Data Latih dan Data Uji 17
KNN 18
SIMPULAN DAN SARAN 26
DAFTAR PUSTAKA 27
LAMPIRAN 28
DAFTAR TABEL
1 Pengaturan jarak pengambilan citra 9
2 Penetapan rentang nilai histogram 10
3 Pembagian citra latih dan uji berdasarkan pengundian 18 4 Confusion matrix percobaan 1untuk k=8 19 5 Hasil kuadrat jarak pada data uji seminis kedua saat k=8 19 6 Hasil kuadrat jarak pada data uji leprosula pertama saat k=8 20 7 Confusion matrix percobaan 2untuk k=7 23 8 Hasil kuadrat jarak pada data uji leprosula pertama saat k=7 23 9 Hasil kuadrat jarak pada data uji materialis pertama saat k=7 24 10 Hasil kuadrat jarak pada data uji palembanica pertama saat k=7 24
11 Perbandingan dengan penelitian terkait 25
DAFTAR GAMBAR
1 Confusion matrix untuk dua kelas 3
2 Penjelasan box plot 4
3 Diagram alir sistem 5
4 Diagram alir KNN 7
5 Citra jenis Shorea 9
6 Alur praproses 10
7 Pemotongan histogram untuk kelas javanica 10
8 Box plot mean tipe 1 12
9 Box plot standar deviasi tipe 1 12 10 Box plot smoothness tipe 1 13 11 Box plot third moment tipe 1 13 12 Box plot uniformity jenis 1 14 13 Box plot entropy tipe 1 14
14 Box plot mean tipe 2 15
15 Box plot standar deviasitipe 2 15 16 Box plot smoothness tipe 2 16 17 Box plot third moment tipe 2 16 18 Box plot uniformity tipe 2 17 19 Box plot entropy tipe 2 17
20 Grafik akurasi percobaan 1 18
21 Box plot mean antara seminis dan johorensis 20 22 Box plot mean antara leprosula dan materialis 21
23 Grafik akurasi percobaan 2 22
DAFTAR LAMPIRAN
1 Contoh citra dan histogram dari masing-masing kelas 28 2 Contoh data tekstur statistik dari masing-masing kelas 31 3 Contoh data tekstur statistik ternormalisasi dari masing-masing kelas 31 4 Confusion matrix percobaan 1 untuk k = 1 32
14 Box plot smoothness (posisi nilai 0.07) antara seminis dan johorensis 35 15 Box plot third moment (posisi nilai -3.49) antara seminis dan johorensis 36 16 Box plot uniformity (posisi nilai 0.014)antara seminis dan johorensis 36 17 Box plot entropy (posisi nilai 6.74)antara seminis dan johorensis 37 18 Box plot standar deviasi (posisi nilai 68.08) antara leprosula dan
materialis 37
19 Box plot smoothness (posisi nilai 0.06) antara leprosula dan materialis 38 20 Box plot third moment (posisi nilai -4.02) antara leprosula dan
materialis 38
21 Box plot uniformity (posisi nilai 0.017) antara leprosula dan materialis 39 22 Box plot entropy (posisi nilai 6.40) antara leprosula dan materialis 39 23 Confusion matrix percobaan 2 untuk k = 1 40
PENDAHULUAN
Latar Belakang
Hutan hujan dataran rendah di Indonesia didominasi oleh jenis-jenis Dipterokarpa (Dipterocarpaceae). Dalam program pengembangan hutan tanaman industri (HTI), jenis-jenis pohon suku Dipterokarpa terutama dari kelompok Shorea spp seperti meranti merah dan beberapa jenis meranti kuning serta meranti putih termasuk jenis-jenis yang diprioritaskan untuk dikembangkan sebagai penghasil kayu bangunan berkualitas tinggi (Istomo et al. 1999).
Berdasarkan perihal tersebut, penelitian ini akan membangun suatu sistem yang dapat digunakan untuk mengidentifikasi Shorea, dikarenakan begitu banyaknya jenis dari Shorea yang memiliki kegunaan yang berbeda-beda. Hal ini bertujuan agar tidak terjadi kesalahan dalam penggunaan kayu di dalam kehidupan. Identifikasi tanaman dapat ditentukan berdasarkan ciri morfologi, bentuk, dan tekstur.
Pada penelitian ini organ tumbuhan yang akan diamati adalah daun, karena daun merupakan salah satu organ vegetatif tumbuhan yang tidak bergantung pada musim dengan beberapa karakteristik yang dapat diamati. Selain itu, daun sangat cocok sebagai alat identifikasi tanaman karena jumlah daun yang sangat berlimpah dan selalu ada setiap waktu.
Proses identifikasi dilakukan dengan menggunakan teknik image processing. Setelah itu, akan dilakukan proses pengklasifikasian terhadap serangkaian citra masukan. Penelitian ini menggunakan objek citra daun Shorea dengan menerapkan metode statistical textures untuk ekstraksi ciri tekstur. Metode statistik menganalisis distribusi spasial dari nilai keabuan, dengan menghitung fitur lokal pada setiap titik di dalam citra, dan menurunkan kumpulan nilai statistik dari distribusi fitur lokal tersebut (Ojala dan Pietikäinen 2004). Penelitian sebelumnya terkait dengan ekstraksi ciri tekstur dengan metode statistical textures telah dilakukan oleh Muhtadan (2009), yang melakukan penelitian mengenai ekstraksi ciri cacat pengelasan pada citra digital film radiografi menggunakan geometric invariant moment dan statistical texture. Dari penelitian tersebut, didapatkan enam parameter yang mampu menghasilkan nilai yang berbeda untuk mewakili masing-masing jenis cacat pengelasan.
Pengklasifikasi yang akan digunakan dalam penelitian ini adalah k-nearest neighbor (KNN). Nurjayanti (2011) melakukan identifikasi jenis Shorea menggunakan metode KNN dan menggunakan karakteristik morfologi daun sebagai bahan identifikasi.
Tujuan Penelitian
2
Ruang Lingkup Penelitian
Ruang lingkup penelitian ini yaitu:
1 Data diperoleh dari hasil pengambilan citra daun Shorea menggunakan kamera digital. Objek citra merupakan koleksi daun Shorea yang berada di Kebun Raya Bogor.
2 Citra daun yang digunakan adalah citra daun bagian atas. 3 Faktor pencahayaan saat pengambilan citra tidak dirancang.
4 Tekstur statistik yang digunakan yaitu mean, standar deviasi, smoothness, third moment, uniformity, dan entropy.
TINJAUAN PUSTAKA
Shorea
Shorea (meranti) merupakan salah satu marga dari suku Dipterocarpaceae. Secara harfiah, Dipterocarpaceae berasal dari kata latin, yaitu di=dua,
carpa=carpus=sayap, yang berarti buah bersayap dua. Shorea (jenis-jenis meranti, bangkirai, dan balau) biasanya memiliki sayap bervariasi antara 2-5 sayap. Jenis-jenis Dipterokarpa tumbuh secara alami di sebagian besar daerah Kalimantan, Sumatera, Jawa, Nusa Tenggara, Bali, Sulawesi, dan Maluku. Sumatera menempati urutan ke dua setelah Kalimantan dalam hal kekayaan jenis dan penyebaran jenis endemik di dunia (Tata et al. 2008).Shorea memiliki sekitar 194 jenis. Penyebarannya meliputi satu jenis di Jawa, satu atau dua jenis di Sulawesi, tiga jenis di Maluku dan sisanya menyebar ke arah timur sampai Maluku (Indonesia) dan tidak meluas ke Cina bagian selatan (Newman et al. 1999).
Ciri-ciri diagnostik utama Shorea adalah pohon sangat besar dengan kulit kayu dalam berlapis-lapis atau coklat merah gelap. Pohon hampir selalu besar, batang utama tinggi dan dua silindris. Tangkai daun berukuran sekitar 0.5-2.5 cm. Daun berukuran panjang 4-18 cm dan lebar 2-8 cm, pangkal daun biasanya simetris, permukaan bawah daun bila diraba licin, pertulangan sekunder bersisip, berjumlah sekitar 7-25 pasang (Newman et al. 1999).
Histogram
Histogram derajat keabuan sebuah citra digital pada selang [0, L-1] merupakan sebuah fungsi diskret n , dengan adalah derajat keabuan yang ke-k dan n adalah jumlah piksel keabuan pada citra yang memiliki tingkat dengan k = 0, 1, . . . , L 1. Melakukan normalisasi histogram merupakan penerapan umum, yaitu dengan cara membagi setiap komponen dengan jumlah seluruh piksel dalam citra, yang dinotasikan dengan produk MN, dengan M dan N merupakan ukuran baris dan kolom citra. Sehingga normalisasi histogram yaitu:
3 dengan k = 0, 1, 2, ..., L 1. P( ) adalah estimasi dari probabilitas kejadian level intensitas pada suatu citra. Penjumlahan dari seluruh komponen suatu normalisasi histogram sama dengan satu (Gonzalez dan Woods 2008).
Statistical Textures
Suatu pendekatan penting untuk melakukan deskripsi region adalah menghitung kandungan teksturnya (texture content). Meskipun tidak ada definisi formal mengenai tekstur, namun deskriptor ini memberikan pengukuran properti seperti kehalusan (smoothness), kekasaran (coarseness), dan keteraturan (regularity). Terdapat tiga prinsip pendekatan untuk mendeskripsikan tekstur region yaitu statistik, struktural, dan spektral (Gonzales dan Woods 2008). Pendekatan statistikal merupakan salah satu pendekatan mudah untuk mendeskripsikan tekstur yaitu dengan menggunakan momen statistik dari histogram intensitas suatu citra atau region (Muhtadan 2009).
Confusion Matrix
Confusion matrix merupakan alat yang berguna untuk menganalisis sebaik apakah pengklasifikasi yang digunakan dalam mengenali tuples dari kelas yang berbeda. Confusion matrix untuk dua kelas ditunjukkan pada Gambar 2 (Han dan Kamber 2006).
Gambar 1 Confusion matrix untuk dua kelas
Jika terdapat m kelas, confusion matrix adalah suatu tabel yang setidaknya berukuran m m. Masukan pada m baris dan m kolom pertama mengindikasikan jumlah tuples dari kelas i yang telah diberi label oleh pengklasifikasi sebagai kelas j (Han dan Kamber 2006).
Box Plot
4
pada kotak menunjukkan median, dan serat (whisker) yang menghubungkan hinges dikedua sisi merepresentasikan data terkecil dan data terbesar. Pencilan (outlier) didefinisikan sebagai suatu pengamatan yang tampak bertentangan atau tidak konsisten terhadap pengamatan yang lain (Tukey 1979).
Gambar 2 Penjelasan box plot
METODE
Gambar 3 merupakan alur proses dari metode penelitian ini. Secara umum, metode penelitian terdiri atas pengumpulan data penelitian, praproses, ekstraksi ciri tekstur, pembagian data latih dan data uji, penyimpanan vektor fitur data latih maupun uji, pengklasifikasian data uji dengan KNN, dan tahap terakhir yaitu hasil prediksi.
Data Citra Daun
Jenis Shorea yang akan digunakan dalam penelitian ini terdiri atas sepuluh spesies. Klasifikasi Shorea dibagi mendadi sepuluh kelas. Label kelas sesuai dengan jenis Shorea yang akan digunakan. Untuk masing-masing kelas digunakan sepuluh buah citra, sehingga total keseluruhan citra adalah 100 buah. Citra daun Shorea yang digunakan pada penelitian ini diakuisisi sendiri dari Kebun Raya Bogor.
5
Gambar 3 Diagram alir sistem
Praproses
Sebelum masuk ke dalam tahap ekstraksi ciri, terlebih dahulu dilakukan praproses untuk citra. Tahap praproses citra dilakukan untuk mempersiapkan citra yang akan digunakan sebelum masuk tahap ekstraksi.
Citra masukan untuk untuk ekstraksi tekstur adalah citra grayscale. Citra grayscale tersebut akan diubah ukurannya menjadi lebih kecil dari citra hasil pemotretan awal. Setelah itu, dari citra grayscale tersebut akan dicari nilai histogramnya. Nilai histogram tersebut akan dinormalisasi terlebih dahulu, dengan cara membagi frekuensi setiap nilai derajat keabuan dengan jumlah seluruh piksel dalam citra. Proses manipulasi histogram juga akan dilakukan. Manipulasi tersebut yaitu penghilangan warna background dengan cara mengambil rentang nilai derajat keabuan tertentu.
Ekstraksi Ciri Tekstur
6
1 Perhitungan pertama adalah mean , yang merepresentasikan intensitas rerata. Anggaplah bahwa z adalah variabel acak yang melambangkan intensitas, dan
merupakan histogramnya, dengan ( merupakan jumlah tingkat intensitas yang berbeda).
2 Perhitungan ke dua adalah standar deviasi yang menunjukkan kontras intensitas.
Perhitungan standar deviasi diperoleh dengan mengakarkan nilai dari ragam.
3 Perhitungan ketiga adalah smoothness. Ragam atau juga yang biasa disebut momen ke dua merupakan bagian penting dalam deskripsi tekstur. Momen tersebut adalah pengukuran kontras intensitas yang dapat memberikan deskripsi kehalusan relatif (relative smoothness).
Nilai Ragam dinormalisasi, karena nilai ragam cenderung menjadi besar untuk citra grayscale, maka ragam ini dapat dinormalisasi dengan interval [0, 1].
4 Perhitungan keempat adalah third moment (momen ketiga). Momen ketiga merupakan pengukuran dari kecondongan (skewness) histogram. Nilai third moment ini juga dinormalisasi.
5 Perhitungan kelima adalah keseragaman (uniformity).
memiliki rentang nilai [0, 1] dan penjumlahanya sama dengan 1, pengukuran adalah maksimum untuk suatu citra dengan semua tingkat keabuannya sama (keseragaman maksimal).
6 Perhitungan terakhir yaitu average entropy atau entropi rerata. Entropi adalah pengukuran variabilitas dan bernilai 0 untuk citra yang konstan.
7 antar ciri tekstur statistik tidak terlalu jauh. Semua ciri tekstur statistik yang telah dinormalisasi akan memiliki rantang nilai dari nol sampai satu. Masing-masing ciri statistical textures ini akan dibuat box plot.
Pembagian Data Latih dan Data Uji
Seluruh data hasil ekstraksi ciri tekstur dibagi menjadi data latih dan data uji. Presentasi data latih dan data uji pada penelitian ini adalah 80%-20%, yang dipilih secara acak.
KNN
K-nearest neighbor adalah salah satu contoh instance-based learning, dengan set data pelatihan (training set) disimpan, sehingga klasifikasi untuk record baru yang belum terklasifikasi dapat ditemukan hanya dengan membandingkannya dengan record paling mirip dalam training set (Larose 2005). Tahap pelatihan algoritme ini hanya menyimpan vektor fitur dan label kelas dari sampel pelatihan (Mirkes 2011).
Teknik klasifikasi dari KNN diterapkan pada data latih yang tersedia. Gambar 3 merupakan diagram alir dari algoritme KNN.
Gambar 4 Diagram alir KNN Tentukan k (jumlah tetangga terdekat)
8
Hitung jarak data uji ke training set
Jarak yang digunakan dalam penilitian ini adalah jarak Euclidean. Tahap ini merupakan perhitungan jarak terdekat untuk setiap data uji. Perhitungan jarak bertujuan untuk mengetahui ukuran kedekatan antara data uji dan latih. Di bawah ini merupakan rumus jarak Euclidean:
dengan x = , , ...., dan y = , , ...., merepresentasikan atribut nilai m dari dua record (Larose 2005).
Urutkan k data berdasarkan jarak terkecil
Setelah perhitungan jarak telah dilakukan, maka akan ada k jarak terkecil. Dari k jarak terkecil tersebut, urutkan data dengan jarak terkecil hingga terbesar, lalu berikan peringkat untuk masing-masing data.
Tentukan prediksi kelas data uji berdasarkan label kelas mayoritas
Penentuan prediksi kelas data uji didasarkan pada label kelas mayoritas pada k. Setelah pemeringkatan data dilakukan, maka akan ditemukan label kelas terbanyak. Label kelas dengan frekuensi terbanyak merupakan hasil kelas prediksi untuk data uji.
Hasil Prediksi
Hasil prediksi merupakan output dari sistem. Hasil prediksi ini sangat berpengaruh kepada tingkat akurasi sistem. Mayoritas data uji diharapkan akan diklasifikasikan ke kelas yang benar, sehingga akurasi sistem akan menjadi baik. Akurasi dari suatu classifier pada suatu kumpulan data uji yang diberikan adalah persentase dari tuple kumpulan data uji yang diklasifikasikan dengan benar oleh classifier tersebut. Label kelas terkait dari setiap tuple data uji dibandingkan dengan hasil pembelajaran prediksi kelas dari classifier untuk tuple tersebut (Han dan Kamber 2006).
Lingkungan Pengembangan
Perangkat lunak yang digunakan dalam penelitian yaitu: Windows Vista Home Basic.
MATLAB R2008b version 7.7.0.471. Microsoft Excel 2010.
Perangkat keras yang digunakan dalam penelitian yaitu: Processor Intel Core 2 Duo CPU 2.00 GHz.
RAM 2 GB.
∑ (10)
9
HASIL DAN PEMBAHASAN
Data Citra Daun
Citra yang digunakan adalah sampel daun Shorea milik Kebun Raya Bogor. Ada sepuluh jenis Shorea yang diidentifikasi, yaitu Shorea seminis, pinanga, leprosula, marcoptera, materialis, lepida, johorensis, javanica, platycados, dan palembanica. Sepuluh jenis Shorea tersebut masing-masing terdiri atas sepuluh citra. Ukuran asli citra yaitu 3648 2736 yang diakuisisi menggunakan kamera digital. Pada Gambar 5 disajikan contoh citra untuk masing-masing jenis Shorea.
Gambar 5 Citra jenis Shorea
Pada saat pengambilan citra, daun masih melekat pada rantingnya. Pengaturan jarak saat pengambilan citra juga dibedakan berdasarkan jenisnya. Pengaturan jarak antara kamera dengan daun dicantumkan pada Tabel 1.
Tabel 1 Pengaturan jarak pengambilan citra Jarak kamera ke daun Jenis Shorea
± 20 – 22 cm lepida, platyclados
± 25 cm marcoptera, johorensis
± 27 – 30 cm pinanga, leprosula, materialis
± 30 cm palembanica
± 32 cm seminis, javanica
Praproses
masing-10
masing citra grayscale yang telah direduksi. Gambar 6 merupakan contoh alur praproses dari salah satu citra dari jenis seminis. Contoh histogram dari masing-masing kelas dapat dilihat pada Lampiran 1.
Gambar 6 Alur praproses
Penghilangan warna background dilakukan dengan cara mengambil rentang nilai tertentu dari histogram yang merupakan perpotongan antara citra daun dengan latar belakang. Rentang nilai untuk masing-masing kelas berbeda-beda. Gambar 7 merupakan contoh ilustrasi dari pemotongan histogram untuk salah satu citra dari kelas javanica.
Gambar 7 Pemotongan histogram untuk kelas javanica
Pengambilan rentang nilai ditetapkan dengan mengamati perpotongan yang terjadi pada histogram asli dari suatu citra. Penetapan rentang nilai untuk masing-masing kelas dapat dilihat pada Tabel 2.
Tabel 2 Penetapan rentang nilai histogram
Rentang nilai Kelas
0 - 120 platyclados
0 - 150 lepida, javanica
0 - 160 pinanga, leprosula, materialis
11 Pada Gambar 6, terlihat titik perpotongan terjadi pada saat derajat keabuan bernilai 150, maka untuk kelas javanica akan diambil nilai derajat keabuan dari 0-150 saja. Untuk nilai derajat keabuan lebih dari 0-150 tidak digunakan. Semua citra dalam satu kelas cenderung memiliki pola yang sama untuk penyebaran nilai derajat keabuannya.
Ekstraksi Ciri Tekstur
Ekstraksi ciri tekstur dilakukan metode statistical textures yang menghasilkan enam nilai ekstraksi tekstur yaitu intensitas rerata (mean), kontras rerata (standar deviasi), smoothness, third moment, uniformity, dan entropy. Keenam ciri tekstur tersebut disimpan dalam suatu vektor baris. Contoh data tekstur statistik dari masing-masing kelas terdapat pada Lampiran 2, sedangkan contoh data tekstur statistik yang telah dinormalisasi dari masing-masing kelas terdapat pada Lampiran 3.
Pada tahap pelatihan, dibuat suatu matriks yang berisi kumpulan data pelatihan yang telah ditentukan label atau kelasnya untuk mengarahkan ciri-ciri tekstur statistik pada data uji. Matriks ini disebut dengan training set. Data pelatihan pada training set ini berupa 80 record tekstur statistik. Tiap record memiliki nilai mean, standar deviasi, smoothness, third moment, uniformity, dan entropy untuk tiap kelas. Ukuran matriks training set ini yaitu 80 6. Setelah ekstraksi ciri dilakukan untuk semua citra, dibuat boxplot untuk masing-masing ciri tekstur statistik. Hal ini dilakukan untuk mengetahui penyebaran data dari ciri tekstur statistik tersebut. Ada dua tipe box plot yang akan dibuat. Tipe 1 yaitu box plot yang diperoleh dari histogram citra grayscale asli, sedangkan tipe 2 yaitu box plot yang diperoleh dari histogram citra grayscale dengan penghilangan warna background dan normalisasi nilai statistcal textures.
Tipe 1: Box plot yang diperoleh dari histogram citra grayscale asli
Mean
12
Gambar 8 Box plot mean tipe 1 Standar Deviasi
Nilai standar deviasi terbesar berdasarkan Gambar 9 terletak pada kelas leprosula, dengan nilai standar deviasi sebesar 83.90. Nilai standar deviasi terkecil berada pada kelas platyclados dengan nilai standar deviasi sebesar 35.42.
Gambar 9 Box plot standar deviasi tipe 1
Smoothness
13
Gambar 10 Box plot smoothness tipe 1
Third Moment
Nilai third moment terbesar berdasarkan Gambar 11 terletak pada kelas johorensis, dengan nilai third moment sebesar 0.22. Nilai third moment terkecil berada pada kelas palembanica dengan nilai third moment sebesar - .
Gambar 11 Box plot third moment tipe 1
Uniformity
14
Gambar 12 Box plot uniformity jenis 1
Entropy
Nilai entropy terbesar berdasarkan Gambar 13 terletak pada kelas javanica, dengan nilai entropy sebesar 7.36. Nilai entropy terkecil berada pada kelas lepida dengan nilai entropy sebesar 3.09.
Gambar 13 Box plot entropy tipe 1
Tipe 2: Box plot yang diperoleh dari histogram citra grayscale dengan penghilangan warna background dan normalisasi nilai statistcal textures
Mean
15
Gambar 14 Box plot mean tipe 2 Standar Deviasi
Nilai standar deviasi terbesar berdasarkan Gambar 15 terletak pada kelas marcoptera, dengan nilai standar deviasi sebesar 1. Nilai standar deviasi terkecil berada pada kelas platyclados dengan nilai standar deviasi sebesar 0.207.
Gambar 15 Box plot standar deviasitipe 2
Smoothness
16
Gambar 16 Box plot smoothness tipe 2
Third Moment
Nilai third moment terbesar berdasarkan Gambar 17 terletak pada kelas seminis, dengan nilai third moment sebesar 1. Nilai third moment terkecil berada pada kelas platyclados dengan nilai third moment sebesar 0.05.
Gambar 17 Box plot third moment tipe 2
Uniformity
17
Gambar 18 Box plot uniformity tipe 2
Entropy
Nilai entropy terbesar berdasarkan Gambar 19 terletak pada kelas johorensis, dengan nilai entropy sebesar 1. Nilai entropy terkecil berada pada kelas platyclados dengan nilai entropy sebesar 0.15.
Gambar 19 Box plot entropy tipe 2
Pembagian Data Latih dan Data Uji
18
Tabel 3 Pembagian citra latih dan uji berdasarkan pengundian
Kelas Data latih Data uji dihitung jaraknya dengan 480 ciri tekstur statistik pada training set. Perhitungan jarak dilakukan per tekstur. Dalam penelitian ini dilakukan dua percobaan. Percobaan pertama dilakukan tanpa melakukan pemotongan terhadap histogram dan nilai statistical textures tidak dinormalisasi. Percobaan ke dua dilakukan dengan melakukan pemotongan terhadap histogram dan nilai statistical textures dinormalisasi.
Percobaan 1 tanpa penghilangan warna background dan normalisasi
Percobaan pertama dilakukan dengan menggunakan nilai histogram dari citra asli, tanpa dilakukan manipulasi di dalamnya. Gambar 20 merupakan grafik akurasi dari percobaan 1 untuk nilai k=1 sampai k=10.
19 Berdasarkan Gambar 20, nilai k yang menghasilkan akurasi terbesar yaitu k=8 dengan akurasi sebesar 90%, sedangkan akurasi terkecil yaitu 70% yang diperoleh pada saat k=1, k=2, k=4, dan k=10.
Untuk mengetahui data mana saja yang salah diklasifikasi, berikut ini merupakan confusion matrix dari hasil klasifikasi percobaan 1 menggunakan k=8. Confusion matrix untuk nilai k yang lain dapat dilihat pada Lampiran 4 sampai
Berdasarkan Tabel 4, kelas yang berhasil diklasifikasikan dengan sempurna untuk setiap citra uji yaitu pinanga, marcoptera, materialis, lepida, johorensis, javanica, platyclados, dan palembanica. Sementara itu dua kelas yang tidak sempurna diklasifikasi yaitu seminis dan leprosula. Untuk kelas seminis citra uji yang salah diklasifikasi merupakan citra uji kedua dan diklasifikasi sebagai kelas johorensis.
Pada Tabel 5, data uji kedua dari kelas seminis mengalami penyebaran pada kuadrat jarak. Untuk kelas seminis, hanya satu record yang memiliki kedekatan jarak, dan berada pada peringkat terakhir (peringkat delapan), padahal citra uji tersebut berasal dari kelas yang sama. Sementara itu, untuk kelas johorensis terdapat dua record yang memiliki jarak terdekat dengan data uji, dan kelas inilah yang diprediksi sebagai hasil prediksi.
Tabel 5 Hasil kuadrat jarak pada data uji seminis kedua saat k=8 Peringkat Kelas prediksi Kuadrat jarak
20
Penjelasan mengenai mengapa hasil prediksi menghasilkan kelas johorensis, sedangkan selain johorensis terdapat leprosula yang memiliki dua record yang menghasilkan jarak yang memiliki kedekatan dengan data uji. Hal itu dikarenakan, peringkat johorensis lebih bagus dibandingkan dengan leprosula, yaitu 2 dan 5 banding 3 dan 6.
Untuk kelas leprosula citra uji yang salah diklasifikasi merupakan citra uji pertama dan diklasifikasi sebagai kelas materialis. Pada perbandingan kelas leprosula dengan materialis, tidak terlalu terjadi penyebaran pada kuadrat jarak. Dari kelas materialis terdapat empat record yang menghasilkan jarak yang
Tabel 6 Hasil kuadrat jarak pada data uji leprosula pertama saat k=8 Peringkat Kelas prediksi Kuadrat jarak
1 Javanica 2.5085 masing-masing kelas yang mengalami salah prediksi. Hal itu dilakukan untuk melihat posisi data uji yang salah diprediksi antara kelas aktual dan kelas prediksi tersebut untuk masing-masing ciri tekstur statistik.
Di bawah ini merupakan box plot perbandingan antara kelas seminis (kelas aktual) dengan kelas johorensis (kelas prediksi) untuk ciri tekstur mean. Posisi nilai mean data uji pada Gambar 21 ditandai dengan garis putus-putus.
21 Gambar di atas menunjukkan bahwa posisi nilai mean data uji seminis pertama yaitu 178.50 berada pada lowerwhisker dan menyinggung lower whisker dari kelas johorensis. Hal itu berarti nilai mean data uji tersebut lebih rendah dari kumpulan nilai mean yang berada dalam bidang IQR. Tekstur statistik selain mean, sebagian besar juga menunjukkan bahwa posisi data uji dalam box plot berada pada lower whisker atau upper whisker, kecuali untuk uniformity dan entropy. Untuk standar deviasi dan smoothness, posisi data uji berada pada upper whisker end (nilai tertinggi dalam himpunan). Box plot perbandingan antara kelas seminis dengan kelas johorensis untuk ciri tekstur yang lain dapat dilihat pada Lampiran 13 sampai Lampiran 17.
Berdasarkan fakta tersebut, kesalahan yang terjadi pada kasus ini diprediksi karena data uji seminis ini memiliki nilai yang jauh dari data nilai mean dominan atau nilai mean yang terletak dalam bidang IQR dalam kelas seminis. Hal ini sangat berpengaruh, karena perhitungan KNN didasarkan pada kedekatan jarak antara data uji dengan himpunan data latih. Data uji ini juga tidak begitu memiliki kedekatan yang signifikan dengan kelas johorensis, karena posisi data uji tersebut jika ditinjau dari kelas johorensis sendiri, tidak juga berada dalam bidang IQR. Hal ini relevan dengan hasil kuadrat jarak pada Tabel 5 yang menunjukkan penyebaran kuadrat jarak yang terjadi pada kasus ini.
Selanjutnya yaitu analisis kesalahan yang terjadi pada kelas leprosula berdasarkan box plot. Gambar 22 merupakan box plot perbandingan antara kelas leprosula (kelas aktual) dengan kelas materialis (kelas prediksi) untuk ciri tekstur mean. Posisi nilai mean data uji pada Gambar 22 ditandai dengan garis putus-merupakan yang terendah pada kelas leprosula.
22
kotak lebih panjang, sedangkan pada kelas materialis ukuran kotak lebih kecil. Hal itu berarti nilai mean pada kelas leprosula memiliki penyebaran nilai mean yang luas atau memiliki rentang yang lebih besar dibandingkan dengan nilai mean pada kelas materialis, yang menyebabkan kesalahan prediksi dalam kasus ini.
Nilai tekstur statistik lain yang berada pada lower whisker yaitu standar deviasi dan smoothness. Untuk nilai third moment, uniformity, dan entropy berada dalam IQR. Meskipun nilai ketiga tekstur tersebut termasuk ke dalam 50% dari himpunan data, hal itu tidak berpengaruh banyak dalam kontribusi untuk menentukan kuadrat jarak akhir dalam kasus ini. Box plot perbandingan antara kelas leprosula dan kelas materialis untuk ciri tekstur yang lain dapat dilihat pada Lampiran 18 sampai Lampiran 22.
Percobaan 2 dengan penghilangan warna background dan normalisasi
Percobaan ke dua dilakukan dengan menggunakan nilai histogram yang telah dimanipulasi. Manipulasi dilakukan dengan cara mengambil rentang nilai tertentu dari nilai derajat keabuan. Setelah histogram dimanipulasi, nilai statistical textures juga akan dinormalisasi dengan cara membagi nilai tekstur statistik dengan nilai yang terbesar yang terdapat dalam himpunan data. Normalisasi ini dilakukan per tekstur. Gambar 23 merupakan grafik akurasi dari percobaan 2 untuk nilai k=1 sampai k=10.
Gambar 23 Grafik akurasi percobaan 2
Berdasarkan Gambar 20, nilai k yang menghasilkan akurasi terbesar yaitu k=7, k=9, dan k=10 dengan akurasi sebesar 75%, sedangkan akurasi terkecil yaitu 60% yang diperoleh pada saat k=3, k=4, dan k=6. Percobaan 2 menghasilkan akurasi 15% lebih rendah dibandingkan dengan percobaan 1 yang menghasilkan akurasi tertinggi sebesar 90% pada saat k=8. Tidak terjadinya peningkatan akurasi bisa dipengaruhi oleh faktor pencahayaan yang tidak seragam sehingga berpengaruh pada histogram yang dihasilkan.
Untuk mengetahui data mana saja yang salah diklasifikasi, berikut ini merupakan confusion matrix dari hasil klasifikasi percobaan 2 dengan
23
Berdasarkan Tabel 7, kelas yang berhasil diklasifikasikan dengan sempurna untuk setiap citra uji yaitu seminis, pinanga, marcoptera, lepida, johorensis, javanica, dan platyclados. Sementara itu tiga kelas yang tidak sempurna diklasifikasi yaitu leprosula, materialis, dan palembanica. Seluruh citra uji untuk kelas leprosula dan materialis gagal diklasifikasi dengan benar. Citra uji pertama dari kelas leprosula diklasifikasi menjadi kelas javanica, sedangkan citra uji ke dua diklasifikasi menjadi kelas materialis. Tabel 8 menjelaskan peringkat dari hasil kuadrat jarak yang terjadi pada kelas leprosula untuk data uji pertama pada saat k=7.
Pada Tabel 8, tidak ada satu pun record yang memiliki kedekatan dengan kelas leprosula, sedangkan dari kelas javanica terdapat empat record yang menghasilkan jarak terdekat dengan data uji. Hal ini berarti, data uji pertama dari kelas leprosula memiliki nilai yang jauh berbeda dengan data leprosula pada training set dan lebih memiliki kedekatan dengan data javanica pada training set.
Tabel 8 Hasil kuadrat jarak pada data uji leprosula pertama saat k=7 Peringkat Kelas prediksi Kuadrat jarak
1 Javanica 0.00336
Seluruh citra uji dari kelas materialis diklasifikasi menjadi kelas pinanga. Tabel 10 menjelaskan peringkat dari hasil kuadrat jarak yang terjadi pada kelas materialis untuk data uji pertama pada saat k=7.
24
tiga jarak terdekat. Peringkat pinanga lebih bagus dibandingkan dengan materialis, yaitu 1, 2 dan 6, sedangkan materialis yaitu 4, 5 dan 7.
Tabel 9 Hasil kuadrat jarak pada data uji materialis pertama saat k=7 Peringkat Kelas prediksi Kuadrat jarak
1 Pinanga 0.00001
Untuk kelas palembanica, citra uji yang gagal diklasifikasi merupakan citra uji pertama, yang diklasifikasi menjadi kelas seminis. Tabel 12 merupakan daftar peringkat dari hasil kuadrat jarak yang terjadi untuk data uji pertama dari kelas palembanica.
Tabel 10 Hasil kuadrat jarak pada data uji palembanica pertama saat k=7 Peringkat Kelas prediksi Kuadrat jarak
1 Palembanica 0.00346
Berdasarkan Tabel 12, data uji pertama dari kelas palembanica memiliki nilai yang cukup dekat dengan kelas seminis, marcoptera, dan palembanica sendiri. Dari kelas seminis menghasilkan tiga record jarak terkecil, sedangkan untuk kelas palembanica dan marcoptera masing-masing menghasilkan dua record.
25
Gambar 24 Box plot mean antara leprosula dan javanica
Gambar di atas menunjukkan bahwa posisi nilai mean data uji leprosula menyinggung bidang IQR dari kelas javanica. Hal ini berarti tampak jelas bahwa nilai mean dari data latih ini lebih memiliki keseragaman dengan kelas javanica, bukan dengan kelas leprosula yang merupakan kelas aktualnya, sehingga data uji ini mengalami kesalahan prediksi. Bukan hanya posisi dari nilai mean saja, hampir semua posisi dari nilai tekstur statistik lainnya, kecuali uniformity, yang menyinggung bidang IQR dari kelas javanica. Box plot perbandingan antara kelas leprosula dan kelas javanica untuk ciri tekstur yang lain dapat dilihat pada Lampiran 32 sampai Lampiran 36.
Perbandingan dengan Penelitian Terkait
Penelitian yang terkait dengan penelitian ini adalah penilitian dari Nurjayanti (2011) dan Ramadhan (2012). Perbandingan ini dilakukan berdasarkan pada objek penelitian, ekstraksi fitur, pengklasifikasi yang digunakan, dan akurasi yang didapatkan. Di bawah ini merupakan tabel perbandingan dengan penelitian sejenis yang telah dilakukan sebelumnya.
Tabel 11 Perbandingan dengan penelitian terkait
26
dengan penelitian ini. Discrete wavelet transform yang digunakan yaitu DWT Daubechies dan Haar.
Penelitian ini menghasilkan akurasi lebih rendah dibandingkan dengan dua penelitian tersebut. Akurasi tertinggi dalam penelitian ini yaitu 90% dan terendah yaitu 70%. Akurasi untuk penelitian Nurjayanti (2011) yaitu 100%. Nurjayanti (2011) mendapatkan nilai akurasi sebesar 100% diperoleh karena terdapat fitur-fitur morfologi daun yang bersifat nominal/kategori. Fitur-fitur-fitur nominal tersebut yaitu bentuk tulang daun, permukaaan daun, ujung daun, dan pangkal daun. Nilai dari fitur-fitur nominal tersebut diinputkan secara manual. Sementara pada penelitian ini, nilai-nilai fitur diperoleh berdasarkan histogram citra grayscale yang dipengaruhi oleh banyak faktor, seperti pencahayaan, kekontrasan citra, dan lain-lain. Penelitian Ramadhan (2012) memperoleh akurasi tertinggi sebesar 93.3% dan terendah sebesar 33.33% yang menggabungkan DWT Haar dan Daubechies, serta ekstraksi warna HSV.
SIMPULAN DAN SARAN
Simpulan
Pada penelitian ini, identifikasi sepuluh jenis Shorea dilakukan menggunakan algoritme KNN berdasarkan enam fitur tekstur statistik, yaitu mean, standar deviasi, smoothness, third moment, uniformity, dan entropy. Penelitian ini dilakukan dengan dua kali percobaan. Percobaan pertama yaitu tanpa menghilangkan warna background pada histogram citra grayscale dan tanpa normalisasi nilai statistical textures. Percobaan pertama ini menghasilkan akurasi tertinggi pada saat nilai k=8 dengan akurasi sebesar 90%. Kesalahan prediksi terjadi pada Shorea jenis seminis dan leprosula. Percobaan kedua yaitu dengan menghilangkan warna background pada histogram citra grayscale dan dengan normalisasi nilai statistical textures. Percobaan kedua ini menghasilkan akurasi tertinggi pada saat nilai k=7, k=9, dan k=10, dengan akurasi sebesar 75%. Kesalahan prediksi terjadi pada Shorea jenis leprosula, materialis, dan palembanica.
Saran
Pada penelitian ini masih memiliki beberapa kekurangan yang dapat diperbaiki pada penelitian selanjutnya. Adapun beberapa saran untuk penelitian selanjutnya yaitu:
27
DAFTAR PUSTAKA
Gonzalez RC, Woods RE. 2008. Digital Image Processing. Ed ke-3. New Jersey (US): Prentice Hall.
Han J, Kamber M. 2006. Data Mining Concept and Techniques. Ed ke-2. San Fransisco (US): Morgan Kaufmann.
Istomo, Wibowo C, Hidayati N. 1999. Evaluasi pertumbuhan tanaman meranti (Shorea spp.) di Haurbentes BKPH Jasinga KPH Bogor Perum Perhutani Unit III Jawa Barat. Manajemen Hutan Tropika. 5(2):13-22.
Larose DT. 2005. Discovering Knowledge in Data An Introduction to Data Mining. New Jersey (US): J Wiley.
Leng J, Huang Z, Li D. 2010. Features extraction and classification of cartridge images for ballistics identification. Di dalam: International Conference on Industrial Engineering and Other Applications of Applied Intelligent Systems; 2010 Jun; Cordoba, Spanyol. Berlin (DE): Springer. hlm 331-340. Mirkes EM. 2011. KNN and potential energy: applet [internet]. [diunduh 2013
Sep 6]. Tersedia pada: http://www.math.le.ac.uk/people/ag153/homepage/ KNN/KNN3.html.
Muhtadan. 2009. Ekstraksi ciri cacat pengelasan pada citra digital film radiografi menggunakan geometric invariant moment dan statistical texture. Jurnal Forum Nuklir. 3(2):83-106.
Newman MF, Burgess PF, Whitmore TC. 1999. Pedoman Identifikasi Pohon-Pohon Dipterocarpaceae Jawa sampai Nugini. Bogor (ID): Prosea Indonesia.
Nurjayanti B. 2011. Identifikasi Shorea menggunakan k-nearest neighbour berdasarkan karakteristik morfologi daun [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Ojala T, Pietikäinen M. 2004. Texture classification [internet]. [diacu 2011 Okt 24]. Tersedia pada: http://homepages.inf.ed.ac.uk/rbf/CVonline/
LOCAL_COPIES/OJALA1/texclas.htm
Ramadhan IA. 2012. Identifikasi daun Shorea dengan backpropagation neural network menggunakan ekstraksi fitur discrete wavelet transform dan ekstraksi warna HSV [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Tata HL, Wibawa G, Joshi L. 2008. Penanaman Meranti di Kebun Karet. Bogor (ID): World Agroforestry Centre, ICRAF Southeast Asia.
28
Lampiran 1 Contoh citra dan histogram dari masing-masing kelas
seminis
pinanga
leprosula
29 Lampiran 1 Lanjutan
materialis
lepida
johorensis
30
Lampiran 1 Lanjutan
platyclados
31 Lampiran 2 Contoh data tekstur statistik dari masing-masing kelas
Kelas Mean St. dev Smoothness Third
moments Uniformity Entropy Seminis 213.5769 57.2810 0.04803 -2.80233 0.13878 5.1516 Pinanga 154.0644 78.1575 0.08587 -0.71603 0.01088 6.9298 Leprosula 182.9605 72.7094 0.07519 -3.14237 0.01685 6.5532 Marcoptera 196.1952 70.3251 0.07068 -2.88252 0.22892 4.7332 Materialis 161.2489 65.5043 0.06190 -2.24268 0.01298 6.6188 Lepida 215.4101 60.8303 0.05384 -5.20403 0.05601 5.7946 Johorensis 181.6181 66.9807 0.06454 -0.06108 0.11831 5.5529 Javanica 147.6544 61.1049 0.05430 -2.53531 0.01053 6.9286 Platyclados 157.7369 52.1889 0.04020 -3.64447 0.02164 6.0113 Palembanica 185.1806 63.7463 0.05882 -5.90845 0.01703 6.4140 Lampiran 3 Contoh data tekstur statistik ternormalisasi dari masing-masing kelas
Kelas Mean St. dev Smoothness Third
35 Lampiran 13 Box plot standar deviasi (posisi nilai 70.06) antara seminis dan
johorensis
36
Lampiran 15 Box plot third moment (posisi nilai -3.49) antara seminis dan johorensis
37 Lampiran 17 Box plot entropy (posisi nilai 6.74)antara seminis dan johorensis
38
Lampiran 19 Box plot smoothness (posisi nilai 0.06) antara leprosula dan materialis
39 Lampiran 21 Box plot uniformity (posisi nilai 0.017) antara leprosula dan
materialis
43 Lampiran 32 Box plot standar deviasi (posisi nilai 0.54) antara leprosula dan
javanica
44
Lampiran 34 Box plot third moment (posisi nilai 0.25) antara leprosula dan javanica
46
RIWAYAT HIDUP