PENGKLASIFIKASIAN DAUN MANGGA, SALAM DAN SAWO DENGAN
MENGGUNAKAN METODE NAIVE BAYES
Andrian Riza Hermawan
1, Andriano E. Wibowo
2, Dhio Alfanda F.
3, Dwi Fetiria
Ningrum
4,
Naldo Sancho Liman
51,2,3,4,5Program Studi Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya
E-Mail: rhyan.3370@gmail.com1, ano.ryu777@gmail.com2, alfanders@live.com3, bluesaphire03@gmail.com4, kingdominheart@gmail.com5
Abstrak
Pengklasifikasian tanaman dapat dilakukan dengan melihat karakteristik daun tanaman tersebut. Daun merupakan salah satu karakteristik tanaman yang mudah dikenali. Warna dan bentuk daun masing-masing tanaman berbeda sehingga dapat ditemukan suatu pola tertentu untuk mengklasifikasikannya. Penelitian ini menggunakan pengenalan pola suatu citra daun untuk diklasifikasi. Daun yang digunakan adalah daun mangga, salam dan sawo. Fitur yang digunakan adalah warna dan bentuk daun. Dalam penelitian ini proses ekstraksi fitur yang digunakan adalah kode rantai. Kode rantai tersebut digunakan untuk mengambil bentuk citra. Penelitian ini menggunakan metode naïve bayes untuk melakukan proses klasifikasi terhadap daun mangga, salam dan sawo. Hasil penelitian ini menunjukkan bahwa tingkat akurasi pada daun mangga adalah 80%, daun salam 80%, dan daun sawo 100%.
Kata kunci: Klasifikasi, warna daun, bentuk daun, kode rantai, naïve bayes
Abstract
Plant classification can be done by observing the leaf’s characteristics. The leaf is one of the plant’s characteristics which is easy to be recognized. The color and the leaf’s shape of each plant are different, therefore a certain pattern can be found to classify it. This research uses a pattern recognition of the leaf’s image to be classified. Leafs that used are mango leaf, bay leaf, and sapodilla leaf. The features are colors and the shape of the leaf. The chain code is used to take the shape of the image. This research is using Naïve Bayes method to do the classification process of mango leaf, bay leaf, and sapodilla leaf. The result of this research shows that degree of accuracy of each mango leaf and bay leaf are 80% while sapodilla leaf is 100%.
Key words: Classificatian, leaf’s color, leaf’s shape, chain code, naïve bayes.
1. PENDAHULUAN
Keanekaragaman hayati yang ada di dunia telah mendorong para ahli biologi untuk membuat suatu sistem untuk mempelajari dan
mengenali organisme dengan melalui
klasifikasi. Pengklasifikasian merupakan
pengelompokkan organisme berdasarkan
karakteristik tertentu. Pengklasifikasian
tumbuhan menggunakan daun dapat dilihat dari bentuk dan warna daun[5]. Pada beberapa sistem temu kembali citra, sebuah citra dapat
direpresentasikan oleh beberapa fitur seperti warna dan bentuk. Citra yang mirip ditentukan oleh kedekatan nilai fitur yang dipakai. Sementara itu di bidang ilmu botani, sangat dibutuhkan teknologi pencarian citra daun secara otomatis dari berbagai koleksi citra daun yang ada[1].
Untuk melakukan representasi terhadap bentuk obyek pada citra dapat menggunakan metode Kode Rantai (chain code). Kode rantai (chain code) adalah metode yang sering
digunakan untuk mengidentifikasi bentuk (contour) suatu citra[2][6].
Setelah didapatkan fitur warna dan bentuk, akan terbentuk suatu pola tertentu. Pola
tersebut dapat digunakan untuk
mengklasifikasi citra daun[4]. Pada penelitian ini digunakan metode naive bayes untuk menentukan klasifikasi tumbuhan. Daun yang digunakan pada penelitian ini adalah daun mangga, salam dan sawo.
2.
METODE PENELITIAN
Tahap-tahap pada penelitian ini adalah pra-proses, fitur ekstraksi, klasifikasi dan post-proses.
Metode yang digunakan dalam penelitian ini adalah sebagai berikut.
2.1 Kode Rantai (Chain code)
Kode rantai seperti pada gambar 1 sering digunakan untuk mengidentifikasi bentuk (contour) suatu citra. Kode ini terbagi menjadi 8 arah dimana urutan pembacaan arah dari satu titik ke titik yang lain sesuai dengan arah jarum jam[6]. 3 2 1 4 0 5 6 7
Gambar 1. Arah Kode Rantai
Untuk menghitung keliling area suatu citra dapat menggunakan persamaan (1) berikut[7].
P = jumlahKodeGenap +
√2.jumlahKodeGanjil (1)
Dengan menggunakan jumlah kode genap dan ganjil pada arah kode rantai dapat menghasilkan keliling area suatu citra. Untuk kode ganjil digunakan √2 karena arah pada kode tersebut diagonal.
Sedangkan untuk menghitug luas suatu citra menggunakan kode rantai seperti pada persamaan (2)[7].
Kode 0 : Area = Area + Y
Kode 1 : Area = Area + (Y + 0.5) Kode 2 : Area = Area
Kode 3 : Area = Area – (Y + 0.5) Kode 4 : Area = Area – Y
Kode 5 : Area = Area – (Y – 0.5) Kode 6 : Area = Area
Kode 7 : Area = Area + (Y – 0.5) (2)
Dimana total area keseluruhan adalah Ʃ Area.
2.2 Naïve Bayes
Naïve bayes adalah suatu metode pengklasifikasian paling sederhana dengan menggunakan peluang yang ada, dimana diasumsikan bahwa setiap variable X bersifat bebas (independence)[3].
Karena asumsi variabel tidak saling terikat, maka didapatkan persamaan (3).
(3) Data yang digunakan dapat bersifat kategorial maupun kontinyu. Untuk data
kontinyu dapat diselesaikan dengan
1. Hitung probabilitas (Prior) tiap kelas yang ada.
2. Lalu hitung rata-rata (mean) tiap fitur dengan persamaan (4).
(4) Dimana :
k = banyaknya data n = nilai data
3. Kemudian hitung nilai standar deviasi dari fitur tersebut seperti pada persamaan (5).
(5)
4. Selanjutnya menghitung densitas
probabilitasnya menggunakan persamaan (6).
(6)
5. Setelah didapatkan nilai densitas
probabilitas dan prior, hitung probabilitas masing-masing kelas dengan menggunakan persamaan (7).
P = P (X│Ci) × P(Ci) (7) Nilai probabilitas terbesar adalah kelas yang sesuai.
Sedangkan untuk data kategorial, hanya memerlukan semua kemungkinan yang terjadi.
Metode kode rantai digunakan pada tahap fitur ekstraksi sedangkan metode naive bayes digunakan pada tahap klasifikasi.
3.
HASIL DAN PEMBAHASAN
Secara garis besar, sistem bekerja sebagai berikut. Pertama, pilih gambar daun yang ingin dikenali. Ketika gambar akan diproses oleh sistem, gambar akan melalui pra-proses dimana nilai RGB gambar disimpan terlebih dahulu dan noise pada gambar dihilangkan. Selanjutnya dilakukan perubahan dari gambar
berwarna menjadi grayscale untuk
mendapatkan bentuk biner gambar tersebut. Setelah permrosesan gambar selesai, dilakukan ekstraksi fitur dengan chain code untuk mendapatkan keliling dan luas daun tersebut. Kemudian dilakukan proses klasifikasi dengan menggunakan naïve bayes.
Sistem diuji dengan database yang berisikan data 102 daun sebagai data latih dan 15 data sampel untuk diuji terlihat pada table 1.
Tabel 1. Jumlah Data Training dan Data Sampel dalam Database
No. Nama Daun Jumlah Citra
1. Mangga 38
2. Salam 35
3. Sawo 40
Total Jumlah Citra 113
Masing-masing daun yang akan diuji dicari terlebih dahulu pobabilitas kemunculannya. Sehingga dapat digunakan dalam menentukan klasifikasi pada data testing.
Selanjutnya nilai rata-rata dan varian setiap fitur yang digunakan dihitung menggunakan persamaan(4) dan (5) sehingga dihasilkan nilai seperti pada tabel 2.
Tabel 2. Nilai rata-rata dan varians tiap fitur
Setelah mengetahui nilai rata-rata dan varian tiap fitur yang digunakan maka hasil pengujian dari data testing sebagai berikut.
Tabel 3. Hasil Pengujian
Sampel Kelas Posterior Prediksi Hasil
1 Sawo 7.8417E-22 Sawo Benar 2 Sawo 1.0964E-20 Sawo Benar
3 Sawo 4.76E-21 Sawo Benar
4 Sawo 5.7272E-21 Sawo Benar 5 Sawo 1.6761E-21 Sawo Benar 6 Salam 3.5315E-32 Salam Benar 7 Salam 4.2482E-24 Salam Benar 8 Salam 1.304E-23 Mangga Salah 9 Salam 5.0189E-30 Salam Benar 10 Salam 2.2832E-25 Salam Benar 11 Mangga 9.4223E-23 Mangga Benar 12 Mangga 6.8895E-24 Mangga Benar 13 Mangga 4.69765E -24 Mangga Benar 14 Mangga 3.1994E-24 Salam Salah
15 Mangga 5.48E-23 Mangga Benar
Dari 15 data sampel terdapat 2 data yang salah prediksi sehingga total akurasi dari data yang terdapat pada tabel 3 adalah 86.67%. Keakurasiannya untuk tiap kelas daun mangga, salam dan sawo adalah 80%, 80% dan 100%.
Ada beberapa hal yang harus diperhatikan dalam pengujian tersebut yaitu ukuran citra yang digunakan harus sama agar ketika pengecekan kode rantai kompleksitasnya tidak terlalu tinggi.
4.
KESIMPULAN
Berdasarkan hasil uji coba dapat
disimpulkan bahwa metode chain code cukup
Fitur Mean Variance
R --- Sawo 33.46 85.61 R --- Mangga 148.82 139.85 R --- Salam 130.67 1058.33 G --- Sawo 49.37 188.42 G --- Mangga 153.64 141.45 G --- Salam 111.10 1263.96 B --- Sawo 29.29 80.21 B --- Mangga 135.88 189.99 B --- Salam 115.53 1137.92 chainDiagUtama --- Sawo 125.14 1062.24 chainDiagUtama --- Mangga 108.45 3250.01 chainDiagUtama --- Salam 76.60 2333.41 chainDiagSamping --- Sawo 112.34 1470.17 chainDiagSamping --- Mangga 95.88 3406.96 chainDiagSamping --- Salam 62.37 2341.09 chainVertikal --- Sawo 265.54 6759.43 chainVertikal --- Mangga 387.76 37016.49 chainVertikal --- Salam 191.57 12446.48 chainHorizontal --- Sawo 57.60 597.54 chainHorizontal --- Mangga 19.79 181.08 chainHorizontal --- Salam 46.57 1441.67 Keliling --- Sawo 659.00 35283.49 Keliling --- Mangga 696.52 112437.41 Keliling --- Salam 434.13 70732.36 Luas --- Sawo 30881.43 96579381.19 Luas --- Mangga 28047.83 361121619.22 Luas --- Salam 25266.20 499290986.84
efektif untuk mendapatkan bentuk daun sehingga fitur bentuk lebih optimal. Hasil uji coba menunjukkan bahwa metode naïve bayes cukup efektif untuk proses klasifikasi.
DAFTAR PUSTAKA
[1] Agus Zainal Arifin, Bayu Bagus, dan Dini Adni Navastara, “Klasifikasi Online Citra Daun berdasarkan Fitur Bentuk dan Ruas Daun”, Jurusan Teknik Informatika, Fakultas Teknik, Institut Teknologi Sepuluh November, 2009.
[2] Z. Wang, Z. Chi, D. Feng, Q. Wang, Leaf Image Retrieval with Shape Features, Lecture Notes in Computer Science 1929 (2000) 477–487.
[3] Cahyo Darujati dan Agustinus Bimo
Gumelar, “Pemanfaatan Teknik
Supervised untuk Klasifikasi Teks Bahasa
Indonesia”, Sistem Informasi, Fakultas
Ilmu Komputer, Universitas Narotama Surabaya, 2012.
[4] Shih, Frank Y. Image Processing and
Pattern Recognition : Fundamentals and Techniques. 2010. Wiley
[5] Anonymous. Struktur Jaringan & Fungsi Daun. 2012. URL : http://www.sentra- edukasi.com/2011/06/struktur-jaringan-fungsi-daun.html, diakses tanggal 28 Desember 2012.
[6] Cris Luengo. How to Obtain Chain Code.
2010. URL :
http://www.cb.uu.se/~cris/blog/index.php/ archives/324, diakses tanggal 11 Oktober 2012
[7] Prof. Yingli Tian, 2012 : “Digital Image
Processing Lecture 21 : Image Descriptor and Representation 1”. The City College
of New York. URL :
www-ee.ccny.cuny.edu/www/web/yltian/Cours es/EE4710/EE4710_Lec21.PDF, diakses tanggal 2 Januari 2013.