IDENTIFIKASI HAMA TANAMAN CABAI DENGAN
MEMBANDINGKAN PRINCIPAL COMPONENT ANALYSIS
DAN GRAY LEVEL CO-OCCURRENCE MATRIX
RINI WINDYASTUTI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Hama Tanaman Cabai dengan Membandingkan Principal Component Analysis dan Gray Level Co-Occurrence Matrix adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
ABSTRAK
RINI WINDYASTUTI. Identifikasi Hama Tanaman Cabai dengan Membanding- kan Principal Component Analysis dan Gray Level Co-Occurrence Matrix. Dibimbing oleh TOTO HARYANTO dan NINA MARYANA.
Cabai merupakan salah satu komoditas hortikultura jenis sayuran buah yang bernilai ekonomi tinggi. Produktivitas cabai yang relatif masih rendah di antaranya disebabkan oleh serangan hama. Salah satu cara mengidentifikasi hama yaitu dengan menggunakan sistem identifikasi secara otomatis berbasis citra digital. Pada penelitian ini dilakukan perbandingan dua ekstraksi ciri yaitu Principal Component Analysis (PCA) dan Gray Level Co-Occurrence Matrix (GLCM) dengan klasifikasi menggunakan Probabilistic Neural Network (PNN). Ekstraksi ciri PCA yang dilakukan pada penelitian ini menggunakan proporsi 80%, 90%, dan 95% dan ekstraksi ciri GLCM menggunakan sudut 0o, 45o, 90o, dan 135o. Hasil penelitian menunjukkan bahwa hasil akurasi identifikasi dengan menggunakan ekstraksi ciri GLCM lebih baik dibandingkan PCA. Hasil akurasi tertinggi pada GLCM yaitu sebesar 72% dan PCA yaitu sebesar 65%.
Kata kunci: Gray Level Co-Occurrence Matrix, hama, PNN, Principal Component Analysis
ABSTRACT
RINI WINDYASTUTI. Identification of Pests of Chili with Comparing Principal Component Analysis and Gray Level Co-Occurrence Matrix. Supervised by TOTO HARYANTO and NINA MARYANA.
Chili is one of the highly regarded vegetables and fruits economically. Chili’s productivity is highly affected by the presence of its pests. Pest identification can done by automatic system pests identification based on image. In this research, two features extraction algorithms are used for the system, i.e. Principal Component Analysis (PCA) and the Gray Level Co-Occurrence Matrix (GLCM), and the classification method Probabilistic Neural Network (PNN). PCA parameters are setup using proportion of 80%, 90%, and 95 % while GLCM uses angles of 0o, 45o, 90o, and 135o. The results show that GLCM outperforms PCA in term of accuracy, with accuracy level 72% for GLCM and 65% for PCA. Keywords: Gray Level Co-Occurrence Matrix, pest, PNN, Principal Component
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada
Departemen Ilmu Komputer
IDENTIFIKASI HAMA TANAMAN CABAI DENGAN
MEMBANDINGKAN PRINCIPAL COMPONENT ANALYSIS
DAN GRAY LEVEL CO-OCCURRENCE MATRIX
RINI WINDYASTUTI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERATANIAN BOGOR
Judul Skripsi : Identifikasi Hama Tanaman Cabai dengan Membandingkan Principal Component Analysis dan Gray Level Co-Occurrence Matrix
Nama : Rini Windyastuti NIM : G64090076
Disetujui oleh
Toto Haryanto, SKom MSi Pembimbing I
Dr Ir Nina Maryana, MSi Pembimbing II
Diketahui oleh
Dr Ir Agus Buono, MSi MKom Ketua Departemen
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini dapat diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Oktober 2012 ini ialah pengolahan citra digital, dengan judul Identifikasi Hama Tanaman Cabai dengan Membandingkan Principal Component Analysis dan Gray Level Co-Occurrence Matrix.
Terima kasih penulis ucapkan kepada pihak-pihak yang telah membantu dalam penyelesaian tugas akhir ini, yaitu:
1 Ayahanda Bahri Au, Ibunda Siti Nilawati, adik Abdiel Reihan serta seluruh keluarga atas segala doa dan kasih sayangnya.
2 Bapak Toto Haryanto, SKom MSi dan Ibu Dr Ir Nina Maryana, MSi selaku dosen pembimbing yang telah memberikan arahan dan bimbingan kepada penulis dalam menyelesaikan tugas akhir ini.
3 Ibu Dr Imas S Sitanggang, SSi MKom selaku dosen penguji.
4 Ibu Aisyah dan Bapak Wawan yang telah membantu penulis dalam menyediakan hama tanaman cabai.
5 Rizkia Hanna Amalia, Kak Cut Malisa Irwan dan M. Luthfi Fajar sebagai teman satu bimbingan yang selalu memberikan masukan dan semangat kepada penulis.
6 Syamsul Arifin, Nurul Azizah, dan sahabat kesebelasan atas segala motivasi, semangat, dukungan, masukan, dan saran selama proses pengerjaan skripsi ini. 7 Rekan-rekan di Departemen Ilmu Komputer angkatan 46 atas segala
kebersamaan.
Semoga karya ilmiah ini bermanfaat.
DAFTAR ISI
DAFTAR TABEL viii
DAFTAR GAMBAR viii
DAFTAR LAMPIRAN viii
PENDAHULUAN 1
Latar Belakang 1
Tujuan Penelitian 2
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE 2
Data Citra Hama 2
Praproses 4
Ekstraksi Ciri Menggunakan PCA 5
Ekstraksi Ciri Menggunakan GLCM 6
K-Fold Cross Validation 8
Klasifikasi dengan Probabilistic Neural Network 8
Evaluasi 9
HASIL DAN PEMBAHASAN 9
Data Citra Hama 9
Praproses 10
Ekstraksi Ciri Menggunakan PCA 10
Ekstraksi Ciri Menggunakan GLCM 11
Perbandingan Hasil Akurasi PCA dan GLCM 12
Analisis Hasil Ekstraksi Ciri PCA Terhadap Identifikasi 13 Analisis Hasil Ekstraksi Ciri GLCM Terhadap Identifikasi 14
Ekstraksi Ciri Menggunakan GLCM Tanpa Resize 15
Hasil Antarmuka Sistem 16
SIMPULAN DAN SARAN 17
Simpulan 17
Saran 18
DAFTAR ISI (2)
LAMPIRAN 20
DAFTAR TABEL
1 Fold data latih dan data uji 8
2 Hasil akurasi (%) PCA dengan menggunakan proporsi 80, 90 dan 95% 11
3 Hasil akurasi (%) GLCM menggunakan jarak 1 11
4 Hasil akurasi (%) GLCM menggunakan jarak 2 12
5 Hasil akurasi (%) GLCM menggunakan jarak 3 12
6 Hasil confusion matrix PCA dengan data uji S3 13 7 Hasil confusion matrix GLCM menggunakan data uji S2, sudut 45o
dan jarak 3 14
8 Selisih dari nilai rata-rata ciri GLCM kelas 1 (T. parvispinus) 15 9 Hasil akurasi (%) GLCM tanpa resize dengan jarak 1 15 10 Hasil akurasi (%) GLCM tanpa resize dengan jarak 2 15 11 Hasil akurasi (%) GLCM tanpa resize dengan jarak 3 16
DAFTAR GAMBAR
1 Alur penelitian 3
2 Struktur PNN 9
3 Tahapan praproses citra 10
4 Grafik perbandingan akurasi rata-rata PCA dan GLCM 13
5 Data latih M. persicae 14
6 Contoh citra hama data latih dan data uji pada kelas 1 (T. parvispinus) 15
7 Antarmuka menu Identifikasi 16
8 Antarmuka hasil identifikasi 17
DAFTAR LAMPIRAN
1 Tujuh citra hama cabai 20
PENDAHULUAN
Latar Belakang
Cabai (Capsicum annum) adalah salah satu komoditas hortikultura jenis sayuran buah yang bernilai ekonomi tinggi dan cocok untuk dikembangkan di daerah tropika seperti Indonesia. Penduduk Indonesia sangat menggemari cabai karena dapat digunakan pada beraneka masakan. Dengan demikian, prospek pemasaran cabai sangat cerah dan potensi pasarnya cukup tinggi. Menurut data Deptan (2012), rata-rata konsumsi cabai per kapita adalah 1 500 gram per tahun. Dengan jumlah penduduk sebanyak 237.6 juta (sensus tahun 2010), berarti Indonesia membutuhkan cabai sebanyak 356 400 ton per tahun. Sekalipun ada kecenderungan peningkatan kebutuhan, tetapi permintaan terhadap cabai merah untuk kebutuhan sehari-hari berfluktuasi, yang disebabkan oleh naik turunnya harga cabai yang terjadi di pasar eceran. Faktor yang menyebabkan produktivitas cabai rendah di Indonesia di antaranya disebabkan oleh gangguan organisme pengganggu tanaman (Suryaningsih dan Hadisoeganda 2007). Kerusakan yang disebabkan oleh serangan hama pada cabai masih merupakan penyebab utama kegagalan panen sehingga hama menjadi faktor penting yang harus diperhatikan dalam budidaya tanaman cabai.
Pada identifikasi hama cabai, yang masih biasa dilakukan adalah masih secara manual dengan membawa hama serangga ke laboratorium dan diidentifikasi dengan merujuknya pada buku identifikasi baik berupa kunci identifikasi maupun gambar acuan atau membandingkan dengan spesimen pembanding di laboratorium. Untuk mempermudah proses identifikasi, dikembangkan suatu sistem berbasis citra yang dapat mengidentifikasi hama secara otomatis.
2
Tujuan Penelitian
Tujuan penelitian ini adalah menerapkan dan membandingkan kemampuan ekstraksi ciri PCA dan GLCM dengan menggunakan klasifikasi PNN sebagai metode identifikasi hama tanaman cabai berbasis citra.
Manfaat Penelitian
Manfaat yang dapat diperoleh dari penelitian ini adalah dihasilkannya suatu sistem untuk identifikasi hama pada tanaman cabai berbasis citra yang dapat membantu bagi praktisi tanaman cabai dalam melakukan identifikasi hama secara otomatis. Kemudian mengetahui metode ekstraksi ciri yang menghasilkan akurasi yang lebih baik antara PCA dan GLCM dalam mengidentifikasi citra hama cabai.
Ruang Lingkup Penelitian
Dari analisis yang telah dilakukan dapat dirumuskan beberapa batasan masalah pada penelitian ini.
1 Penelitian dibatasi pada 7 jenis hama serangga pada tanaman cabai
2 Hama cabai yang digunakan dalam penelitian ini diperoleh dari Kebun Cabai di Kecamatan Cipanas, Kabupaten Cianjur, dan Kebun cabai di Pasir Muncang, Kecamatan Megamendung, Jawa Barat. Selain itu digunakan juga spesimen yang ada di Laboratorium Biosistematika Serangga, Departemen Proteksi Tanaman, Fakultas Pertanian, IPB. Data diperoleh juga dari informasi yang didapat pada buku dan internet.
METODE
Secara garis besar, alur metode penelitian ini digambarkan pada Gambar 1. Tahapan penelitian ini meliputi pengumpulan data citra, praproses, ekstraksi ciri citra, data dibagi menjadi data uji dan data latih menggunakan k-fold cross validation, klasifikasi PNN, dan evaluasi.
Data Citra Hama
Data yang digunakan adalah 7 jenis citra hama yang disajikan pada Lampiran 1. Setiap satu jenis hama terdiri atas 30 citra hama sehingga total citra hama yang digunakan sebanyak 210 citra. Jenis hama yang digunakan pada penilitian ini terdiri atas:
Trips parvispinus Karny (Thysanoptera: Thripidae)
3
keperakan menjadi kecoklatan dan daun mengeriting dengan arah ke atas (Prabaningrum dan Moekasan 1996). Tubuh imago T. parvispinus berwarna coklat. Bagian kepala dan toraks lebih pucat dibanding dengan bagian abdomen. Pada bagian kepala terdapat sepasang antena yang terdiri atas tujuh ruas. Tungkai pada umumnya berwarna kuning (Sartiami et al. 2011).
Myzus persicae (Sulz.) (Hemiptera: Aphididae)
Secara umum M. persicae tubuhnya lunak, berbentuk seperti buah pir, mobilitasnya rendah dan biasanya hidup secara berkoloni (Setiawati et al. 2005). Hama ini dapat menyebabkan kerusakan pada daun yang disebabkan oleh aktivitas makan dengan cara menghisap cairan daun. Daun yang terserang keriput, berwarna kekuningan, terputir dan pertumbuhan tanaman terhambat (Suryaningsih dan Prabaningrum 1998).
Empoasca sp. (Homoptera: Cicadellidae)
Empoasca sp. disebut juga wereng. Wereng berukuran kecil dan gerakannya sangat lincah, jika terganggu akan meloncat dengan cepat. Hama ini mengisap cairan tanaman yang mengakibatkan tanaman menjadi lemah. Wereng juga menghasilkan racun yang dapat merusak tanaman. Gejala serangan hama ini menyebabkan bintik-bintik putih pada daun, karena cara makannya dengan menusuk dan mengisap, terutama pada permukaan atas daun (Setiawati et al. 2005).
Citra Hama
Praproses
GLCM PCA
K-fold cross validation
PNN
Evaluasi
Citra Latih Citra Uji
4
Helicoverpa armigera (Hȕbner) (Lepidoptera: Noctuidae)
Hama ini menyerang buah cabai muda maupun tua dengan membuat lubang dan memakannya, serangga ini juga bersifat polifag. Telur H. armigera berwarna kuning muda dan berubah menjadi abu-abu dan hitam ketika akan menetas menjadi larva. Setelah fase larva H. armigera mengalami fase pupa sebelum menjadi ngengat (fase dewasa). Ngengat H. armigera memiliki sayap dengan warna coklat dengan satu bintik hitam pada sayap tersebut. Sayap belakangnya memiliki tepi berwarna hitam, sedangkan pangkal sayap berwarna putih kecoklatan (Herlinda 2005).
Bactrocera dorsalis Hendel (Diptera: Tephritidae)
Hama ini memiliki tubuh berwarna cerah dengan pita-pita berwarna mencolok pada sayapnya. Biasanya imago memakan cairan atau sekresi dari kumbang atau serangga lainnya, juga nektar yang terdapat pada bunga serta cairan buah lainnya. Lalat buah jarang ditemukan pada pagi hari, tetapi sering ditemukan pada siang hari sampai sore hari, terutama menjelang senja (Setiawati et al. 2005). Serangan B. dorsalis atau lalat buah pada buah cabai ditandai dengan adanya titik hitam pada pangkal buah dan apabila buah dibelah, di dalamnya terdapat belatung (Widodo et al. 2010).
Spodoptera litura Fabricius (Lepidoptera: Noctuidae)
S. litura disebut juga ulat gerayak. Hama ini menyerang daun yang ditandai dengan adanya lubang-lubang tidak beraturan. Serangan menyebabkan tanaman menjadi gundul (Suryaningsih dan Prabaningrum 1998). Telur berbentuk bulat dengan bagian datar melekat pada daun, telur berwarna coklat kekuningan. Warna larva bervariasi, larva mempunyai tanda kalung dan bulan sabit berwarna hitam pada ruas abdomen yang ke empat dan ke sepuluh (Setiawati et al. 2005).
Praproses
5
Operator Sobel adalah magnitude dari gradient yang dihitung dengan rumus: M = √
Matriks operator Sobel dapat dilihat di bawah ini.
[ pixel yang lebih dekat dengan titik pusat (Febriani dan Lussiani 2008).
Ekstraksi Ciri Menggunakan PCA
PCA mentransformasikan sejumlah peubah yang saling berkorelasi menjadi sekumpulan peubah yang tidak berkorelasi. Teknik ini mereduksi dimensi himpunan peubah yang biasanya terdiri dari peubah yang banyak dan saling berkorelasi menjadi peubah baru yang tidak berkorelasi. Pada tahap ekstraksi ciri dengan menggunakan metode PCA, data yang dimasukkan pada ekstraksi ciri PCA adalah dalam bentuk vektor. Data citra yang dihasilkan pada tahap praproses berukuran 60 x 60 pixel akan ditransformasikan menjadi vektor yang berukuran 1 x 3600. Kumpulan data citra yang diubah dalam suatu vektor dapat dilihat pada persamaan di bawah ini:
f(x1,y1),...,f(xq,y1),...,f(x1,yk),...,f(xq,yk)
6
Perhitungan rata-rata dari suatu data citra yang sudah dinormarlisasi dengan mengurangkan nilai masing-masing data citra dengan rata-rata seluruh data citra yang dilakukan penggandaan pada rata-rata seluruh data citra sebanyak data citra. Hasil perhitungan rata-rata digunakan untuk mendapatkan nilai matriks kovarian, seperti terlihat pada persamaan dibawah ini:
C
dengan:
µi = nilai rata-rata baris ke-i matriks x k = banyaknya data (Budiman 2008)
Dengan demikian, untuk mendapatkan ciri dari suatu data yang direpresentasikan dalam bentuk matriks, maka dihitung vektor eigen dan nilai eigen dari matriks covarian yang dapat dilihat pada persamaan:
Cv = bIv
Nilai eigen yang dihasilkan berupa vektor kemudian diurutkan secara menurun dari nilai paling besar menuju nilai yang paling kecil. Vektor eigen yang bersesuaian dengan nilai terbesar dari nilai eigen mempunyai ciri yang paling dominan. Pada penelitian ini dilakukan 3 kali percobaan dengan proporsi yang berbeda yaitu 80, 90, dan 95%. Proporsi ini berguna untuk menentukan besarnya komponen utama yang digunakan.
Ekstraksi Ciri Menggunakan GLCM
7 ekstraksi ciri dengan menggunakan metode GLCM, data citra yang dimasukkan pada GLCM ialah data citra hasil tahap praproses. Ekstraksi ciri GLCM yang dilakukan pertama kali ialah menormalisasikan jumlah elemennya sama dengan 1. Setiap elemen pixel (i,j) dalam GLCM yang sudah dinormalisasi menunjukkan terjadinya peluang gabungan pasangan pixel dengan hubungan spasial yang didefinisikan memiliki tingkat keabuan i dan j pada citra.
Teknik GLCM mencakup perhitungan entropi, kontras, energi, homogenitas, dan korelasi. Entropi berfungsi untuk mengukur keteracakan dari distribusi perbedaan lokal dalam citra (Gadkari 2004). Persamaan entropi diuraikan sebagai berikut.
entropi ∑ log ,
Kontras menyatakan sebaran terang (lightness) dan gelap (darkness) di dalam sebuah gambar, befungsi untuk mengukur perbedaan lokal dalam citra (Gadkari 2004). Persamaan kontras adalah:
kontras ∑| | ,
,
Energi digunakan untuk mengukur konsentrasi pasangan graylevel. Nilai ini didapat dengan meningkatkan setiap elemen dalam GLCM, kemudian dijumlahkan (Gadkari 2004). Persamaan energi adalah sebagai berikut.
energi ∑ ,
,
8
K-Fold Cross Validation
Seluruh data hasil ekstraksi ciri masing-masing dibagi menjadi data latih dan data uji. Pembagian data latih dan data uji dilakukan dengan menggunakan metode k-fold cross validation dengan menggunakan kombinasi k = 5. Proses identifikasi dilakukan dengan 5 fold. Fold pertama S2, S3, S4 dan S5 digunakan
sebagai data latih sedangkan S1 digunakan sebagai data uji. Pada fold kedua S1, S3, S4 dan S5 digunakan sebagai data latih sedangkan S2 digunakan sebagai data
uji, dan seterusnya. Fold yang digunakan untuk data latih dan data uji secara lengkap disajikan pada Tabel 1.
Klasifikasi dengan Probabilistic Neural Network
Klasifikasi dapat dilakukan setelah matriks terpisah komponennya menjadi data latih dan data uji. Setelah itu dilakukan klasifikasi yang hasilnya dapat dilihat seberapa banyak data yang cocok dan yang tidak cocok dari pembagian data latih serta data uji. Banyaknya kelas target pada penelitian ini adalah 7 sesuai dengan jenis hama yang diidentifikasi. Citra yang digunakan pada proses klasifikasi adalah citra hasil proses pendeteksian tepi. Matriks yang masuk pada tahap pelatihan PNN merupakan hasil proyeksi vektor hasil ekstraksi terhadap citra latih.
PNN terdiri atas empat lapisan, yaitu lapisan masukan, lapisan pola, lapisan penjumlahan, dan lapisan keluaran. Struktur PNN dapat dilihat pada Gambar 2. Lapisan masukan (input layer) merupakan input x yang terdiri atas k nilai yang diklasifikasikan pada salah satu kelas dari n kelas. Pada lapisan pola (pattern layer) dihitung jarak vektor data latih ke vektor data uji. Pada lapisan penjumlahan (summation layer), setiap keluaran pattern layer dijumlahkan dengan keluaran dari pattern layer lainnya yang berada dalam satu kelas untuk menghasilkan probabilitas vektor output. Lapisan penjumlahan ini dapat dilihat persamaannya sebagai berikut.
N = jumlah pola pelatihan seluruh kelas
9 NA = jumlah pola pelatihan pada kelas A
= faktor penghalus
Pada output layer, diambil nilai maksimum dari vektor output. Proses pelatihan digunakan data hasil dari kombinasi k-fold cross validation untuk masing-masing kelas. Proses pengujian dilakukan dengan menggunakan data berdasarkan k-fold cross validation untuk masing-masing kelas. Masing-masing data uji dijadikan input layer yang kemudian dihitung peluangnya terhadap masing-masing kelas yang ada pada sistem. Nilai peluang terbesar yang dihasilkan data uji merupakan kelas yang merepresentasikan data uji tersebut.
Gambar 2 Struktur PNN (Sumber: Specht 1990) Evaluasi
Dari hasil masing-masing matriks yang diklasifikasikan dengan PNN kemudian ditentukan dan dibandingkan melalui besaran akurasi yang berhasil dicapai. Akurasi dihitung dengan persamaan berikut:
Akurasi = ∑data uji enar klasifikasi
∑data uji
HASIL DAN PEMBAHASAN
Data Citra Hama
10
dino capture adalah 1280×1024 pixel. Kelas citra terdiri atas: T. parvispinus, M. persicae, Empoasca sp, B. dorsalis, H. armigera, larva S. litura (larva), dan H. armigera (larva).
Praproses
Tahapan praproses pada citra yang dilakukan ialah dilakukan cropping secara manual kemudian mengubah citra asli menjadi 60×60 pixel. Setelah itu citra diubah dari citra RGB menjadi grayscale kemudian hasil citra grayscale dilakukan proses pemfilteran menggunakan operator Sobel. Hasil praproses ini di-input-kan pada proses ekstraksi ciri GLCM, sedangkan pada proses ekstraksi PCA data citra yang dihasilkan pada tahap praproses berukuran 60×60 pixel ditransformasikan menjadi vektor yang berukuran 1×3600 sehingga matriks citra latih yang di-input-kan pada proses ekstraksi ciri PCA berukuran 168×3600, dengan 168 merupakan banyak citra yang dilatih. Tahapan praproses citra dapat dilihat pada Gambar 3.
Ekstraksi Ciri Menggunakan PCA
Pada proses PCA terbentuk matriks kovarian berukuran 3600×3600 dengan menghasilkan nilai eigen yang mewakili 3600 kolom. Penggunaan proporsi 80, 90, dan 95% dengan menggunakan data latih S2, S3, S4, dan S5 berdasarkan 5-fold cross validation pada percobaan pertama dengan menggunakan proporsi 80% menghasilkan komponen utama berdimensi 68, yang berarti data sebanyak 68 kolom mewakili sebesar 80% data citra. Komponen utama dari proporsi 80% berupa matriks berukuran 3600×68. Matriks PCA yang menjadi input pada PNN merupakan hasil proyeksi dari matriks citra latih hasil normalisasi dengan komponen utama. Dengan demikian, dimensi matriks input PNN pada percobaan pertama adalah 168×68.
Komponen utama yang dihasilkan pada percobaan ke dua dengan menggunakan proporsi 90% yaitu menghasilkan komponen utama berupa matriks berukuran 3600×101. Dimensi matriks input PNN berdasarkan proporsi 90% adalah 168×101.
Pada percobaan ke tiga dengan menggunakan proporsi 95% menghasilkan komponen utama berdimensi 125, yang berarti data sebanyak 125 kolom mewakili sebesar 95% citra. Komponen utama dari proporsi 95% berupa matriks berukuran
Gambar 3 Tahapan praproses citra
Operator
Sobel
grayscale cropping
11 3600×125. Dengan demikian dimensi matriks input PNN pada percobaan ke tiga adalah 168×125. Kemudian masing-masing percobaan dilakukan pengujian dengan data uji berdasarkan 5-fold cross validation menggunakan klasifikasi PNN dengan proporsi 80, 90, dan 95% (Tabel 2).
Tingkat akurasi yang paling tinggi yaitu sebesar 69% pada fold kedua dengan menggunakan proporsi 80% dan data uji S2. Hasil rata-rata akurasi pada ketiga proporsi ini menunjukkan akurasi optimum tercapai dengan menggunakan PCA proporsi 80%. Hal ini menunjukkan bahwa dengan semakin besarnya komponen utama yang digunakan tidak selalu memberikan pengaruh yang lebih baik terhadap akurasi.
Ekstraksi Ciri Menggunakan GLCM
Data hasil tahap praproses diekstraksi ciri menggunakan GLCM, kemudian setiap citra dibuat matriks co-occurrence dengan sudut yang digunakan yaitu 0, 45, 90dan 135º dengan jarak 1, 2, dan 3. Pertama dilakukan perhitungan nilai peluang antar nilai pixel yang berdekatan secara horizontal, diagonal, dan vertikal sesuai dengan sudut yang ditentukan dengan jarak. Kemudian hasil matriks peluang dinormalisasi yaitu nilai peluang pasangan pixel dibagi dengan jumlah semua peluang nilai pixel berdekatan sehingga hasil penjumlahan pixel dalam matriks sama dengan 1. Selanjutnya dari hasil tersebut dilakukan perhitungan entropi, energi, homogenitas, kontras, dan korelasi. Hasil perhitungan tersebut membentuk dimensi matriks input PNN yaitu 168×5. Percobaan pertama dilakukan menggunakan jarak 1 dengan sudut 0, 45, 90,dan 135º. Hasil akurasi pada jarak 1 dapat dilihat pada Tabel 3.
Tabel 3 merupakan hasil akurasi pada jarak 1, yang memperlihatkan akurasi yang merata di setiap fold. Hasil rata-rata akurasi pada keempat sudut menunjukkan hasil tertinggi yaitu pada sudut 45o dan 90o sebesar 66%. Hasil
Tabel 2 Hasil akurasi (%) PCA dengan menggunakan proporsi 80, 90 dan 95%
Proporsi (%) Fold Rata-rata
1 2 3 4 5
80 64 69 57 67 67 65
90 55 50 55 64 60 57
95 50 48 50 57 55 52
Tabel 3 Hasil akurasi (%) GLCM menggunakan jarak 1
12
akurasi percobaan ke dua dengan sudut 0, 45, 90,dan 135º menggunakan jarak 2 dapat dilihat pada Tabel 4.
Tabel 4 Hasil akurasi (%) GLCM menggunakan jarak 2
Sudut (o) Fold Rata-rata
Akurasi pada jarak 2 menghasilkan akurasi rata-rata tertinggi yaitu pada sudut 90o sebesar 70%. Hasil akurasi percobaan ke tiga menggunakan sudut 0, 45, 90dan 135º dengan jarak 3 dapat dilihat pada Tabel 5.
Tabel 5 Hasil akurasi (%) GLCM menggunakan jarak 3
Sudut (o) Fold Rata-rata
Hasil percobaan ke tiga yang diperoleh menunjukkan akurasi yang merata di setiap fold. Rata-rata akurasi pada keempat sudut menunjukkan hasil tertinggi yaitu pada sudut 45o sebesar 72%. Hasil dari tiga percobaan dengan mengunakan jarak 1, 2 dan 3 menunjukkan hasil akurasi tertinggi yaitu pada jarak 3 dengan sudut 45o sebesar 72%.
Perbandingan Hasil Akurasi PCA dan GLCM
13
Gambar 4 Grafik perbandingan akurasi rata-rata PCA dan GLCM
Analisis Hasil Ekstraksi Ciri PCA Terhadap Identifikasi
Berdasarkan hasil pengujian terhadap setiap hama, dapat diketahui bahwa kelas 2 (M. persicae) memiliki tingkat akurasi terendah pada saat pengujian dibandingkan dengan kelas hama lainnya. Pada perbandingan setiap kelas, berdasarkan akurasi 57% pada Tabel 2 menggunakan proporsi 80% dan data uji S3 pada confusion matrix Tabel 6.
Tabel 6 merupakan confusion matrix perbandingan setiap kelas, terlihat penyebaran masing-masing hama setiap kelas dan hama yang masuk ke kelas yang tidak sesuai. Pada kelas 2 (M. persicae), dari 6 data hama uji hanya 1 yang teridentifikasi benar. Hal ini dapat disebabkan oleh data latih yang digunakan pada kelas 2 memiliki variasi bentuk pola pelatihan cukup tinggi yang dapat dilihat pada Gambar 5.
Tabel 6 Hasil confusion matrix PCA dengan data uji S3 Kelas hama 1 2 3 4 5 6 7 Akurasi (%) 4 = Helicoverpa armigera (imago)
14
Gambar 5 Data latih M. persicae
Analisis Hasil Ekstraksi Ciri GLCM Terhadap Identifikasi
Berdasarkan hasil pengujian terhadap setiap hama, dapat diketahui bahwa kelas 1 (T. parvispinus) memiliki tingkat akurasi terendah pada saat pengujian dibandingkan dengan kelas hama lainnya. Perbandingan setiap kelas, berdasarkan akurasi terendah sebesar 64% pada Tabel 5 dengan menggunakan data uji S2, sudut 45o dan jarak 3 dapat dilihat pada confusion matrix Tabel 7.
Tabel 7 merupakan confusion matrix penyebaran masing-masing hama setiap kelas dan hama yang masuk ke kelas yang tidak sesuai. Pada kelas 1 (T. parvispinus), dari 6 data hama yang diuji teridentifikasi benar ada 2. Hal ini dapat disebabkan kelas ini memiliki kemiripan nilai-nilai ciri yang tinggi dengan beberapa kelas lain dan dapat disebabkan beragamnya variasi pola pelatihan yang digunakan.
Hal lain dapat disebabkan oleh beragamnya nilai kontras. Pengaruh nilai kontras pada hasil pengujian dapat dilihat pada selisih dari nilai rata-rata ciri GLCM pada data latih dan data uji kelas 1 (T. parvispinus). Hasil selisih dari nilai rata-rata ciri GLCM pada data latih dan data uji kelas 1 dapat dilihat pada Tabel 8 dan hasil nilai ciri GLCM pada data latih dan data uji dilihat pada Lampiran 2. Pada Tabel 8 dari nilai rata-rata 5 ciri terlihat bahwa nilai kontras pada kelas ini memiliki selisih tertinggi dibandingkan dengan ke empat ciri lainnya. Hasil pengujian kelas 1 dapat dilihat pada Gambar 6.
Tabel 7 Hasil confusion matrix GLCM menggunakan data uji S2, sudut 45o dan jarak 3
15 Tabel 8 Selisih dari nilai rata-rata ciri GLCM kelas 1 (T. parvispinus) Data Entropi Kontras Homogen Energi Korelasi Data Latih 0 8.363522 0.590530 0.116208 0.280557 Data Uji 0 8.835385 0.550718 0.078399 0.297466
Selisih 0 0.471863 0.039812 0.037809 0.016909
.
Gambar 6 Contoh citra hama data latih dan data uji pada kelas 1 (T. parvispinus) Ekstraksi Ciri Menggunakan GLCM Tanpa Resize
Proses ekstraksi ciri GLCM tanpa resize dilakukan pada 3 percobaan dengan menggunakan jarak 1, 2 dan 3 berdasarkan 5-fold cross validation. Hasil akurasi pada jarak 1 dapat dilihat pada Tabel 9. Hasil akurasi jarak 2 dapat dilihat pada Tabel 10 dan jarak 3 dapat dilihat pada Tabel 11. Berdasarkan 3 percobaan tersebut hasil rata-rata akurasi tertinggi yaitu pada jarak 1 menggunakan sudut 0o sebesar 85%.
Tabel 9 Hasil akurasi (%) GLCM tanpa resize dengan jarak 1
Sudut (o) Fold Rata-rata
1 2 3 4 5
0 83 83 93 81 83 85
45 76 74 69 76 71 73
90 86 76 83 81 76 80
135 79 81 81 69 69 76
Tabel 10 Hasil akurasi (%) GLCM tanpa resize dengan jarak 2
Sudut (o) Fold Rata-rata
1 2 3 4 5
0 81 86 88 86 83 85
45 79 69 62 71 71 70
90 79 76 74 74 69 74
135 69 64 62 69 67 66
16
Tabel 11 Hasil akurasi (%) GLCM tanpa resize dengan jarak 3
Sudut (o) Fold Rata-rata
1 2 3 4 5
0 86 67 83 76 81 79
45 64 64 69 74 69 68
90 74 64 76 67 71 70
135 79 57 57 69 64 65
Data citra hasil tahap praproses dengan resize dan tanpa resize pada ekstraksi ciri GLCM dapat mempengaruhi hasil akurasi pada proses identifikasi. Hal ini dapat disebabkan dengan melakukan resize, dapat menghilangkan tekstur citra yang sebenarnya dan menurunkan kualitas citra. Hal lain dapat disebabkan oleh pada kelas 6 dan kelas 7 memiliki tekstur dan bentuk tubuh yang memanjang dengan ukuran citra 1500 x 500, kemudian dilakukan resize ukuran citra menjadi 60 x 60 sehingga menghasilkan citra yang memampat. Hal tersebut dapat menyebabkan kesalahan proses identifikasi.
Hasil Antarmuka Sistem
Antarmuka sistem ini hanya terdiri atas 1 menu yaitu menu Identifikasi. Tampilan menu Identifikasi dapat dilihat pada Gambar 7. Pada menu Identifikasi, user dapat mengambil citra hama dari gallery komputer. Kemudian user dapat memilih ekstraksi ciri PCA dan GLCM. Selanjutnya identifikasi citra hama akan diproses. Hasil yang ditampilkan merupakan nama citra hama yang telah diidentifikasi. Tampilan hasil identifikasi dapat dilihat pada Gambar 8.
17
Gambar 8 Antarmuka hasil identifikasi
SIMPULAN DAN SARAN
Simpulan
Program dapat mengklasifikasikan citra hama tanaman cabai ke dalam kelas tertentu dengan tingkat pengenalan masukan yang berbeda untuk setiap fold. Hasil percobaan dengan proporsi 80, 90, dan 95% ekstraksi ciri PCA pada penelitian ini menunjukkan bahwa semakin besarnya komponen utama yang digunakan tidak selalu memberikan pengaruh lebih baik terhadap akurasi. Analisis tekstur dengan menggunakan metode GLCM dapat digunakan sebagai metode untuk analisis citra hama tanaman cabai.
18
Saran
Penelitian selanjutnya disarankan untuk melakukan pemilihan data yang mampu mewakili ciri-ciri yang signifikan dari data masukan. Pemilihan jumlah data latih yang optimal agar didapatkan hasil pengenalan yang lebih baik. Saat pengambilan citra, perlu dikembangkan suatu metode yang mampu meminimalkan kesalahan pengenalan yang diakibatkan oleh adanya perbedaan pengambilan citra, dan perbedaan kualitas antar citra. Selain itu, perlu dilakukan proses segmentasi pada tahap praproses data.
DAFTAR PUSTAKA
Ashar BL. 2009. Sistem pakar diagnosa hama dan penyakit tanaman cabai besar merah (Capsicum annum L.) [skripsi]. Bogor: Institut Pertanian Bogor.
Budiman R. 2008. Pengenalan spesies nematoda puru akar (Meloidogyne spp.) melalui karakter morfologi ekor menggunakan jaringan syaraf tiruan [skripsi]. Bogor (ID): Institut Pertanian Bogor.
[Deptan] Departemen Pertanian. 2012. Survei sosial ekonomi nasional [internet]. [diunduh 2012 Okt 11]. Tersedia pada: http://www.deptan.go.id/Indikator/tabe-15b-konsumsi-rata.pdf.
Febriani, Lussiani ETP. 2008. Analisis penelusuran tepi citra menggunakan detektor tepi Sobel dan Canny. Di dalam: Seminar Ilmiah Nasional Komputer dan Sistem Intelijen; 2008 Agus 20-21; Depok, Indonesia. Depok(ID): Universitas Gunadarma. Hlm 462-466.
Gadkari D. 2004. Image quality analysis using GLCM [Tesis]. Orlando (US): University of Central Florida.
Ganis KY. 2011. Klasifikasi citra dengan matriks ko-okurensi aras keabuan (Gray Level Co-occurrence Matrix-GLCM) pada lima kelas biji-bijian [Skripsi]. Semarang (ID): Universitas Diponegoro.
Gasim. 2006. Jaringan syaraf tiruan untuk pengenalan jenis kayu berbasis citra [Tesis]. Bogor (ID): Institut Pertanian Bogor.
Hartadi R. 2011. Deteksi potensi kanker payudara pada mammogram menggunakan metode gray level co-occurrence matrices [Skripsi]. Semarang (ID): Universitas Diponegoro.
Herlinda S. 2005. Bioekologi Helicoverpa armigera Hubner (Lepidoptera: Noctuidae) pada tanaman tomat. Agria. 2(1): 32-36.
Johnson RA, Wichern DE. 1998. Applied Multivariate Statistical Analysis. New Jersey (USA): Prentice Hall.
Nurfadhilah E. 2011. Identifikasi tumbuhan obat menggunakan fitur citra morfologi, tekstur dan bentuk dengan klasifikasi Probabilistic Neural Network [skripsi]. Bogor(ID): Institut Pertanian Bogor.
19 Sartiami D, Magdalena, Nurmansyah A. 2011. Thrips parvispinus Karny (Thysanoptera: Thripdidae) pada tanaman cabai: perbedaan karakter morfologi pada tiga ketinggian tempat. J Entomol Indon. 8(2): 85-95.
Setiawati W, Udiarto BK, Muharam A. 2005. Pengenalan dan pengendalian hama-hama penting pada tanaman cabai. Bandung (ID): Balai Penelitian Tanaman Sayur.
Specht DF. 1990. Probabilistic Neural Networks. Neural Network. 3: 109-118. Suryaningsih E, Hadisoeganda AWW. 2007. Pengendalian hama dan penyakit
penting cabai dengan pestisida biorasional. J Hort. 17(3): 261-269.
Suryaningsih E, Prabaningrum L. 1998. Pestisida selektif untuk mengendalikan Organisme Pengganggu Tumbuhan (OPT) pada tanaman cabai. Bandung (ID): Balai Penelitian Tanaman Sayur.
Tahir NMD, Hussain A, Samad SA, Husain H. 2007. PCA-based human posture classification. J Teknologi. 46 (D): 35-44.
20
Lampiran 1 Tujuh citra hama cabai
Lampiran 2 Nilai 5 ciri GLCM pada data latih dan data uji kelas 1 (T. parvispinus) Data Latih Entropi Kontras Homogen Energi Korelasi
21 Lampiran 2 Nilai 5 ciri GLCM pada data latih dan data uji kelas 1 (Lanjutan)
Data Latih Entropi Kontras Homogen Energi Korelasi
22 0 9.245614 0.556362 0.094990 0.213640
23 0 8.672515 0.580635 0.095387 0.383803
24 0 8.470606 0.584699 0.095729 0.392103
Rata-rata 0 8.363522 0.59053 0.116208 0.280557 Data Uji Entropi Kontras Homogen Energi Korelasi
1 0 10.21976 0.523734 0.066069 0.172419
2 0 7.268390 0.578756 0.077235 0.407872
3 0 10.49461 0.490658 0.046333 0.181680
4 0 7.618036 0.552994 0.054530 0.398522
5 0 7.587258 0.551324 0.057905 0.387648
6 0 9.824254 0.606840 0.168324 0.236655
22
RIWAYAT HIDUP
Penulis dilahirkan di Bogor, Jawa Barat pada tanggal 24 Juli 1991. Penulis merupakan anak pertama dari 2 bersaudara dari ayah Bahri AU dan Ibu Siti Nilawati. Pada tahun 2009, penulis menamatkan pendidikan di SMA Negeri 1 Depok. Penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) pada tahun yang sama melalui jalur Undangan Seleksi Masuk IPB di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam.