KLASIFIKASI CITRA MENGGUNAKAN METODE
MINOR COMPONENT ANALYSIS PADA SISTEM TEMU KEMBALI
CITRA
VERA YUNITA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2009
KLASIFIKASI CITRA MENGGUNAKAN METODE
MINOR COMPONENT ANALYSIS PADA SISTEM TEMU KEMBALI
CITRA
VERA YUNITA
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2009
ABSTRACT
VERA YUNITA. The Application of Minor Component Analysis to Image Classification in CBIR Systems. Under supervision of YENI HERDIYENI.
In content-based image retrieval (CBIR) system, retrieving process is done by comparing a query image to all images from image database. This process is not effective because spends much times besides the retrieved images are not always match with the query image particularly for large databases. To solve this problem, image classification is proposed. In this research, minor component analysis (MCA) is used for images classification. For each image, a feature vector describing color, shape and texture. MCA vector will be formed as a representative pattern for each images class. In classification process, image database divided for image training and testing. Train data used to build classification model while test data used for test the accuracy of classification model. From this research it can be concluded that usage of MCA can improve the accuracy about 33.20%. This improvement shows that MCA can be applied in CBIR system, especially for large images database.
Keywords: Content-based Image Retrieval, Minor Component Analysis, Principal Component Analysis.
Judul : Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra
Nama : Vera Yunita
NIM : G64050542
Menyetujui: Pembimbing
Yeni Herdiyeni, S.Si., M.Kom. NIP 197509232000122001
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Drh. Hasim, DEA NIP 196103281986011002
RIWAYAT HIDUP
Penulis dilahirkan di Batusangkar, Sumatera Barat pada tanggal 27 Juni 1987 sebagai anak kedua dari tiga bersaudara pasangan Bapak Makmur dan Ibu Hasnah. Pada tahun 2005, penulis lulus dari SMA Negeri 1 Batusangkar dan pada tahun yang sama penulis diterima menjadi mahasiswa Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2006, berdasarkan hasil seleksi Mayor Minor, penulis diterima di Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam IPB (FMIPA IPB) yang merupakan departemen pilihan pertama penulis. Selain itu, untuk melengkapi kompetensi, penulis memilih minor Statistika Sosial Ekonomi pada Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam IPB (FMIPA IPB).
Selama menjadi mahasiswa di Institut Pertanian Bogor, penulis aktif pada organisasi Dewan Perwakilan Mahasiswa FMIPA IPB periode 2006/2007 sebagai staf Komisi Eksternal dan periode 2007/2008 sebagai staf Komisi Internal. Pada tahun 2008 penulis melaksanakan kegiatan Praktik Kerja Lapangan di SEAMEO BIOTROP pada unit BrMC. Pada tahun 2007, penulis mendapatkan beasiswa Bantuan Belajar Mahasiswa (BBM) dari DIKTI dan pada tahun 2008-2009 penulis memperoleh beasiswa dari Bank Indonesia. Penulis terpilih menjadi finalis Data Mining Contest pada ajang Pagelaran Mahasiswa Nasional Bidang Teknologi Informasi dan Komunikasi (geMasTIK) 2008 di IT Telkom Bandung.
PRAKATA
Alhamdulillahi Rabbil ‘alamin, puji dan syukur yang sedalam-dalamnya penulis panjatkan kepada Allah Subhanahu wa Ta’ala atas limpahan rahmat dan hidayah-Nya sehingga tugas akhir yang berjudul Klasifikasi Citra Menggunakan Metode Minor Component Analysis (MCA) pada Sistem Temu Kembali Citra dapat diselesaikan. Penelitian ini dilaksanakan mulai Oktober 2008 sampai dengan Juli 2009, bertempat di Departemen Ilmu Komputer.
Penulis juga menyampaikan ucapan terima kasih kepada:
1. Kedua orang tua, Amak dan Abak, Uni Ipit serta Yuli yang selalu memberikan doa serta dukungan untuk penulis,
2. Ibu Yeni Herdiyeni, S.Si.,M.Kom. selaku dosen pembimbing yang telah memberikan arahan dan bimbingan serta kesabarannya kepada penulis dalam menyelesaikan skripsi ini,
3. Indra Nugraha, Ferry Pratama, Fitria Yuningsih, Ramadhani, Dimas Perdana dan M. Abi Rafdi sebagai teman-teman satu bimbingan yang selalu memberikan masukan, saran dan semangat kepada penulis,
4. Anak-anak CI, Idaliana, Indra Juniawan, Annisa dan Siti yang selalu menjadi teman diskusi, 5. Venerate Zone, Yuni Arti, Sri Danuriati, Karina Gusriani, Zissalwa Hafsari, Ninon NF dan semua
anak-anak kost Harmony atas dukungan dan semangat yang telah diberikan,
6. Roy, Mega, Resti, Mba Dian, Mba Mercy, Mba Heni, Mba Ratih, Mba Rita dan teman-teman kost La Sapiensa yang selalu menemani dan memberikan semangat kepada penulis untuk menyelesaikan skripsi ini.
Penulis menyadari bahwa masih terdapat kekurangan dalam penulisan skripsi ini. Semoga skripsi ini dapat memberikan manfaat bagi siapapun yang membaca.
Bogor, Agustus 2009
iv DAFTAR ISI Halaman DAFTAR TABEL ... v DAFTAR GAMBAR ... v DAFTAR LAMPIRAN ... v PENDAHULUAN ... 1 Latar belakang ... 1 Tujuan ... 1 Ruang Lingkup ... 1 TINJAUAN PUSTAKA ... 1
Content Based Image Retrieval ... 1
Principal Component Analysis ... 1
Minor Component Analysis ... 2
Proyeksi Vektor ... 3
METODE PENELITIAN ... 3
Data Citra ... 3
Pembentukan Classifier Menggunakan MCA ... 3
Penentuan Kelas Target Citra Kueri ... 3
Hasil Klasifikasi ... 4
Evaluasi Hasil Klasifikasi ... 4
Lingkup Pengembangan ... 4
HASIL DAN PEMBAHASAN ... 4
Praproses Citra ... 4
Ekstraksi Fitur ... 4
Pembentukan Classifier Menggunakan MCA ... 5
Pembentukan Matriks Korelasi ... 5
Pembentukan Vektor MCA ... 5
Penentuan Kelas Target Citra Kueri ... 5
Hasil Klasifikasi ... 5
Evaluasi Hasil Klasifikasi ... 5
KESIMPULAN DAN SARAN ... 8
Kesimpulan ... 8
Saran ... 8
v DAFTAR TABEL
Halaman
1 Hasil Pengujian Klasifikasi dengan Menggunakan MCA ... 7
2 Hasil Pengujian Klasifikasi dengan Menggunakan PCA ... 7
DAFTAR GAMBAR Halaman 1 Arsitektur Sistem CBIR ... 1
2 Model Proyeksi Antara Dua Vektor ... 3
3 Metode Penelitian ... 3
4 Proses Pembentukan Vektor MCA... 5
5 Hasil Temu Kembali untuk Klasifikasi yang Benar ... 6
6 Hasil Temu Kembali untuk Klasifikasi yang Salah ... 6
7 Hasil Pengujian Klasifikasi dengan Menggunakan MCA ... 7
8 Hasil Pengujian Klasifikasi dengan Menggunakan PCA ... 8
9 Perbandingan Akurasi PCA dan MCA pada Pengujian Klasifikasi ... 8
DAFTAR LAMPIRAN Halaman 1 Contoh Citra yang Digunakan Sebagai Training pada Setiap Kelas ... 11
2 Contoh Citra yang Digunakan Sebagai Testing pada Setiap Kelas ... 15
1 PENDAHULUAN
Latar Belakang
Sistem temu kembali citra berdasar pada informasi citra atau yang lebih dikenal dengan
content-based image retrieval (CBIR) tidak selalu memberikan hasil yang memuaskan. Hal ini disebabkan karena dalam proses pencarian, kueri citra harus dibandingkan dengan semua citra yang terdapat dalam basis data citra. Cara pencarian seperti ini tentunya membutuhkan waktu terutama pada basis data citra yang sangat besar. Permasalahan ini dapat diatasi dengan cara mengklasifikasikan citra yang terdapat pada basis data sehingga sebuah citra kueri hanya akan dibandingkan dengan kelas-kelas citra, bukan dengan semua citra yang terdapat dalam basis data citra.
Terdapat beberapa metode yang dapat digunakan untuk klasifikasi citra di antaranya adalah support vector machines (SVM), fuzzy logic, k-nearest neighbor (KNN) dan minor component analysis (MCA). Untuk teknik
klasifikasi citra menggunakan MCA
sebelumnya telah diteliti oleh Jancovic et al.
(2006). Dalam penelitian tersebut, Jancovic et al. menerapkan teknik klasifikasi dalam sistem CBIR dengan tujuan untuk meningkatkan keakuratan hasil temu kembali citra dan mempercepat proses pencarian terhadap suatu kueri. Hasil penelitian tersebut akan diterapkan pada basis data citra yang berukuran sangat besar.
Pada penelitian ini, klasifikasi citra dilakukan dengan menggunakan metode yang sama dengan penelitian Jancovic et al. (2006) yaitu minor component analysis (MCA). Metode ini dipilih karena dari penelitian
tersebut diketahui bahwa MCA dapat
mempertahankan informasi yang fokus terhadap objek citra melalui proses learning. Sedangkan
principal component analysis (PCA) lebih fokus terhadap informasi citra secara global yang tentu saja melibatkan background citra. Pada proses temu kembali, citra kueri hanya akan dibandingkan dengan pola representatif dari setiap kelas citra, sehingga proses pencarian akan lebih cepat dan hasil temu kembali yang diperoleh akan lebih akurat (Jancovic et al. 2006).
Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk menerapkan metode minor component analysis
(MCA) dalam klasifikasi citra digital pada sistem temu kembali citra.
Ruang Lingkup
Pada penelitian ini, fitur citra yang digunakan adalah warna, bentuk dan tekstur. Data citra yang digunakan dibatasi dengan hanya menggunakan sepuluh kelas citra, yaitu: kelas matahari terbenam, sapi, gajah, pohon, burung, mobil, singa, sepeda motor, helikopter dan beruang.
TINJAUAN PUSTAKA
Content Based Image Retrieval
Content based image retrieval (CBIR) merupakan salah satu sistem dalam temu kembali citra yang didasarkan pada informasi yang dimiliki oleh citra. Informasi yang terdapat pada citra dapat bersifat semantik atau berupa informasi visual. Temu kembali citra berdasarkan informasi semantik dilakukan dengan memberikan kata kunci yang diketikan secara manual pada setiap citra. Di lain pihak, temu kembali citra berdasarkan informasi visual menggunakan teknik pengolahan warna, bentuk dan tekstur citra (Chung 2007). Pada proses temu kembali dengan CBIR, citra akan ditemukembalikan berdasarkan kemiripan fitur antara kueri dan basis data citra. Skema umum dari proses CBIR dapat dilihat pada Gambar 1.
Image Query Image Feature Extraction Feature Extraction Compare Image retrieval Database
Gambar 1 Arsitektur sistem CBIR (Mueen et al. 2007).
Principal Component Analysis
Principal component analysis (PCA) merupakan suatu metode untuk mendapatkan informasi dari suatu data dengan mereduksi dimensi dari data tersebut. Reduksi dimensi yang dilakukan pada suatu data tidak akan menyebabkan hilangnya informasi dari data tersebut (Smith 2002). Komponen utama atau yang disebut dengan principal component (PC) direpresentasikan oleh sebuah vektor yang merupakan vektor eigen yang bersesuaian dengan nilai eigen terbesar dari suatu data.
2 Untuk memperoleh vektor PCA, maka
langkah pertama yang dilakukan adalah mengurangi setiap elemen pada matriks A
dengan nilai rataan dari matriks tersebut sehingga dihasilkan matriks B. Setelah itu, hitung matriks peragam (Ω) dengan cara mengalikan matriks Bdengan BT.
Dari matriks Ω yang berukuran n×n, sebuah vektor tak nol v di Rn disebut vektor eigen dari Ωjika terdapat skalar sedemikian hingga:
Ω
v
= λ
v
.
λ disebut nilai eigen dan v adalah vektor eigen
dari Ωyang bersesuaian dengan λ dimana v ≠ 0 (Leon 1998). Prosedur yang dapat dilakukan untuk menghitung nilai eigen dari sebuah matriks adalah sebagai berikut:
1. Menentukan persamaan karakteristik det ((Ω
- λI) = 0.
2. Membentuk matriks Ω dengan elemen diagonal utamanya dikurangi λ.
3. Menguraikan persamaan karakteristik ke dalam persamaan sukubanyak karakteristik: λⁿ + cn-1λn-1 +cn-2 λn-2 + …+ c1λ+ c0 = 0
4. Menyelesaikan persamaan yang diperoleh pada langkah di atas. Nilai-nilai eigen
merupakan penyelesaian persamaan
tersebut.
Dari setiap nilai eigen yang diperoleh dapat dihasilkan satu vektor eigen. Semua vektor
eigen yang diperoleh pada perhitungan tersebut merupakan vektor komponen utama atau yang dikenal dengan principal component.
Minor Component Analysis
Minor component analysis (MCA) atau yang disebut juga dengan minor subspace analysis
(MSA) merupakan suatu metode statistika yang digunakan untuk menentukan ragam terkecil pada suatu data. Namun, menurut Luo et al.
(1997) yang dimaksud dengan komponen minor adalah vektor eigen yang bersesuaian dengan nilai eigen terkecil dari sebuah matriks input (matriks korelasi). Pada pemrosesan MCA, vektor bobot dimodifikasi menggunakan metode learning rule agar menghasilkan sebuah vektor eigen yang bersifat konvergen (memusat) terhadap sebaran data (Moller & Konies 2003). Menurut Jankovic (2005), algoritme MCA mengekstrak N komponen minor dari vektor K-dimensi melalui proses acak stationer N < K.
Target dari MCA adalah mengekstrak komponen minor dari data input dengan
mengupdate vektor bobot secara adaptif. Misalkan matriks korelasi
merupakan matriks dari input . Karena matriks R merupakan sebuah matriks persegi, maka dari matriks ini dapat dihitung sejumlah nilai eigen (λ). Banyaknya nilai eigen yang dihasilkan akan sama dengan jumlah dimensi (baris atau kolom) dari matriks R. Nilai eigen
yang dihasilkan akan beragam yaitu, λ1 > λ2 >
… > λn ≥ 0 dan vektor eigenv1, v2,…, vndapat
dibentuk dari setiap nilai eigen tersebut, sehingga :
.
Proses perhitungan yang digunakan untuk memperoleh komponen minor (MCA) berbeda dengan komponen utama (PCA). Perhitungan
MCA dilakukan dengan menggunakan
algoritme learning dengan iterasi t yang sangat besar sehingga menghasilkan sebuah vektor bobot yang nilainya konvergen.
Proses pembentukan algoritme MCA
menurut Luo et al. (1997) adalah:
1 Misal merupakan sebuah vektor input, adalah vektor output dengan sebuah persamaan :
(t = 0, 1, 2, …, N) dengan Є Rn (t = 0, 1, 2, …, N) merupakan vektor bobot.
2 Algoritme untuk menghitung MCA dari sebuah vektor input adalah:
dengan Є untuk j = 1, 2, 3, .., N. 3 Rumus di atas dapat ditulis dalam bentuk
matriks dan disubtitusi dengan
, sehingga menjadi:
4 Nilai disubtitusi dengan
sehingga:
Jika matriks korelasi , maka
3
Dengan demikian, algoritme yang
diperkenalkan oleh Luo et al. (1997) untuk menghitung MCA secara deterministik adalah:
w(t+1) = w(t) – η [Rw(t)wT(t)w(t) –
w(t)wT(t)Rw(t)]
dengan η > 0 merupakan koefisien learning rate. Algoritme tersebut menghasilkan vektor w yang konvergen dengan iterasi t yang sangat besar.
Proyeksi Vektor
Proyeksi vektor digunakan untuk
menemukan titik koordinat terdekat antara suatu vektor terhadap vektor lain (Leon 1998). Misal vektor a diproyeksikan terhadap vektor bseperti yang ditunjukkan pada Gambar 2.
Gambar 2 Model proyeksi antara dua vektor. Hasil proyeksi dari vektor aterhadap vektor b yang terdapat pada Gambar 2 adalah sebuah vektor c, dengan:
METODE PENELITIAN
Tahapan yang dilalui dalam proses klasifikasi citra menggunakan metode MCA ini ada lima tahap, yaitu: (1) ekstraksi fitur, (2) pembentukan classifier menggunakan MCA, (3) penentuan kelas target citra kueri, (4) hasil klasifikasi, (5) evaluasi hasil klasifikasi. Tahapan tersebut dapat dilihat pada Gambar 3. Data Citra
Data citra yang digunakan dalam penelitian ini adalah data citra California Institute of Technology (Caltech). Data tersebut diperoleh dari situs www.caltech.edu. Citra yang digunakan sebagai data training berjumlah 250 citra yang dibagi ke dalam sepuluh kelas, sehingga masing-masing kelas memiliki 25 citra. Setiap kelas citra memiliki objek yang sama sedangkan background, pencahayaan dan posisi objek bervariasi. Sepuluh kelas citra yang digunakan dalam basis data citra adalah kelas matahari terbenam, sapi, gajah, pohon, burung, mobil, singa, sepeda motor, helikopter dan beruang.
Indexing Retrieval
Basis Data Citra
Pembentukan classifier menggunakan MCA Penentuan kelas target Kueri Evaluasi Klasifikasi Ekstraksi Ciri Ekstraksi Ciri
Citra Kueri
Hasil Klasifikasi
Kueri
Gambar 3 Metode Penelitian. Ekstraksi Fitur
Ekstraksi fitur dilakukan untuk memperoleh informasi fitur warna, bentuk dan tekstur. Proses ekstraksi ini dilakukan dengan menggunakan hasil penelitian Pebuardi (2008).
Pembentukan Classifier Menggunakan MCA
Fitur suatu kelas dapat direpresentasikan
dengan sebuah vektor MCA. Untuk
mendapatkan vektor MCA, terlebih dahulu harus dihitung vektor fitur dari setiap citra yang terdapat pada basis data citra. Fitur yang diekstrak dari setiap citra adalah warna, bentuk dan tekstur, sehingga setiap citra pada basis data citra memiliki tiga vektor fitur. Dari ketiga vektor fitur ini akan dibentuk satu vektor fitur yang telah mencakup fitur warna, bentuk dan tekstur.
Untuk setiap kelas citra akan dibentuk
sebuah vektor MCA yang merupakan
representasi fitur dari masing-masing kelas. Proses perhitungan untuk menghasilkan vektor
MCA adalah menggunakan algoritme
deterministik yang diperkenalkan oleh Luo et al. (1997) dengan matriks korelasi fitur sebagai inputnya.
Penentuan Kelas Target Citra Kueri
Sebuah citra kueri akan dihitung vektor fiturnya, yaitu vektor fitur untuk warna, bentuk dan tekstur. Dari ketiga vektor fitur tersebut
4 akan dibentuk satu vektor fitur yang merupakan
kombinasi dari ketiga fitur tersebut. Vektor fitur inilah yang akan diproyeksikan pada setiap vektor MCA dari masing-masing kelas untuk menentukan kelas dari citra kueri. Proyeksi dihitung dengan menggunakan rumus proyeksi vektor, yaitu:
dengan c adalah vektor hasil proyeksi, a merupakan vektor fitur kueri dan b adalah vektor MCA dari setiap kelas.
Kelas target dari citra kueri akan ditentukan dengan melihat panjang vektor hasil proyeksi kueri terhadap vektor MCA pada setiap kelas. Sebuah citra kueri diklasifikasikan ke dalam suatu kelas apabila panjang vektor hasil proyeksinya pada MCA kelas tersebut lebih kecil dari pada kelas lainnya.
Hasil Klasifikasi
Citra kueri yang digunakan pada proses temu kembali dapat berasal dari data training
maupun data testing. Apabila sebuah citra kueri telah diklasifikasikan ke dalam suatu kelas, maka semua citra yang terdapat pada kelas tersebut akan menjadi citra hasil temu kembali. Hasil klasifikasi yang benar akan memberikan citra hasil temu kembali yang sangat relevan terhadap kueri yang diberikan.
Evaluasi Hasil Klasifikasi
Tahap evaluasi dilakukan untuk menilai kinerja sistem dalam menentukan benar atau tidaknya hasil klasifikasi dari citra kueri. Evaluasi dihitung menggunakan rumus:
Nilai akurasi dihitung untuk mengetahui
seberapa besar peluang kueri untuk
diklasifikasikan dengan benar dari hasil pengujian citra pada setiap kelas (Mueen et al. 2007).
Lingkup Pengembangan
Spesifikasi perangkat keras dan perangkat lunak yang digunakan dalam penelitian ini adalah:
a Perangkat keras yang digunakan adalah komputer dengan spesifikasi memori DDR2 2GB dan Harddisk 80GB.
b Perangkat lunak yang digunakan adalah
MATLAB 7.0.1 dan sistem operasi
Windows XP Professional SP 2.
HASIL DAN PEMBAHASAN Praproses Citra
Data citra yang digunakan dibagi menjadi dua bagian yaitu 250 citra digunakan sebagai data training dan 250 citra untuk data testing. Sebelum data training dan data testing
diekstraksi, terlebih dahulu dilakukan pembersihan data seperti cropping pada citra yang memiliki frame agar tidak menghasilkan informasi yang salah pada saat ekstraksi fitur terutama pada fitur bentuk.
Ekstraksi Fitur
Proses ekstraksi fitur dilakukan untuk mendapatkan informasi warna, bentuk dan tekstur dari setiap citra, baik citra yang terdapat pada basis data citra maupun citra kueri yang berasal dari luar basis data citra. Proses ekstraksi fitur pada basis data citra citra dilakukan secara terpisah pada setiap kelas. Hal ini dilakukan untuk mempermudah proses pembentukan vektor MCA dari setiap kelas. a. Ekstraksi Fitur Warna
Ekstraksi warna dilakukan terhadap semua citra pada setiap kelas secara terpisah. Proses ekstraksi warna pada setiap kelas akan menghasilkan matriks berukuran 162 25. Nilai 162 merupakan fitur warna dan 25 merupakan banyaknya citra per kelas yang diekstraksi. Dengan demikian, untuk hasil ekstraksi warna pada basis data citra diperoleh sepuluh matriks berukuran 162 25.
b. Ekstraksi Fitur Bentuk
Proses ekstraksi fitur bentuk dilakukan secara terpisah tehadap setiap kelas citra, dan
menghasilkan matriks berukuran .
Nilai 72 menunjukkan informasi bentuk dan nilai 25 merupakan banyaknya citra pada setiap kelas. Dengan demikian, untuk hasil ekstraksi bentuk pada basis data citra akan menghasilkan
sepuluh matriks berukuran .
c. Ekstraksi Fitur Tekstur
Ekstraksi tekstur dilakukan terhadap semua citra secara terpisah berdasarkan kelas masing-masing. Ekstraksi tekstur untuk suatu kelas
menghasilkan matriks berukuran .
Angka tujuh menunjukkan informasi tekstur. Angka 25 menunjukkan banyaknya citra yang terdapat pada suatu kelas.
5 Vektor fitur yang akan digunakan untuk
membentuk vektor MCA merupakan kombinasi dari fitur warna, bentuk dan tekstur. Untuk fitur warna digunakan 162 komponen, fitur bentuk 72 komponen dan fitur tekstur 7 komponen. Kombinasi ini menghasilkan vektor fitur berukuran 241 × 1 untuk setiap citra, sehingga untuk setiap kelas terdapat matriks fitur yang berukuran 241 × 25.
Pembentukan Classifier Menggunakan MCA
a. Pembentukan Matriks Korelasi
Matriks korelasi dihitung dengan
menggunakan rumus: ,
dengan X adalah matriks hasil ekstraksi fitur yang berukuran 241 × 25 sehingga dihasilkan matriks korelasi berukuran 241 × 241.
b. Pembentukan Vektor MCA
Vektor MCA merupakan vektor eigen yang bersesuaian dengan nilai eigen terkecil yang diperoleh dari matriks korelasi. Algoritme yang digunakan untuk mengekstrak vektor MCA dari sebuah matriks korelasi adalah:
w(t+1) = w(t) – η [Rw(t)wT(t)w(t) –
w(t)wT(t)Rw(t)]
dengan R adalah matriks korelasi,w merupakan
vektor bobot dan η merupakan laju
pembelajaran (learning rate). Proses pembentukan vektor MCA dapat dilihat pada Gambar 4.
Matriks Korelasi R
Inisialisasi nilai η dan w(0) Algoritme MCA Apakah w(t+1)-w(t) = 0? w(t+1) adalah vektor MCA Tidak Ya
Gambar 4 Proses pembentukan vektor MCA.
Algoritme MCA diproses hingga iterasi ke-t
yang sangat besar. Iterasi berhenti apabila selisih antara w(t+1) dan w(t) sangat kecil atau mendekati nol. Untuk inisialisasi awal, setiap elemen dari vektor bobot w(0) yang berukuran 241 × 1, diisi dengan nilai 0.1. Pemberian nilai
w(0) ini disamakan untuk pemrosesan vektor MCA bagi semua kelas citra. Di sisi lain, untuk nilai η digunakan nilai 0.05. Semakin kecil nilai
η yang digunakan, maka iterasi algoritme akan semakin lama. Hasil dari algoritme MCA di atas adalah sebuah vektor tak nol yang disebut dengan vektor MCA.
Penentuan Kelas Target Citra Kueri
Citra kueri yang akan digunakan dapat berasal dari basis data citra maupun dari luar basis data citra. Sebuah citra kueri diklasifikasikan ke dalam sebuah kelas apabila panjang vektor hasil proyeksi fiturnya pada vektor MCA kelas tersebut lebih kecil daripada kelas lainnya.
Hasil Klasifikasi
Apabila sebuah citra kueri diklasifikasikan ke dalam suatu kelas, maka semua citra yang berada dalam kelas tersebut akan dijadikan sebagai citra hasil temu kembali. Oleh karena itu, apabila sebuah citra kueri diklasifikasikan dengan benar, maka semua citra hasil temu kembali merupakan citra yang relevan dengan kueri dan sebaliknya apabila citra kueri diklasifikasikan ke dalam kelas yang salah, maka semua citra hasil temu kembali tidak akan relevan dengan kueri tersebut.
Hasil temu kembali untuk citra kueri yang diklasifikasikan dengan benar sesuai dengan kelasnya dapat dilihat pada Gambar 5,
sedangkan untuk citra kueri yang
diklasifikasikan ke dalam kelas yang salah dapat dilihat pada Gambar 6.
Evaluasi Hasil Klasifikasi
Evaluasi hasil klasifikasi dilakukan dengan menghitung akurasi pada setiap kelas. Akurasi
merupakan banyaknya citra yang
diklasifikasikan dengan benar pada setiap kelas dibagi dengan jumlah citra uji pada kelas tersebut. Proses pengujian dibagi menjadi dua, yaitu pengujian menggunakan classifier MCA dan classifier PCA. Tujuannya adalah untuk membandingkan akurasi yang diperoleh dari hasil klasifikasi menggunakan PCA dan MCA. Dari hasil yang diperoleh dapat diketahui apakah terbukti bahwa MCA lebih baik daripada PCA dalam mengklasifikasikan citra.
6 Gambar 5 Hasil temu kembali untuk klasifikasi yang benar.
Gambar 6 Hasil temu kembali untuk klasifikasi yang salah.
Citra Kueri Citra51 Citra52 Citra53 Citra54 Citra55 Citra56 Citra57 Citra58 Citra59 Citra60 Citra61
Citra62 Citra63 Citra64 Citra65 Citra66 Citra67 Citra68
Citra69 Citra70 Citra71
Citra72 Citra73 Citra74 Citra75
Citra Kueri
Citra201 Citra202 Citra203 Citra204
Citra205 Citra206 Citra207 Citra208 Citra209 Citra210 Citra211
Citra212 Citra213 Citra214 Citra215 Citra216 Citra217 Citra218
Citra219 Citra220 Citra221 Citra222 Citra223
7 Evaluasi klasifikasi menggunakan MCA
Hasil yang diperoleh dari pengujian data
testing menggunakan MCA dapat dilihat pada Tabel 1.
Tabel 1 Hasil pengujian klasifikasi dengan menggunakan MCA
Kelas Hasil klasifikasi Akurasi (%) Benar Salah Matahari terbenam 9 16 36% Sapi 2 23 8% Gajah 9 16 36% Pohon 8 17 32% Burung 14 11 56% Mobil 16 9 64% Singa 2 23 8% Sepeda Motor 9 16 36% Helikopter 5 20 20% Beruang 9 16 36%
Persentase akurasi yang terdapat pada Tabel 1 divisualisasikan ke dalam grafik yang ditampilkan pada Gambar 7.
Gambar 7 Hasil pengujian klasifikasi dengan menggunakan MCA.
Hasil pengujian yang ditampilkan pada
Gambar 7 menunjukkan bahwa akurasi
tertinggi dimiliki oleh kelas mobil yaitu sebesar 64%, sedangkan akurasi terkecil dimiliki oleh kelas sapi dan singa yaitu sebesar 8%. Rataan akurasi yang diperoleh pada pengujian data
testing untuk seluruh kelas adalah 33.20%. Nilai ini diperoleh dari:
Hasil akurasi yang diperoleh sangat dipengaruhi oleh hasil ekstraksi fitur yang dilakukan pada tahap praproses. Oleh karena itu, kesalahan hasil klasifikasi dapat disebabkan karena citra yang diuji memiliki warna, bentuk atau tekstur yang mirip dengan kelas yang lain. Misalnya untuk citra kueri beruang berwarna coklat dengan berlatar salju dan air laut yang berwarna biru, maka citra beruang tersebut bisa saja diklasifikasikan ke dalam kelas helikopter yang kebanyakan citranya berlatar langit yang berwarna biru dan putih. Selain itu, citra yang terdapat pada setiap kelas memiliki fitur warna, bentuk dan tekstur yang beragam sehingga sangat mempengaruhi akurasi klasifikasi.
Evaluasi klasifikasi menggunakan PCA Hasil yang diperoleh pada pengujian data
testing menggunakan PCA dapat dilihat pada Tabel 2.
Tabel 2 Hasil pengujian klasifikasi dengan menggunakan PCA
Kelas Hasil klasifikasi Akurasi (%) Benar Salah Matahari terbenam 1 24 4% Sapi 2 23 8% Gajah 0 25 0 Pohon 4 21 16% Burung 3 22 12% Mobil 0 25 0 Singa 5 20 20% Sepeda Motor 8 17 32% Helikopter 1 24 4% Beruang 1 24 4%
Persentase akurasi yang terdapat pada Tabel 2 divisualisasikan pada grafik yang ditunjukkan pada Gambar 8. 36 8 36 32 56 64 8 36 20 36 0 10 20 30 40 50 60 70 80 90 100 ak u rasi ( %) kelas citra
8 Gambar 8 Hasil pengujian klasifikasi dengan
menggunakan PCA.
Pengujian yang dilakukan dengan
menggunakan PCA memberikan hasil yang tidak begitu baik. Kelas gajah dan mobil hanya memiliki akurasi sebesar 0%. Akurasi tertinggi diperoleh oleh kelas sepeda motor yaitu sebesar 32%. Akurasi rataan untuk hasil pengujian ini adalah 10%. Nilai ini diperoleh dari perhitungan:
Nilai rata-rata akurasi yang diperoleh dari hasil pengujian menggunakan PCA yaitu sebesar 10% lebih kecil dibandingkan dengan hasil pengujian menggunakan MCA yaitu sebesar 33.2%. Perbandingan hasil akurasi antara MCA dan PCA dalam pengujian klasifikasi ditunjukkan pada Gambar 9.
Dari grafik yang ditunjukkan Gambar 9 terlihat bahwa penggunaan MCA sebagai
classifier memberikan hasil akurasi yang lebih besar daripada PCA. Oleh karena itu, penggunaan MCA dalam proses klasifikasi pada sistem temu kembali citra tentunya dapat meningkatkan hasil temu kembali.
Gambar 9Perbandingan akurasi PCA dan MCA pada pengujian klasifikasi.
MCA, PCA.
KESIMPULAN DAN SARAN Kesimpulan
Penelitian ini telah berhasil menerapkan metode minor component analysis (MCA) pada proses klasifikasi citra dalam sistem temu kembali citra. Secara umum, penggunaan MCA sebagai classifier dapat meningkatkan nilai akurasi. Nilai rata-rata akurasi yang diperoleh pada pengujian klasifikasi menggunakan MCA
lebih tinggi dari pada PCA. Dengan
menerapkan proses klasifikasi pada sistem temu kembali citra, diperoleh hasil temu kembali yang sangat akurat apabila sebuah citra kueri diklasifikasikan dengan benar. Selain itu, proses pencarian menjadi lebih efisien karena citra kueri hanya dibandingkan dengan sepuluh vektor MCA yang merupakan representasi fitur dari setiap kelas.
Saran
Hasil akurasi yang diperoleh pada pengujian klasifikasi sangat dipengaruhi oleh kualitas ekstraksi fitur. Oleh karena itu, untuk penelitian selanjutnya perlu diterapkan metode lain yang lebih baik pada ekstraksi fitur agar akurasi yang dihasilkan lebih besar. Selain itu, penggunaan citra yang lebih banyak pada proses training
perlu diujikan untuk mengetahui apakah terjadi peningkatan akurasi atau tidak.
4 8 0 16 12 0 20 32 4 4 0 10 20 30 40 50 60 70 80 90 100 ak u rasi ( %) kelas citra 0 10 20 30 40 50 60 70 80 90 100 % ak u rasi kelas citra
9 DAFTAR PUSTAKA
Chung, KP. 2007. Intelligence Content Based Image Retrieval Framework Based on Semi-Automated Learning and Historic Profile
[tesis]. Australia: Murdoch University; 2007.
Jancovic, M & Reljin, B. 2005. A New Minor Component Analysis Method Based on Douglas-Kung-Amari Minor Subspace Analysis Method. IEEE Signal Processing Letters. Vol. 12. 2005.
Jankovic, M et al. 2006. Minor Component Analysis (MCA) Applied to Image Classification in CBIR Systems. IEEE Transactions on Neural Network. Volume 06. 2006.
Leon, SJ. 1998. Aljabar Linear dan Aplikasinya. Erlangga: Jakarta.
Luo FL, Unbehauen R, Cichocki A. 1997. A Minor Component Analysis Algorithm. Vol.
10,No. 2, p. 291-297, 1997.
Moller, R & Konies, A. 2003. Couple principal Component Analysis. IEEE Transactions on Neural Network. Volume 03. 2003.
Mueen A, Sapiyan M, Zainuddin R. 2007.
Multilevel Feature Extraction and X-ray Image Classification. Journal of Applied Science 7(8). 1224-1229. 2007.
Pebuardi R. 2008. Pengukuran Kemiripan Citra Berbasis Warna, Bentuk dan Tekstur Menggunakan Bayesian Network [skripsi]. Bogor : Departemen Ilmu Komputer, Institut Pertanian Bogor.
Smith, LI. 2002. A Tutorial on Principal Component Analysis. 12-20. 2002.
11 Lampiran 1 Contoh citra yang digunakan sebagai training pada setiap kelas
1 Kelas Matahari terbenam
Citra 3 Citra 8 Citra 10 Citra 13 Citra 15
Citra 17 Citra 20 Citra 22 Citra 24 Citra 25
2 Kelas Sapi
Citra 26 Citra 28 Citra 30 Citra 32 Citra 34
Citra 36 Citra 38 Citra 40 Citra 42 Citra 44
3 Kelas Gajah
Citra 52 Citra 54 Citra 55 Citra 57 Citra 60
12 Lampiran 1 Lanjutan
4 Kelas Pohon
Citra 77 Citra 79 Citra 81 Citra 83 Citra 85
Citra 88 Citra 89 Citra 91 Citra 99 Citra 100
5 Kelas Burung
Citra 104 Citra 106 Citra 108 Citra 109 Citra 111
Citra 113 Citra 115 Citra 119 Citra 121 Citra 125
6 Kelas Mobil
Citra 127 Citra 129 Citra 131 Citra 134 Citra 136
13 Lampiran 1 Lanjutan
7 Kelas Singa
Citra 152 Citra 153 Citra 154 Citra 155 Citra 156
Citra 158 Citra 159 Citra 161 Citra 163 Citra 165
8 Kelas Sepeda Motor
Citra 176 Citra 179 Citra 181 Citra 184 Citra 187
Citra 193 Citra 195 Citra 197 Citra 199 Citra 200
9 Kelas Helikopter
Citra 201 Citra 203 Citra 205 Citra 207 Citra 209
14 Lampiran 1 Lanjutan
10 Kelas Beruang
Citra 228 Citra 229 Citra 230 Citra 231 Citra 234
15 Lampiran 2 Contoh citra yang digunakan sebagai citra testing
1 Kelas matahari terbenam
2 Kelas sapi
3 Kelas gajah
4 Kelas pohon
5 Kelas burung
16 Lampiran 2 Lanjutan
7 Kelas singa
8 Kelas sepeda motor
9 Kelas helikopter
17 Lampiran 3 Antarmuka Sistem
a. Antarmuka untuk memuat dan menampilkan citra kueri.