HASIL DAN PEMBAHASAN Penelitian ini menekankan pada penerapan

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

HASIL DAN PEMBAHASAN Penelitian ini menekankan pada penerapan

metode SVM untuk mengklasifikasikan citra berdasarkan ciri warna citra. Citra yang digunakan sebanyak 300 dengan format JPG yang kemudian distandarkan ke dalam ukuran 50×50 piksel. Terdapat 10 kelas citra yang berbeda yang digunakan dalam penelitian ini yaitu buaya, bonsai, macan, pesawat, kapal, wajah, bunga, kura-kura, gentong, dan budha. Segmentasi Citra

Pada tahapan segmentasi ini, setiap citra akan disegmentasi untuk mengelompokkan warna yang dikandung oleh setiap piksel dari citra ke beberapa segmen (cluster) yang sudah ditentukan jumlahnya, yaitu dua, tiga, empat, dan lima. Cluster ini merupakan representasi dari warna-warna dominan citra. Tahapan segmentasi ini bertujuan mendapatkan kelompok-kelompok warna dominan dan mengurangi jumlah warna citra asli seperti yang terlihat pada Gambar 4.

1) dua cluster

2) tiga cluster

citra asli 3) empat cluster

4) lima cluster

Gambar 4 Contoh citra sebelum dan sesudah

segmentasi menggunakan algoritma EM.

Selanjutnya dilakukan pemilihan keempat hasil segmentasi tersebut secara manual untuk dijadikan masukan pada tahap ekstraksi warna. Berdasarkan Gambar 4, dapat dilihat bahwa hasil segmentasi keempat adalah hasil segmentasi yang paling baik. Hal ini dikarenakan citra hasil segmentasi tersebut paling mirip dengan citra aslinya. Hasil

dengan nilai σ yang digunakan pada tahap pelatihan sebelumnya. Selanjutnya dilakukan perhitungan tingkat akurasi SVM terhadap citra yang telah diprediksi secara benar dan tidak benar oleh model klasifikasi. Proses pengujian dilakukan berdasarkan metode 10- fold cross validation. Model klasifikasi dikatakan terbaik jika mencapai nilai akurasi yang paling tinggi ketika diaplikasikan ke data uji dengan nilai C dan σ terbaik. Model klasifikasi inilah yang akan digunakan untuk menentukan hasil klasifikasi akhir.

Hasil Temu Kembali

Dari hasil klasifikasi akhir, diambil citra di dalam basis data yang memiliki kelas yang sama dengan citra kueri dan citra dari kelas lain yang memiliki tingkat kemiripan yang tinggi dengan citra kueri sebagai citra hasil temu kembali. Pengukuran tingkat kemiripan citra kueri terhadap citra dari kelas lain menggunakan perhitungan jarak Euclidean. Jarak Euclidean antara citra a dan b dirumuskan dengan formula:

[

]

, 1 2 ) ( ) ( , = ∑₌ − B i fcha i fchb i b a d dengan

fch = hasil ekstraksi ciri warna dengan menggunakan FCH,

B = jumlah bin pada histogram warna. Evaluasi Hasil Temu Kembali

Pada tahap evaluasi dilakukan penilaian tingkat keefektifan proses temu kembali terhadap sejumlah koleksi pengujian. Evaluasi menggunakan nilai recall dan precision dari hasil temu kembali citra berdasarkan penilaian relevansinya. Recall adalah perbandingan jumlah citra relevan yang terambil terhadap jumlah citra relevan di dalam basis data, sedangkan precision adalah perbandingan jumlah citra relevan yang terambil terhadap jumlah seluruh citra yang terambil.

Perangkat Lunak dan Perangkat Keras yang Digunakan

Perangkat lunak yang digunakan pada penelitian ini adalah Matlab 7.0.1 dan sistem operasi Windows XP Professional SP 1, sedangkan spesifikasi perangkat keras yang mendukung adalah komputer dengan

processor Pentium IV 1.8 GHz dan memori 512 MB.

HASIL DAN PEMBAHASAN Penelitian ini menekankan pada penerapan metode SVM untuk mengklasifikasikan citra berdasarkan ciri warna citra. Citra yang digunakan sebanyak 300 dengan format JPG yang kemudian distandarkan ke dalam ukuran 50×50 piksel. Terdapat 10 kelas citra yang berbeda yang digunakan dalam penelitian ini yaitu buaya, bonsai, macan, pesawat, kapal, wajah, bunga, kura-kura, gentong, dan budha. Segmentasi Citra

1) dua cluster

2) tiga cluster

citra asli 3) empat cluster

4) lima cluster

Gambar 4 Contoh citra sebelum dan sesudah

segmentasi menggunakan algoritma EM.

segmentensi yang sudah terpilih sebagai masukan pada tahap ekstraksi warna untuk seluruh citra di dalam basis data dapat dilihat pada Lampiran 1.

Ekstraksi ciri warna

Pada tahapan ekstraksi ini, setiap piksel pada citra akan direpresentasikan dengan peluang atau frekuensi piksel-piksel tersebut terhadap nilai warna (bin) yang sudah ditentukan sebanyak 25. Bin tersebut diperoleh dari FCH menggunakan FCM. Bin

FCH yang digunakan pada penelitian ini dapat dilihat pada Lampiran 2.

Gambar 5 Gambar wajah.

Gambar 6 Hasil FCH dengan FCM 25 bin. Gambar 6 adalah hasil FCH dengan FCM dari Gambar 5. Berdasarkan Gambar 6, dapat dilihat bahwa bin 4 yang cenderung berwarna hijau merupakan warna yang paling banyak muncul.

Data Uji dan Data Latih

Seluruh data citra hasil ekstraksi ciri warna di dalam basis data sebanyak 300 citra, dibagi secara acak ke dalam 10 subset. Setiap subset memiliki jumlah citra yang sama, yaitu 30 citra. Subset-subset tersebut akan digunakan sebagai data latih dan data uji sesuai dengan metode validasi silang, yaitu metode 10-fold cross validation.

Klasifikasi

Di dalam proses pelatihan SVM yang menggunakan algoritma SMO dan fungsi

KernelGaussian RBF diperlukan parameter C

dan σ. Sedangkan di dalam proses pengujian SVM yang menggunakan fungsi Kernel Gaussian RBF juga diperlukan parameter σ. Untuk memilih nilai parameter C dan σ terbaik digunakan metode 10-fold cross validation. Pada penelitian ini, dicobakan

beberapa nilai C dan σ untuk dicari yang terbaik, yaitu untuk nilai C (20,21,...,29)dan σ (2-2,2-1, dan 20).

Di dalam metode 10-fold cross validation, dilakukan proses pelatihan dan proses pengujian terhadap data latih dan data uji. Proses pelatihan dan pengujian ini bertujuan membangun model klasifikasi dan menghitung tingkat akurasi SVM dalam memprediksi citra uji. Model klasifikasi dikatakan terbaik jika mencapai nilai akurasi yang paling tinggi ketika diaplikasikan ke data uji dengan nilai C dan σ terbaik. Nilai C dan σ dikatakan terbaik jika mencapai rataan akurasi yang paling tinggi ketika digunakan dalam klasifikasi SVM.

Akurasi adalah perbandingan jumlah citra yang telah diprediksi benar terhadap jumlah data uji. Rataan akurasi adalah nilai rata-rata dari akurasi di setiap pasangan nilai C dan σ. Rataan akurasi hasil proses pengujian untuk setiap pasangan nilai parameter C (20,21,...,29) dan σ(2-2,2-1, dan 20) dapat dilihat pada Tabel 1.

Tabel 1 Rataan akurasi hasil proses pengujian untuk setiap pasangan C dan σ

σ C 2 -2 2-1 20 20 53.67% 52% 51.33% 21 54.33% 52.66% 51.33% 22 53.67% 53.67% 52% 23 54% 53% 53% 24 51% 53.33% 53% 25 51% 53.67% 52.03% 26 51.33% 55.67% 54% 27 52.33% 53.70% 55.33% 28 52.33% 51.67% 52.50% 29 _{52.33% 51.67% 54.67%}

Berdasarkan Tabel 1, dapat dilihat bahwa untuk pasangan nilai parameter C = 26 dan σ= 2-1 dihasilkan rataan akurasi yang paling tinggi, yaitu 55.67%. Hal itu menunjukkan bahwa nilai C = 26 dan σ = 2-1 merupakan pasangan nilai C dan σ terbaik. Rincian akurasi untuk setiap tahap pengujian dengan menggunakan C = 26 _dan_σ_{= 2}-1 _{dapat dilihat}

pada Tabel 2.

Berdasarkan Tabel 2, dapat dilihat bahwa proses pengujian ke-10 memiliki akurasi yang paling tinggi, yaitu 86.67%. Hal itu menunjukkan bahwa model klasifikasi SVM terbaik telah terbentuk dari proses pelatihan ke-10 dengan C = 26 dan σ = 2-1_{. Model}

klasifikasi ini mengandung bias (b), 240 buah citra dari data latih ke-10 yang terpilih sebagai

support vector, dan

α

y

,(i=1,2,...,240)

. Citra yang termasuk support vector ini memiliki nilai lagrange multiplier0≤α≤C. Tabel 2 Hasil proses pengujian dengan C = 26

dan σ= 2-1 Pengujian Akurasi 1 43.33% 2 56.67% 3 56.67% 4 63.33% 5 53.33% 6 40% 7 53.33% 8 46.67% 9 56.67% 10 86.67% Rataan 55.67%

Model klasifikasi terbaik digunakan untuk menentukan hasil klasifikasi akhir dengan menghitung nilai fungsi diskriminan seperti pada persamaan (5). Dalam perhitungan nilai fungsi diskriminan tersebut tidak digunakan seluruh citra di dalam basis data, akan tetapi hanya digunakan citra di dalam basis data yang termasuk support vector. Hasil klasifikasi akhir untuk seluruh citra di dalam basis data dapat dilihat pada Lampiran 3. Hasil Temu Kembali

Pada penelitian ini, temu kembali citra diujicobakan ke dua metode yang berbeda untuk melihat perbedaan tingkat keefektifan hasil temu kembali citra. Dua metode ini adalah temu kembali citra tanpa menggunakan SVM dan temu kembali citra menggunakan SVM. Citra di dalam basis data yang digunakan sebagai citra kueri adalah citra yang termasuk data uji ke-10 (Lampiran 4). Hal ini dikarenakan hasil proses pengujian yang paling baik dicapai saat model klasifikasi diaplikasikan terhadap data uji ke- 10.

Hasil temu kembali citra tanpa menggunakan SVM hanya didasarkan pada kemiripan ciri warna menggunakan perhitungan jarak Euclidean. Contoh hasil temu kembali tanpa menggunakan SVM dapat dilihat pada Gambar 7.

Gambar 7 memperlihatkaan bahwa citra hasil temu kembali tidak sepenuhnya berasal dari jenis citra yang sama dengan citra kueri.

Citra yang relevan di dalam basis data yang ditemukembalikan sampai 30 citra teratas hanya sebanyak 10 dari 30 citra yang relevan di dalam basis data. Terdapat beberapa citra yang ditemukembalikan memiliki warna berbeda sekali dengan warna citra kueri, yaitu citra pada peringkat 4, 5, 8, 10, 11, 12, 14, 18, 22, 23, 26, 27, 28, dan 30. Citra-citra tersebut cenderung berwarna biru, berbeda sekali dengan warna citra kueri yang cenderung berwarna hijau kekuningan. Hal ini dikarenakan sistem tidak mengenal kelas citra dan sistem hanya menemukembalikan citra di dalam basis data yang mempunyai tingkat kemiripan yang tinggi dengan citra kueri. Kekurangan sistem ini diperbaiki oleh temu kembali citra menggunakan SVM yang dapat dilihat pada Gambar 8.

Gambar 7 Contoh hasil temu kembali tanpa menggunakan SVM.

Gambar 8 Contoh hasil temu kembali menggunakan SVM.

Berdasarkan Gambar 8, dapat dilihat bahwa citra hasil temu kembali sudah terlihat sangat baik meskipun masih ada satu citra lainnya yang relevan di dalam basis data tidak ditemukembalikan sampai 30 citra teratas. Masih terdapat satu citra yang ditemukembalikan dari jenis yang berbeda dengan citra kueri, yaitu citra pada peringkat

21. Citra tersebut tidak sejenis dengan citra kueri, akan tetapi memiliki warna yang cenderung sama dengan citra kueri. Hasil temu kembali citra yang sangat baik ini dikarenakan sistem mengenal kelas citra dan melakukan prediksi baik terhadap citra kueri maupun terhadap seluruh citra di dalam basis data sehingga diperoleh kelas yang baru untuk setiap citra. Citra yang ditemukembalikan adalah citra hasil klasifikasi di dalam basis data yang terdapat dalam kelas citra yang sama dengan citra kueri dan citra dari kelas lain yang memiliki tingkat kemiripan yang tinggi dengan citra kueri. Hasil temu kembali menggunakan SVM yang baik ini juga dipengaruhi oleh model klasifikasi yang terbaik. Pada tahap klasifikasi sebelumnya, telah dipilih model klasifikasi terbaik yang mencapai nilai akurasi 86.67% setelah diaplikasikan terhadap data uji ke-10. Nilai akurasi SVM yang baik ini, menyebabkan hasil temu kembali citra juga baik.

Gambar 9 Contoh hasil temu kembali citra menggunakan SVM.

Gambar 9 adalah contoh hasil temu kembali menggunakan SVM. Berdasarkan Gambar 9, dapat dilihat bahwa warna citra yang ditemukembalikan cenderung mirip dengan warna pada citra kueri, meskipun hanya dua citra yang relevan di dalam basis data yang ditemukembalikan sampai 30 citra teratas. Hal ini disebabkan hasil perhitungan fungsi diskriminan dengan SVM menunjukkan bahwa indeks warna citra kueri masuk ke kelas citra lain, yaitu citra buaya. Kesalahan klasifikasi ini menyebabkan hasil temu kembali citra menjadi kurang baik. Oleh karena itu, untuk penelitian selanjutnya dapat digunakan metode relevance feedback dalam temu kembali citra agar hasil temu kembali citra menjadi lebih baik. Dalam penggunaan metode relevance feedback, model klasifikasi SVM dapat dibentuk dari citra yang relevan dan yang tidak relevan dengan citra kueri

yang merupakan hasil penandaan oleh pengguna. Dengan model klasifikasi tersebut, sistem dapat menemukembalikan lebih banyak citra di dalam basis data yang relevan dengan citra kueri. Contoh hasil temu kembali citra berdasarkan ciri warna menggunakan SVM untuk setiap kelas citra dapat dilihat pada Lampiran 5.

Evaluasi Hasil Temu Kembali

Pada tahap evaluasi dilakukan penilaian tingkat keefektifan dalam proses temu kembali terhadap sejumlah koleksi pengujian dengan menghitung nilai recall dan precision

dari proses temu kembali citra berdasarkan penilaian relevansinya. Penentuan relevansi citra hasil temu kembali dibuat berdasarkan kelas citra di dalam basis data, di mana terdapat 10 kelas citra yang berbeda, yaitu: 1 Buaya, 2 Bonsai, 3 Macan, 4 Pesawat, 5 Kapal, 6 Wajah, 7 Bunga, 8 Kura-kura, 9 Genthong, 10 Budha.

Di dalam basis data terdapat 300 citra dari 10 kelas citra dengan 30 citra untuk setiap kelas citra. Dengan demikian untuk setiap kueri citra terdapat 30 citra relevan di dalam basis data yang penilaian relevansinya didasarkan atas kesamaan kelas citra. Penilaian relevansi tersebut kemudian digunakan sebagai acuan pada saat melakukan evaluasi terhadap hasil temu kembali untuk setiap citra kueri.

Nilai recall yang digunakan adalah 0,0.1,0.2,...,1. Nilai ini menunjukkan jumlah bagian citra dari seluruh citra terambil untuk perhitungan nilai precision. Misalkan untuk nilai recall 0.1 berarti jumlah citra yang digunakan untuk perhitungan nilai precision

adalah 10% dari seluruh citra yang terambil. Nilai precision untuk nilai recall 0.1 adalah perbandingan banyaknya citra relevan yang terambil dari seluruh citra dengan jumlah tersebut. Nilai rataan precision hasil temu kembali citra dapat dilihat pada Tabel 3.Nilai

recall-precision hasil temu kembali citra menggunakan SVM untuk setiap citra kueri dapat dilihat pada Lampiran 6. Nilai recall-

precision hasil temu kembali citra tanpa menggunakan SVM untuk setiap citra kueri dapat dilihat pada Lampiran 7.

Tabel 3 Nilai rataan precision hasil temu kembali citra Recall Dengan SVM Tanpa SVM 0 100% 100% 0.1 80% 74.44% 0.2 72.78% 56.67% 0.3 72.59% 50.37% 0.4 72.22% 46.67% 0.5 73.33% 43.11% 0.6 73.52% 41.3% 0.7 74.29% 40.16% 0.8 74.72% 37.78% 0.9 74.94% 35.56% 1 76% 34% Rataan 76.76% 50.91% 0 10 20 30 40 50 60 70 80 90 100 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Recall R at aan Pr e c is io n (% ) dengan SVM tanpa SVM

Gambar 10 Grafik rataan precision hasil temu kembali citra menggunakan SVM dan tanpa menggunakan SVM. Berdasarkan Gambar 10, dapat dilihat bahwa nilai rataan precision temu kembali citra menggunakan SVM cenderung lebih besar daripada nilai rataan precision temu kembali citra tanpa menggunakan SVM pada setiap nilai recall lebih dari nol. Hal ini menunjukkan bahwa tingkat keefektifan hasil temu kembali citra menggunakan SVM cenderung selalu lebih tinggi daripada hasil temu kembali citra tanpa menggunakan SVM. Untuk temu kembali citra menggunakan SVM, dapat dilihat bahwa nilai rataan precision

mengalami penurunan pada nilai recall 0.1, sedangkan pada nilai recall lainnya cenderung stabil. Hal ini dikarenakan pada peringkat

recall 0.1 banyak kueri citra yang tidak menemukan citra yang relevan di dalam basis data. Untuk temu kembali citra tanpa

menggunakan SVM, dapat dilihat bahwa nilai rataan precision cenderung selalu mengalami penurunan pada setiap nilai recall. Hal ini dikarenakan banyak kueri citra yang menemukan sedikit citra yang relevan di dalam basis data.

Dalam dokumen Metode Support Vector Machine untuk Klasifikasi pada Sistem Temu Kembali Citra (Halaman 46-51)