cukup membutuhkan waktu. Hal ini terjadi karena komputasi pada proses pengindeksan melibatkan seluruh citra dalam basis data untuk membentuk struktur graf. Namun, pada saat temu kembali, yang dilakukan sistem adalah menelusuri nilai-nilai yang telah dihitung tersebut. Oleh sebab itu, minimnya proses komputasi pada saat temu kembali diharapkan mampu mempercepat proses pencarian.
Ekstraksi Ciri Citra
Seluruh citra dalam basis data mengalami proses ekstraksi warna, bentuk, dan tekstur sesuai penelitian Pebuardi (2008). Hasilnya, setiap citra direpresentasikan menjadi vektor warna berisi 162 elemen, vektor bentuk berisi 72 elemen, dan vektor tekstur berisi 7 elemen. Struktur Graf
Landscape 1
Landscape ini memiliki node yang
merepresentasikan satu citra. Setiap citra memiliki tiga vektor yang terdiri dari vektor warna berisi 162 elemen, vektor bentuk berisi 72 elemen, dan vektor tekstur berisi 7 elemen. Edge-nya dilabeli dengan jumlah ketiga nilai kemiripan cosine fiturnya. Semakin besar nilai kemiripannya maka citra semakin identik. Perhitungan nilai kemiripan cosine dilakukan antara citra basis data urutan pertama dengan seluruh citra dalam basis data menghasilkan sebuah matriks berukuran 1×1100 atau sesuai dengan jumlah citra dalam basis data. Hal ini dilakukan karena penelusuran pada landscape 1 selalu dimulai dari citra basis data urutan pertama, sehingga pada saat penelusuran, kemiripan node-node dalam basis data dibandingkan dengan citra urutan pertama
sebagai node awal. Gambar 6 menunjukkan ilustrasi landscape 1.
c = nilai kemiripan cosine. Gambar 6 Ilustrasi landscape 1.
Komputasi yang dilakukan pada tahap pembentukan landscape ini melibatkan 1100 citra dalam basis data. Waktu yang diperlukan untuk perhitungan kemiripan cosine antar 1100 citra tersebut adalah sekitar 90 detik.
Landscape 2
Landscape ini memiliki node yang
merepresentasikan satu citra. Edge-nya dilabeli dengan nilai kemiripan yang dihitung dengan implementasi pembobotan automatis dengan GA yang dinilai memiliki kinerja yang baik berdasarkan penelitian Pratama (2009). Perhitungan ini menghasilkan sebuah matriks berukuran 1100×1100 sesuai dengan jumlah 1100 citra dalam basis data. Ilustrasi landscape
2 ditunjukkan pada Gambar 7.
cga= nilai kemiripan dengan pembobotan GA.
Gambar 7 Ilustrasi landscape 2.
Pada penelitian yang dilakukan oleh Pratama (2009), proses pembobotan dengan GA dilakukan pada setiap kueri dimasukkan. Hasilnya, proses temu kembali menjadi lebih lama yaitu sekitar 5 sampai 6 detik karena pengaruh iterasi-iterasi dalam proses GA. Di samping itu, nilai bobot yang dihasilkan selalu berubah karena pembangkitan nilai awal yang dilakukan secara acak.
Pada penelitian ini proses pembobotan dengan GA dilakukan pada saat pengindeksan, yaitu digunakan untuk pembentukan struktur
landscape 2. Nilai bobot yang berubah-ubah tersebut dicoba untuk ditetapkan dengan dilakukan sepuluh kali percobaan dan dipilih yang menghasilkan rata-rata nilai precision
tertinggi. Bobot-bobot tersebut menjadi bobot tetap antar citra dalam basis data. Waktu yang diperlukan untuk komputasi 1100 citra untuk pembentukan landscape ini adalah sekitar 1618 detik.
Proses Pencarian
Proses pencarian bergerak antar node pada graf dengan sistematika BFS. Penelusuran dibatasi dengan threshold sebesar 0.5 dengan asumsi bahwa citra-citra yang mirip akan memiliki nilai kemiripan tinggi.
Pada proses penelusuran, kegiatan komputasi minim dilakukan karena pencarian lebih banyak menelusuri angka-angka yang telah dihitung pada tahap pengindeksan. Alur proses pencarian pada dua landscape ini dapat dilihat pada Gambar 8.
Pencarian pertama bergerak pada landscape
1 untuk menemukan citra dalam basis data dengan nilai kemiripan tertinggi atau yang paling identik dengan kueri. Node awal pencarian adalah anggota citra basis data urutan pertama. Selanjutnya, pencarian menuju
landscape 2 untuk menemukan citra lain yang masih relevan dengan kueri namun dengan nilai kemiripan yang lebih rendah dibandingkan hasil pencarian pada landscape 1. Pencarian dimulai pada node awal yang indeksnya merupakan indeks node akhir hasil pencarian pada
landscape 1. Selanjutnya penelusuran dilakukan dengan mencari node tetangga yang memiliki identik berdasarkan urutan nilai kemiripan GA mulai dari yang terbesar. Pencarian akan berhenti dilakukan jika menemukan node
dengan kemiripan kurang dari 0,5. Hasil Temu Kembali
Hasil temu kembali adalah hasil penelusuran graf dengan batasan threshold nilai kemiripan sebesar 0.5. Citra kueri yang digunakan adalah seluruh citra basis data. Rata-rata waktu yang diperlukan untuk setiap proses penelusuran adalah sekitar 0.66 detik. Contoh tampilan utama sistem saat menemukembalikan suatu kueri dapat dilihat pada Gambar 9. Di lain pihak, contoh hasil temu kembali untuk tampilan tersebut terlihat pada Gambar 10. Pada
Gambar 10 terlihat bahwa proses temu kembali berhasil baik dengan menghasilkan 37 citra teratas yang seluruhnya relevan dengan kueri.
Hitung cosine similarity c1 antara kueri dengan node
awal Mencari nilai kemiripan antar
node awal dan node
lain yang sama atau mendekati c1 Hitung cosine similarity antara node
(dengan kemiripan mendekati c1) dengan kueri Maksimum? Selesai (simpan indeks-nya) Kueri masuk ya tidak Node awal Hampiri node berdasarkan urutan nilai kemiripan GA mulai dari yang terbesar Lihat nilai kemiripannya >0.5 ? ya Simpan indeksnya, lanjutkan penelusuran tidak Pencarian selesai. Tampilkan indeks-indeks yang tersimpan
Gambar 8 Diagram alur proses penelusuran. Contoh hasil temu kembali yang kurang relevan tertera pada Gambar 11. Pada gambar tersebut terlihat hanya ditemukan dua citra yang relevan, sedangkan selainnya adalah citra-citra dari kelas lain namun dengan nilai kemiripan yang besar terhadap kueri. Ini menunjukkan bahwa antar citra dalam satu kelas belum tentu memiliki nilai kemiripan tinggi. Hal ini berkaitan dengan perhitungan nilai kemiripan yang sangat dipengaruhi oleh kualitas ekstraksi ciri. Dengan kata lain, pada beberapa citra, ekstraksi ciri yang digunakan kurang mencirikan citra tertentu untuk masuk ke kelasnya.
Landscape 1
Gambar 9 Contoh tampilan utama sistem.
Gambar 10 Contoh hasil temu kembali.
Jumlah citra yang ditemukan
Rentang citra hasil temu kembali yang ditampilkan
Gambar 11 Contoh hasil temu kembali yang kurang relevan. Evaluasi Hasil Temu Kembali
Evaluasi dilakukan menggunakan perhitungan recall dan precision. Perhitungan nilai recall dan precision ini melibatkan seluruh citra dalam basis data sebagai kueri. Nilai recall
yang digunakan adalah 0, 0.1, 0.2, 0.3, …, 1.
Penentuan nilai precision pada recall tersebut menggunakan interpolasi maksimum dengan aturan
, dengan
rj {0.0, 0.1, …, 1.0},
r0 = 0.0, r1 = 0.1, …, r10=1.0.
Nilai precision yang ditampilkan pada Tabel 1 adalah hasil rataan nilai precision dari keseluruhan kueri. Grafik perbandingan nilai
recall dan precision dapat dilihat pada Gambar 12. Pada nilai recall 0 dan 0.1, precision yang dihasilkan masih di atas 0.5 walaupun penurunannya cukup signifikan. Hal ini berarti rata-rata pada sejumlah hasil temu kembali yang teratas, lebih dari setengahnya merupakan citra yang relevan terhadap kueri. Pada nilai recall
selanjutnya, precision yang dihasilkan kurang dari 0.5 namun dengan penurunan yang tidak signifikan.
Tabel 1 Rataan precision temu kembali.
Recall Precision 0 1.0000 0.1 0.5746 0.2 0.4779 0.3 0.3957 0.4 0.3385 0.5 0.2929 0.6 0.2511 0.7 0.2116 0.8 0.1697 0.9 0.1159 1 0.0231 Rataan 0.3501
Dari segi kecepatan waktu komputasi temu kembali, proses heuristik berjalan lebih cepat.. Perhitungan waktu ini menggunakan seluruh citra dalam basis data dan dicobakan pada sistem dengan dan tanpa metode heuristik. Sistem temu kembali tanpa metode heuristik menghasilkan rata-rata waktu temu kembali sekitar 5.97 detik, sedangkan sistem dengan implementasi heuristik menghasilkan rata-rata temu kembali sekitar 0.66 detik, atau terjadi penurunan waktu temu kembali sebesar 88.94%. Dengan kata lain, waktu pencarian temu kembali menjadi 8.89 kali lebih cepat. Grafik perbandingan waktu tertera pada Gambar 13.
Gambar 12 Grafik perbandingan nilai recall dan
precision.
KESIMPULAN DAN SARAN Kesimpulan
Metode heuristik berhasil
diimplementasikan dan mampu menghasilkan
temu kembali 8.89 kali lebih cepat dibandingkan dengan sistem tanpa implementasi heuristik. Kinerja metode heuristik ini dapat berjalan lebih baik jika nilai kemiripan yang dihasilkan antar citra baik, artinya nilai tersebut mampu mencirikan citra-citra yang memang berada pada kelas yang sama.
Saran
Model heuristik dengan landscape ini sangat bergantung pada nilai kemiripan antar citra, dan nilai kemiripan ini sangat dipengaruhi oleh kualitas ekstraksi ciri. Penelitian selanjutnya dapat mengimplementasikan teknik ekstraksi ciri lain yang lebih mencirikan antar satu citra dengan citra lainnya terutama untuk fitur bentuk dan tekstur. Selain itu, penghitungan nilai kemiripan dengan menggabungkan ketiga fitur juga merupakan tantangan yang masih dapat terus dicarikan solusi. Di sisi lain, pengimplementasian model heuristik lain masih mungkin untuk hasil yang lebih optimal.
Gambar 13 Grafik perbandingan waktu temu kembali. 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 P rec is io n Recall Grafik Perbandingan R-P 0 1 2 3 4 5 6 7 8 1 29 57 85 113 141 169 197 225 253 281 309 337 365 393 421 449 477 505 533 561 589 617 645 673 701 729 757 785 813 841 869 897 925 953 981 1009 1037 1065 1093 W a k tu (d etik ) Kueri
Grafik perbandingan waktu temu kembali
Lampiran 1 Contoh citra yang digunakan untuk masing-masing kelas 1. Kelas mobil
Citra 2 Citra20 Citra 43 Citra 66
Citra 96 Citra 109 Citra 135 Citra 164
2. Kelas singa
Citra 179 Citra 192 Citra 206 Citra 181
Citra 216 Citra 252 Citra 263 Citra 279
3. Kelas matahari terbenam
Citra 280 Citra 279 Citra 323 Citra 317
Citra 329 Citra 342 Citra 344 Citra 375
4. Kelas tekstur
Citra 386 Citra 400 Citra 418 Citra 430
Citra 465 Citra 494 Citra 506 Citra 545
5. Kelas beruang
Lanjutan
Citra 611 Citra 617 Citra 620 Citra 654
6. Kelas gajah
Citra 659 Citra 678 Citra 684 Citra 691
Citra 705 Citra 720 Citra 738 Citra 754
7. Kelas tanda panah
Citra 760 Citra 764 Citra 774 Citra 789
Citra 793 Citra 795
Citra 797 Citra 800
8. Kelas pemandangan
Citra 804 Citra 823 Citra 847 Citra 861
Citra 868 Citra 880 Citra 899 Citra 933
9. Kelas reptil
Lanjutan
Citra 965 Citra 937 Citra 988 Citra 994
10.Kelas pesawat
Citra 1006 Citra1023 Citra 1027 Citra 1030
PENDAHULUAN
Latar Belakang
Dalam perkembangan media informasi terutama di bidang temu kembali citra dewasa ini, para pengguna membutuhkan mesin pencari yang cepat dengan hasil yang relevan. Oleh karena itu, metode pencarian heuristik diaplikasikan dengan harapan mampu membuat proses pencarian citra menjadi lebih cepat.
Proses pencarian yang umum dilakukan adalah dengan membandingkan citra kueri dengan seluruh citra dalam basis data. Proses ini dilakukan berulang setiap citra kueri diberikan. Hal ini tidak efisien karena proses tersebut cukup membutuhkan waktu terutama pada basis data berukuran besar.
Metode heuristik diterapkan untuk membuat basis data lebih terstruktur. Model struktur basis data tersebut menransformasi isi basis data menjadi graf terhubung. Setiap node graf adalah representasi setiap citra dalam basis data. Antara node satu dengan node lainnya dihubungkan dengan edge yang dilabeli dengan nilai kemiripan dan prediksi kedekatan (Stadler 2001). Model graf ini dalam ruang lingkup
Evolutionary Algorithm (EA) dikenal dengan
fitness landscape (Jones 1995). Prediksi kedekatan dan kemiripan tersebut mempengaruhi posisi antar node. Semakin mirip citra-citra tersebut maka posisinya semakin berdekatan.
Pada saat kueri dimasukkan, pencarian dilakukan dengan cara menelusuri node-node
graf tersebut dengan algoritme pencarian
Breadth-First Search (BFS). Awal pencarian difokuskan untuk mencari citra dalam basis data yang paling relevan dengan kueri. Setelah itu, pencarian berlanjut dengan menelusuri citra-citra lain dengan posisi yang berdekatan dengan citra basis data yang paling relevan tersebut. Hal ini dilakukan karena model struktur graf ini telah memposisikan citra-citra yang mirip saling berdekatan, sehingga ketika citra paling relevan dengan kueri telah ditemukan, maka citra-citra lain yang letaknya berdekatan dengan citra tersebut juga relevan terhadap kueri. Hasil penelusuran kemudian ditampilkan sebagai hasil temu kembali.
Tujuan
Tujuan penelitian ini adalah mengimplementasikan dan menganalisis kinerja metode heuristik pada pencarian citra.
Ruang Lingkup
Ruang lingkup penelitian ini difokuskan pada implementasi pemrograman heuristik pada proses pencarian citra dalam konteks Content Based Image Retrieval (CBIR) berdasarkan fitur warna, bentuk, dan tekstur. Implementasi ini diterapkan pada data sebanyak 1100 citra yang terbagi menjadi 10 kelas, yaitu mobil, singa, matahari terbenam, tekstur, beruang, gajah, tanda panah, pemandangan, reptil, dan pesawat.
TINJAUAN PUSTAKA