HASIL DAN PEMBAHASAN Pada metode heuristik, proses pengindeksan

cukup membutuhkan waktu. Hal ini terjadi karena komputasi pada proses pengindeksan melibatkan seluruh citra dalam basis data untuk membentuk struktur graf. Namun, pada saat temu kembali, yang dilakukan sistem adalah menelusuri nilai-nilai yang telah dihitung tersebut. Oleh sebab itu, minimnya proses komputasi pada saat temu kembali diharapkan mampu mempercepat proses pencarian.

Ekstraksi Ciri Citra

Seluruh citra dalam basis data mengalami proses ekstraksi warna, bentuk, dan tekstur sesuai penelitian Pebuardi (2008). Hasilnya, setiap citra direpresentasikan menjadi vektor warna berisi 162 elemen, vektor bentuk berisi 72 elemen, dan vektor tekstur berisi 7 elemen. Struktur Graf

Landscape 1

Landscape ini memiliki node yang

merepresentasikan satu citra. Setiap citra memiliki tiga vektor yang terdiri dari vektor warna berisi 162 elemen, vektor bentuk berisi 72 elemen, dan vektor tekstur berisi 7 elemen. Edge-nya dilabeli dengan jumlah ketiga nilai kemiripan cosine fiturnya. Semakin besar nilai kemiripannya maka citra semakin identik. Perhitungan nilai kemiripan cosine dilakukan antara citra basis data urutan pertama dengan seluruh citra dalam basis data menghasilkan sebuah matriks berukuran 1×1100 atau sesuai dengan jumlah citra dalam basis data. Hal ini dilakukan karena penelusuran pada landscape 1 selalu dimulai dari citra basis data urutan pertama, sehingga pada saat penelusuran, kemiripan node-node dalam basis data dibandingkan dengan citra urutan pertama

sebagai node awal. Gambar 6 menunjukkan ilustrasi landscape 1.

c = nilai kemiripan cosine. Gambar 6 Ilustrasi landscape 1.

Komputasi yang dilakukan pada tahap pembentukan landscape ini melibatkan 1100 citra dalam basis data. Waktu yang diperlukan untuk perhitungan kemiripan cosine antar 1100 citra tersebut adalah sekitar 90 detik.

Landscape 2

Landscape ini memiliki node yang

merepresentasikan satu citra. Edge-nya dilabeli dengan nilai kemiripan yang dihitung dengan implementasi pembobotan automatis dengan GA yang dinilai memiliki kinerja yang baik berdasarkan penelitian Pratama (2009). Perhitungan ini menghasilkan sebuah matriks berukuran 1100×1100 sesuai dengan jumlah 1100 citra dalam basis data. Ilustrasi landscape

2 ditunjukkan pada Gambar 7.

cga= nilai kemiripan dengan pembobotan GA.

Gambar 7 Ilustrasi landscape 2.

Pada penelitian yang dilakukan oleh Pratama (2009), proses pembobotan dengan GA dilakukan pada setiap kueri dimasukkan. Hasilnya, proses temu kembali menjadi lebih lama yaitu sekitar 5 sampai 6 detik karena pengaruh iterasi-iterasi dalam proses GA. Di samping itu, nilai bobot yang dihasilkan selalu berubah karena pembangkitan nilai awal yang dilakukan secara acak.

Pada penelitian ini proses pembobotan dengan GA dilakukan pada saat pengindeksan, yaitu digunakan untuk pembentukan struktur

landscape 2. Nilai bobot yang berubah-ubah tersebut dicoba untuk ditetapkan dengan dilakukan sepuluh kali percobaan dan dipilih yang menghasilkan rata-rata nilai precision

tertinggi. Bobot-bobot tersebut menjadi bobot tetap antar citra dalam basis data. Waktu yang diperlukan untuk komputasi 1100 citra untuk pembentukan landscape ini adalah sekitar 1618 detik.

Proses Pencarian

Proses pencarian bergerak antar node pada graf dengan sistematika BFS. Penelusuran dibatasi dengan threshold sebesar 0.5 dengan asumsi bahwa citra-citra yang mirip akan memiliki nilai kemiripan tinggi.

Pada proses penelusuran, kegiatan komputasi minim dilakukan karena pencarian lebih banyak menelusuri angka-angka yang telah dihitung pada tahap pengindeksan. Alur proses pencarian pada dua landscape ini dapat dilihat pada Gambar 8.

Pencarian pertama bergerak pada landscape

1 untuk menemukan citra dalam basis data dengan nilai kemiripan tertinggi atau yang paling identik dengan kueri. Node awal pencarian adalah anggota citra basis data urutan pertama. Selanjutnya, pencarian menuju

landscape 2 untuk menemukan citra lain yang masih relevan dengan kueri namun dengan nilai kemiripan yang lebih rendah dibandingkan hasil pencarian pada landscape 1. Pencarian dimulai pada node awal yang indeksnya merupakan indeks node akhir hasil pencarian pada

landscape 1. Selanjutnya penelusuran dilakukan dengan mencari node tetangga yang memiliki identik berdasarkan urutan nilai kemiripan GA mulai dari yang terbesar. Pencarian akan berhenti dilakukan jika menemukan node

dengan kemiripan kurang dari 0,5. Hasil Temu Kembali

Hasil temu kembali adalah hasil penelusuran graf dengan batasan threshold nilai kemiripan sebesar 0.5. Citra kueri yang digunakan adalah seluruh citra basis data. Rata-rata waktu yang diperlukan untuk setiap proses penelusuran adalah sekitar 0.66 detik. Contoh tampilan utama sistem saat menemukembalikan suatu kueri dapat dilihat pada Gambar 9. Di lain pihak, contoh hasil temu kembali untuk tampilan tersebut terlihat pada Gambar 10. Pada

Gambar 10 terlihat bahwa proses temu kembali berhasil baik dengan menghasilkan 37 citra teratas yang seluruhnya relevan dengan kueri.

Hitung cosine similarity c1 antara kueri dengan node

awal Mencari nilai kemiripan antar

node awal dan node

lain yang sama atau mendekati c1 Hitung cosine similarity antara node

(dengan kemiripan mendekati c1) dengan kueri Maksimum? Selesai (simpan indeks-nya) Kueri masuk ya tidak Node awal Hampiri node berdasarkan urutan nilai kemiripan GA mulai dari yang terbesar Lihat nilai kemiripannya ^{>0.5 ?} ya Simpan indeksnya, lanjutkan penelusuran tidak Pencarian selesai. Tampilkan indeks-indeks yang tersimpan

Gambar 8 Diagram alur proses penelusuran. Contoh hasil temu kembali yang kurang relevan tertera pada Gambar 11. Pada gambar tersebut terlihat hanya ditemukan dua citra yang relevan, sedangkan selainnya adalah citra-citra dari kelas lain namun dengan nilai kemiripan yang besar terhadap kueri. Ini menunjukkan bahwa antar citra dalam satu kelas belum tentu memiliki nilai kemiripan tinggi. Hal ini berkaitan dengan perhitungan nilai kemiripan yang sangat dipengaruhi oleh kualitas ekstraksi ciri. Dengan kata lain, pada beberapa citra, ekstraksi ciri yang digunakan kurang mencirikan citra tertentu untuk masuk ke kelasnya.

Landscape 1

Gambar 9 Contoh tampilan utama sistem.

Gambar 10 Contoh hasil temu kembali.

Jumlah citra yang ditemukan

Rentang citra hasil temu kembali yang ditampilkan

Gambar 11 Contoh hasil temu kembali yang kurang relevan. Evaluasi Hasil Temu Kembali

Evaluasi dilakukan menggunakan perhitungan recall dan precision. Perhitungan nilai recall dan precision ini melibatkan seluruh citra dalam basis data sebagai kueri. Nilai recall

yang digunakan adalah 0, 0.1, 0.2, 0.3, …, 1.

Penentuan nilai precision pada recall tersebut menggunakan interpolasi maksimum dengan aturan

, dengan

rj {0.0, 0.1, …, 1.0},

r0 = 0.0, r1 = 0.1, …, r10=1.0.

Nilai precision yang ditampilkan pada Tabel 1 adalah hasil rataan nilai precision dari keseluruhan kueri. Grafik perbandingan nilai

recall dan precision dapat dilihat pada Gambar 12. Pada nilai recall 0 dan 0.1, precision yang dihasilkan masih di atas 0.5 walaupun penurunannya cukup signifikan. Hal ini berarti rata-rata pada sejumlah hasil temu kembali yang teratas, lebih dari setengahnya merupakan citra yang relevan terhadap kueri. Pada nilai recall

selanjutnya, precision yang dihasilkan kurang dari 0.5 namun dengan penurunan yang tidak signifikan.

Tabel 1 Rataan precision temu kembali.

Recall Precision 0 1.0000 0.1 0.5746 0.2 0.4779 0.3 0.3957 0.4 0.3385 0.5 0.2929 0.6 0.2511 0.7 0.2116 0.8 0.1697 0.9 0.1159 1 0.0231 Rataan 0.3501

Dari segi kecepatan waktu komputasi temu kembali, proses heuristik berjalan lebih cepat.. Perhitungan waktu ini menggunakan seluruh citra dalam basis data dan dicobakan pada sistem dengan dan tanpa metode heuristik. Sistem temu kembali tanpa metode heuristik menghasilkan rata-rata waktu temu kembali sekitar 5.97 detik, sedangkan sistem dengan implementasi heuristik menghasilkan rata-rata temu kembali sekitar 0.66 detik, atau terjadi penurunan waktu temu kembali sebesar 88.94%. Dengan kata lain, waktu pencarian temu kembali menjadi 8.89 kali lebih cepat. Grafik perbandingan waktu tertera pada Gambar 13.

Gambar 12 Grafik perbandingan nilai recall dan

precision.

KESIMPULAN DAN SARAN Kesimpulan

Metode heuristik berhasil

diimplementasikan dan mampu menghasilkan

temu kembali 8.89 kali lebih cepat dibandingkan dengan sistem tanpa implementasi heuristik. Kinerja metode heuristik ini dapat berjalan lebih baik jika nilai kemiripan yang dihasilkan antar citra baik, artinya nilai tersebut mampu mencirikan citra-citra yang memang berada pada kelas yang sama.

Saran

Model heuristik dengan landscape ini sangat bergantung pada nilai kemiripan antar citra, dan nilai kemiripan ini sangat dipengaruhi oleh kualitas ekstraksi ciri. Penelitian selanjutnya dapat mengimplementasikan teknik ekstraksi ciri lain yang lebih mencirikan antar satu citra dengan citra lainnya terutama untuk fitur bentuk dan tekstur. Selain itu, penghitungan nilai kemiripan dengan menggabungkan ketiga fitur juga merupakan tantangan yang masih dapat terus dicarikan solusi. Di sisi lain, pengimplementasian model heuristik lain masih mungkin untuk hasil yang lebih optimal.

Gambar 13 Grafik perbandingan waktu temu kembali. 0.0 0.2 0.4 0.6 0.8 1.0 1.2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 P rec is io n Recall Grafik Perbandingan R-P 0 1 2 3 4 5 6 7 8 1 ₂₉ ₅₇ ₈₅ 113 141 169 197 225 253 281 309 337 365 393 421 449 477 505 533 561 589 617 645 673 701 729 757 785 813 841 869 897 925 953 981 1009 1037 1065 1093 W a k tu (d etik ) Kueri

Grafik perbandingan waktu temu kembali

Lampiran 1 Contoh citra yang digunakan untuk masing-masing kelas 1. Kelas mobil

Citra 2 _Citra20 _{Citra 43} _{Citra 66}

Citra 96 Citra 109 _{Citra 135} Citra 164

2. Kelas singa

Citra 179 _{Citra 192} ^{Citra 206} ^{Citra 181}

Citra 216 ^{Citra 252} ^{Citra 263} Citra 279

3. Kelas matahari terbenam

Citra 280 Citra 279 Citra 323 Citra 317

Citra 329 ^{Citra 342} _{Citra 344} _{Citra 375}

4. Kelas tekstur

Citra 386 Citra 400 Citra 418 Citra 430

Citra 465 Citra 494 Citra 506 Citra 545

5. Kelas beruang

Lanjutan

Citra 611 _{Citra 617} _{Citra 620} _{Citra 654}

6. Kelas gajah

Citra 659 Citra 678 Citra 684 Citra 691

Citra 705 Citra 720 Citra 738 Citra 754

7. Kelas tanda panah

Citra 760 Citra 764 Citra 774 Citra 789

Citra 793 _{Citra 795}

Citra 797 ^{Citra 800}

8. Kelas pemandangan

Citra 804 Citra 823 Citra 847 Citra 861

Citra 868 Citra 880 Citra 899 Citra 933

9. Kelas reptil

Lanjutan

Citra 965 Citra 937 _{Citra 988} Citra 994

10.Kelas pesawat

Citra 1006 ^Citra1023 Citra 1027 _{Citra 1030}

PENDAHULUAN

Latar Belakang

Dalam perkembangan media informasi terutama di bidang temu kembali citra dewasa ini, para pengguna membutuhkan mesin pencari yang cepat dengan hasil yang relevan. Oleh karena itu, metode pencarian heuristik diaplikasikan dengan harapan mampu membuat proses pencarian citra menjadi lebih cepat.

Proses pencarian yang umum dilakukan adalah dengan membandingkan citra kueri dengan seluruh citra dalam basis data. Proses ini dilakukan berulang setiap citra kueri diberikan. Hal ini tidak efisien karena proses tersebut cukup membutuhkan waktu terutama pada basis data berukuran besar.

Metode heuristik diterapkan untuk membuat basis data lebih terstruktur. Model struktur basis data tersebut menransformasi isi basis data menjadi graf terhubung. Setiap node graf adalah representasi setiap citra dalam basis data. Antara node satu dengan node lainnya dihubungkan dengan edge yang dilabeli dengan nilai kemiripan dan prediksi kedekatan (Stadler 2001). Model graf ini dalam ruang lingkup

Evolutionary Algorithm (EA) dikenal dengan

fitness landscape (Jones 1995). Prediksi kedekatan dan kemiripan tersebut mempengaruhi posisi antar node. Semakin mirip citra-citra tersebut maka posisinya semakin berdekatan.

Pada saat kueri dimasukkan, pencarian dilakukan dengan cara menelusuri node-node

graf tersebut dengan algoritme pencarian

Breadth-First Search (BFS). Awal pencarian difokuskan untuk mencari citra dalam basis data yang paling relevan dengan kueri. Setelah itu, pencarian berlanjut dengan menelusuri citra-citra lain dengan posisi yang berdekatan dengan citra basis data yang paling relevan tersebut. Hal ini dilakukan karena model struktur graf ini telah memposisikan citra-citra yang mirip saling berdekatan, sehingga ketika citra paling relevan dengan kueri telah ditemukan, maka citra-citra lain yang letaknya berdekatan dengan citra tersebut juga relevan terhadap kueri. Hasil penelusuran kemudian ditampilkan sebagai hasil temu kembali.

Tujuan

Tujuan penelitian ini adalah mengimplementasikan dan menganalisis kinerja metode heuristik pada pencarian citra.

Ruang Lingkup

Ruang lingkup penelitian ini difokuskan pada implementasi pemrograman heuristik pada proses pencarian citra dalam konteks Content Based Image Retrieval (CBIR) berdasarkan fitur warna, bentuk, dan tekstur. Implementasi ini diterapkan pada data sebanyak 1100 citra yang terbagi menjadi 10 kelas, yaitu mobil, singa, matahari terbenam, tekstur, beruang, gajah, tanda panah, pemandangan, reptil, dan pesawat.

TINJAUAN PUSTAKA

Dalam dokumen Image Searching Using Heuristic Method for Image Retrieval System. (Halaman 26-35)