73
Pasnur1, Agus Zainal Arifin2, Anny Yuniarti3 1,2,3
Jurusan Teknik Informatika, Institut Teknologi Sepuluh Nopember Kampus ITS Keputih, Sukolilo, Surabaya 60111, Jawa Timur
Email: 1pasnur13@mhs.if.its.ac.id, 2agusza@cs.its.ac.id, 3anny@cs.its.ac.id
Abstrak
Sistem Region BasedImageRetrieval (RBIR) yang efisien harus mempertimbangkan teknik pemilihan query regionsebelum melakukan proses pencarian. Query region merupakan region yang merepresentasikan sebuah Region of Interest (ROI) atau saliency region. Query regionyang terpilih harus menentukan region-region tertentu pada koleksi gambar yang akan menjadi cakupan pencarian, agar waktu komputasi dapat direduksi. Penelitian ini bertujuan untuk mengusulkan strategi penentuan query region berdasarkan posisi relatif Saliency Region OverlappingBlock (SROB), agar dihasilkan sistem RBIR dengan komputasi yang lebih efisien. Saliency region dipilih secara manual oleh pengguna dan akan ditentukan target pencarian berdasarkan posisi relatif SROB. Hasil pengujian pada NEC AnimalDataset
menunjukkan bahwa metode usulan memerlukan waktu pencarian rata-rata selama 0,113 detik atau67,53% lebih cepat dibandingkan metode Shrivastavadengan ukuran region 5x5. Penelitian ini membuktikan bahwa penentuan query region dapat dilakukan berdasarkan posisi relatifSROB untuk menghasilkan sistem RBIR yang lebih efisien.
Kata Kunci : region basedimageretrieval, saliency region, posisi relatif, region code,
localbinarypattern
1. Pendahuluan
ContentBasedImageRetrieval (CBIR) merupakan sebuah teknik untuk menemukan kembali gambar dari koleksi yang sangat besar berdasarkan kesamaan visual (Shrivastava & Tyagi, 2014). Pencarian gambar dengan CBIR memiliki keunggulan dibandingkan dengan cara tradisional yang memanfaatkan anotasi teks pada gambar. Perkembangan data yang sangat cepat menyebabkan banyaknya gambar yang belum memiliki anotasi atau terdapat ketidaksesuaian dengan konteksnya (Shete & Chavan, 2012; Singh & Ahmad, 2014). Kondisi tersebut akan menurunkan efektivitas pencarian gambar, sehingga sangat dibutuhkan teknik CBIR yang tidak tergantung pada anotasi teks serta menghasilkan hasil pencarian berdasarkan konteks.
Salah satu teknik kueri yang sangat
populer penggunaannya pada sebuah sistem CBIR adalah QuerybyExample (QBE). Pengguna menyediakan kueri berupa sebuah gambar yang akan dijadikan dasar pencarian. Fitur dari gambar tersebut akan diekstrak dan dibandingkan dengan fitur dari seluruh gambar yang terdapat pada database. Gambar yang memiliki kesamaan fitur paling dekat akan ditampilkan sebagai prioritas hasil pencarian (Vimina & Jacob, 2013).
74
secara lokal dapat dilakukan dengan membentuk region pada gambar kueri dan dikenal dengan nama Region BasedImageRetrieval (RBIR)(Shrivastava & Tyagi, 2014).
Sebuah sistem RBIR yang efisien harus mempertimbangkan teknik pemilihan
query region dan cakupan region pada proses pencarian. Query region merupakan
region yang merepresentasekan sebuah
Region of Interest (ROI) atau saliency region.Query region yang terpilih harus menentukan cakupan region-region pada koleksi gambar agar proses komputasi dapat lebih efisien seperti yang diusulkan pada penelitian (Shrivastava & Tyagi, 2014).
Penelitian (Shrivastava & Tyagi, 2014) mengusulkan sebuah sistem RBIR
dengan memanfaatkan region codeuntuk pemilihan target komputasi. Gambar kueri dibagi ke dalam region berukuran 3x3 dan 5x5. Pengguna melakukan seleksi ROI secara manual pada gambar kueri.
ROIOverlappingBlock (ROB) merupakan
ROI manual yang overlapdengan satu atau beberapa region. ROB akan diseleksi berdasarkan kesamaan fitur
DominantColorDescriptor (DCD). Setiap
ROB terpilih akan dibandingkan dengan seluruh region yang memiliki region code
yang similar pada koleksi gambar tanpa memperhatikan posisi relatif setiap ROB. Pemilihan region codesimilaruntuk target komputasi pada metode (Shrivastava & Tyagi, 2014) tidak memperhatikan posisi relatif region. Hal ini menyebabkan pada target komputasi masih terdapat region
yang tidak relevan dengan kueri pengguna, sehingga membutuhkan waktu komputasi yang lebih lama.
Penelitian ini bertujuan untuk mengusulkan strategi penentuan query region berdasarkan posisi relatif Saliency Region OverlappingBlock (SROB), agar dihasilkan sistem RBIR dengan komputasi yang lebih efisien. Target komputasi dari
saliency region terpilih ditentukan
berdasarkan posisi relatif seluruh SROB.
Nilai similaritas gambar kueri dengan gambar pada koleksi ditentukan berdasarkan jarak kedekatan histogram fitur LocalBinaryPattern (LBP). Hasil pencarian diurutkan berdasarkan nilai jarak terdekat dan akan dievaluasi menggunakan
Precision, Recall,
AveragedNormalizedModifiedRetrievalRan k (ANMRR), dan Average of Retrieval Time. Penelitian ini akan menghasilkan metode pencarian gambar berbasis konteks dengan waktu komputasi yang lebih efisien serta tetap mempertahankan nilai efektivitas yang tinggi.
2. Kajian Pustaka 2.1Region Code
Region code pertama kali digunakan pada algoritma Cohen-SutherlandLineClipping(Shrivastava & Tyagi, 2014). Algoritma tersebut digunakan untuk memotong garis atau bagian garis yang berada di luar area of interest. Algoritma tersebut membagi sebuah area dua dimensi ke dalam 9 region
dan menentukan garis atau bagian garis yang harus dipotong.
Penelitian (Shrivastava & Tyagi, 2014) melakukan pengembangan algoritma
Cohen-SutherlandLineClipping agar dapat dimanfaatkan pada RBIR. Gambar yang digunakan dalam RBIR dibagi ke dalam beberapa region berukuran 3x3 seperti pada Gambar 1. Setiap region akan diberikan kode 4 bit yang menunjukkan posisi reatifnya terhadap pusat
region.Pemberian region code dimulai dari
bit paling kanan, yang secara berurutan menunjukkan posisi kiri, kanan, bawah, dan atas region terhadap pusat. Apabila posisi menunjukkan posisi yang benar, akan diberikan bit 1, dan sebaliknya akan diberikan bit 0.
Dua buah region code
75
similar dua buah region code dapat juga dilakukan dengan menggunakan operasi logika AND antara keduanya. Apabila hasil operasi AND tidak sama dengan 0000, maka kedua region codetersebut dianggap similar. Gambar 2 menunjukkan
region codesimilar dengan 0001 yang berada pada posisi kiri tengah dari region
pusat. Region code yang similar dengan 0001 adalah 1001, 0001, 1111, dan 0101. Berdasarkan aturan tersebut, maka region
pusat dengan kode 1111 similar dengan seluruh region code yang lainnya (Shrivastava & Tyagi, 2014).
Penelitian ini menggunakan konsep dari (Shrivastava & Tyagi, 2014) yang hanya melakukan komputasi pada region codeyang similar. Konsep tersebut berasumsi bahwa peluang untuk mendapatkan gambar yang dicari berada pada posisi region code ROI dan region code lainnya yang berdekatan. Dua buah
Gambar 2Region CodeYang Similar
Dengan 0001
2.2LocalBinaryPattern
Tekstur merupakan pola visual yang memiliki atribut homogenitas yang tidak hanya berasal dari kehadiran satu warna saja. Tekstur memiliki peranan penting untuk mendeskripsikan permukaan sebuah obyek dan relasinya dengan area sekitarnya (Shrivastava & Tyagi, 2014). Fitur tekstur dapat diekstrak secara struktural atau statistikal(Shete & Chavan, 2012). Salah satu fitur tekstur yang sangat populer penggunaannya adalah
LocalBinaryPattern (LBP).
Fitur LBP mendeskripsikan sebuah nilai pixel berdasarkan nilai gray level pixeltetangganya (Zhu et al., 2013). Nilai
LBP sebuah pixel dapat dihitung berdasarkan Persamaan (1).
𝐿𝐵𝑃𝑃,𝑅 = ∑ 𝑠(𝑔𝑝− 𝑔𝑐). 2𝑃, 𝑃−1
𝑃=0
𝑠(𝑥) = {1, 𝑥 ≥ 00, 𝑥 < 0
(1)
Pada Persamaan (1), variabel gc
menunjukkan grayvalue dari centerpixel, variabel gp menunjukkan grayvalue dari pixel tetangga. Setelah semua nilai LBP
dihitung, maka histogram dari LBP
tersebut digunakan untuk
76
3. Metode Penelitian
Model sistem yang digunakan dalam penelitian ini diadopsi dari penelitian (Shrivastava & Tyagi, 2014) seperti ditunjukkan pada Gambar 3. Model tersebut dimodifikasi dengan melakukan penambahan tahapan yang merupakan kontribusi dari penelitian ini. Model tersebut terdiri atas tiga bagian besar, masing-masing merupakan proses untuk koleksi gambar, gambar kueri, dan perhitungan similaritas antara gambar kueri dengan gambar-gambar pada koleksi. Pada bagian koleksi gambar akan dilakukan proses pembentukan region dan ekstraksi fitur. Pembentukan region
dimulai dengan menghitung panjang dan lebar dari gambar masukan. Nilai panjang dan lebar gambar kemudian dibagi 3 (untuk ukuran region 3x3) dan dibagi 5 (untuk ukuran region 5x5), sehingga masing-masing akan dihasilkan
regiondengan ukuran yang seragam sebanyak 9 (untuk ukuran region 3x3) dan 25 (untuk ukuran region 5x5). Seluruh
region yang terbentuk akan menyalin informasi dari gambar masukan sesuai batas daerah region tersebut, sehingga dihasilkan gambar-gambar baru yang merupakan pecahan dari gambar masukan. File gambar region ditempatkan pada lokasi tertentu untuk memudahkan proses ekstraksi fitur setiap region pada tahap berikutnya.
Fitur yang diekstrak pada gambar kueri maupun gambar pada koleksi adalah fitur LBP. Fitur tersebut merupakan ciri yang akan menjadi dasar penentuan kesamaan dua buah gambar. Nilai histogram setiap fitur LBP juga akan dihitung. Histogram tersebut menunjukkan frekuensi kemunculan sebuah nilai keabuan pada fitur LBP.
77 pada ukuran gambar yang berbeda-beda.
Perhitungan nilai kesamaan memanfaatkan jarak histogram masing-masing fitur LBP
dari gambar yang dibandingkan.
Pada bagian gambar kueri akan dilakukan penentuan saliency region, saliency region overlappingblock, dan penentuan region codesimiliar.
Saliency region yang telah ditentukan pada proses sebelumnya akan
overlapdengan satu atau beberapa blok
region dan disebut sebagai Saliency Region OverlappingBlock (SROB). Seluruh SROB
disimpan ke dalam sebuah daftar. SROB
yang memiliki area overlapping terbesar dijadikan sebagai acuan untuk memilih
SROB lain yang memiliki fitur dominan color yang sama dengan SROB acuan.
Pada penelitian ini, penentuan
region codesimiliar mempertimbangkan posisi relatif seluruh SROB.Region codesimiliarditentukan berdasarkan pada keberadaan bit 1 pada posisi yang sama antara SROB dengan region yang terbentuk pada gambar. Gambar 4 menunjukkan algoritma yang digunakan untuk penentuan
Perhitungan similaritas dilakukan dengan membandingkan kedekatan nilai histogram fitur LBP antara setiap SROB
terpilih dengan seluruh region pada gambar koleksi yang memiliki region codeyang similar dengan SROB. Perhitungan similaritas tersebut dilakukan sesuai Persamaan (2) dan hasilnya diurutkan sesuai kedekatan. Sejumlah nilai similaritas terdekat akan ditampilkan sebagai hasil pencarian.
𝐷(𝐵𝑟, 𝐼𝑖) = min (𝐿𝐷𝑖(𝐵𝑟, 𝐼𝑏𝑖 𝑗)) , 𝑖
= 1 … 𝑛.
(2)
Pada Persamaan (3), variabel 𝐷(𝐵𝑟, 𝐼𝑖) menunjukkan nilai pengukuran jarak antara
SROBBr dengan gambar ke-i di database.
Variabel 𝐿𝐷𝑖(𝐵𝑟, 𝐼𝑏
𝑖
𝑗) menunjukkan nilai
pengukuran jarakantara SROBBr
dengansetiap blok 𝐼𝑏
𝑖
𝑗 pada gambar 𝐼𝑖 di databaseyang memiliki region codesimilar
Gambar 4 Algoritma Untuk Penentuan Region CodeSimiliar
1. Buat daftar kandidat region codeyang similar untuk setiap
SROB.
2. Pilih SROB acuan dengan jumlah kandidat region
codeyangsimilar terkecil.
3. Tempatkan SROB acuan pada seluruh kandidat region
codeyangsimilar yang berasosiasi dengan SROB acuan secara
bertahap. Tempatkan SROB yang lain dengan mempertahankan
posisi relatifnya terhadap SROB acuan.
4. Tentukan region codeyang similar dengan aturan:
a. Jika seluruh SROB menempati kandidat region
codeyangsimilar yang sesuai dan tidak ada SROB yang
terpotong, maka seluruh kandidat tersebut disimpan
sebagai region codeyang similar.
b. Jika terdapat SROB yang menempati region code yang
tidak termasuk kandidat region codeyang similar atau
terdapat SROB yang terpotong, maka seluruh kandidat
region code yang ditempati tersebut disimpan sebagai
78
dengan SROB Br. Proses pengukuran akan
dilakukan sebanyak n jumlah blok pada gambar di database yang memiliki region codeyang similar dengan Br. Jenis
pengukuran yang digunakan adalah
EuclideanDistance dan dipilih nilai jarak yang terdekat (Shrivastava & Tyagi, 2014). Analisa hasil pengujian dilakukan dengan melakukan pengukuran kinerja sistem, baik yang berkaitan dengan efektivitas hasil pencarian maupun efisiensi waktu komputrasi. Pengukuran efektivitas hasil pencarian dilakukan dengan melihat nilai Precision, Recall, dan
AveragedNormalizedModifiedRetrievalRan k (ANMRR). Sedangkan pengukuran efisiensi waktu komputasi dilakukan dengan melihat nilai Average of Retrieval Time.
4. Hasil Uji Coba
Pengukuran waktu pencarian rata-rata dilakukan terhadap metode Shrivastava dan metode usulan seperti ditunjukkan pada Tabel 1. Hasil pengujian menunjukkan bahwa waktu pencarian rata-rata metode usulan lebih unggul dibandingkan dengan metode Shrivastava, baik untuk ukuran region 3x3, maupun ukuran region 5x5.
Precisionmenunjukkan persentase jumlah gambar relevan pada hasil pencarian terhadap total hasil pencarian.
Recallmenunjukkan persentase gambar relevan pada hasil pencarian terhadap total gambar relevan pada koleksi gambar. Kualitas sebuah sistem CBIR tidak dapat ditentukan hanya pada nilai precisionsaja. Tabel 1. Perbandingan Waktu Komputasi Metode Shrivastava dan Metode Usulan
Metode
Waktu Komputasi Rata-Rata (Detik)
Region 3x3 Region 5x5 Shrivastava 0,148 0,349
Usulan 0,075 0,113
Nilai pengukuran recallharus diperhitungkan sebagai pendamping pada nilai precisionyang dihasilkan sistem. Gambar 5 menunjukkan hasil pengukuran
precision, sedangkan Gambar 6 menunjukkan hasil pengukuran recall.
Pada penelitian ini, digunakan juga pengukuran nilai ANMRR. Nilai ANMRR
sering digunakan untuk menentukan kualitas sebuah sistem CBIR. Pengukuran
ANMRR tidak hanya mempertimbangkan jumlah gambar relevan yang muncul pada hasil pencarian, tetapi juga mempertimbangkan posisi (rank) gambar-gambar relevan tersebut. Nilai ANMRR
yang lebih rendah menunjukkan kualitas sistem yang lebih baik. Gambar 7 menunjukkan hasil pengukuran nilai
ANMRR.
5. Pembahasan Hasil Uji Coba
Pengurangan waktu pencarian yang dilakukan oleh metode usulan untuk ukuran region 3x3 adalah 0,073 detik atau sebesar 49,14% dari hasil metode Shrivastava. Sedangkan untuk ukuran
region 5x5 metode usulan mencapai pengurangan waktu pencarian sebesar 0,235 detik atau sebesar 67,53%. Pengurangan waktu pencarian yang dihasilkan oleh metode usulan disebabkan oleh teknik penentuan region codesimilar
berdasarkan posisi relatif region. Teknik ini mengurangi jumlah target komputasi pada gambar koleksi. Target komputasi metode lama yang dihilangkan pada metode usulan merupakan region yang memiliki peluang kecil memiliki kesamaan dengan regionkueri. Hal tersebut berdampak pada pengurangan waktu komputasi tetapi tetap mempertahankan nilai efektivitas hasil pencarian.
79 Gambar 5 Hasil Pengukuran Precision
Gambar 6 Hasil Pengukuran Recall
efektivitas sistem diukur dengan menggunakan precision, recall, dan
ANMRR. Pada Gambar 5 ditunjukkan nilai
precisionrata-rata metode Shrivastava dan metode usulan. Nilai precisionrata-rata ditunjukkan untuk berbagai jumlah hasil pencarian, yaitu dari 5 hingga 100. Pada gambar tersebut terlihat bahwa nilai
precisionrata-rata kedua metode hampir
tidak memiliki banyak perbedaan. Hal ini menunjukkan bahwa metode usulan mampu mempertahankan nilai
80
Gambar 7 Hasil Pengukuran ANMRR
dicapai karena metode usulan hanya menghilangkan region-region yang berpeluang kecil memiliki kesamaan visual dengan querypada proses pencarian.
Pada Gambar 6 ditunjukkan nilai
recallrata-rata metode Shrivastava dan metode usulan. Nilai recallrata-rata ditunjukkan untuk berbagai jumlah hasil pencarian, yaitu dari 5 hingga 100. Pada gambar tersebut terlihat bahwa nilai
recallrata-rata kedua metode hampir tidak memiliki banyak perbedaan. Metode usulan memiliki sedikit keunggulan pada jumlah hasil pencarian tertentu. Hal ini menunjukkan bahwa metode usulan mampu mempertahankan nilai
recallmetode Shrivastava bahkan sedikit memiliki keunggulan. Hal ini dicapai karena metode usulan hanya menghilangkan region-region yang berpeluang kecil memiliki kesamaan visual dengan querypada proses pencarian.
Pada Gambar 7 ditunjukkan nilai
ANMRR metodeShrivastava dan metode usulan. Nilai ANMRR metode usulan lebih baik (lebih rendah) dari pada metode Shrivastava baik untuk ukuran region 3x3 maupun 5x5. Penelitian ini
merekomendasikan penggunaan ukuran
region 3x3 karena memiliki nilai ANMRR
yang lebih rendah dari pada ukuran region
5x5. Hal ini menunjukkan bahwa kualitas hasil pencarian metode yang diusulkan sedikit lebih baik dari pada metode Shrivastava. Hal tersebut juga dapat dibuktikan dengan nilai precision dan
recall kedua metode. Metode usulan mampu mempertahankan efektivitas metode Shrivastava bahkan memiliki sedikit keunggulan pada jumlah hasil pencarian tertentu.
6. Kesimpulan
Pada penelitian ini telah dilakukan penentuan query region berdasarkan posisi relatif Saliency Region OverlappingBlock (SROB)untuk menghasilkan sebuah sistem
Region BasedImageRetrieval (RBIR)
81 Hasil pengujian membuktikan
bahwa penentuan region
codesimiliarsebagai target komputasi dapat dilakukan dengan menggunakanposisi relatif setiap SROB. Pemanfaatan posisi relatif pada metode usulan menghasilkan waktu pencarian yang lebih cepat dibandingkan dengan metode lama.
Penelitian ini dapat dikembangkan dengan menggunakan pemilihan saliency region secara otomatis sebagai pengganti pemilihan secara manual. Pemilihan secara otomatis dapat dilakukan dengan mempertimbangkan persentase luas region
terhadap luas keseluruhan gambar serta jarak region ke titik pusat gambar.
Referensi
[1] Cheng, M.-M., Zhang, G.-X., Mitra, N. J., Huang, X., & Hu, S.-M. (2015). Global Contrast Based Salient Region Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 37(3)
[2] Shete, D. S., & Chavan, M. S. (2012). Content Based Image Retrieval : Review. International Journal of Emerging Technology and Advanced Engineering, 2(9), 85–90.
[3] Shrivastava, N., & Tyagi, V. (2014). Content Based Image Retrieval Based on Relative Locations of Multiple Regions of Interest Using Selective Regions Matching. Information Sciences, 259, 212–224.
[4] Singh, B., & Ahmad, W. (2014). Content Based Image Retrieval: A Review Paper. International Journal of Computer Science and Mobile Computing, 3(5), 769–775.
Matching. International Journal of Computer Science Issues, 10(1), 686– 692.
[6] Wang, X., & Wang, Z. (2013). A Novel Method for Image Retrieval Based on Structure Elements’ Descriptor. Journal of Visual
Communication and Image
Representation, 24(1), 63–74.
[7] Wang, X.-Y., Yu, Y.-J., & Yang, H.-Y. (2011). An Effective Image Retrieval Scheme Using Color, Texture and Shape Features. Computer Standards & Interfaces, 33(1), 59–68. [8] Yang, X., & Cai, L. (2014). Adaptive
Region Matching for Region-Based Image Retrieval by Constructing Region Importance Index. IET Computer Vision, 8(2), 141–151. [9] Zhu, C., Bichot, C. E., & Chen, L.