• Tidak ada hasil yang ditemukan

Purwarupa Sistem Content Based Image Retrieval untuk Pencarian Produk Sepatu

N/A
N/A
Protected

Academic year: 2022

Membagikan "Purwarupa Sistem Content Based Image Retrieval untuk Pencarian Produk Sepatu"

Copied!
5
0
0

Teks penuh

(1)

Purwarupa Sistem Content Based Image Retrieval untuk Pencarian Produk Sepatu

Baldri, Septia Rani, Izzati Muhimmah Jurusan Informatika Fakultas Teknologi Industri

Universitas Islam Indonesia Yogyakarta

[email protected], [email protected], [email protected]

Abstract—Di era teknologi informasi, salah satu proses yang penting dalam pengelolaan data yaitu adanya proses temu balik informasi atau information retrieval (IR). Di dalam dunia nyata, implementasi dari IR dapat ditemui pada mesin pencari seperti situs google.com dan bing.com. Pada mesin pencari tersebut, proses pencarian kebanyakan dilakukan dengan kata kunci atau query berupa teks, namun ada juga beberapa yang sudah mendukung pencarian dengan query berupa gambar. Teknik untuk melakukan temu balik informasi berdasarkan gambar dikenal juga dengan istilah content based image retrieval (CBIR).

Dengan banyaknya situs e-commerce seperti sekarang ini, keberadaan fitur pencarian produk menjadi salah satu aspek yang penting. Pencarian berdasarkan query teks terkadang kurang memuaskan karena seringkali pengguna kesulitan untuk mendeskripsikan produk yang dicari. Salah satu alternatif solusinya adalah melakukan pencarian produk berdasarkan query gambar. Dalam penelitian ini penulis mengembangkan sebuah purwarupa sistem CBIR untuk pencarian produk sepatu.

Query berupa citra sepatu akan dimasukkan oleh pengguna ke dalam sistem. Selanjutnya citra query ini akan mengalami proses ekstraksi fitur bentuk, warna, dan tekstur untuk menemukan kesamaan terhadap citra-citra yang tersimpan dalam basis data.

Proses penemuan citra tersebut menggunakan perhitungan jarak euclidean distance.

Beberapa skenario pengujian dilakukan untuk mengetahui performansi sistem. Berdasarkan hasil pengujian diperoleh nilai rata-rata presisi sebesar 81,33%.

Kata kunci—content based image retrieval; produk sepatu;

ekstraksi fitur; euclidean distance

I. PENDAHULUAN

Perkembangan teknologi informasi dan perluasan pemanfaatan teknologi komputer telah menjadikan komputer sebagai kebutuhan utama dalam pengelolaan berbagai data.

Peranan pokok teknologi informasi, terutama dalam hal pengelolaan data telah mampu memberikan peningkatan pendapatan, efektifitas, dan efisiensi yang lebih baik bagi perorangan, instansi, maupun pemerintah. Salah satu proses yang penting dalam pengelolaan data yaitu adanya proses penemuan kembali informasi yang dibutuhkan oleh pengguna.

Proses ini disebut dengan istilah temu balik informasi atau information retrieval (IR). Tujuan dari IR adalah memberikan

dokumen yang berisi informasi yang relevan dengan query yang dimasukkan oleh pengguna.

Dalam IR terdapat tempat penyimpanan dokumen- dokumen dan pengguna akan merumuskan suatu pertanyaan (request atau query) yang jawabannya adalah himpunan dokumen yang mengandung informasi yang diperlukan.

Pengguna akan memperoleh dokumen-dokumen yang diperlukannya dengan membaca semua atau sebagian dokumen dalam tempat penyimpanan, menyimpan dokumen-dokumen yang relevan, dan membuang dokumen lainnya. Di dalam dunia nyata, implementasi dari IR dapat ditemui pada mesin pencari seperti situs google.com dan bing.com.

Pada mesin pencari, proses pencarian kebanyakan dilakukan dengan query berupa teks, namun ada juga beberapa yang sudah mendukung proses pencarian berupa gambar.

Terkadang pencarian menggunakan query yang berbentuk teks saja tidak cukup. Terlebih jika pengguna ingin mencari produk seperti baju atau sepatu yang memiliki jumlah variasi model yang sangat banyak di sebuah situs e-commerce, seringkali pengguna kesulitan untuk mendeskripsikan produk yang dicari.

Ditemui juga kasus bahwa pengguna telah memiliki citra dari produk yang dicari dan pengguna ingin mencari apakah produk tersebut (atau produk yang mirip) dimiliki oleh toko yang dimaksud. Untuk kasus-kasus tersebut, pencarian menggunakan query berbentuk citra akan lebih sesuai dibandingkan pencarian menggunakan query berbentuk teks.

Teknik untuk melakukan temu balik informasi berdasarkan isi (content) dalam sebuah citra dikenal juga dengan istilah content based image retrieval (CBIR).

Dalam penelitian ini penulis mengembangkan sebuah purwarupa sistem CBIR untuk pencarian produk sepatu. Ke depannya sistem ini diharapkan dapat diimplementasikan pada situs e-commerce penjualan produk sepatu agar fitur pencarian produk menjadi lebih handal. Selanjutnya pembahasan pada makalah ini akan disajikan sebagai berikut. Pada bagian 2 akan dijelaskan mengenai kajian pustaka terkait dengan penelitian ini. Pada bagian 3 akan dijelaskan tentang metodologi yang digunakan. Di bagian 4 dipaparkan mengenai hasil dan pembahasan. Terakhir pada bagian 5 berisi kesimpulan dan saran untuk penelitian lebih lanjut.

(2)

II. KAJIAN PUSTAKA

A. Content Based Image Retrieval

Temu kembali citra (image retrieval) merupakan proses untuk mendapatkan sejumlah citra berdasarkan masukan satu buah citra. Istilah yang lebih spesifik lagi adalah content based image retrieval (CBIR) atau temu kembali citra berdasarkan isinya. CBIR adalah sebuah metode pencarian citra dengan melakukan perbandingan antara citra query dengan citra yang ada di basis data berdasarkan informasi yang ada pada citra tersebut. Metode CBIR yang sering digunakan adalah pencarian berdasarkan kemiripan bentuk, warna, dan tekstur.

Pada awalnya CBIR digunakan untuk pencarian citra secara otomatis di dalam basis data yang didasarkan pada fitur bentuk dan warna. Sejak saat itu, bermunculan berbagai sistem CBIR.

Contoh yang terkenal adalah Query By Image Content (QBIC) yang dikembangkan IBM [1]. Pada perkembangan selanjutnya, fitur tekstur juga dimasukkan sebagai bagian untuk melakukan pencarian citra. Sistem CBIR secara umum dibangun dengan melihat karakteristik dari suatu gambar atau dengan kata lain dengan melihat ciri dari gambar tersebut. Ciri merupakan suatu tanda yang khas, yang membedakan antara satu gambar dengan gambar yang lain. Pada dasarnya suatu gambar memiliki ciri- ciri dasar yaitu: bentuk, warna, dan tekstur.

Prinsip sistem CBIR adalah melakukan perbandingan antara citra query dengan citra yang ada di basis data. Dalam perbandingan tersebut, jenis dan banyaknya citra query yang digunakan oleh peneliti sesuai dengan kepentingan dan kebutuhan masing-masing. Berikut ini beberapa penelitian sebelumnya yang terkait dengan topik pada penelitian ini. Azis [2] mengembangkan sebuah sistem temu kembali citra berbasis tekstur dan warna untuk objek citra kain. Ekstraksi ciri tekstur dilakukan dengan menerapkan metode ekstraksi ciri statik orde dua, sedangkan untuk ciri warna menggunakan histogram HSV. Selain itu, ada juga Sadli [3] yang mengajukan sistem image retrieval untuk citra bunga. Pada penelitiannya digunakan histogram warna untuk pengindeksan warna citra dan integrated region matching untuk memperhitungkan nilai warna. Adapun penelitian CBIR dengan objek citra sepatu pernah dilakukan oleh Ulinnuha dan Sa'dyah [4]. Pada metode yang mereka ajukan digunakan prosedur pencarian dua fase dengan fitur histogram multi tekston. Pada penelitian ini, akan digunakan objek citra sepatu dengan metode ekstraksi fitur warna menggunakan statistika warna, ekstraksi fitur bentuk menggunakan momen invariant, dan ekstraksi fitur tekstur menggunakan tekstur berbasis histogram.

B. Ekstraksi Fitur

Pada umumnya fitur dinyatakan dengan suatu tanda yang khas, yang membedakan antara satu gambar dengan gambar yang lain. Fitur-fitur suatu objek mempunyai peran penting untuk berbagai aplikasi berikut [5]:

• Pencarian citra: fitur dipakai untuk mencari objek-objek tertentu yang berada di dalam basis data.

• Penyederhanaan dan hampiran bentuk: bentuk objek dapat dinyatakan dengan representasi yang lebih ringkas.

• Pengenalan dan klasifikasi: sejumlah fitur dipakai untuk menentukan jenis objek.

Adapun ciri-ciri atau fitur dasar dari gambar sebagai berikut:

• Bentuk

Ciri bentuk suatu gambar dapat ditentukan oleh tepi (sketsa) atau besaran momen dari suatu gambar.

Pemakaian besaran momen pada ciri bentuk ini banyak digunakan orang dengan memanfaatkan nilai-nilai transformasi fourier dari gambar. Proses yang dapat digunakan untuk menentukan ciri bentuk adalah deteksi tepi, threshold, segmentasi dan perhitungan momen seperti (mean, median dan standar deviasi dari setiap lokal gambar).

• Warna

Ciri warna suatu gambar dapat dinyatakan dalam bentuk histogram dari gambar tersebut yang dituliskan dengan: H (r,g,b), dimana H (r,g,b) adalah jumlah munculnya pasangan warna R (red), G (green) dan B (blue).

• Tekstur

Tekstur merupakan karakteristik intrinsik dari suatu citra yang terkait dengan tingkat kekasaran (roughness), granularitas (granulation), dan keteraturan (regularity) susunan struktural piksel. Aspek tekstural dari sebuah citra dapat dimanfaatkan sebagai dasar dari segmentasi, klasifikasi, maupun interpretasi citra.

C. Perhitungan Kesamaan Antara Dua Citra

Pada pencarian citra, untuk merepresentasikan sebuah citra biasanya digunakan vektor fitur. Selanjutnya untuk menentukan kesamaan antara dua buah citra maka dapat digunakan pendekatan perhitungan jarak antara dua vektor fitur citra tersebut. Tingkat kesamaan dinyatakan dengan suatu skor atau ranking. Semakin kecil nilai ranking, semakin dekat kesamaan kedua vektor tersebut. Pengukuran jarak dilakukan dengan beberapa cara. Metode yang sering digunakan yaitu menggunakan jarak Euclidean. Jarak Euclidean [6]

didefinisikan dengan rumus (1).

(1) Dalam hal ini, p dan q adalah dua vektor yang jaraknya akan dihitung dan n menyatakan dimensi vektor.

D. Recall dan Precision

Pengukuran efektivitas suatu sistem temu kembali informasi dapat dilakukan dengan perhitungan terhadap nilai perolehan (recall) dan nilai ketepatan (precision). Recall berhubungan dengan kemampuan sistem untuk memanggil dokumen yang relevan. Untuk menghitung nilai recall digunakan rumus (2).

(2) Precision (presisi) dapat diartikan sebagai kecocokan antara permintaan informasi dengan jawaban terhadap permintaan itu.

Untuk menghitung nilai presisi digunakan rumus (3). Jumlah yang besar dari dokumen yang relevan di dalam basis data membuat recall sulit untuk dihitung. Oleh karena itu presisi

(3)

lebih banyak digunakan untuk menilai keefektifan dalam sebuah sistem temu balik informasi [7].

(3) III. METODOLOGI

Pada penelitian ini, pertama-tama dilakukan pengumpulan data yang akan disimpan menjadi basis data. Data yang digunakan kurang lebih 100 citra sepatu yang terdiri dari dua jenis yaitu sepatu pria dan sepatu wanita. Sepatu pria terdiri dari tiga kategori, yaitu casual, formal, dan sandal. Sedangkan untuk sepatu wanita terdiri dari tujuh kategori, yaitu sandal flat, sandal hak, sepatu casual, sepatu formal, sepatu hak, dan wedges. Sepatu difoto dari sisi samping dengan masing-masing citra foto berukuran 300 x 300 piksel. Data sepatu diperoleh dari salah satu website toko online penjualan produk sepatu.

Beberapa contoh data citra sepatu yang digunakan dapat dilihat pada Gambar 1.

Tahap selanjutnya yaitu melakukan pemodelan sistem.

Rancangan alur sistem yang akan dibangun dapat dilihat pada Gambar 2. Penjelasan alur sistem CBIR yang akan dibangun adalah sebagai berikut:

• Pengguna terlebih dahulu memasukkan query yang berupa citra sepatu.

• Citra query tersebut diekstraksi. Dalam proses ekstraksi ada tiga fitur yang diambil yaitu fitur bentuk, warna, dan tekstur yang selanjutnya digabungkan menjadi sebuah vektor ciri.

• Vektor ciri kemudian dinormalisasi sehingga dihasilkan data fitur citra ternormalisasi.

• Untuk data citra yang tersimpan dalam basis data, dilakukan proses yang sama seperti citra query sehingga untuk masing-masing citra akan direpresentasikan dalam vektor ciri.

• Antara vektor ciri citra query dengan vektor ciri yang tersimpan dalam basis data akan dibandingkan satu sama lain untuk mencari kesamaannya. Proses similarity matching ini menggunakan perhitungan Euclidean distance.

• Setelah proses pembandingan tersebut, akan terpilih beberapa citra dari basis data yang memiliki nilai vektor ciri yang sama atau hampir sama dengan citra query. Citra-citra tersebut akan diurutkan dari yang paling kecil jaraknya (paling mirip) kemudian ditampilkan ke pengguna sebagai hasil pencarian.

Gambar 1. Contoh data sepatu yang digunakan

Gambar 2. Alur sistem secara umum

Metode yang digunakan untuk ekstraksi fitur bentuk yaitu moment invariant yang memperhitungkan area objek. Momen yang dihasilkan dapat mengatasi proses transformasi seperti translasi, dilatasi, dan rotasi citra. Dari hasil perhitungan sesuai yang ada pada referensi [5] akan diperoleh tujuh buah nilai sebagai ciri fitur bentuk. Untuk ekstraksi fitur warna, digunakan perhitungan statistika warna [5] pada setiap komponen warna R, G, dan B. Karakteristik yang dihitung yaitu rerata, simpangan baku, skewness, dan kurtosis. Dari hasil perhitungan akan diperoleh dua belas buah nilai sebagai ciri fitur warna. Adapun untuk ekstraksi fitur tekstur menggunakan metode tekstur berbasis histogram [5]. Perhitungan yang dilakukan yaitu dengan mencari nilai rerata intensitas, simpangan baku, skewness, nilai energi (keseragaman), entropi, dan tingkat kehalusan intensitas pada citra (smoothness). Dari hasil perhitungan akan diperoleh enam buah nilai sebagai ciri fitur tekstur. Dengan demikian, dari hasil proses ekstraksi fitur secara keseluruhan, masing-masing citra akan direpresentasikan menggunakan 25 nilai ciri/fitur.

Selain merancang alur sistem, dirancang juga antarmuka sistem. Antarmuka sistem merupakan jembatan komunikasi antara pengguna dengan sistem, sehingga sistem dapat lebih mudah untuk digunakan. Rancangan antarmuka untuk sistem temu kembali citra pencarian produk sepatu dapat dilihat pada Gambar 3. Pada rancangan yang dibuat, pengguna dapat memilih citra query dan memilih basis data yang akan digunakan. Kemudian pada hasil pencarian hanya akan ditampilkan sebanyak 10 buah citra yang paling mirip.

Setelah perancangan selesai dilakukan, selanjutnya sistem diimplementasikan dengan menggunakan MATLAB R2013a.

Kemudian sistem CBIR akan diuji performansinya menggunakan pendekatan perhitungan presisi.

(4)

Gambar 3. Rancangan antarmuka sistem

IV. HASIL DAN PEMBAHASAN

Pada Gambar 4 dapat dilihat contoh tampilan dari purwarupa sistem temu kembali citra sepatu yang telah dibuat.

Pada tampilan tersebut, terdapat tombol “Set Database” yang berfungsi untuk memilih basis data yang digunakan (basis data dalam bentuk kumpulan citra sepatu yang disimpan dalam sebuah folder), sekaligus akan dilakukan proses ekstraksi fitur citra. Hasil ekstraksi fitur citra yang telah dinormalisasi kemudian disimpan dalam file Excel. Contoh nilai fitur yang tersimpan dalam file Excel dapat dilihat pada Gambar 5.

Banyaknya baris menyatakan banyaknya citra pada basis data, sedangkan banyaknya kolom menyatakan banyaknya fitur citra yang terdiri dari 7 kolom nilai fitur bentuk, 6 kolom nilai fitur tekstur, dan 12 kolom nilai fitur warna. Tombol “Browse”

digunakan untuk memilih citra query, tombol “Search” untuk memulai proses similarity matching, kemudian tombol “Clear”

untuk menghapus kembali tampilan citra yang ada pada purwarupa sistem.

Pada pengujian performansi sistem, pada awalnya dilakukan dengan cara membandingkan satu citra query dengan semua citra yang ada di basis data. Kemudian setelah dihitung nilai jarak terhadap semua citra yang ada di basis data, nilai tersebut diurutkan dari yang terkecil. Dari hasil pengurutan ini dapat diketahui citra yang mirip dengan citra query. Namun setelah dicoba dengan menggunakan metode ini, ternyata tingkat presisinya sangat rendah, yaitu rata-rata sebesar 34%

dari sepuluh kali percobaan pencarian. Berdasarkan hasil ini, kemudian dilakukan modifikasi terhadap metode pencarian yang digunakan, yaitu dengan melakukan pengelompokan terlebih dahulu untuk membatasi ruang pencarian dalam basis data. Ilustrasi dari metode pengelompokan yang digunakan pada penelitian ini dapat dilihat pada Gambar 6.

Berdasarkan ilustrasi pada Gambar 6, pertama-tama dilakukan pengelompokan pada 100 data citra yang ada dalam basis data. Data tersebut dikelompokkan ke dalam 10 kelompok dengan masing-masing kelompok berisi 10 citra.

Setelah itu, citra query dibandingkan dengan semua citra yang ada dalam basis data. Kemudian nilai jaraknya diurutkan secara ascending (dari yang kecil ke besar). Dari pengurutan ini didapatkan tiga nilai jarak yang terkecil. Jika tiga nilai jarak tersebut masing-masing diperoleh dari citra yang berbeda kelompok, maka semua nilai jarak yang ada dalam tiga kelompok tersebut diurutkan kembali dari yang terkecil

kemudian diambil 10 citra dengan nilai jarak terkecil yang berasal dari tiga kelompok yang terpilih tadi.

Setelah dilakukan percobaan dengan beberapa citra uji, ternyata hasil pencarian menggunakan metode pengelompokan dan mengambil dari tiga kelompok ini belum memberikan nilai presisi yang bagus, yaitu rata-rata sebesar 61% dari sepuluh kali percobaan pencarian. Maka dari itu selanjutnya dicoba digunakan metode pengelompokan dengan mengambil dua kelompok saja untuk diurutkan kembali. Pada proses pengujian, digunakan data uji sejumlah 15 yang terdiri dari 10 data uji citra yang ada di dalam basis data dan 5 data uji citra yang tidak ada di dalam basis data. Rekapitulasi hasil pengujian dengan menggunakan metode ini dapat dilihat pada Tabel I. Adapun salah satu contoh hasil pengujian dapat dilihat pada Tabel II.

Gambar 4. Antarmuka sistem temu kembali citra sepatu

Gambar 5. Data hasil ekstraksi fitur yang tersimpan dalam file Excel

Gambar 6. Ilustrasi metode pengelompokan pada pencarian citra

(5)

TABEL I. REKAPITULASI HASIL PENGUJIAN PERFORMANSI SISTEM

TABEL II. CONTOH SALAH SATU HASIL PENCARIAN

Berdasarkan pengujian yang telah dilakukan, persentase presisi sistem temu kembali citra sepatu yang dibangun memiliki nilai 50% - 100%, dengan nilai rata-rata presisi sebesar 81,33%. Hal ini menunjukkan bahwa sistem yang dibangun sudah dapat memberikan hasil pencarian dengan menampilkan citra-citra yang relevan. Meskipun demikian, hasil pencarian akan sangat bergantung pada dua buah citra yang memiliki nilai jarak paling kecil (paling mirip) terhadap citra query. Jika berdasarkan penilaian objektif kedua buah citra tersebut berada pada kelompok yang sama dengan citra query, maka presisi hasil pencarian akan tinggi. Namun apabila salah satu atau keduanya berada pada kelompok yang berbeda dengan kelompok citra query yang sebenarnya maka sistem dapat mengembalikan beberapa citra yang tidak relevan.

V. KESIMPULAN DAN SARAN

Pada penelitian ini sudah berhasil dibangun sebuah purwarupa sistem content based image retrieval untuk pencarian produk sepatu berdasarkan fitur bentuk, fitur warna, dan fitur tekstur yang dimiliki oleh citra sepatu. Dari hasil pengujian diperoleh nilai rata-rata presisi sistem yang dibangun sebesar 81,33%. Hal ini menunjukkan bahwa sistem yang dibangun sudah dapat memberikan hasil pencarian dengan menampilkan citra-citra yang relevan. Untuk ke depannya, data citra yang digunakan sebagai basis data perlu ditambah lagi jumlahnya. Selain itu juga perlu dieksplorasi pengaruh metode ektraksi fitur yang berbeda terhadap tingkat presisi sistem.

REFERENSI

[1] M. Flickner, et al, “Query by image and video content: The QBIC system,” Computer, vol. 28.9, 1995, pp.23-32.

[2] F. Azis, “Sistem temu kembali citra kain berbasis tekstur dan warna,”

Diss. Universitas Islam Negeri Sultan Syarief Kasim Riau, 2013.

[3] M. Sadli, "Image retrieval berdasarkan warna dan bentuk dengan metode color histogram dan integrated region matching," Skripsi Sekolah Tinggi Teknologi Indonesia Tanjungpinang, 2014.

[4] N. Ulinnuha dan H. Sa’dyah, “Sistem temu kembali citra untuk e- commerce menggunakan prosedur pencarian dua fase dengan fitur histogram multi tekston,” Systemic: Information System and Informatics Journal, vol. 1.1, 2015, pp. 35-41.

[5] A. Kadir dan A. Susanto, “Teori dan aplikasi pengolahan citra,”

Yogyakarta: Andi, 2013.

[6] L.H. Lee, C.H. Wan, R. Rajkumar, and D. Isa, “An enhanced Support Vector Machine classification framework by using Euclidean distance function for text document categorization,” Applied Intelligence, vol.

37.1, 2012, pp. 80-99.

[7] J. Hasugian, “Penelusuran informasi ilmiah secara online: Perlakuan terhadap seorang pencari informasi sebagai real user,” Pustaha, vol. 2.1, 2006, pp.1-13.

Gambar

Gambar 1. Contoh data sepatu yang digunakan
Gambar 4. Antarmuka sistem temu kembali citra sepatu

Referensi

Dokumen terkait

sains merupakan keseluruhan keterampilan ilmiah yang terarah (baik kognitif maupun psikomotorik) yang dapat digunakan untuk menemukan suatu konsep, prinsip atau teori,

tempat lain maka saya akan mengejar peluang tersebut 2 Saya merasa tidak akan tetap tinggal di KAP tempat. saya bekerja sampai 5

Kimia Farma (Persero) Tbk., tidak optimal karena nilai ROA menurun, perurunan nilai ROA disebabkan karena nilai NPM yang berfluktuasi cenderung menurun karena

Yang paling penting untuk dilihat dan menjadi alasan penelitian ini adalah tentang pesan-pesan dakwah yang disampaikan oleh penulis sehingga karyanya tidak sekedar menjadi

Perbedaan warna ekstrak rosella secara visual pada setiap kali ekstraksi dapat dilihat pada Figur 4 yang secara jelas terlihat adanya perbedaan warna karena semakin

Produk utama dari sebuah institusi politik adalah platform partai yang berisikan konsep, identitas ideologi, dan program kerja sebuah institusi politik, selain itu apa saja yang

Pada praktikum yang pertama yaitu membahas mengenai penentuan struktur tanah menggunakan metode ayakan yang dimana setiap agregat tanah akan memberi pengaruh terhadap

Setelah dilakukan pengamatan dan pengkajian terhadap data dari petikan-petikan percakapan dapat diketahui bahwa dari 15 data implikatur yang dikaji dan digunakan oleh