PENELUSURAN CITRA ASET BERBASIS KEMIRIPAN CITRA MENGGUNAKAN FITUR BENTUK, WARNA DAN TEKSTUR SERTA KLUSTERING K-MEANS Jumi¹, Achmad Zaenuddin²

(1)

PROSIDING SENTRINOV Vol. 001, Tahun 2015 | ISSN: 2477 – 2097 325 PENELUSURAN CITRA ASET BERBASIS KEMIRIPAN CITRA

MENGGUNAKAN FITUR BENTUK, WARNA DAN TEKSTUR SERTA KLUSTERING K-MEANS

Jumi¹, Achmad Zaenuddin²

¹,2_{Jurusan Administrasi Niaga, Politeknik Negeri Semarang} Email: [email protected], [email protected]

Abstract

Similarity an image is one of the key fields to retrieving back (image retrieval) an image of the assets. The similarity a query image with the image of database is one of the key fields to search process back (image retrieval) based on image of the assets. The similarity a query image with the image database can be done by performing analysis based on image features are features of shapes, colors and textures. This research has been carried out analysis of image search based similarity on features of shapes, colors and textures by using invariant moment, moment color and texture as well as statistical euclidean distance as distance measuring similarity. The results of test showed that the combination of these three features are features of shape, color and texture as well as grouping data with K-Means Clustering has resulted similarity accuracy rate reached more than 90 %%. That in previous studies analyzing the accuracy of similarity based on shape features have an accuracy level of 70%. It shows that the combination of these three features and a K-Means Clustering has improved the accuracy of image search on the database assets.Keywords: Similarity, Image, retrieval, invariant, moment.

Key Words : Similarity, Image, retrieval, invariant, moment. Abstrak

Kemiripan (similarity) sebuah citra merupakan salah satu key field untuk melakukan proses

pencarian kembali (image retrieval) sebuah citra dalam hal ini citra aset. Kemiripan sebuah

citra query dengan citra database dapat dilakukan dengan melakukan analisa berdasarkan fitur citra yaitu fitur bentuk, warna dan tekstur. Pada penelitian ini telah dilakukan analisa pencarian kemiripan citra berdasarkan fitur bentuk, warna dan tekstur dengan menggunakan metode Invariant moment, color moment dan statistical texture serta euclidean distance

sebagai pengukur jarak kemiripannya. Hasil pengujian menunjukkan bahwa kombinasi dari ketiga fitur yaitu fitur bentuk, warna dan tekstur serta pengelompokan data dengan K-Means Clustering telah menghasilkan tingkat akurasi kemiripan mencapai lebih dari

90%%. Bahwa pada penelitian sebelumnya tingkat akurasi analisa kemiripan berdasarkan fitur bentuk mempunyai tingkat akurasi sebesar 70%. Hal tersebut menunjukkan bahwa kombinasi ketiga fitur dan K-Means Clustering telah meningkatkan akurasi penelusuran

pada database citra aset.

Kata kunci : Similarity, Image, retrieval, invariant, moment.

PENDAHULUAN

Teknologi informasi yang selalu berkembang memungkinkan penelusuran informasi menggunakan fitur citra yang berukuran besar sebagai key field.Hal ini karena

tersedianya software dan hardware yang mendukung pengolahan data citra yang

(2)

PROSIDING SENTRINOV Vol. 001, Tahun 2015 | ISSN: 2477 – 2097 326

akurasi penelusuran yang beragam karena dipengaruhi oleh berbagai variabel diantaranya adalah ketelitian dan ketepatan dalam proses perhitungan nilai fitur.

Citra sebuah obyek secara umum mempunyai mempunyai tiga fitur dominan yaitu fitur bentuk, warna dan tekstur. Seperti contohnya pada citra obyek aset memiliki fitur bentuk yang lebih dominan untuk membedakan kemiripan antara citra aset yang satu dengan citra aset yang lainnya.Sedangkan fitur warna dan tekstur citra aset adalah sebagai fitur penunjang untuk pengukuran kemiripan citra (Vadivel, A. dkk., 2004). Pengukuran kemiripan citra dapat dikelompokkan dengan tiga kelompok utama yaitu pertama kemiripan bentuk, kedua kemiripan warna dan yang ketiga kemiripan tekstur (Gonzales, R.C. and Woods, R.E., 2008). Kemiripan digunakan sebagai kunci pengurutan pada penelusuran data berbasis citra. Semakin mendekati nilai nol maka semakin tinggi tingkat kemiripannya (Gonzales, R.C. and Woods, R.E., 2008). Penelusuran dilakukan dengan membandingkan kemiripan fitur antara fitur citra query dengan fitur citra pada database (Castleman, K.R, 1996).

Penelitian sebelumnya tentang penelusuran kemiripan citra berdasarkan ekstraksi ciri bentuk, warna dan tekstur telah dilakukan tanpa memperhatikan bobot fitur dan

clustering dengan hasil akurasi kemiripan mencapai lebih dari 85% (Jumi and Harjoko,

2012). Beberapa penelitian sejenis yang berkaitan dengan penelusuran informasi citra berbasis CBIR (Content Based Image Retrieval) menggunakan metode pembobotan

fitur citra diantaranya adalah penelusuran citra menggunakan kombinasi fitur warna dan vektor fitur tekstur tertimbang (Vadivel, A. dkk., 2004). Penelusuran dengan pembobotan fitur tekstur menggunakan DCT (Discrette Cosine Transform)juga telah

dilakukan untuk penelusuran citra berbasis CBIR (Dong, L. And Edmund, Y.L., 2006). Nilai fitur akan menjadi koefisien bobot citra yang akan dipakai sebagai dasar penelusuran.Pengindeksan citra berbasis nilai fitur warna tertimbang coocurence matrix,

menghasilkan nilai akurasi penelusuran yang relatif tinggi (Joshua Z., H., dkk, 2005). Pada penelitian ini dilakukan pembobotan nilai fitur warna dan pengindeksan berdasarkan kesamaan elemen diagonal dan non diagonal.

(3)

pengelompokan data berdasarkan formula bobot variabel (Taoying, L., and Yan, C., 2008). Penggunaan k-means juga dilakukan dengan mengkombinasikan bobot entropy.Pada penelitian ini clustering dilakukan dengan memperhitungkan nilai entropinya (Xiang, Y., H., dkk, 2003).

METODE YANG DIUSULKAN

Pada beberapa penelitian yang sudah dilakukan diatas belum ada yang menggunakan penggabungan metode klusteringdan kombinasi fitur berdasarkan fitur bentuk, warna dan tekstur untuk proses penelusuran citra berbasis CBIR. Pada penelitian ini telah dilakukan retrieval imagedengan metode klustering dan kombinasi

ketiga fitur dengan tahapan penelitian yang ditunjukkan oleh Gambar 1.

Gambar 1. Gambaran Umum Penelusuran Citra

Berdasarkan Gambar 1, maka rincian tahapan penelusuran pada penelitian ini adalah sebagai berikut :

1. Preprocessing

Preprocessing merupakan tahapan perbaikan kualitas citra sebelum ekstraksi fitur dengan tujuan meningkatkan akurasi hasil ekstraksi fitur citra.Terdapat perbedaan

preprocessing pada ekstraksi fitur bentuk dengan ekstraksi fitur warna dan Input Images Aquisition

Ekstraksi Fitur bentuk, tekstur dan warna

Normalisasi nilai fitur bentuk, tekstur dan warna

RETRIEVAL IMAGE

Normalisasi nilai fitur bentuk, tekstur dan warna Image Query

Pre Processing(Grayscale, resize, edge Enhancement, Histogram Equalization)

(4)

tekstur.Perbedaan preprocessing tersebut untuk mendapatkan citra yang berkualitas sebelum ekstraksi fitur.

1.1 Preprocessing Fitur Bentuk

a. Resizing

Ukuran citra akan mempengaruhi lamanya waktu ekstraksi fitur, semakin kecil ukurannya, maka semakin cepat komputasi ekstraksi fiturnya. Pada tahapan ini dilakukan resize citra menjadi 300 x 300 pixel.

b. Grayscale

Khusus pada penghitungan fitur bentuk unsur warna tidak diperhitungkan, sehingga dilakukan perubahan citra menjadi grayscale agar proses komputasinya menjadi

lebih cepat.

c. Edge Enhancement dan Histogram Equalization (HE)

Tahapan edge enhancementakan menghasilkan citra baru dengan tepi obyek

yang lebih jelas atau tajam, sehingga bentuk citra akan lebih jelas. Tahapan ini menggunakan metode konvolusi dengan operator Sobel (Gonzales, R.C. and Woods, R.E., 2008). Hasil penajaman tepi dapat dilihat pada Gambar 2.

(a) (b)

( d ) (c)

Gambar 2. Tahapan Preprocessing Fitur Bentuk, (a) Citra Original, (b) Citra Grayscale, (c) Resize, (d) Citra Hasil Edge Enhancement

1.2 Preprocessing Fitur Warna dan Fitur Tekstur

(5)

Semakin besar ukuran citra, maka waktu ekstraksinya juga semakin lama, sehingga diperlukan tahapan resize untuk mempercepat proses komputasinya. Pada

tahapan ini dilakukan resize citra menjadi 300 x 300 pixel. b. Grayscale

Preprocessing grayscale dilakukan untuk ektraksi fitur tekstur agar tekstur lebih

terlihat, sedangkan pada ekstraksi fitur warna tidak dilakukan grayscalekarena nilai

warna yang akandiperhitungkan.

c. Histogram Equalization

Pada tahapan ini dilakukan perataan histogram agar kualitas gambar menjadi

lebih kontras untuk mendapatkan nilai fitur warna dan tekstur yang berkualitas.Hasil perataan histogram dapat dilihat pada Gambar 3 dan Gambar 4.

(a) (b)

Gambar 3.Perbandingan citra sebelum dan sesudah proses histogram, (a) Citra Asli, (b) Citra Hasil Histogram Equalization (HE)

(a) (b)

Gambar 4. Perbandingan histogram,(a) Histogram Citra Asli, (b) Histogram citra Hasil HE

2. Ekstraksi Fitur Bentuk, Warna dan Tekstur

Ekstraksi dilakukan pada ketiga fitur dengan tahapansebagai berikut:

2.1 Ekstraksi Fitur Bentuk.

Ekstraksi fitur bentuk dilakukan dengan menggunakan metode invariant moment.

(6)

PROSIDING SENTRINOV Vol. 001, Tahun 2015 | ISSN: 2477 – 2097 330 Invariant Momentakan menghasilkan tujuh nilai invariant moment yang konstan

terhadap RST (Castleman, K.R, 1996). Adapun region digambarkan dengan tujuh

invariant momentyang dapat dicari dari momen sentral: μ00, μ10, μ01, μ20, μ11, μ02,

μ30, μ12, μ21, μ03 , dan dengan mendefisinikan normalized central momentsyaitu ηpq

= μpq / μγ00, dimana γ = 0.5 ( p + q) + 1 untuk p + q = 2, 3, dan seterusnya,yang akhirnya didapat tujuh invariant moments. , ketujuh invariant moments tersebut

ditunjukkan pada persamaan (1) sampai dengan persamaan (7)

M1 η20 η02 (1)

Nilai dari ketujuh invariantmoments ini tidak berubah terhadap rotasi, translasi dan

skala(Xiang, Y., H., dkk, 2003).

2.2 Ekstraksi Fitur Warna

Preprocessing dengan histogram equalization pada Gambar 3 menghasilkan citra

yang lebih kontras. Citra tersebut merupakan citra input pada ekstraksi fitur warna. Metode ekstraksi yang digunakan adalah color moment.Metode ini mampu

membedakan citra berdasarkan fitur warnanya (Susilo, A., 2006).

Color Moment merupakan metode yang cukup baik dalam pengenalan ciri

warna.Metode ini menggunakan tiga momen utama dari distribusi warna citra, yaitu

mean, standard deviation, dan skewness (Acharya, T. and Ray, A., K., 2005). Setiap

komponen warna yaitu HSV (Hue, Saturation dan Value) memiliki 3 moment. 2.3 Ekstraksi Fitur Tekstur

Tekstur merupakan keteraturan pola-pola tertentu yang terbentuk dari susunan piksel-piksel pada suatu citra.Nilai tekstur dapat digunakan sebagai salah satu variabel

(7)

PROSIDING SENTRINOV Vol. 001, Tahun 2015 | ISSN: 2477 – 2097 331 Statistical Texture merupakan salah satu metode untukmendeskripsikan tekstur

menggunakan pendekatan secara statistikdarihistogram intensitas suatu citra atau region. Statistikal dapat memberikan pengukuran citra seperti kehalusan (smoothness),

kekasaran (coarseness) dan keteraturan (regularity) yang merupakan variabel fitur

tekstur. Nilai fitur tekstur pada penelitian ini diukur menggunakan lima fitur yaitu : smoothness, standard deviasi, skewness, uniformity dan entropy.

2.4 Normalisasi Fitur

Normalisasi penting dilakukan untuk mengelompokkan range atau interval dari nilai-nilai fitur yang berbeda dalam skala yang sama dengan range lebih kecil. Normalisasi dilakukan untuk memberikan bobot yang sama terhadap nilai-nilai fitur yang berbeda dari hasil ekstraksi.Normalisasi pada penelitian ini menggunakan persamaan (8).

(8)

dengan adalah nilai fitur ke-i yang sudah ternormalisasi, adalah nilai fitur ke-i sebelum dke-inormalke-isaske-i, min D merupakan nilai minimum dari masing-masing fitur

dan max D adalah nilai maksimal masing-masing fitur.

2.5 K-Means Clustering

Penggunaan clustering pada penelitian ini betujuan untuk mempercepat proses

retrieval. K-Means merupakan teknik clustering dengan menggunakan centroid (titik

pusat cluster) untuk merepresentasikan sebuah cluster (Adi, 2007). Selain itu K-Means

mampu mengelompokkan data berukuran besar dengan cepat (Arai, K. And Barakbah, A., R., 2007).

Algoritma K-Means digunakan untuk menentukan posisi cluster pada setiap citra dengan cara menghitung terlebih dahulu jarak citra dengan semua centroid menggunakan metode euclidean distance. Pemetaan cluster dilakukan dengan memilih

jarak terdekat dari semua centroid yang ada. Penghitungan jarak menggunakan

(8)

(9)

Dimana D H,I adalah jarak citra H dengan centroidI, adalah Nilai fitur ke-n dari

citraH, adalah nilai fitur ke-n dari centroidI dan n adalah banyaknya dimensi

2.5 Pengukuran Kemiripan

Pengukuran kemiripan citra query dengan citra database menggunakan konsep

euclidean distance dan dilakukan hanya pada satu kluster saja. Pengukuran kemiripan

menggunakan persamaan (10) dengan menggunakan sebelas dimensi atau fitur yaitu tiga fitur bentuk meliputi nilai moment invariant ke 3, 5 dan 7, kemudian 3 fitur warna

dengan menggunakan nilai Hue dan 5 fitur tekstur yaitu smoothness, standard deviasi, skewness, uniformity dan entropy.

(10)

Dimana dan adalah fitur dari citra query dan citra database pada dimensi ke-n. Hasil penghitungan kemiripan diurutkan sehingga nilai kemiripan yang mendekati nol mempunyai tingkat kemiripan yang paling tinggi.

2.6 Akurasi Retrieval

Pengukuran akurasi retrieval pada citra sebelum dan sesudah pembobotan maupun clustering dilakukan dengan menggunakan persamaan (11).

(11)

AR (Actual Relevant) : jumlah data yang dianggap relevan oleh user.

AS (Actual Search) : jumlah data yang di retrieve oleh sistem.

HASIL DAN PEMBAHASAN

(9)

Contoh hasil pengujian retrieval dilakukan dengan variasi jumlah kluster variasi 9 ditunjukkan pada Gambar 5.

Gambar 5.Retrieval Menggunakan Bobot Bentuk, Warna dan Tekstur

Pada Gambar 5. ditampilkan hasil retrieval dengan rangking kemiripan 1 sampai 10 dari

database citra aset dengan pengujian menggunakan variasi jumlah kluster sebanyak 9. Tahap berikutnya adalahpenghitungan akurasi retrieval pada database citra aset.

Dan selanjutnya dilakukan analisis akurasi retrieval pada database citra aset sebelum dan sesudah clustering dengan jumlah kluster yang bervariasi mulai dari 3 sampai dengan 15 kluster. .

Sebelum Clustering

Analisis akurasi retrieval pada tahapan ini menggunakan database citra aset sebelum klustering dengan variasi pembobotan pada fitur bentuk, warna dan tekstur. Nilai akurasi hasil retrieval dengan bobot fitur sama dan bobot fitur bervariasi dapat

dilihat pada Tabel 1.

Tabel 1.

Prosentase Akurasi Retrieval pada Citra Uji

Nama

Citrs I1 I2 I3 I4 I5 I6 I7 I8 I9 I10

Akurasi

Retrieval 75,55% 74,67% 75,05% 74,69% 75,65% 75% 75,76% 74,89% 74,87% 75,35%

Tabel 1 menunjukkan bahwa akurasi retrieval menggunakan kombinasi ketiga nilai fitur dan tanpa klustering pada data uji.

(10)

PROSIDING SENTRINOV Vol. 001, Tahun 2015 | ISSN: 2477 – 2097 334 Gambar 6. Grafik AkurasiRetrieval dengan Bobot Fitur Sama dan

BervariasiSebelum Clusteringpada Database Citra Aset

Dari gambar 6., ditunjukkan bahwa Akurasi retrieval pada citra I7 memiliki prosentase yang paling tinggi yaitu 75.76%, sedangkan rata-rata akurasi retrieval sebeum klustering adalah 75%.

Sesudah Clustering

Pengelompokan berdasarkan kemiripan akan lebih mempersempit ruang penelusuran informasi data citra sehingga akan mempersingkat waktu retrieval dan

meningkatkan akurasi retrieval. Tingkat akurasi retrievaldengan variasi bobot dan

jumlah cluster dapat dilihat pada Tabel 2.

Tabel 2

Prosentase Akurasi Retrieval dengan Variasi Bobot Fitur dan Variasi Jumlah Kluster Jumlah

Kluster 3 4 5 6 7 8 9 10 11 12

Prosentase

retrieval 75,59% 75% 76,45% 76,15% 77,75% 77,50% 77,45% 79,65% 79,15% 77,25%

Dari Tabel 2 menunjukkan bahwa variasi jumlah kluster 10 menghasilkan akurasi retrieval paling tinggi yaitu lebih dari 79,65%, Sedangkan rata-rata akurasi retrieval

dengan variasi jumlah kluster adalah 77,19%. Grafik akurasi retrieval pada database

citra aset menggunakan variasi jumlah cluster mulai dari 3 sampai dengan 12 dapat

(11)

PROSIDING SENTRINOV Vol. 001, Tahun 2015 | ISSN: 2477 – 2097 335 Gambar 7. Grafik Akurasi Retrieval dengan Variasi Bobot Fitur

dan Variasi Jumlah Kluster

Pada Gambar 7. menunjukkan bahwa akurasi retrieval cenderung naik hingga variasi

jumlah cluster 10 dan cenderung menurun setelah jumlah kluster lebih besar dari 10.

Waktu Komputasi

Waktu komputasi yang digunakan untuk me-retrieve sebuah citra pada database

citra aset dipengaruhi oleh besarnya ukuran database citra dan teknik pengelolaan databasenya.Waktu komputasi rata-rata untuk penelusuran pada database citra sebelum klustering adalah dengan variasi jumlah kluster dapat dilihat pada grafik Gambar 8.

Gambar 8. Waktu komputasi rata-rata Retrieval

Pada Gambar 8. Menunjukkan bahwa semakin banyak jumlah kluster maka waktu komputasi semakin cepat.

SIMPULAN

Pada dasarnya tingkat akurasi pada proses penelusuran (retrieval) citra aset

(12)

Pada penelitian ini membuktikan bahwa variasi jumlah cluster akan berpengaruh

terhadap peningkatan akurasi dan kecepatan retrieval pada database citra aset. Tingkat

akurasi retrieval paling tinggi adalah pada viarisi jumlah kluster 10.Hasil Penelitian

menunjukkan bahwa waktu komputasi rata-rata yang dibutuhkan untuk retrieval adalah

5 mili-second.

DAFTAR PUSTAKA

A Vadivel , Majumdar, A.K. and Shamik S., 2004,Characteristics Of Weighted Feature Vector In Content-Based Image Retrieval Applications, IEEE.

Gonzales, R. C., Woods, R. E., 2008, Digital Image Processing, ThirdEdition, Pearson

Prentice Hall, New Jersey.

Castleman, K. R., 1996, Digital Image Processing, Prentice Hall Inc., New Jersey.

Jumi and Harjoko, A., 2012, Image Similarity Analysis Based on Shape, Color and Texture Feature of Asset Image, International Conference on Computer Science

Electronics and Instrumentation, Yogyakarta, Indonesia

Dong L. And Edmund Y. L., 2006,Image Indexing Using Weighted Color cooccurrence Matrix and Feature Selection, IEEE.

Joshua Z. H., Michael K. N., Hongqiang R., and Zichen L., 2005, Automated Variable Weighting in k-Means Type Clustering,IEEE, Transactionon Pattern Analysisand

Machine Intelligence,Vol. 27, No. 5.

Taoying, L. And Yan, C., 2008,A Weight Entropy K-Means Algorithm for Clustering Dataset with Mixed Numeric and Categorical Data,Fifth International Conference

on Fuzzy Systems and Knowledge Discovery, 978-0-695-3305, IEEE

Xiang Y. H, Yu-Jin B., and Dong H., 2003,Image Retrieval Based on WeigthedTexture Features using DCT Coefficients of JPEG Images, International Conference

Information and Computer Security (ICICS), Singapore.

Acharya T. and Ray, A. K, 2005, “Image Processing Principle and Applications”, John

Willey & Sons, USA

Susilo, A., 2006, Web Image Retrieval untuk Identifikasi bunga dengan Pengelompokan Content Warna, Proceeding IES, Surabaya

Adi, 2007, Comparison of Agglomerative Heirarchical Clustering Methods for Text Data, International Journal of Information Technology and Decision Making,

ISSN: 0219-6220