METODE FUZZY COLOR HISTOGRAM UNTUK
TEMU KEMBALI CITRA BUNGA
Oleh:
DINDA PUTRI BALQIS
G64102056
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
METODE FUZZY COLOR HISTOGRAM UNTUK
TEMU KEMBALI CITRA BUNGA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Oleh:
DINDA PUTRI BALQIS
G64102056
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ABSTRAK
DINDA PUTRI BALQIS. Metode Fuzzy Color Histogram untuk Temu Kembali Citra Bunga. Dibimbing oleh YENI HERDIYENI dan MUSHTHOFA.
Citra bunga memiliki bentuk dan warna yang sangat beragam. Hal ini menyebabkan sulitnya dilakukan pencarian citra bunga. Ekstraksi warna merupakan salah satu proses yang paling penting pada temu kembali berbasis citra. Penelitian ini akan mengimplementasikan metode fuzzy color histogram (FCH) untuk pengindeksan warna citra bunga. Penelitian ini mengembangkan penggabungan teknik fuzzy c-means (FCM) untuk FCH. Sebagai bahan perbandingan, penelitian juga menggunakan pendekatan FCH menggunakan fungsi Cauchy untuk menghasilkan matriks derajat keanggotaan. Penelitian ini juga membandingkan hasil temu kembali metode FCH dengan conventional color histogram (CCH).
Evaluasi hasil temu kembali menggunakan rataan precision untuk tiap tingkat recall. Berdasarkan penelitian ini, metode FCH menggunakan FCM memiliki hasil temu kembali dengan rataan precision mencapai 73%, metode FCH dengan fungsi Cauchy memiliki rataan precision 72%, sedangkan pada CCH nilai rataan precision mencapai 70%.
Kata Kunci: flower image retrieval, conventional color histogram, fuzzy color histogram, fuzzy c-means,cauchy function.
Judul :
Metode
Fuzzy Color Histogram
untuk Temu Kembali Citra Bunga
Nama : Dinda Putri Balqis
NRP :
G64102056
Menyetujui:
Pembimbing I,
Yeni Herdiyeni, S.Si., M.Kom.
NIP 132 282 665
Pembimbing II,
Mushthofa, S.Kom
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Prof. Dr. Ir. Yonny Koesmaryono, MS
NIP 131473999
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 29 November 1984 dari ayah Asyikin Solichin dan ibu Sri Hatmoko Meganingsih. Penulis merupakan putri kedua dari dua bersaudara. Tahun 2002 penulis lulus dari SMU Negeri 12 Jakarta dan pada tahun yang sama lulus seleksi masuk IPB melalui jalur Seleksi Penerimaan Mahasiswa Baru IPB. Penulis memilih Program Studi Ilmu Komputer, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam.
Pada tahun 2005 Penulis menjalankan Praktik Lapangan (PL) di Badan Koordinasi Survei dan Pemetaan Nasional (BAKOSURTANAL) Cibinong selama kurang lebih dua bulan.
PRAKATA
Alhamdulillahirabbil ‘alamin, puji syukurpenulis panjatkan kepada Allah Subhanahu wa ta’ala atas segala curahan rahmat dan karunia-Nya, sehingga skripsi dengan judul Metode Fuzzy Color Histogram untuk Temu Kembali Citra Bunga dapat diselesaikan. Shalawat serta salam juga penulis sampaikan kepada junjungan kita Nabi Muhammad Shallalahu ‘alaihi wasallam beserta seluruh sahabat dan umatnya hingga akhir zaman.
Penulis mengucapkan terima kasih kepada Ibu Yeni Herdiyeni, S.Si., M.Kom. dan Bapak Mushthofa, S.Kom selaku pembimbing I dan pembimbing II yang telah banyak memberi saran, masukan dan ide-ide kepada penulis serta kebersamaannya yang tidak bisa terlupakan. Penulis juga mengucapkan terima kasih kepada Bapak Firman Ardiansyah, S.Kom., M.Si. selaku penguji dan pembimbing akademik penulis pada tingkat 2 dan 3 yang telah memberi saran dan masukan. Selanjutnya, penulis ingin mengucapkan terima kasih kepada:
1 Ibu, Bapak dan Mas Nanda yang selalu memberikan dukungan, bimbingan dan kasih sayang. 2 Muqiet E.B. atas segalanya yang tidak bisa dijabarkan.
3 Yuni dan Ratih atas penginapan, printer, kebersamaan dan dukungannya. 4 Erna, Mulan, Ichoy atas hiburannya
5 Eden, Firman, dan teman-teman di Lab CI atas bantuannya menyelesaikan penelitian ini. 6 Ilkomerz 39 yang banyak membantu penulis pada masa perkuliahan.
7 Departemen Ilmu Komputer, dosen dan staf yang telah banyak membantu penulis pada masa perkuliahan dan penelitian.
Penulis menyadari bahwa masih banyak kekurangan dalam penelitian ini. Oleh karena itu, kritik dan saran sangat penulis harapkan untuk perbaikan di masa mendatang. Penulis berharap hasil dari penelitian ini dapat bermanfaat dan dapat menjadi acuan bagi penelitian berikutnya.
Bogor, September 2006
DAFTAR ISI Halaman DAFTAR ISI ... v DAFTAR TABEL ... vi DAFTAR GAMBAR... vi DAFTAR LAMPIRAN... vi PENDAHULUAN ... 1 Latar Belakang ... 1 Tujuan ... 1 Ruang Lingkup... 1 TINJAUAN PUSTAKA ... 1
Temu Kembali Citra... 1
Ekstraksi Warna ... 1
Kuantisasi Warna ... 1
Histogram Warna ... 1
Fuzzy C-Means Clustering... 2
Fuzzy Color Histogram... 2
Fungsi Cauchy... 3
Ukuran Kesamaan ... 3
Recall dan Precision... 3
METODE PENELITIAN ... 3
Data Penelitian ... 4
Segmentasi ... 4
Ekstraksi Ciri Warna dengan CCH ... 4
Ekstraksi Ciri Warna dengan FCH... 4
Nilai warna kuantisasi dan histogram awal ... 4
Nilai warna kuantisasi FCH... 4
Matriks derajat keanggotaan... 5
Fuzzy color histogram... 5
Pengukuran Kesamaan ... 5
Piranti Lunak dan Piranti Keras yang Digunakan ... 6
HASIL DAN PEMBAHASAN... 6
Segmentasi citra ... 6
Ekstraksi warna ... 6
KESIMPULAN DAN SARAN... 11
Kesimpulan ... 11
Saran ... 11
DAFTAR PUSTAKA... 11
DAFTAR TABEL
Halaman
1 Nilai warna kuantisasi pada proses segmentasi... 4
2 Nilai rataan precision dari hasil temu kembali menggunakan FCH dengan fungsi Cauchy... 9
3 Nilai recall-precision temu kembali citra menggunakan CCH ... 10
4 Nilai recall-precision temu kembali citra menggunakan FCH dengan FCM... 10
5 Nilai recall-precision temu kembali citra menggunakan FCH dengan Cauchy dan σ = 15... 11
DAFTAR GAMBAR Halaman 1 Fungsi Cauchy... 3
2 Skema kinerja sistem temu kembali citra... 3
3 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi pertama. ... 6
4 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi ketiga. ... 6
5 Bunga Daffodil.... 6
6 Hasil CCH... 7
7 Hasil FCH dengan fungsi Cauchy... 7
8 Hasil FCH dengan FCM... 8
9 Contoh hasil temu kembali citra... 8
10 Contoh hasil temu kembali citra jika bunga pada citra kueri tidak ada dalam basis data... 9
11 Nilai rataan precision temu kembali menggunakan FCH dengan fungsi Cauchy pada berbagai jumlah bin dan nilai σ... 10
12 Grafik recall precision temu kembali citra menggunakan CCH. ... 10
13 Grafik recall precision temu kembali citra menggunakan FCH dengan FCM... 10
14 Grafik recall precision temu kembali citra menggunakan FCH dengan fungsi Cauchy dan σ = 15 ... 11
DAFTAR LAMPIRAN Halaman 1 Seluruh citra dalam basis data setelah melalui proses segmentasi ... 14
2 Warna kuantisasi ... 17
1
PENDAHULUAN Latar Belakang
Seiring dengan perkembangan multimedia yang sangat pesat, jumlah koleksi data citra pun semakin bertambah. Sampai saat ini, dalam temu kembali informasi berbasis citra, pencarian data citra masih memiliki banyak masalah. Berbagai macam metode pencarian citra telah dikembangkan untuk mempermudah pencarian data. Pencarian citra dapat dilakukan berdasarkan warna, bentuk atau tekstur citra. Salah satu metode pencarian citra yang banyak dikembangkan adalah berdasarkan warna citra.
Secara konvensional, warna direpresentasi-kan dengan perpaduan tiga warna primer. Perpaduan tiga warna tersebut dengan komposisi tertentu akan menghasilkan satu warna sekunder, seperti dinyatakan pada persamaan berikut:
C = aC1 + bC2 + cC3,
dengan C adalah warna sekunder yang merupakan kombinasi linear dari tiga warna primer (C1, C2, C3) dengan koefisien a, b, c pada
tiap warna primer (Pitas 1993). Tiap warna sekunder memiliki kombinasi yang unik dari tiap warna primer. Dalam sistem warna RGB, pengolahan terhadap citra warna dilakukan pada tiap matriks warna primer secara terpisah. Representasi warna tersebut sering disebut dengan conventional color histogram (CCH). Adanya perbedaan penafsiran kuantisasi warna yang tidak menentu dan perbedaan persepsi manusia mengenai warna, maka representasi CCH memiliki kelemahan. Hal ini disebabkan karena CCH tidak mempertimbangkan persamaan warna pada bin yang berbeda dan perbedaan pada bin yang sama (Han J & Ma KK 2002).
Dengan adanya kelemahan pada metode CCH, selanjutnya representasi CCH dimodifikasi dengan menggunakan teknik fuzzy Hasil modifikasi tersebut kemudian diberi nama metode fuzzy color histogram (FCH).
Han J dan Ma KK (2002) telah meng-gunakan metode FCH untuk meng-ekstraksi ciri warna dengan menggunakan fuzzy c-means clustering (FCM) untuk mendapatkan matriks derajat keanggotaan. Zhang R dan Zhang Z (2004) menggunakan fungsi Cauchy untuk menghasilkan matriks derajat keanggotaannya.
Berdasarkan beberapa hasil penelitian, metode FCH memberikan hasil pengenalan yang lebih baik dibandingkan dengan metode CCH. Oleh karena itu, pada penelitian ini akan
dikembangkan sebuah temu kembali citra bunga dengan menggunakan metode fuzzy color histogram. Relevansi antara citra kueri dengan citra dalam basis data ditentukan berdasarkan peringkat dari pengukuran kesamaan(similarity measurement).
Tujuan
Tujuan penelitian ini adalah mengimplementasikan metode fuzzy color histogram untuk temu kembali citra bunga dan membandingkan metode FCH menggunakan dua pendekatan, yakni FCM dan fungsi Cauchy serta metode CCH.
Ruang Lingkup
Ruang lingkup percobaan dibatasi pada objek utama citra fotografi bunga dengan latar belakang yang sederhana.
TINJAUAN PUSTAKA Temu Kembali Citra
Penelitian mengenai temu kembali citra (image retrieval) mulai dikembangkan pada tahun 1970, dengan menggunakan teknik pelabelan citra, setiap citra diberi label dan pencarian dilakukan berdasarkan label tersebut (text retrieval). Pada saat ini telah banyak dikembangkan temu kembali citra didasarkan pada warna, bentuk, dan tekstur. Teknik ini biasa disebut dengan content based image retrieval (CBIR), (en.wikipedia.org 2006). Ekstraksi Warna
Warna merupakan salah satu ciri citra yang paling sering digunakan pada penelitian content-based image retrieval (CBIR). Pengindeksan warna dan pencarian citra berdasarkan warna pada CBIR bisa dilakukan dengan pendekatan color histogram, namun pada penelitian ini akan digunakan fuzzy color histogram.
Kuantisasi Warna
Kuantisasi warna adalah pemetaan nilai input yang memiliki interval warna yang besar ke dalam nilai output yang memiliki interval warna yang terbatas (Gonzales et al 2004). Histogram Warna
Histogram warna menyatakan frekuensi atau peluang keberadaan setiap warna dalam sebuah citra. Banyaknya nilai warna (bin) dapat ditetapkan sesuai kebutuhan pembuatan histogram. Histogram warna dapat dinyatakan sebagai berikut:
2
∑
==
N j i|j iP
N
h
11
, ⎩ ⎨ ⎧ = lainnya 0 i -ke bin sasi terkuanti j -ke pixel 1 j i Phistogram warna seperti ini disebut juga conventional color histogram (CCH), (Han J & Ma KK 2002).
Fuzzy C-Means Clustering
Fuzzy c-means (FCM) adalah suatu teknik pengelompokan data (clustering) tanpa proses pelatihan (unsupervised learning). Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981. Metode ini didasarkan pada minimisasi fungsi objektif dengan cara memperbaiki pusat cluster dan derajat keanggotaan setiap titik data secara berulang. Fungsi objektif tersebut adalah:
(
)
∑∑
= =−
=
n k c j i k m ik mU
V
X
u
x
v
J
1 1 2;
,
,dengan x1, x2,..., xn adalah n vektor data.
adalah sebuah matriks c x n, u
ik
u
U
=
ikmenyatakan nilai keanggotaan ke-i dari sampel input ke-k, xk. Nilai-nilai keanggotaan tersebut
memenuhi kondisi berikut:
. ,..., 2 , 1 , 0 , ,..., 2 , 1 , 1 , ,..., 2 , 1 , ,..., 2 , 1 , 1 0 1 1 c i n u n k u n k c i u n k ik c i ik ik = < < = = = = ≤ ≤
∑
∑
= ={
v
v
v
c}
V
=
1,
2,...,
adalah pusat cluster dan adalah konstanta pembobot.( )
1
,
0
∈
m
Fungsi objektif Jm(U,V) merupakan
penjumlahan dari kuadrat jarak Euclidean antara masing-masing sampel input dan pusat cluster yang sesuai dengan sampel tersebut, dengan jarak terboboti oleh nilai keanggotaan.
Output FCM adalah sejumlah pusat cluster dengan derajat keanggotaan setiap titik data terhadap cluster tersebut. Algoritma FCM adalah sebagai berikut (Han J & Ma KK 2002): 1. Input jumlah clusterc, konstanta pembobot
m, toleransi nilai error.
2. Inisialisasi pusat clustervi, untuk
1
≤
i
≤
c
.
3. Data input X = {x1, x2, x3,...,xn}.
4. Menghitung pusat cluster
v
i( )l dengan( )
( )
( )
∑
∑
= ==
n k m ik n k k m ik l iu
x
u
v
1 1 .5. Perbaharui nilai keanggotaan i=1 k=1
Warna merupakan salah satu ciri yang aling fundamental untuk mendiskriminasikan itra. Representasi warna dapat memberikan
H dalam representasi bangkan persamaan war F : Rn U(l) dengan ,2,...,c. ,2,...,n. ( )
∑
= −⎥
⎥
⎦
⎤
⎢
⎢
⎣
⎡
−
−
=
c j m j k i k l ikv
x
v
x
u
1 1 21
Fuzzy Color Histogram
p c
beragam informasi. CC warna tidak mempertim
na pada bin yang berbeda dan perbedaan pada bin yang sama. Pada CCH, bisa terjadi dua warna yang berbeda diperlakukan sama sehingga kedua warna tersebut dimasukkan ke dalam satu bin histogram. Karena hal tersebut, CCH menjadi sangat sensitif terhadap interfensi noise seperti perubahan iluminasi dan kesalahan kuantisasi. Adanya perbedaan penafsiran dan persepsi manusia mengenai warna, menyebabkan CCH tidak mampu mengatasi perbedaan tersebut. Untuk mengatasi hal tersebut, dibuatlah fuzzy color histogram yang mempertimbangkan persamaan warna pada tiap piksel warna yang terasosiasikan ke semua bin histogram melalui fuzzy set membership function. Pada FCH, satu warna dapat masuk ke dalam dua bin histogram atau lebih dengan derajat keanggotaan yang berbeda tentunya.
Tiap warna direpresentasikan dengan himpunan fuzzy (fuzzy set). Hubungan antara warna dimodelkan dengan fungsi keanggotaan (membership function) terhadap fuzzy set. Fuzzy setF pada ruang ciri Rn didefinisikan oleh μ
→ [0, 1] yang biasa disebut membership function. Untuk tiap vektor ciri
f
∈
R
n, nilai dariμ
F( )
f
disebut derajat keanggotaan dari f terhadap fuzzy set F (derajat keanggotaan F). Nilaiμ
F( )
f
yang mendekati 1 lebih representatif terhadap vektor ci rhadap fuzzy Zhang R & Zhang Z 2004).ri f te setF (
3
Fungsi Cauchy
Fungsi Cauchy merupakan suatu fungsi eanggotaan. Berdasarkan hasil penelitian ebelumnya fungsi Cauchy lebih baik dari pada one dan trapezoidal function. Fungsi Cauchy, didefinisikan sebagai berikut (Zh k s c
[ ]
0
,
1
:
R
n→
C
ang R & Zhang Z 2004):
( )
(
)
αd
v
x
x
C
r
v
v
−
+
=
1
, dengan R v∈1
r , R d,α∈ , 0 > d dan α≥0, vr adala merepreh titik tengah dari lokasi fuzzy set, d se asikan lebar dari fungsi dan α menentuk usan dari fungsi. Secara bersamaan, dan α mendeskripsikan tingkat
fuzziness aburan). Pada Gambar 1
di
nt an kehal
d (kek
ilustrasikan fungsi Cauchy dalam R (0-255) dengan v = 128, d = 15 dan α = 0.7; 1; 1.3; 1.5; 1.7; 2.
Gambar 1 Fungsi Cauchy. Ukuran Kesamaan
Ukuran kesamaan antara citra a dan b dirumuskan dengan formula:
[
]
2 1 ,b=
∑
i= ad
fch
a(
i
)
−
fch
b(
i
)
, dendalah jumlah bin histogram.
Recall dan Precision
ah perbandingan jumlah materi
ukembalikan terhadap jum
B
gan fch adalah hasil ekstraksi warna dengan menggunakan FCH dan B a
Dua parameter utama yang dapat digunakan untuk menentukan keefektifan penemukembalian adalah recall dan precision. Recall adal
relevan yang ditem
lah materi yang relevan, sedangkan precision adalah perbandingan jumlah materi relevan yang ditemukembalikan terhadap jumlah materi yang ditemukembalikan. Average precision adalah suatu ukuran evaluasi yang diperoleh dengan menghitung rata-rata tingkat precision pada berbagai tingkat recall (Grossman D 2002). data basis dlm relevan citra jumlah terambil yang relevan citra jumlah recall= terambil yang citra sel jumlah terambil yang relevan citra jumlah precision = uruh
Kelemahan dari pengukuran prec on recall adalah ketidakmampuan untuk menilai mana yang lebih baik antara dua buah grafik yang saling menyilang dan seimbang. Untu mengatasi hal tersebut dilakukan pengukuran kine
reprocessing, (2) ekstraksi ciri, (3) temu embali citra dan (4) evaluasi. Untuk lebih jelasnya, dapat dilihat
pada skem (Gambar
2).
Gambar 2 Skema kinerja sistem temu kembali citra.
isi k rja sistem yang mampu menentukan titik-titik optimal. Penentuan titik-titik-titik-titik optimal antara variabel precision dan recall, dapat dilakukan dengan interpolated precision. Penggunaan interpolated precision adalah pengoptimalan precision dengan cara interpolasi nilai precision pada setiap nilai recall. Recall yang digunakan adalah standard recall level.
METODE PENELITIAN
Metode penelitian ini akan dibagi menjadi empat tahap yaitu: (1) p
k
a kinerja temu kembali citra
Basis data
citra Segmentasi citra
Ekstraksi cirri warna dengan FCH/CCH
Indeks warna citra basis data
Segmentasi citra Ekstraksi cirri warna dengan FCH/CCH Pengukuran kesamaan Hasil kueri Citra kueri pengguna
4
Data Penelitian
Data yang digunakan sebanyak 360 citra bunga dalam berbagai jenis yang diambil dari www.flowers.vg. Format citra adalah JPEG berukuran 50x50 piksel dengan latar belakang yang sederhana.
Segmentasi
Tahap preprocessing dalam penelitian ini adalah melakukan segmentasi seluruh citra untuk mendapatkan wilayah yang menjadi perhatian utama. Segmentasi dilakukan secara otomatis dengan beberapa parameter kuantisasi yang berbeda.
Tahapan segmentasi dijelaskan sebaga berikut:
kuantis rtama menggunakan warna , hijau, dan biru. Parameter
genta, kuning, dan putih, h jelasnya dapat dilihat pada Tabel
jumlah piksel tiap warna arna kuantisasi yang memiliki jumlah
3.
Tab S
i 1. Mengkuantisasi warna piksel. Parameter
asi pe hitam, merah
kuantisasi kedua menggunakan warna hitam, merah, hijau, biru, dan putih. Parameter kuantisasi ketiga menggunakan warna hitam, cyan, magenta, dan kuning. Parameter kuantisasi keempat menggunakan warna hitam, cyan, ma
untuk lebi
1. Kuantisasi ini berguna untuk mengurangi jumlah warna pada citra dan untuk memastikan bahwa variasi warna objek dapat klasifikasikan menurut warna yang sama secara penampakannya (Ardiansyah 2002).
2. Menghitung
kuantisasi pada 20x20 piksel pusat citra., dua w
piksel diatas 70 kecuali warna hitam diambil kemudian seluruh piksel dengan warna kuantisasi tersebut menjadi objek citra yang menjadi perhatian utama.
Membuat citra biner. Piksel dengan nilai 1 merupakan daerah bunga pada citra, sedangkan 0 adalah daerah yang tidak diperhitungkan.
el 1 Nilai warna kuantisasi pada proses segmentasi
eg 1 Seg 2 Seg 3 Seg 4 0 0 0 0 0 0 0 0 0 0 0 0 255 0 0 255 0 0 0 255 255 0 255 255 0 255 0 0 255 0 255 0 255 255 0 255 0 0 255 0 0 255 255 255 0 255 255 0 255 255 255 255 255 255 Kemudian dilakukan pemilihan keempat il segmentasi tersebut secara manual. Pada ses ini, beberapa citra masih terdapat sedikit r belakangnya. Namun hal ini tidak banyak
mpengaruhi kinerja sistem karena bagian r belakang yang terambil
has pro lata
me
lata pada umumnya
Sel dap Ek H w CCH ai pe ing te me FCH en an s u i c . W nt u m aka ar i b s Ek pertama yan nyak sehingga rna yang hitungan hist an pola den atriks derajat keanggotaan yang akan me
g digunakan adalah 10, 15, masih termasuk bagian dari warna bunga.
uruh hasil segmentasi citra dalam basis data at dilihat pada Lampiran 1.
straksi Ciri Warna dengan CC
Pada penelitian ini, dilakukan ekstraksi
engg n
arna m
rhadap todeunaka sebaguntuk m mbandghasilk uatu tem kembal itra bunga yang baik
arna kuantisasi u uk penghit ngan CCH enggun
in yang ama dengan Fn nilai w na kuantisasCH. dan jumlah straksi Ciri Warna dengan FCH
Proses ekstrakasi warna dengan FCH ini tidak terlalu beragam hasilnya pada perbedaan ruang warna (RGB, HSV, Lab) (Vertan C & Boujemaa N 2000). Oleh karena itu, pengo-lahan citra dilakukan pada ruang warna RGB untuk mempermudah pengolahan citra.
1 Nilai warna kuantisasi dan histogram awal
Untuk menghitung FCH, langkah
g dilakukan adalah penghitungan histogram awal. Pada penelitian ini, nilai warna kuantisasi awal tersebut didasarkan pada sebaran warna bunga dalam basis data yang memiliki 37 kelas bunga dengan jenis dan warna yang bervariasi. Untuk tiap kelas bunga diambil sepuluh warna piksel yang muncul terba
dihasilkan 370 warna tanpa ada wa sama. Kemudian dilakukan peng
ogram awal dengan memetakan tiap pixel yang ditemukan ke dalam 370 warna yang telah ditentukan tersebut.
Histogram tersebut menghasilkan jumlah ciri yang terlalu banyak sehingga menyebabkan komputasi yang besar untuk pengenal
suatu citra. Dengan demikian, akan dikalikan gan m
ng-hasilkan nilai ciri yang cenderung sedikit bergantung pada jumlah bin histogram yang akan ditentukan.
2 Nilai warna kuantisasi FCH
Pengelompokkan warna dilakukan untuk mengklasifikasikan distribusi warna dari seluruh bunga dalam basis data yang telah dihasilkan pada proses sebelumnya kedalam beberapa warna kuantisasi dengan jumlah yang berbeda dengan menggunakan Fuzzy C-Means Clustering (FCM). Pada FCM setiap cluster merepresentasikan bin FCH. Beberapa jumlah kuantisasi warna yan
5
20,
keanggotaan yang dapat
an pada kinerja dari fungsi
da cone dan 25 dan 30 (Lampiran 2). Hal ini bertujuan untuk mencari kuantisasi yang optimal dengan jumlah yang sedikit namun peka terhadap kesalahan kuantisasi.
3 Matriks derajat keanggotaan
Untuk penghitungan FCH, diperlukan matriks derajat
diperoleh menggunakan:
a. Fuzzy C-Means Clustering
Nilai keanggotaan tiap piksel terhadap tiap bin FCH direpresentasikan dengan nilai keanggotaan tiap kuantisasi awal n terhadap pusat clustern’ yang dihasilkan oleh FCM. Tiap elemen
m
ij dalammatriks derajat keanggotaan adalah nilai keanggotaan kuantisasi awal njterhadap
bin warna ni’ (bin FCH) yang jumlahnya
lebih sedikit (n’<<n). Selanjutnya penghitungan FCH dengan pengambilan derajat keanggotaan menggunakan FCM ini disebut sebagai FCH dengan FCM. b. Fungsi Cauchy
Fungsi Cauchy digunak
penghitungan membership degree atau derajat keanggotaan untuk FCH karena sudah terbukti
Cauchy lebih baik dari pa
trapezoidal function (Ruofei Zhang dan Zhongfei Zhang, 2004). Warna kuantisasi c’ menggunakan warna hasil clustering dengan FCM, sedangkan semesta warna adalah sebaran warna bunga yang sudah diperoleh pada proses sebelumnya.
(
σ
)
αμ
)
,'
(
1
1
)
(
'c
c
d
c
c+
=
, dengand(c’,c) = jarak Euclid antara warna c dgn c’.
w
c’ = arna pada bin FCH.
c = semesta warna (universe color).
α = digunakan untuk menentukan bentuk atau kehalusan dari fungsi
σ = untuk menentukan lebar dari fungsi keanggotaan
nilai parameter α = 2 diperoleh dari hasil beberapa percobaan yang dianggap paling baik. Selanjutnya penghitungan FCH dengan pengambilan derajat keanggotaan menggunakan FCM ini disebut sebagai FCH dengan fungsi Cauchy.
Matriks derajat keanggotaan ini,
n n ij
m
M
=
[
]
'× hanya dihitung sekali tuk tiap F n jumlah bin tertentu dan mengh jumlah keangg kut:⎢
⎢
⎢
⎢
⎣
⎡
)
(
'
)
(
'
)
)
(
' 1 2 ' c c cc
n
c
n
c
μ
μ
μ
4 Fu Mo pembe warna Zhangditemu citra akan mempengaruhi sel
warna dengan w
un CH denga
asilkan matriks n’ x n dengan n’ adalah bin histogram FCH. Matriks derajat otaan diilustrasikan sebagai beri
⎥
⎥
)
(
'
c
n
μ
μ
M
L
O
M
M
⎥
⎥
⎤
(
)
(
)
(
)
(
)
(
2 ' 2 2 ' 1 ' 2 1 ' 1 1 ' n c c n c cc
c
c
c
c
μ
μ
L
L
⎦
2 ' 1 c c nzzy color histogram
del warna fuzzy ini memungkinkan saran pengaruh warna yang diberikan ke
lainnya (Ruofei Zhang dan Zhongfei 2004). Pada FCH, setiap warna C yang
kan pada
μ
μ
uruh kuantisasi warna berdasarkan kemiripan arna C tersebut. Hal ini dapat dinotasikan dengan:
)
(
*
)
(
)
'
(
' 2c
c
h
c
h
c c∑
∈=
μμ
denganh2 = fuzzy color histogram
h(c) = conventional color histogram µc’(c) = nilai keanggotaan dari warna c ke
warna c’
Pada penghitungan FCH dengan FCM, hasil kali dari matriks derajat keanggotaan dengan
nghasilkan matriks FC
histogram awal sudah me
H tanpa perlu dilakukan normalisasi, Di lain pihak, pada penghitungan FCH dengan fungsi Cauchy dilakukan normalisasi dengan formula:
)
'
(
max
)
'
(
)
'
(
2 ' 2c
h
c
h
c
fch
c∈μ=
.Dengan demikian, nilai yang dihasilkan akan berkisar antara 0 dan 1.
Pengukuran Kesamaan
Citra yang digunakan sebagai kueri h 37 (Lampiran 3) yang diambil dari
sampai 18 citra ra yang
ngan enis dan warn a dengan bunga pada citra kue
berjumla
tiap kelas bunga dan memiliki 5 yang relevan dalam basis data. Cit relevan ditentukan secara manual de memilih bunga dalam basis data yang sej
a yang sam
ri. Temu kembali citra dibatasi sampai 30 citra teratas. Nilai kesamaan antar citra dihitung menggunakan persamaan jarak Euclid. Untuk perbandingan keefektifan temu kembali dibuat
6
grafik recall-precision dari masing-masing proses.
Piranti Lunak dan Piranti Ker yang Digunakan
Home Edition SP 1, piranti keras yang men
fokus dari penelitian ini adalah pada leh proses segmentasi.
Gambar 4 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi ketiga.
si war kua dari ekst H adal Ekstraksi warna
Pada penelitian ini, dilakukan ekstrak na menggunakan CCH dengan nilai warna ntisasi yang sama dengan FCH. Hasil
raksi warna dengan menggunakan CC ah sebagai berikut:
as
Piranti lunak yang digunakan pada penelitian ini adalah Matlab 7.0 dan sistem operasi Windows XP
sedangkan spesifikasi
dukung adalah komputer dengan processor Pentium III 800 MHz dan memori 256 MB.
HASIL DAN PEMBAHASAN Segmentasi citra
Parameter kuantisasi yang berbeda menghasilkan wilayah objek utama yang berbeda sehingga dilakukan pemilihan keempat cara segmentasi yang telah dipaparkan. Hal ini bertujuan untuk mendapatkan objek utama citra yang paling baik dengan cara yang sederhana karena
proses ekstraksi ciri warna yang tidak dipengaruhi o
Gambar 3 Citra sebelum dan sesudah segmentasi dengan menggunakan parameter kuantisasi pertama.
Gambar 5 Bunga Daffodil.
(a) CCH dengan 10 bin
(b) CCH dengan 15 bin
(c) CCH dengan 20 bin
7
(e) CCH dengan 30 bin Gambar 6 Hasil CCH.
Gambar 6 adalah hasil CCH dari Gambar 5. Berdasarkan Gambar 6(a), dapat dilihat bahwa bin 1 yang cenderung berwarna ungu merupakan warna yang paling banyak muncul pada bunga daffodil yang berwarna kuning. Sementara itu, warna pada bin 6 yang cenderung berwarna kuning justru memiliki pengaruh yang lebih sedikit. Hal ini merupakan
suatu kesala ng terjadi
pada CCH rjadi pada
histogram yang lain dengan jumlah bin histogram yang berbeda. Kesalahan kuantisasi ini diperbaiki oleh kedua model FCH yang dapat dilihat pada Gambar 7 dan Gambar 8.
han kuantisasi yang seri sebagaimana juga te
(a) FCH dengan Cauchy dengan 10 bin
(b) FCH dengan Cauchy dengan 15 bin
(c) FCH dengan Cauchy dengan 20 bin
(d) FCH dengan Cauchy dengan 25 bin
(e) FCH dengan Cauchy dengan 30 bin Gambar 7 Hasil FCH dengan fungsi Cauchy. Gambar 7 adalah hasil FCH dengan fungsi Cauchy dari Gambar 5. Pada Gambar 7(a), bin 6 yang cenderung berwarna kuning memiliki nilai yang paling tinggi, sedangkan pada bin 1 yang berwarna ungu hanya memiliki sedikit pengaruh. Hal ini memperbaiki hasil CCH sebelumnya dan juga terjadi pada setiap jumlah bin yang berbeda. Selain FCH dengan fungsi Cauchy,
pend CM
juga but
(Gambar 8). Gambar 8 adalah hasil FCH dengan FCM dari Gambar 5.
ekatan menggunakan FCH dengan F memperbaiki kesalahan kuantisasi terse
8
(b) FCH dengan FCM dengan 15 bin
(c) FCH dengan FCM dengan 20 bin
(d) FCH dengan FCM dengan 25 bin
(a) Hasil temu kembali dengan CCH (25 bin)
(b) Hasil temu kembali menggunakan FCH dengan fungsi Cauchy (25 bin)
(c) Hasil temu kembali menggunakan FCH dengan FCM (25 bin)
Gambar 9 Contoh hasil temu kembali citra. Pada Gambar 9(a), citra kueri pada contoh temu kembali tersebut berasal dari basis data
CCH skipun tiga
citra lainnya yang relevan dalam basis data tidak ditemukembalikan sampai 30 citra teratas. Namun jika jenis dan warna bunga pada kueri citra tidak ada dalam basis data citra, CCH tidak mampu untuk menemukembalikan bunga dengan warna yang hampir sama dengan kueri citra (Gambar 10).
(e) FCH dengan FCM dengan 30 bin Gambar 8 Hasil FCH dengan FCM.
Temu kembali citra
Selain dapat mengatasi kesalahan kuantisasi, kedua metode FCH juga dapat memberikan hasil yang lebih baik pada sistem temu kembali citra seperti dapat dilihat pada Gambar 9.
sehingga hasil temu kembali citra menggunakan masih terlihat cukup baik me
9
(a) Hasil temu kembali dengan CCH (25 bin)
(b) Hasil temu kembali menggunakan FCH dengan FCM (25 bin)
(c) Hasil temu kembali menggunakan FCH dengan fungsi Cauchy (25 bin)
Gambar 10 Contoh hasil temu kembali citra jika bunga pada citra kueri tidak ada dalam basis data.
Kedua FCH memberikan hasil temu kembali yang secara perseptual mendekati bunga pada kueri. Pada CCH, bunga yang ditemukembalikan cenderung berwarna putih, berbeda sekali dengan warna bunga pada citra kueri, sedangkan pada FCH dengan FCM dapat
ada beberapa bunga yang berbeda sekali masih terambil, sedangkan pada FCH dengan fungsi Cauchy hanya empat bunga yang sama sekali berbeda, bunga pada peringkat 19, 22, 26 dan 29.
Evaluasi untuk menentukan keefektifan temu kembali citra pada setiap metode ekstraksi ciri warna digunakan recall dan precision. Nilai recall yang digunakan adalah 0 sampai 1. Nilai ini menunjukkan jumlah bagian citra dari seluruh citra relevan dalam basis data untuk penghitungan nilai precision.
men optimal
Pada Tabel
hasil temu kan FCH dengan
fun
mengambil citra yang memiliki warna yang hampir sama dengan citra pada kueri meskipun
Beberapa percobaan dilakukan untuk entukan fungsi Cauchy yang
dengan derajat keanggotaan yang mampu memberikan hasil temu kembali yang baik.
2 dapat dilihat rataan precision dari kembali mengguna
gsi Cauchy dan α = 2.
Tabel 2 Nilai rataan precision dari hasil temu kembali menggunakan FCH dengan fungsi Cauchy
Jumlah bin histogram nilai σ rataan precision
10 0,62375 15 0,6311 20 0,62399 25 0,63807 10 30 0,63544 10 0,66245 15 0,67477 20 0,66927 25 0,67095 15 30 0,66986 10 0,68747 15 0,69181 20 0,69192 25 0,68928 20 30 0,68213 10 0,71401 15 0,72117 20 0,7169 25 0,70387 25 30 0,69096 10 0,70591 15 0,70425 20 0,69987 25 0,69473 30 30 0,68433
10 0,56 0,58 0,6 0,62 0,64 0,66 0,68 0,7 0,72 0,74 10 15 20 25 30 10 15 20 25 30 10 1520 2530 10 15 20 25 30 1015 20 25 30 10 bin 15 bin 20 bin 25 bin 30 bin
rataan precision
Gambar 11 Nilai rataan p ision temu menggunakan CH dengan auchy pada rbagai juml dan nilai σ.
Hasil percobaan men ukkan bahw
saat jumlah bin 25 d an nilai rataan precision yang paling ba ntuk berbag
σ. Kuan si optimal da FCH menggunakan fungsi Cauchy terdapa jumlah bin 25 dan σ = 1 ada jumlah
ilai rataan precision cenderung menurun un masih lebih tinggi dibandingkan nilai rataan precision pada jumlah bin di bawah 25 pada tiap-tiap nilai σ yang sama.
Tabel 3 Nilai recall-precision temu kembali citra menggunakan CCH
10 bin 15 bin 20 bin 25 bin 30 bin
rec kembali F fungsi C be ah bin unj a pada ihasilk ik u ai nilai tisa pa dengan t pada 5. P bin 30, n nam 0 1 1 1 1 1 0,1 0,9518 0,95967 0,95946 0,94294 0,93604 0,2 0,82291 0,89305 0,89656 0,89109 0,92194 0,3 0,70313 0,80683 0,81222 0,86844 0,87543 0,4 0,62298 0,75756 0,78772 0,84296 0,85743 0,5 0,52271 0,63451 0,70239 0,79181 0,80208 0,6 0,39549 0,57427 0,58501 0,70271 0,71285 0,7 0,30662 0,49614 0,50474 0,62851 0,59452 0,8 0,2396 0,32473 0,34835 0,37256 0,39704 0,9 0,20934 0,29055 0,30785 0,38007 0,38933 1 0,16488 0,22139 0,20511 0,28662 0,25342 rataan 0,53995 0,63261 0,64631 0,7007 0,70364
Pada hasil temu kembali menggunakan CCH, dapat diperhatikan bahwa pada setiap kenaikan jumlah bin histogram terjadi kenaikan rataan nilai precision. Recall dan precision dari temu kembali dengan CCH cukup tinggi walaupun hanya 10 sampai 30 bin histogram, hal ini
sebaran a dalam basis
dat bu
karena kuantisasi yang diperoleh adalah dari warna seluruh kelas bung
a nga. 0 0,1 0,2 0,3 0,4 0,5 0,6 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 p reci si 0, 0, 7 8 9 1 recall on 0,
10 bin 15 bin 20 bin 25 bin 30 bin
Gambar 12 Grafik recall precision temu kembali citra menggunakan CCH. Tabel 4 Nilai recall-precision temu kembali
citra menggunakan FCH dengan FCM
10 bin 15 bin 20 bin 25 bin 30 bin
0 1 1 1 1 1 0,1 0,96847 0,93581 0,9471 0,93874 0,93659 0,2 0,84667 0,87558 0,8922 0,91715 0,90573 0,3 0,77237 0,83427 0,84607 0,87909 0,86558 0,4 0,7331 0,81015 0,82579 0,84956 0,84663 0,5 0,57076 0,66224 0,75474 0,7926 0,80059 0,6 0,43689 0,6302 0,70521 0,7383 0,75316 0,7 0,3278 0,54519 0,60627 0,64036 0,6369 0,8 0,25881 0,39198 0,43299 0,47224 0,49271 0,9 0,20708 0,36588 0,434 0,46003 0,46668 1 0,16156 0,25514 0,32439 0,35117 0,32253 rataan 0,57123 0,66422 0,70625 0,73084 0,72974 0 0, 1 1 2 3 4 5 6 7 8 0,9 4 0, 0, 0, pr 0, ec is i 0, on 0, 0, 0 0,1 0,2 0,3 0, 0,5 0,6 0,7 0,8 0,9 1 recall
10 bin 15 bin 20 bin 25 bin 30 bin
Gambar 13 Grafik recall precision temu kembali citra menggunakan FCH dengan FCM.
11
Tabel 5 Nilai recall-precision temu kembali citra menggunakan FCH dengan Cauchy dan σ = 15
10 bin 15 bin 20 bin 25 bin 30 bin
0 1 1 1 1 1 0,1 0,9343 0,9222 0,9162 0,9269 0,9257 0,2 0,8590 0,8921 0,8697 0,8856 0,8724 0,3 0,7868 0,8378 0,8213 0,8774 0,8393 0,4 0,7317 0,7735 0,8046 0,8363 0,8161 0,5 0,6448 0,70997 0,72539 0,76372 0,74475 0,6 0,5728 0,6383 0,6674 0,7157 0,7131 0,7 0,4837 0,5581 0,5767 0,6439 0,6197 0,8 0,3593 0,4394 0,4758 0,5145 0,4879 0,9 0,3427 0,4109 0,4639 0,4716 0,4440 1 0,227 0,2402 0,2890 0,2972 0,2838 rataan 0,6311 0,6748 0,6918 0,7212 0,7043 0 0,1 2 3 4 0,5 0,6 0,7 0,8 1 0, 6 on 0, 0, 0, p reci 0,9 0 0,1 2 0,3 0,4 0,5 0, 0,7 0,8 0,9 1 recall si
10 bin 15 bin 20 bin 25 bin 30 bin
Gamba ra
dengan fungsi Cauchy dan σ = 15. Berdasarkan Tabel 2, Tabel 3, dan Tabel 4, nilai precision pada bin = 10 cenderung selalu lebih rendah dibandingkan dengan nilai precision pada bin yang lain. Hal ini disebabkan nilai kuantisasi yang belum cukup merepresentasikan warna yang muncul pada seluruh bunga dalam basis data.
Berdasarkan Gambar 12, Gambar 13, dan Gambar 14, nilai recall 0,8 dan 0,9 cenderung stabil. Penurunan nilai precision terjadi pada nilai recall 1 karena banyak kueri citra yang tidak menemukan seluruh citra yang relevan dalam basis data citra.
Pada FCH, kuantisasi optimal terdapat pada jumlah bin 25, setelah jumlah bin tersebut, nilai disebabkan
makin ba g
berdekatan sehingga memberikan informasi pen
nelitian ini mengem-ban
nga tidak cukup hanya dengan menggunakan indeks w rna saja karena bentuk dan tekstur bunga j ga sangat beragam.
Berdasa erbaiki
mbali diperlukan informasi lain seperti bentuk dan tekstur. Oleh kar
l Image cessing Using Matlab. Pearson Prentice
rocessing Algorithms. Prentice Hall. United Kingdom
Vertan C & sing Fuzzy
Histogr olor Image
r 14 G fik recall precision temu kembali citra menggunakan FCH
recall dan precision menurun. Hal ini karena semakin banyak jumlah bin nyak kemungkinan warna yan
garuh warna yang berulang. Dapat diperhatikan pada jumlah bin 25 nilai rataan precision-nya cenderung lebih tinggi dibandingkan nilai rataan precision pada jumlah bin 30.
KESIMPULAN DAN SARAN Kesimpulan
Penelitian ini telah mengimplementasikan sistem temu kembali citra untuk citra bunga berdasarkan warna dengan menggunakan teknik histogram warna. Pe
gkan penggabungan teknik FCM untuk FCH. Berdasarkan penelitian ini, metode FCH menggunakan FCM memiliki hasil temu kembali dengan rataan precision mencapai 73%, metode FCH dengan fungsi Cauchy memiliki rataan precision 72%, sedangkan pada CCH nilai rataan precision mencapai 70%.
Saran
Sistem temu kembali citra khususnya pada citra bu
a u
rkan penelitian, untuk memp hasil temu ke
selain warna
ena itu, diperlukan penelitian lebih lanjut mengenai sistem temu kembali citra.
DAFTAR PUSTAKA
Ardiansyah F. 2002. Segmentasi Automatisasi Objek pada Citra Fotografi untuk Temu Kembali. Departmen Ilmu Komputer, Institut Pertanian Bogor. Bogor.
Gonzales RC et al. 2004. Digita Pro
Hall, New Jersey.
Grossman D. IR Book. www.ir.iit.edu/~dagr/ cs529/files/ir_book/ [7 Maret 2002].
Han J & Ma KK, Fuzzy Color Histogram and Its Use in Color Image Retrieval. IEEE Transaction on Image Processing, vol. 11, no. 8, 2002.
Pitas I. 1993. Digital Image P Boujemaa N. 2000. U am and Distances for C
Retrieval. Challenge of Image Retrieval, Brighton.
12 Wik 0 Januari Wik 10 Januari 2006]. age ipedia. 2006. Content Based Image Retrieval. en.wikipedia.org. [1
2006].
ipedia. 2006. Color Quantization. en.wikipedia.org. [
Zhang R & Zhang Z, A Robust Color Object Analysis Approach to Efficient Im Retrieval. EURASIP Journal on Applied Signal Processing, 6, 2004, 871-885.
14
17
Lampiran 2. Warna kuantisasi 10 bin histogram warna R G B 156 108 144 203 139 238 240 81 101 204 200 194 227 218 225 223 203 38 202 30 23 193 168 160 220 132 8 237 140 180 15 bin histogram warna R G B 202 27 19 232 221 228 157 114 159 241 140 189 217 191 20 217 25 129 222 128 5 233 220 177 227 215 87 192 163 166 184 203 240 204 136 240 248 92 91 161 86 88 200 196 192 20 bin histogram warna R G B 227 216 93 155 112 157 206 34 24 247 115 136 216 147 248 183 165 142 191 15 10 184 205 242 243 143 192 234 220 180 161 84 87 250 91 87 223 127 3 217 23 129 233 222 228 195 165 176 201 199 194 187 121 228 215 176 18 226 216 28 25 bin historam warna R G B 218 191 9 160 80 86 216 21 128 224 127 2 227 217 93 228 221 29 251 93 86 189 123 231 244 69 115 217 148 249 241 151 161 215 172 22 194 162 173 180 125 41 204 182 185 163 118 166 190 208 243 203 202 196 202 26 18 149 107 148 234 223 229 236 220 181 242 93 183 162 189 215 187 169 141 30 bin histogram warna R G B 226 134 3 252 120 133 219 114 2 216 21 128 190 172 141 217 148 249 215 175 20 188 122 230 229 220 48 236 221 181 226 217 94 245 68 115 163 85 89 244 143 193 202 26 18 167 147 136 157 112 159 161 189 215 182 130 43 219 197 8 198 123 91 200 201 195 225 213 220 203 182 185 223 156 155 187 207 245 236 226 231 149 59 78 193 161 174 251 92 86
18
Lam irp an 3. Citra kueri
Kueri03
CR = 11 CR = 10 Kueri05
Ku
CR = 5 eri01 Kueri02 CR = 9 CRKueri04 = 10
Kueri10 Ku C eri06 R = 7 K CR = 9 ueri07 Kueri08 CR = 7 Kueri09 CR = 8 CR = 9 Kueri11
CR = 6 Kueri12 CR = 6 Kueri13 CR = 9 Kueri14 CR = 6 CR = 10 Kueri15
Kueri16
CR = 8 CR = 14 Kueri17 Kueri18 CR = 6 CR = 11 Kueri19 CR = 11 Kueri20
Kueri21 CR = 11
Kueri22
CR = 11 Kueri23 CR = 7 CR = 10 Kueri24 Kueri25 CR = 6
Kueri26
CR = 11 CR = 14 Kueri27 Kueri28 CR = 14 Kueri29 CR = 8 Kueri30 CR= 10
Kueri31 CR = 18 Kueri32 CR = 18 Kueri33 CR =10 Kueri34 CR = 10 Kueri35 CR = 10
19 Kueri36 CR = 10 Kueri37 CR = 13 Keterangan : CR : Citra Relevan.