CONTENT BASED IMAGE RETRIEVAL MENGGUNAKAN METODE COLOR HISTOGRAM DAN ALGORITMA K-MEANS CLUSTERING

(1)

CONTENT BASED IMAGE RETRIEVAL MENGGUNAKAN METODE COLOR HISTOGRAM DAN ALGORITMA K-MEANS CLUSTERING

Risa Fithrasari – 208700923 Jurusan Teknik Informatika Fakultas Sains dan Teknologi UIN Sunan Gunung Djati Bandung

Perkembangan teknologi yang semakin canggih memicu makin berkembangnya data di berbagai bidang seperti hiburan, perdagangan, pendidikan,

biomedicine, dan lain-lain. Data citra dari berbagai bidang tersebut semakin

bertambah dengan cepat pula. Data citra membutuhkan ruang simpanan yang besar, dan kemungkinan dalam suatu direktori penyimpanan pada harddisk terdapat banyak citra. Sehingga sistem penyimpanan dari berbagai macam informasi digital tersebut semakin meningkat dan membuat masalah dalam pencarian kembali dan pengolahannya.

Teknik pencarian yang sudah ada saat ini merupakan pencarian dengan

inputan berupa teks namun menghadapi berbagai masalah diantaranya kurang

praktis dan hasilnya terkadang tidak sesuai dengan yang dicari. Maka dibangunlah

Content Based Image Retrieval (CBIR). Metode color histogram digunakan untuk

mengekstraksi fitur warna dan juga sebagai nilai pembanding untuk menemukan kembali citra. Citra query maupun citra acuan diekstrak color histogramnya kemudian dihitung selisihnya. Selain itu digunakan pula teknik clustering menggunakan algortima K-Means. Penggunaan centroid hasil pengelompokan dataset yang berasal dari color histogram dari kumpulan citra dapat digunakan sebagai acuan untuk melakukan pencarian. Sistem ini dibangun dengan bahasa pemrograman Java. Metode pengembangan perangkat lunak menggunakan metode RUP (Rational Unified Process). Hasil percobaan dari pencarian dengan

color histogram dan teknik clustering ini ternyata berhasil menemukan citra yang

mirip dari segi warna dengan akurasi cukup tinggi dan waktu pencarian yang cepat.

Kata Kunci : Content Based image retrieval (CBIR), color histogram, K-Means

clustering

1. PENDAHULUAN Latar Belakang

Seiring berkembangnya teknologi, makin banyak pulalah hasil-hasil citra digital di berbagai aspek. Citra tersebut bisa merupakan hasil digitalisasi foto-foto analog, hasil foto dari kamera digital, lukisan, maupun gambar-gambar dari

bidang medis. Salah satu cara yang biasa digunakan untuk mencari kumpulan-kumpulan gambar tersebut adalah menggunakan pencarian citra berbasis teks. Teknik pencarian citra berbasis teks ini dilakukan dengan cara pengguna memasukkan query berupa teks untuk mendapatkan kembali citra. Namun teknik ini

(2)

dinilai kurang efektif dan banyak ditemukan ketidaksesuaian karena hasil yang didapatkan terkadang berbeda jauh dengan yang diinginkan dari query dan nama dari sebuah file tidak dapat mempresentasikan isinya. Selain itu dengan query yang berupa teks ini, maka kita harus mengetahui kata kunci yang benar-benar tepat agar gambar yang kita inginkan dapat ditampilkan.

Untuk menghindari kesulitan tersebut, maka digunakanlah sistem temu kembali citra berdasarkan isi

(Content Based Image Retrieval)

yang mencari citra berdasarkan komponen-komponen yang membentuk citra. Komponen pada citra diantaranya adalah warna, bentuk, tekstur, topologi dan lain-lain. Query yang digunakan pada sistem ini sudah bukan berupa teks lagi namun berupa citra. Fitur warna merupakan fitur yang paling banyak digunakan pada sistem ini.

Dalam tugas akhir ini, akan diuraikan tentang metode pencarian citra dengan query berupa citra menggunakan segmentasi (clustering) yang di dalamnya sudah tersimpan fitur warna berupa color histogram. Sedangkan teknik

clustering yang dipakai adalah

Algoritma K-Means. Teknik

clustering ini diharapkan dapat

mempercepat proses komputasi dan pencarian citra. Waktu pengambilan gambar pun biasanya diperlukan oleh beberapa orang untuk penelitian dari suatu kejadian, namun tidak semua gambar memiliki data lengkap tentang waktu pengambilannya.

Dengan adanya permasalahan-permasalahan tersebut maka penulis bermaksud mengambil judul “Content Based Image Retrieval

Menggunakan Metode Color

Histogram Dan Algoritma K-Means

Clustering”.

Rumusan Masalah

Berdasarkan dari latar belakang yang telah diuraikan, maka masalah yang akan dibahas yaitu :

a. Bagaimana melakukan ekstraksi fitur warna berupa color

histogram pada citra query dan citra acuan ?

b. Bagaimana hasil clustering

K-Means pada proses

pengelompokkan color histogram citra acuan dan menerapkannya pada aplikasi content based image

retrieval ?

c. Bagaimana membangun aplikasi yang dapat membantu pengguna menemukan kembali citra diantara sekumpulan citra dari segi kemiripan color histogram sekaligus mengetahui waktu pembuatan/pengambilan dari citra

query ?

Tujuan Penelitian

Tujuan dari pembuatan aplikasi ini yaitu :

a. Dapat mengekstraksi fitur warna berupa color histogram pada citra

query dan database.

b. Mengetahui hasil implementasi teknik clustering, yaitu K-Means

Clustering, dalam image retrieval

menggunakan fitur warna (color histogram).

c. Membantu pengguna menemukan kembali citra yang mirip dengan citra query diantara sekumpulan citra acuan dari segi content warna yang dihitung dari color histogram sekaligus mengetahui waktu pembuatan dari citra query

(3)

tersebut.

Batasan Masalah

Pembatasan dibatasi pada ruang lingkup :

a. Menggunakan citra digital, dengan tipe citra : jpg.

b. Image content yang digunakan

dalam ekstraksi fitur pada aplikasi

image retrieval ini adalah color

histogram.

2. LANDASAN TEORI Content Based Image Retrieval

Content Based Image Retrieval System (CBIR) merupakan suatu

teknik pencarian kembali citra yang mempunyai kemiripan karakteristik atau content dari sekumpulan citra. Sistem CBIR melakukan dua tugas utama, yang pertama adalah citra yang menjadi query dilakukan proses ekstraksi fitur, begitu halnya dengan citra yang ada pada database juga dilakukan proses seperti pada citra

query. Tugas yang kedua adalah

mengukur kesamaan (similarity measurement), dimana jarak antara

citra query dengan setiap citra dalam

database telah dihitung sehingga

sehingga citra dengan jarak terdekat dapat ditampilkan.[Silva, Xavier, 2006 ].

Citra Digital

Menurut Rodiyansyah (2010), citra digital (digital image) adalah citra kontinyu f(x,y) yang sudah didiskritkan baik koordinat spasial maupun tingkat kecerahannya. Setiap titik biasanya memiliki koordinat sesuai dengan posisinya dalam citra. Koordinat ini biasanya dinyatakan indeks x dan y hanya bernilai bilangan bulat positif, yang dapat dimulai dari 0 atau 1. Citra digital

yang selanjutnya akan disingkat “citra” sebagai matrik ukuran M x N yang baris dan kolomnya menunjukkan titik-titiknya yang diperlihatkan pada persamaan sebagai berikut :

( , ) = (0,0)(1,0) (0,1)(1,1) ⋯ (0, − 1)⋯ (1, − 1) ( − 1,0) ( − 1,1) … ( − 1, − 1)

(1) Color Histogram

Histogram citra menurut Rodiyansyah adalah representasi distribusi warna dalam sebuah gambar yang didapatkan dengan menghitung jumlah pixel dari setiap bagian range warna. Histogram juga dapat menunjukkan banyak hal tentang kecerahan (brightness) dan kontras (contrast) dari sebuah gambar. Secara grafis histogram ditampilkan dengan diagram batang.

Gonzales dan Woods (2002) menyatakan histogram dari sebuah gambar digital dengan gray level dalam rentang [0, L-1] merupakan fungsi :

ℎ( ) = (2) dimana rk adalah gray level

ke-k dan nk adalah jumlah pixel dalam

gambar yang memiliki gray level

ke-k. Umumnya histogram mengalami

proses normalisasi dengan cara membagi nilai tiap bin dengan jumlah seluruh pixel yang ada dalam gambar yang diwakili oleh variabel

n. dengan demikian, histogram ternormalisasi dari sebuah gambar dapat dinyatakan dengan persamaan berikut:

p( ) = (3)

Normalisasi

Perbedaan ukuran gambar mengakibatkan perbedaan histogram

(4)

meskipun memiliki distribusi warna yang sama, oleh karena itu diperlukan suatu normalisasi histogram. Daripada menggunakan jumlah aktual, lebih baik menggunakan persentase pembagian jumlah aktual dengan jumlah total piksel gambar yang digunakan color

histogram. [Widodo, 2007].

Pengukuran Jarak antar dua histogram

Color histogram antara dua

gambar dihitung jaraknya. Gambar yang memiliki jarak paling kecil, merupakan solusinya. Untuk menghitung jarak antara dua color histogram yaitu dengan menghitung akar dari kuadrat Euclidean distance (Wang, S., 2001), rumusnya :

( , ) = ∑ [ ] − [ ] (4)

K-Means

K di sini dimaksudkan sebagai konstanta jumlah cluster yang diinginkan. Means dalam hal ini berarti nilai suatu rata-rata dari suatu grup data yang dalam hal ini didefinisikan sebagai cluster. metode

K-means ini menggunakan nilai

rata-rata yang diambil dari setiap cluster. Langkah-langkah algoritma

K-means clustering :

1. Tentukan K

2. Bangkitkan k centroids (titik pusat cluster) awal secara random

3. Hitung jarak setiap data ke masing-masing centroids

4. Setiap data memilih centroids yang terdekat

5. Tentukan posisi centroids baru dengan cara menghitung nilai rata-rata dari data-data yang memilih pada centroid yang sama 6. Kembali ke langkah 3 jika posisi

centroids baru dengan centroids

lama tidak sama. [Barakbah,2010].

RUP

Rational Unified Process

(RUP) merupakan suatu metode rekayasa perangkat lunak yang dikembangkan dengan mengumpulkan berbagai best

practices yang terdapat dalam

industri pengembangan perangkat lunak. Ciri utama metode ini adalah menggunakan use-case driven dan pendekatan literatif. RUP menggunakan konsep object oriented, dengan aktifitas yang

berfokus pada pengembangan model dengan menggunakan Unified Model

Language (UML). Berikut metode

pengembangan sistem yang digunakan pada metode RUP :

1. Inception : Pada tahap ini pengembang mendefinisikan batasan kegiatan, melakukan analisis kebutuhan user, dan melakukan perancangan awal perangkat lunak (perancangan arsitektural dan use case).

2. Elaboration: Pada tahap ini dilakukan perancangan perangkat lunak mulai dari menspesifikasikan fitur perangkat lunak hingga perilisan prototipe versi Betha dari perangkat lunak. 3. Construction:

Pengimplementasian rancangan perangkat lunak yang telah dibuat dilakukan pada tahap ini. Pada akhir tahap ini, perangkat lunak versi akhir yang sudah disetujui administrator dirilis beserta dokumentasi perangkat.

4. Transition : Instalasi, deployment dan sosialisasi perangkat lunak dilakukan pada tahap ini.

(5)

3. ANALISIS SISTEM Fase Inception

Fase inception merupakan fase pertama dalam pengembangan perangkat lunak metode RUP. Pada fase ini didefinisikan masalah yang dihadapi, cara pemecahan masalah, analisis kebutuhan, dan pembuatan

bussiness modelling.

Deskripsi Masalah

Data citra membutuhkan ruang simpanan yang besar, dan kemungkinan dalam suatu direktori penyimpanan pada harddisk terdapat banyak citra (image). Sehingga sistem penyimpanan dari berbagai macam informasi digital tersebut semakin meningkat dan membuat masalah dalam pencarian kembali dan pengolahannya.

Pemecahan Masalah

Dengan masalah yang sudah diuraikan maka diambil solusi untuk membangun sebuah sistem yang dapat digunakan untuk mempermudah dan mempercepat pencarian/penemuan kembali citra dalam sebuah direktori/database berdasarkan content sebuah citra. Deskripsi Umum Sistem

Dalam penelitian ini dibangun sistem CBIR untuk melakukan pencarian dokumen citra berwarna. Pengguna menentukan sendiri nilai K yang digunakan sebagai konstanta pembentukan cluster untuk proses

clustering, selanjutnya pengguna

memilih citra acuan dan memberi

input berupa citra, kemudian sistem

akan mencari citra-citra lain yang mirip dengan citra input melalui proses matching. Kemiripan ditentukan berdasarkan nilai jarak antar histogram. Hasil pencarian

akan ditampilkan terurut berdasarkan nilai jarak histogramnya. Gambaran sistem pada gambar 1.

Gambar 1 Gambaran sistem secara keseluruhan

Berikut ini dipaparkan penjelasan dari sistem :

A. Ekstraksi Fitur

Ekstraksi fitur dilakukan pada citra query dan citra acuan. Pengguna memilih sekumpulan citra pada direktori, kemudian diekstrak fitur

color histogramnya. Hasil dari

ektraksi ini disimpan ke database. Selain diekstrak histogramnya, data

property citra query juga akan

diekstrak dengan bantuan exif tools untuk dapat mengetahui tanggal pembuatan citra.

Color histogram dari tiap citra

(citra acuan/database maupun citra

query) dihitung dengan cara

mendiskretkan warna dalam citra, dan menghitung jumlah dari tiap-tiap citra. Setelah pengambilan nilai RGB dari tiap pixel, kemudian langsung dikonversi ke HSV. Selanjutnya dilakukan kuantisasi warna. Warna yang semula berjumlah (255 x 255 x255) atau 16.581.375 kemungkinan

(6)

warna, diubah menjadi (4 x 4 x 4) atau 64 kemungkinan warna.

B. Clustering

Clustering dilakukan pada

sejumlah histogram dari citra acuan dengan menggunakan algoritma

K-Means clustering. Tahap clustering

diawali dengan inisialisasi besarnya K, dan inisialisasi dataset. Dataset masukan berasal dari obyek yang menyimpan array histogram tiap gambar. Algoritma K-Means ini akan memilih secara random dataset yang akan dijadikan centroid. Kemudian menghitung jarak setiap data ke masing-masing centroid. Setiap data memilih centroid yang terdekat yang dihitung dengan rumus euclidian

distance.

Gambar 2 Ilustrasi Klastering C. Pencocokan

Setelah proses clustering

selesai dilakukan, maka tiap cluster tersebut dihitung nilai histogram rata-ratanya (untuk dijadikan centroid). Nilai centroid-centroid ini kemudian dibandingkan dengan HSV histogram gambar query. Centroid yang memiliki jarak paling dekat merupakan solusinya, dan citra dengan centroid terdekat ini ditampilkan pada sistem. Kemudian sistem akan menampilkan pula

beberapa citra yang memiliki jarak terdekat. Penghitungan similarity antara histogram citra acuan dan citra

query yaitu menggunakan euclidian distance. Contoh :

H(citra 1) = {0,2,3} H(citra 2) = {0,1,2}

Mengacu pada persamaan 4, jarak antara histogram citra 1 dengan histogram citra 2 adalah:

= (0 − 0) + (2 − 1) _{+ (3 − 2)}

= √2 = 1,41

Analisis Kebutuhan Fungsional Dalam membangun image retrieval ini diperlukan batasan yang

jelas sebagai tujuan utamanya agar tidak keluar dari rencana yang telah ditetapkan. Beberapa kebutuhan sistem yang akan didefinisikan dalam

Software Requirement Specification

antara lain :

Tabel 1 Software Requirement

Specification No SRS ID Description 1 SRS -STK001 Pengguna dapat mengakses halaman utama aplikasi. 2 SRS -STK002 Pengguna dapat menentukan nilai K dan memilih sekumpulan citra yang akan dijadikan acuan. 3 SRS -STK003 Pengguna dapat menentukan citra query.

(7)

4 SRS -STK004 Pengguna dapat melakukan pencarian citra, sehingga memperoleh hasil berupa citra yang mirip dan tanggal pembuatan citra. Fase Elaboration

Identifikasi Aktor

Aktor pada aplikasi content

based image retrieval menggunakan color histogram dan algoritma

K-Means clustering ini yaitu user. User dapat menentukan sendiri sekumpulan citra database dan citra

query yang akan dilakukan

pencarian.

Use Case Diagram

Use case diagram ini berfungsi

untuk melihat proses interaksi aktor terhadap sistem. Use case diagram yang dirancang pada tugas akhir ini adalah use case diagram image

retrieval, terdapat pada gambar 3

berikut :

Gambar 3 Use Case Diagram Image

Retrieval

Activity Diagram

Activity Diagram memodelkan alur

kerja sebuah proses dan urutan aktivitas dalam suatu proses. Contoh

activity diagram pencarian pada

gambar 4.

Gambar 4 Activity Diagram Pencarian

Sequence Diagram

Sequence diagram

memperlihatkan kolaborasi dinamik antara objek-objek dengan suatu urutan pesan (a sequence of message) antar objek tersebut.

Contoh sequence diagram pencarian

dapat dilihat pada gambar 5 di bawah ini.

User

Halaman Utama Citra

tekan tombol open()

Histogram createHistogram() KMeansCluster calculatedistance() select() prosesOpen()

tekan tombol retrieve() getSelectedFile() imageHSVHistogram() search() Centroid result() panel.addFinalResult()

Gambar 5 Sequence Diagram Pencarian

Class Diagram

Class adalah deskripsi

kelompok objek-objek dengan properti, perilaku (operasi) dan relasi yang sama. Dengan adanya class

diagram dapat memberikan

pandangan umum tentang sebuah sistem.

Adapun untuk perancangan

class diagram sistem ini terdapat

pada gambar 6.

(8)

1. Sistem dimulai ketika user

membuka aplikasi CBIR, dengan nilai K yang diinputkan sebagai konstanta.

2. Sistem akan membaca nilai K ini dan dijadikan parameter untuk pembentukan cluster.

3. User akan memilih sekumpulan citra yang kemudian citra-citra ini akan diekstrak fiturnya, berupa

color histogram, yang nanti

menjadi dataset. Sistem akan membaca dataset ini, kemudian membangkitkan centroid cluster secara acak dari dataset yang ada. Dataset yang lainnya akan dihitung jaraknya dengan centroid kemudian mengelompokkan sendiri dengan jarak yang paling kecil. Jika tidak ada lagi objek yang berpindah, maka proses

clustering selesai dan tiap citra

menempati clusternya masing-masing, dan data ini disimpan pada tabel clusterer.

4. User memilih citra query, sistem akan membaca histogram dari citra query kemudian menghitung jarak antara histogram query ini dengan histogram citra acuan. Jarak histogram terkecillah yang menjadi solusinya dan sistem menampilkan hasilnya.

Gambar 6 Class Diagram Perancangan Antarmuka (Interface)

Perancangan antarmuka bertujuan untuk memberikan gambaran tentang aplikasi yang akan dibangun, sehingga akan mudah dalam mengimplementasikan aplikasi.

A. Antarmuka Halaman Utama Di bawah ini merupakan perancangan antarmuka halaman utama, terdapat pada gambar 7.

Gambar 7 Antarmuka Halaman Utama

(9)

4. IMPLEMENTASI SISTEM Fase Construction

Fase construction merupakan fase ketiga dalam pengembangan perangkat lunak metode RUP.

Persiapan Sistem

Beberapa hal yang harus dipersiapkan dalam pengimplementasian adalah sebagai berikut :

A. Spesifikasi Perangkat Lunak Adapun untuk melengkapi perangkat keras yang telah disebutkan sebelumnya maka diperlukan juga perangkat lunak, diantaranya :

1. jdk-6u3-windows-i586-p.exe sebagai paket JDK untuk bahasa pemrograman Java, yaitu Java jdk 1.6.0_10, dengan menggunakan library jre6, dan library tambahan berupa jfreechart-1.0.14 dan jcommon-1.0.17.

2. Tools yang digunakan untuk pembuatan dan pengembangan aplikasi adalah IDE Eclipse Galileo, dan tool tambahan exiftool.

3. Perangkat lunak yang digunakan untuk pembuatan database adalah XAMPP MySQL 5.

Implementasi Sistem

Berdasarkan perancangan antarmuka sistem yang telah dibuat pada bab sebelumnya, maka implementasinya disajikan dalam gambar di bawah ini.

Gambar 8 Implementasi Antarmuka Halaman Utama

Pengujian

Pengujian dilakukan dengan dua tahap, yaitu uji keakuratan program dan uji aplikasi.

1. Parameter Uji Coba

Parameter uji coba merupakan bagian penting dari percobaan yang menentukan hasil akhir pencarian. Pada percobaan ini, parameter uji coba yang digunakan adalah sebagai berikut: a. Tipe citra digital: jpg.

b. Jumlah citra acuan: 233.

c. Metode clustering: K-Means dengan nilai K yang diisi oleh

user, 5– 10.

d. 10 citra query diambil dari folder yang sama dengan citra acuan, dan 10 lainnya cdiambil dari folder yang berbeda.

1) Hasil Clustering

Pada percobaan ini, citra masuk ke cluster 3, 5, dan 6.

Cluster 3 didominasi oleh

warna kuning dan jingga,

cluster 5 oleh warna biru muda

dan cluster 6 oleh warna biru tua. Hasil cluster 5 ditunjukkan pada gambar 9.

Gambar 9 Hasil Percobaan 1

Cluster 5

2) Hasil Pencarian

Query A (Citra Query yang Direktorinya Sama dengan Direktori Citra Acuan)

Hasil pencarian percobaan 1 terdapat pada gambar 10 di bawah ini.

(10)

Gambar 10 Hasil Pencarian Percobaan 1 (Query 1) Hasil pencarian citra query yang lainnya dapat dilihat pada tabel 1 di bawah ini.

Tabel 1 Tabel Pencarian Percobaan 1 Query Dikenali/ Akurasi Jarak gambar query Waktu 1 V 0.0 63 2 V 0.0 59 3 V 0.0 42 4 V 0.0 46 5 v 0.0 52 6 v 0.0 41 7 v 0.0 46 8 v 0.0 60 9 v 0.0 61 10 v 0.0 54 Jumlah 0.0 524

Query B (Direktori citra query tidak sama dengan direktori citra acuan)

Hasil pencarian percobaan 2 dapat dilihat pada gambar 4.11 di bawah ini.

Gambar 4.11 Hasil Pencarian Percobaan 2

Analisa Data Hasil Clustering Berikut ini adalah tabel hasil pengujian dari tiap nilai K yang

dimasukkan range 5-10 beserta jumlah cluster yang terisi dan tingkat kemiripannya, terdapat pada tabel 2.

Tabel 2 HasilClustering Keseluruhan Percobaan

Berdasarkan data di atas, dapat menunjukkan bahwa banyaknya nilai K tidak mempengaruhi masuknya citra menjadi anggota pada cluster tertentu, serta semakin besar jumlah

cluster yang terisi maka semakin

besar pula tingkat kemiripan tiap

clusternya.

Analisis Data Hasil pencarian Berikut ini adalah tabel hubungan jarak antara centroid dan citra query dengan tingkat akurasi, terdapat pada tabel dan 4.

Tabel 3 Tabel Akurasi Citra Query A No QueryA Jarak gambar query dan centroid terdekat Akurasi 1 0.0 1 2 0.0 1 3 0.0 1 K Perco-baan Jumlah Cluster terisi Rata-Rata Kemiripan 5 1 2 0.725 2 2 0.715 6 1 3 0.73 2 2 0.725 7 1 2 0.665 2 2 0.675 8 1 2 0.665 2 1 0.55 9 1 1 0.55 2 1 0.55 10 1 1 0.55 2 3 0.72

(11)

Tabel 3 Tabel Akurasi Citra Query A(lanjut)

Tabel 4 Tabel Akurasi Citra Query B

Di bawah ini tabel 5 yang menunjukkan perbedaan waktu pencarian antara pencarian dengan

query yang berasal dari direktori

yang sama dengan citra (query A) dengan query yang berbeda direktori (query B).

Tabel 5 Perbandingan Waktu Percobaan ke-Waktu Rata-Rata Query A Query B 1 524 574 2 578 573 3 584 566

Tabel 5 Perbandingan Waktu(lanjut) Percobaan ke-Waktu Rata-Rata Query A Query B 4 551 572 5 590 613

Dari tabel di atas dapat diketahui bahwa waktu yang dibutuhkan untuk pencarian citra yang masih berasal dari direktori yang sama dengan direktori citra acuan lebih sedikit daripada waktu untuk menemukan kembali citra yang mirip dengan query yang bukan berasal dari citra yang sama dengan citra acuan.

PENUTUP Kesimpulan

Kesimpulan dalam penelitian skripsi ini adalah :

1. Untuk melakukan ekstraksi fitur warna, sistem akan membaca nilai histogram RGB. Color histogram dari tiap citra (citra acuan/database maupun citra

query) dihitung dengan cara

mendiskretkan warna dalam citra, dan menghitung jumlah dari tiap-tiap citra. Kemudian dilakukan kuantisasi warna serta proses normalisasi dan didapatlah nilai histogramnya .

2. K-Means digunakan dengan terlebih dahulu mengelompokkan citra yang memiliki nilai HSV histogram yang berdekatan. Kemudian sistem akan menampilkan hasil clusteringnya. Dengan cara ini, pada beberapa pengujian, nilai K yang diinputkan manual ternyata membentuk cluster sebanyak K namun tidak semua cluster

No QueryA Jarak gambar query dan centroid terdekat Akurasi 4 0.0 1 5 0.0 1 6 0.0 1 7 0.0 1 8 0.0 1 9 0.0 1 10 0.0 1 No QueryB Jarak gambar query Akurasi 1 28.05 0.78 2 23.09 0.8 3 5.04 1 4 26 0.9 5 13.6 0.85 6 15.8 0.9 7 20.11 0.6 8 17.15 0.8 9 19.5 0.45 10 28.1 0.75 Rata-rata 0.783

(12)

memiliki anggota. Semakin banyak jumlah cluster yang memiliki anggota maka semakin tinggi juga tingkat kemiripan tiap

clusternya.

3. Waktu yang dibutuhkan dalam pencarian untuk query yang berasal dari direktori yang sama dengan citra acuan lebih cepat dan jarak centroid dengan citra query memberi pengaruh 100% terhadap tingkat akurasi. Sedangkan untuk

query yang berasal dari direktori

yang berbeda dengan citra acuan, waktu yang dibutuhkannya lebih lama dan dekatnya jarak centroid dengan citra query, hanya mempunyai pengaruh sebesar 0.33% saja terhadap tingkat akurasi, sisanya sebesar 99.67%, nilai akurasi dipengaruhi oleh faktor bukan jarak. Maka sistem ini berhasil membantu pengguna menemukan citra yang mirip dan memberikan informasi tanggal pembuatan citra query. Aplikasi ini dirancang dengan tampilan yang simpel sehingga mudah digunakan.

Saran

1. Untuk lebih meningkatkan akurasi hasil pencarian pada sistem CBIR (khususnya fitur warna), perlu dipertimbangkan penggunaan LCH (Local Colour Histogram).

2. Untuk proses clustering perlu

menggunakan metode yang lebih baik lagi agar performa lebih baik selain K-Means ataupun FGKA. 3. Dapat melakukan ekstraksi fitur

yang lebih banyak, tidak hanya dari fitur warna, tapi juga dari tekstur maupun bentuk agar content based image retrieval ini dapat dikembangkan secara luas.

DAFTAR PUSTAKA

Barakbah, Ali R. 2006.Clustering. Workshop. Surabaya: Politeknik Elektronika Negeri Surabaya.

Gonzales, R., Woods, R. 2002.

Digital Image Processing. New

Jersey: Prentice Hall.

Rodiyansyah, Sandi Fajar. 2010.

Ekstraksi Histogram Citra

Digital Untuk mengukur

Similarity dengan

Menggunakan Metode

Euclidian Distance. Jurnal.

Yogyakarta: Universitas Gadjah Mada.