Fitur merupakan suatu tanda yang khas, yang membedakan antara satu dengan yang lain. Tidak berbeda dengan sebuah citra, citra juga memiliki fitur yang dapat membedakannya dengan citra yang lain. Masing-masing fitur citra didapatkan dari proses ekstraksi fitur.
Fitur-fitur dasar dari citra: a. Warna
- Fitur warna suatu citra dapat dinyatakan dalam bentuk histogram dari citra tersebut yang dituliskan dengan:
H(r,g,b), dimana H(r,g,b) adalah jumlah munculnya pasangan warna r (red), g (green) dan b (blue) tertentu.
b. Bentuk
- Fitur bentuk suatu citra dapat ditentukan oleh tepi (sketsa), atau besaran moment dari suatu citra. Pemakaian besaran moment pada fitur bentuk ini banyak digunakan orang dengan memanfaatkan nilai-nilai transformasi fourier dari citra.
- Proses yang dapat digunakan untuk menentukan fitur bentuk
adalah deteksi tepi, threshold, segmentasi dan perhitungan moment seperti (mean, median dan standard deviasi dari setiap lokal citra).
c. Tekstur
hijau (H), dan biru (B). Jika warna-warna pokok tersebut digabungkan, maka akan menghasilkan warna lain. Penggabungan warna tersebut bergantung pada warna pokok dimana tiap-tiap warna memiliki nilai 256 (8 bit).
Gambar 2.21 Contoh warna dan nilai RGB-nya
Konsep ruang warna adalah setiap pixel mempunyai warna yang dinyatakan dalam RGB, sehingga merupakan gabungan nilai R, nilai G, dan nilai B yang tidak bisa dipisahkan satu dengan lainnya. Hal ini dapat dituliskan dengan P(r,g,b).
Gambar 2.22 Konsep warna ruang
Warna yang dideskripsikan dengan RGB adalah pemetaan yang mengacu pada panjang gelombang dari RGB. Pemetaan menghasilkan nuansa warna untuk masing-masing R, G, dan B. Masing-masing-masing R, G, dan B didiskritkan dalam skala 256, sehingga RGB akan memiliki indeks antara 0 sampai 255. Jika dilihat dari pemetaan model warna RGB yang berbentuk cube ( kubus ) seperti citra dibawah ini.
Gambar 2.23 Model warna RGB berbentuk kubus
Dengan pemetaan RGB 24-bit color cube maka 3 warna dasar dapat dicampurkan sehingga mendapatkan warna yang baru.
Gambar 2.24 Pemetaan RGB yang dicampurkan
2.3.3.1.1 Segmentasi
Segmentasi adalah suatu proses yang digunakan untuk mengelompokkan citra sesuai dengan obyek citranya. Segmentasi dapat dilakukan dengan pendekatan region merging dan splitting.
dimana R,G,B merupakan tiga macam warna dan N adalah jumlah pixel pada citra. Color histogram dihitung dengan cara mendiskretkan warna dalam citra, dan menghitung jumlah dari tiap-tiap pixel pada citra. Karena jumlah dari tiap-tiap warna terbatas, maka untuk lebih tepatnya dengan cara menstransform 3 histogram ke dalam single variable histogram. Misalkan pada citra RGB, salah satu transformnya didefinisikan sebagai berikut :
m =Nr+Ng+Nb (2.3)
dimana Nr, Ng, dan Nb merupakan jumlah nilai biner dari warna merah ,biri, dan hijau secara berturut-turut. Untuk mendapatkan Color histogram menggunakan persamaan sebagai berikut : , , , , | , , (2.4) Keterangan : R = warna merah G = warna hijau B = warna biru
Gambar 2.25 Contoh jumlah warna dalam satu citra
Gambar di atas menjelaskan bahwa warna merah mempunyai jumlah 5, Kuning = 2, Hijau = 3, Biru = 1, Abu-abu = 1, Pink = 2 danPutih = 2. Dari jumlah tersebut maka akan ditampilkan dalam bentuk histogram seperti citra dibawah ini.
Keterangan :
P(r,g,b) = nilai histogram probabilitas H(r,g,b) = nilai histogram warna Nimage = jumlah pixel dari image
Gambar 2.27 Histogram Probability Density Function
(2.5) Keterangan :
P(r,g,b) = nilai histogram probabilitas H(r,g,b) = nilai histogram warna
Histogram interseksi melakukan perhitungan jarak dengan membandingkan dua histogram h1 dan h2 dan terhadap n bin dengan mengambil nilai interseksi dari kedua histogram tersebut.
(h1,h2)=1- ∑ ∑ , (2.6)
Keterangan : = Nilai jarak antar dua histogram h1 = Nilai histogram 1
h2 = Nilai histogram 2
Normalisasi diperlukan karena pada saat menggunakan image dengan ukuran yang berbeda, fungsi jarak ini bukanlah sebuah matrik yang seharusnya DH(g,h)≠DH(g,h). Supaya manjadi sebuah matrik yang valid, pada histogram diperlukan :
1 ∑ (2.7)
Untuk histogram yang ternormalisasi (jumlah total sama dengan 1), interseksi histogram adalah :
1 , 2 1 ∑ | 1 2 | (2.8)
Keterangan : = Nilai jarak antar dua histogram yang ternormalisasi 1 = Nilai histogram 1 ternormalisasi
2 = Nilai histogram 2 ternormalisasi
Persamaan diatas adalah model matriks jarak Minkowski dengan k=1. Sifat interseksi histogram dapat menghilangkan bagian tertentu (occlusion), dimana apabila sebuah objek dalam suatu image dihilangkan pada bagian tersebut, bagian yang kelihatan masih mempunyai kontribusi untuk kesamaan atau similaritas.
di atas. Bila setiap proses perhitungan dilakukan menggunakan tiga layer, berarti dilakukan tiga perhitungan yang sama. Sehingga konsep itu diubah dengan mengubah 3 layer di atas menjadi 1 layer matrik grayscale dan hasilnya adalah citra gray-scale. Dalam citra ini tidak ada lagi warna, yang ada adalah derajat keabuan. Untuk mengubah citra berwarna yang mempunyai nilai matrik masing-masing r, g dan b menjadi citra gray scale dengan nilai s, maka konversi dapat dilakukan dengan mengambil rata-rata dari nilai r, g dan b sehingga dapat dituliskan menjadi:
s= (2.9) Keterangan : s = Nilai derajat keabuan
r = Nilai Red pada suatu nilai RGB g = Nilai Green pada suatu nilai RGB b = Nilai Blue pada suatu nilai RGB
Pada penjelasan di atas pengubahan citra berwarna menjadi gray-scale dilakukan dengan menggunakan rata-rata nilai gray-scale dari setiap layer R, G, dan B. Hal ini bukanlah suatu keharusan. Meskipun hasilnya sudah cukup bagus, pemakaian nilai rata-rata masih belum optimal untuk menunujukkan citra gray-scale sehingga dilakukan pengubahan komposisi sebagai berikut:
Grayscale = αR + βG + δB / (α + β + δ) (2.10)
Dengan nilai α=0.35, β=0.25 dan δ=0.4 sehingga nilai α+β+δ =1 Fungsi dari format warna gray ini adalah untuk memudahkan proses selanjutnya karena kita akan kesulitan apabila kita menjalankan proses selanjutnya dengan menggunakan format citra berwarna karena nilai r, g, dan b yang dihasilkan dengan format citra itu akan bervariasi. Dengan format warna gray ini maka dihasilkan nilai R=G=B.
2.3.3.2.2 Filter Gaussian
Filter rata-rata adalah filter dengan nilai pada setiap elemen kernelnya berbentuk fungsi Gaussian dan sebagai LPF maka jumlah dari semua nilai kernelnya adalah 1 (satu). Dengan rumus :
F(x,y)=
√ exp (2.11)
Keterangan :
x = jarak dari titik di sumbu horizontal y = adalah jarak dari titik di sumbu vertical σ = standar deviasi dari distribusi Gaussian
Filter rata-rata termasuk dalam linier filter dengan menggunakan kernel berupa matrik. 2.3.3.2.3 Edge Detection
Bentuk merupakan atribut dari suatu citra. Fitur bentuk suatu citra dapat dilakukan dengan deteksi tepi, threshold, segmentasi dan perhitungan moment seperti mean, median, dan standart dari setiap local citra. Deteksi tepi adalah proses yang penting pada preprosessing citra, karena hasil daripada deteksi tepi ini adalah tepi dari citra saja yang menunjukkan bentuk spesifik citra. Proses deteksi tepi ini dilakukan pada
Persamaan untuk kernel y (horizontal)
(2.12)
Persamaan untuk kernel x (vertical)
(2.13)
2.3.3.2.4 Integral Proyeksi
Integral Proyeksi adalah suatu teknik yang menjumlahkan nilai setiap kolom atau setiap baris. Integral proyeksi didefinisikan dengan :
h(j) = ∑ ,
Gambar 2.28 Rumus integral proyeksi
Gambar 2.29 Proses perhitungan integral proyeksi
2.3.3.2.5 Resampling dan Normalisasi
Resampling adalah suatu metode yang digunakan untuk pengenalan suatu citra dengan cara mengambil sampel yang tepat. Sampling pada image adalah resolusi dari image itu sendiri, atau menyatakan banyaknya pixel yang digunakan untuk dapat menyajikan citra. Semakin besar samplingnya maka semakin besar resolusi sehingga citra yang diperoleh menjadi lebih halus.
suatu image. Proses normalisasi dilakukan untuk mengecilkan data yaitu antara nol sampai dengan satu. Hal ini sangat diperlukan, karena bila terjadi matching citra yang berlainan ukuran, maka otomatis data dari citra yang dimatching tersebut selalu antara nol sampai dengan satu. Untuk setiap pixel ke-k pada vektor kolom dinormalisasi dengan rumus :
| | =
| | (2.14)
Sedangkan untuk mencari nilai standar deviasi menggunakan rumus:
∑
(2.15) 2.3.4 K-means
Setelah proses normalisasi kami menggunakan metode k-means agar dapat dilakukan clustering sehingga data dapat dijadikkan beberapa kelas. Pembagian kelas ini dilakukan agar proses retrieval citra menjadi lebih efisien dan lebih cepat.
K s k 2 b d a S d e d Dem 2.31 Kelebihan m sederhana da kumpulan da 2.3.5 Image