Latar Belakang - MODIFIKASI SPEED-UP ROBUST FEATURE (SURF) DENGAN HISTOGRAM OF ORIENTED GRADIEN

BAB I PENDAHULUAN

1.1. Latar Belakang

Bag of visual words merupakan suatu metode untuk mempresentasikan citra berdasarkan fitur lokal (Farhangi et al. 2013). Bag of visual words memaparkan bagaimana sebuah citra dapat diambil karakteristiknya. Setiap citra mempunyai karakteristik tertentu dalam nilai pixelnya, seperti contoh pada Gambar 1.1 dan Gambar 1.2 berupa citra mobil dan objek-objek lainnya. Secara kasat manusia dapat membedakan bahwa pada citra tersebut terdapat mobil dan objek lainnya, seperti tumbuhan, tanah dan rumah yang terdapat pada citra tersebut. Namun, komputer tidak memiliki kemampuan seperti mata manusia yang dapat langsung membedakan objek pada citra tersebut. Karena komputer hanya mengenali bilangan biner yaitu 0 dan 1. Untuk itu bag of visual words dapat digunakan untuk mengambil nilai-nilai pixel pada citra tersebut sebagai ciri karakteristik dalam membedakan objek-objek pada citra tersebut.

Tahapan bag of visual words dimulai dengan ekstraksi fitur lokal dari citra, ekstraksi fitur lokal pada bag of visual words terbagi menjadi 2 bagian, yaitu penentuan interest point detector dan interest point descriptor (Shuka et al. 2013). Ekstraksi fitur merupakan suatu

Gambar 1.1 Citra mobil dan rumah

Gambar 1.2 Citra rumah dan tumbuhan

proses seleksi informasi pada citra yang dinginkan, baik bentuk, warna, maupun sudut objek pada citra dengan menggunakan metode tertentu (Nixon & Aguado, 2008). Ekstraksi fitur adalah tahap pre-processing yang penting dalam klassifikasi, untuk menentukan ciri (feature) dari sebuah dataset yang akan diklassifikasikan. Secara teori, seleksi fitur dapat meminimalisasi tingkat error klassifikasi dan jumlah fitur untuk menjadi acuan pengetahuan klassifikasi (Han & Kamber, 2006).

Pada ekstrasi fitur lokal ini telah dikembangkan beberapa metode diantaranya menggunakan menggunakan Haris detector (Harris & Stephens, 1988), grid regular yang mensegmentasikan citra dengan garis horizontal dan vertikal untuk mendapatkan area local blur (Sivic, 2003.), scale invariant feature transform (Lowe, 2004), speed-up robust feature (Bay et al. 2006) dan variabel fitur persegi panjang berdasarkan area lokal blur (Khrisnamoorthy & Punidha, 2012). Scale invariant feature transform dan speed-up robust feature lebih sering digunakan sebagai interest point detector dan interest point descriptor pada skema bag of visual words, seperti yang dilakukan oleh Raza et al. 2011 dan Shukla et al. 2013. Hal ini disebabkan penggunaan rotasi invarian dan skala invarian dalam penentuan fitur pada citra yang dapat meningkatkan kecepatan komputasi dan akurasi klasifikasi citra. Namun ditemukan kekurangan dalam kedua metode tersebut, yaitu sulit menentukan interest point pada intensitas citra yang terdegradasi.

Dalam image processing, citra merupakan istilah lain untuk gambar yang merupakan bentuk informasi visual (Szelizki, 2011). Namun dalam perolehan data, citra yang didapat tidak selalu dalam kondisi yang berkualitas. Dapat terjadi suatu kesalahan atau keterbasan alat yang menyebabkan citra tidak berkualitas. Maka tidak jarang citra yang didapat terkadang tidak terlihat jelas, dikarenakan oleh noise atau blur di dalam citra tersebut. Citra yang blur merupakan citra yang tidak dikenali secara jelas, dikarenakan terjadi degradasi di dalam citra tersebut (Gonzalez & Woods, 2008).

Blur terbagi dalam beberapa jenis, diantaranya; average blur, motion blur, Gaussian blur, dan out of focus blur. Average Blur adalah jenis blur yang terdapat di seluruh permukaan gambar baik secara vertical maupun horizontal. Motion Blur adalah jenis blur yang terjadi karena pergerakan saat menangkap suatu citra. Gaussian blur adalah jenis blur yang terjadi dalam sisi interior dan eksterior pada tepi citra. Out of focus blur adalah jenis

blur yang terjadi ketika pengguna foto mengambil gambar dengan kamera, dan tiba-tiba gambar mendapat blur (Vignesh & Sivabalakrishnan, 2015).

Penelitian sebelumnya mengenai citra blur, berfokus terhadap prediksi model degradasi citra untuk mengklasifikasikan daerah blur pada citra. Seperti yang dilakukan oleh Tiwari et al. (2014) menggunakan wavelet transform untuk menemukan pola frekuensi blur pada citra sebagai fitur tekstur untuk klassifikasi citra blur. Sedangkan Suta & Vaida (2012) menggunakan deteksi tepi berdasarkan 3 tipe tepi yang berbeda pada citra yaitu dirac-sturucture egde, roof-structure edge dan step-structure edge untuk memprediksi daerah blur pada citra. Model degradasi citra menentukan prediksi dalam klassifikasi tekstur citra yang blur dimana proses ini akan menentukan keakuratan pada proses klassifikasi citra blur (Corburn, 2002).

Rassem & Khoo, 2015. menganalisa histogram of oriented gradient lebih stabil dalam mengenali perubahan pola tekstur pencahayaan dan degradasi citra dibandingkan metode lain yang menggunakan pixel sebagai interest point. Kelebihan histogram of oriented gradient ini berkaitan dengan speed-up robust feature, dimana speed-up robust feature menggunakan pixel untuk menentukan interest point (Bay et al. 2006). Karena histogram of oriented gradient menghitung gradient vertical dan horizontal yang terpusat (Dalal &

Triggs, 2005), yang dapat mendeteksi nilai intensitas pada citra.

Berdasarkan penelitian yang sudah pernah dilakukan oleh penulis lain dan dari uraian pada paragraf-paragraf diatas, diperlukan suatu modifikasi metode feature extractor speed-up robust feature dalam skema bag of visual words pada klassifikasi citra blur. Untuk itu penulis tertarik melakukan penelitian modifikasi metode speed-up robust feature dalam skema bag of visual words pada klassifikasi citra blur.

1.2. Perumusan Masalah

Dalam skema bag of visual words, speed-up robust feature memiliki kelemahan dalam menentukan interest point pada citra yang terdegradasi. Pada penelitian sebelumnya, histogram of oriented gradients mampu mengenali perubahan pola tekstur pencahayaan dan degradasi citra dibandingkan dengan metode lain yang menggunakan pixel sebagai interest point. Untuk itu perlu dilakukan penelitian modifikasi metode speed-up robust

feature dengan mengambil beberapa kelebihan metode histogram of oriented gradients dalam penentuan interest point pada citra yang terdegradasi.

1.3. Batasan Masalah

Karena keterbatasan waktu,sumber daya, dana dan kemampuan keilmuan penulis, maka dalam penelitian ini hanya akan dilakukan hal-hal sebagai berikut:

a. Resolusi citra yang digunakan adalah 640 width x 480 height pixel.

b. Penelitian menggunakan sumber daya berbasis opensource yang tidak melanggar hak cipta (license).

c. Menggunakan Support Vector Machine sebagai klassifier

1.4. Tujuan Penelitian

Penelitian ini bertujuan untuk menentukan interest point guna mengklasifikasi citra blur dengan menggunakan modifikasi metode speed-up robust feature dalam skema bag of visual words.

1.5. Manfaat Penelitian

Manfaat penelitian ini adalah untuk memperoleh cara baru dalam pendeteksian blur pada citra

BAB 2

TINJAUAN PUSTAKA

2.1 Pengolahan Citra

Pengolahan Citra Digital adalah teknologi menerapkan sejumlah algoritma komputer untuk memproses gambar digital. Hasil dari proses ini dapat berupa gambar atau suatu set perwakilan karakteristik atau properti dari gambar asli. Tujuan utama dari pengolahan citra digital adalah untuk memungkinkan manusia untuk mendapatkan gambar berkualitas tinggi atau karakteristik deskriptif dari gambar asli (Zhou et al. 2010).

2.2 Distribusi pixel (Histogram)

Sebuah histogram citra adalah alur dari frekuensi relatif dari peristiwa masing-masing nilai pixel yang diizinkan pada citra terhadap nilai-nilai itu sendiri (Salomon & Breckon, 2011).

Jika kita menormalkan sebuah alur frekuensi, sehingga total jumlah semua entri frekuensi selama rentang yang diperbolehkan adalah satu, kita dapat memperlakukan histogram citra sebagai fungsi probabilitas diskrit kepadatan yang mendefinisikan kemungkinan nilai pixel yang terjadi di dalam citra.

Histogram memberikan deskripsi global utama dalam citra (Acharya & Ray, 2005).

Sebagai contoh histogram citra greyscale, jika histogram citra sempit, maka dapat diartikan bahwa citra terlihat kurang baik (secara visual) karena perbedaan level grey yang ada pada citra umumnya rendah. Sedangkan jika histogram citra lebar, maka dapat diartikan hampir semua level grey, kontras dan visibilitas citra meningkat.

2.3 Deteksi Tepi (Edge detection)

Tepi atau edge dapat didefinisikan sebagai batas antara dua wilayah pada citra yang memiliki karakteristik berbeda berdasarkan beberapa fitur (misalnya tingkat abu-abu,

warna dan tekstur) (Marques, 2011). Seperti pada citra greyscale , yang biasanya berhubungan dengan variasi yang tajam dari intensitas di bagian citra. Gambar 2.1 mengilustrasikan konsep ini dan menunjukkan perbedaan antara tepi ideal (transisi tajam) dan tepi lereng (transisi bertahap antara daerah gelap dan terang pada citra).

Deteksi tepi biasanya bergantung pada perhitungan turunan pertama atau kedua sepanjang tampilan intensitas citra (Marques, 2011). Turunan pertama memiliki sifat berbanding lurus dengan perbedaan intensitas di tepi, sehingga turunan pertama dapat digunakan untuk mendeteksi keberadaan tepi pada titik tertentu dalam citra. Turunan kedua dapat digunakan untuk menentukan apakah pixel terletak pada sisi gelap atau terang pada tepi. Selain itu persimpangan nol antara puncak positif dan negatif dapat digunakan untuk menemukan pusat pada tepi yang tebal. Berikut adalah ilustrasi tepi :

Gambar 2.1 Ilustrasi tepi ideal dan tepi lereng pada citra (Marques, 2011).

2.3.1 Turunan Pertama deteksi tepi (First-order derivative)

Pada dasarnya, batas suatu objek adalah langkah perubahan dalam tingkat intensitas. Untuk mendeteksi posisi tepi dapat digunakan diferensiasi ordo pertama, diferensiasi ordo pertama tidak memberikan respon ketika diterapkan pada perubahan intensitas yang tidak berubah, sebuah perubahan intensitas dapat diungkapkan oleh perbedaan titik yang berdekatan (Nixon & Aguado, 2008).

Perbedaan perhitungan titik horizontal yang berdekatan akan mendeteksi perubahan vertikal dalam intensitas dan sering disebut detektor-tepi horizontal berdasarkan perlakuannya. Sebuah operator horizontal tidak akan muncul pada perubahan intensitas

horizontal karena perbedaannya adalah nol. Ketika diterapkan pada citra 𝑃 aksi detector-tepi horizontal membentuk perbedaan antara dua titik horizontal yang berdekatan, seperti mendeteksi tepi vertikal , 𝐸𝑥, seperti berikut: (Nixon & Aguado, 2008)

𝐸𝑥_𝑥,𝑦= |𝑃_𝑥,𝑦− 𝑃_𝑥+1,𝑦| ∀𝑥 ∈ 1, 𝑁 − 1; 𝑦 ∈ 1, 𝑁 (2.1)

untuk mendeteksi tepi horizontal dibutuhkan detektor-tepi vertikal yang membedakan poin vertikal yang berdekatan. Hal ini akan menentukan perubahan intensitas horizontal, tetapi tidak yang vertikal, sehingga detektor-tepi vertikal mendeteksi tepi horisontal, 𝐸𝑦, seperti berikut:

𝐸𝑦_𝑥,𝑦 = |𝑃_𝑥,𝑦− 𝑃_𝑥,𝑦+1| ∀𝑥 ∈ 1, 𝑁; 𝑦 ∈ 1, 𝑁 − 1 (2.2)

gambar 2.2 (b) dan (c) menampilkan aplikasi operator vertikal dan horizontal pada citra persegi pada gambar 2.2 (a).

Gambar 2.2 Turunan pertama deteksi tepi (Nixon & Aguado, 2008).

tepi kiri vertikal pada gambar 2.2 (b) muncul pada samping persegi (citra asli) yang disebabkan oleh proses diferensiasi. Demikian juga dengan tepi atas pada gambar 2.2(c) muncul diatas persegi (citra asli).

Mengkombinasikan kedua operator E yang dapat mendeteksi tepi vertikal dan horizontal secara bersamaan, yaitu,

𝐸_𝑥,𝑦= |𝑃_𝑥,𝑦− 𝑃_𝑥+1,𝑦 + 𝑃_𝑥,𝑦− 𝑃_𝑥,𝑦+1| ∀𝑥, 𝑦 ∈ 1, 𝑁 − 1 (2.3)

menghasilkan

𝐸_𝑥,𝑦= |2 𝑥 𝑃_𝑥,𝑦− 𝑃_𝑥+1,𝑦 − 𝑃_𝑥,𝑦+1| ∀𝑥, 𝑦 ∈ 1, 𝑁 − 1 (2.4)

persamaan 2.4 memberikan koefisien diferensiasi yang dapat konvolusikan dengan gambar untuk mendeteksi semua poin tepi, seperti yang ditunjukkan pada gambar 2.2 (d). Titik cerah di sudut kanan bawah dari tepi pada Gambar 2.2 (d) jauh lebih terang dari titik-titik lainnya. Hal ini karena itu adalah satu-satunya titik yang dideteksi sebagai tepi oleh kedua operator vertikal dan horizontal dan karena itu jauh lebih terang dari titik tepi lainnya.

Sebaliknya, titik sudut kiri atas tidak terdeteksi oleh kedua operator sehingga tidak muncul di gambar 2.2 (d).

2.3.2 Turunan kedua deteksi tepi (Second-order derivative)

Prinsip deteksi tepi berdasarkan turunan kedua adalah hanya untuk mendeteksi titik tepi yang memiliki maxima lokal dalam nilai-nilai gradien (Acharya & Ray, 2005). Dalam hal ini, kita mendapatkan puncak di turunan pertama dan persimpangan nol pada turunan kedua pada titik-titik tepi. Oleh karena itu titik di mana turunan kedua memiliki persimpangan nol diperlakukan sebagai titik tepi. Operator Laplacian adalah operator tepi yang paling umum digunakan turunan kedua deteksi tepi. Dimana laplacian dari sebuah citra 𝑓(𝑥, 𝑦) dapat dirumuskan sebagai berikut : (Acharya & Ray, 2005)

∇²(𝑥, 𝑦) = ^𝜕²^(𝑥,𝑦)

𝜕𝑥² + ^𝜕²^(𝑥,𝑦)

𝜕𝑦² (2.5)

Dimana turunan kedua deteksi tepi :

𝜕²(𝑥,𝑦)

𝜕𝑥² = 𝑓(𝑥 + 1, 𝑦) + 𝑓(𝑥 − 1, 𝑦) − 2𝑓(𝑥, 𝑦) (2.6) Dan

𝜕²(𝑥,𝑦)

𝜕𝑦² = 𝑓(𝑥, 𝑦 + 1) + 𝑓(𝑥, 𝑦 − 1) − 2𝑓(𝑥, 𝑦) (2.7)

yang menghasilkan ekspresi laplacian yang dinyatakan sebagai jumlah produk :

∇²(𝑥, 𝑦) = 𝑓(𝑥 + 1, 𝑦) + 𝑓(𝑥 − 1, 𝑦) + 𝑓(𝑥, 𝑦 − 1) − 4𝑓(𝑥, 𝑦) (2.8)

2.4 Bag of visual words

Bag of words merupakan suatu skema yang digunakan untuk kategorisasi teks dan pencarian teks. Dalam penelitian ini bag of words digunakan untuk pembangunan codebook, yaitu kosakata visual dimana pola yang paling representative (codified) di dalam codebook sebagai kosakata visual. Kemudian representasi gambar yang dihasilkan melalui analisis frekuensi sederhana setiap codeword dalam citra. Representasi ini telah digunakan dalam berbagai jenis klassifikasi citra diantaranya dalam penelitian Cruz-Roa et al. (2009) menganalisis pola visual histopathology menggunakan bag of word. Penelitian tersebut mengidentifikasi koleksi citra menggunakan bag of word yang berhubungan dengan konsep semantik gambar histopatologi. Raza et al. (2011) menganalisis pengaruh skala dan rotasi invariant descriptor dalam skema bag of word.

Terdapat tiga langkah utama dalam skema bag of word, diantaranya adalah deteksi fitur dan deskrispi citra, cluster fitur, dan pembangunan kantong fitur (bag of feature). Gambar 2.3 akan menunjukkan langkah-langkah bag of visual words:

Citra Keabuan (Grayscale) Deteksi Interest Point Menggunakan Speed-Up Robust Feature

Ekstraksi Interest Point meggunakan Speed-Up Robust Feature

Penentuan Cluster pada fitur dengan nilai k yang telah ditentukan Histogram Feature Vector

Citra Blur

Bag of Visual Words

Gambar 2.3 Tahapan Bag of visual words (diadoptasi dari Raza et al. (2011).

2.5 Deteksi skala (scale detection)

Representasi ruang skala adalah serangkaian citra yang diwakili pada tingkat resolusi yang berbeda (Mikolajczyk & Schmid, 2001). Resolusi yang berbeda dibentuk dengan konvolusi menggunakan kernel Gaussian (Mikolajczyk & Schmid, 2001):

𝐿(𝑥, 𝑠) = 𝐺(𝑠) ∗ 𝐼(𝑥) (2.9)

dimana I adalah citra dan x = (x,y). Dengan demikian dapat direpresentasikan fitur (seperti tepi atau sudut) pada resolusi yang berbeda dengan menerapkan fungsi yang sesuai (kombinasi turunan) pada skala yang berbeda.

Derivatif Amplitudo spasial, secara umum, menurun berdasarkan skala. Dalam kasus bentuk invarian skala, derivatif harus konstan atas skala. Untuk mempertahankan nilai invarian fungsi skala turunan harus dinormalisasi sehubungan dengan observasi skala.

Skala yang dinormalisasikan derivatif D atas orde m didefenisikan sebagai berikut (Mikolajczyk & Schmid, 2001):

𝐷_{𝑖1…….𝑖𝑚} = 𝑠^𝑚 𝐿_{𝑖1…….𝑖𝑚}(𝑥, 𝑠) = 𝑠^𝑚 𝐺_{𝑖1…….𝑖𝑚}(𝑠) ∗ 𝐼(𝑥) (2.10)

Derivatif yang dinormalisasi berjalan baik pada skala pola intensitas. Pertimbangkan dua gambar dan dicitrakan pada skala yang berbeda. Hubungan antara dua gambar ini kemudian didefinisikan 𝐼(𝑥) = 𝐼^′(𝑥^′), dimana 𝑥^′ = 𝑡𝑥. Derivatif citra kemudian terkait sebagai berikut (Mikolajczyk & Schmid, 2001):

𝑠^𝑚 𝐺_{𝑖1…….𝑖𝑚}(𝑠) ∗ 𝐼(𝑥) = 𝑡^𝑚𝑠^𝑚𝐺_{𝑖1…….𝑖𝑚}(𝑡𝑠) ∗ 𝐼(𝑥′) (2.11)

kemudian untuk derivatif yang dinormalisasikan, didapatkan : (Mikolajczyk & Schmid, 2001)

𝐷_{𝑖1……𝑚}(𝑥, 𝑠) = 𝐷′_{𝑖1……𝑚}(𝑥, 𝑡𝑠) (2.12)

Dengan nilai-nilai yang sama diperoleh pada skala relatif yang sesuai. Untuk menjaga perubahan informasi yang seragam antara tingkat resolusi yang berurut dan factor skala harus didistribusikan secara eksponensial.

Gambar 2.4 menampilkan titik-titik pada citra yang menampilkan seleksi skala yang memungkinkan (citra hitam putih). Titik-titik hitam adalah point untuk fungsi laplacian

yang tidak mempunyai nilai maximum. Titik-titik ini terletak pada daerah yang homogen dan tidak mempunyai nilai maximum dalam jangkauan jarak yang dianggap dalam skala.

Skala yang dipilih untuk titik adalah benar jika rasio antara skala karakteristik dalam poin yang sesuai adalah sama dengan faktor skala dalam citra. Titik yang sesuai ditentukan oleh proyeksi dengan perkiraan transformasi matrik. Dalam beberapa kasus skala maxima, titik dianggap benar, jika salah satu dari maxima sesuai dengan rasio yang benar. Titik dengan skala yang benar ditampilkan dalam titik putih.

Gambar 2.4 Titik karakteristik pada citra (Mikolajczyk & Schmid, 2001).

2.6 Deteksi fitur Speed-up Robust Feature (SURF)

Untuk mendeteksi fitur pada citra, digunakan SURF dalam bag of visual words. SURF mengambil interest point pada citra, dimana interest point ini adalah deskripsi pada setiap bagian citra.

Penentuan interest point SURF feature menggunakan matrix hessian, dimana matrix hessian didefenisikan sebagai berikut: (Bay et al. 2006).

𝐻(𝑋, 𝜎) = [𝐿_𝑥𝑥(𝑋, 𝜎) 𝐿_𝑥𝑦(𝑋, 𝜎)

𝐿_𝑥𝑦(𝑋, 𝜎) 𝐿_𝑦𝑦(𝑋, 𝜎) ] (2.13)

dimana 𝐿_𝑥𝑥(𝑋, 𝜎) = 𝜕²𝑔(𝜎)/ 𝜕²𝑥 adalah konvolusi dari orde kedua derivatif Gaussian dengan input citra pada point 𝑋 = (𝑥, 𝑦), dan serupa untuk 𝐿_𝑦𝑦(𝑋, 𝜎) (Bay et al. 2006).

Dengan menggunakan perkiraan orde kedua derivative Gaussian dapat dievaluasi dengan

sangat cepat menggunakan citra yang dintegralkan. Seperti yang ditunjukkan pada gambar 2.5 dengan menggunakan filter kotak 9x9 memperkirakan orde kedua derivative Gaussian dengan skala (𝜎=1.2) .

Gambar 2.5 Orde kedua gaussian yang terdiskrit dan dikelompokkan secara derivatif parsial dalam arah y dan arah xy, (diambil dari Bay et al. 2006).

Dengan pendekatan perkiraan adalah 𝐷_𝑥𝑥, 𝐷_𝑦𝑦, dan 𝐷_𝑥𝑦, dimana determinan hessian (diambil dari Bay et al. 2006)

|𝐿𝑥𝑦(1,2)|_𝐹||𝐷𝑥𝑥(9)|_𝐹

|𝐿𝑥𝑥(1,2)|𝐹||𝐷𝑥𝑦(9)|𝐹=0.912..≅0.9, (2.14)

dimana ||𝑥|_𝐹 adalah norma frobenius yang menghasilkan (diambil dari Bay et al. 2006)

𝐷𝑒𝑡(𝐻_{𝑎𝑝𝑝𝑟𝑜𝑥}) = 𝐷_𝑥𝑥𝐷_𝑦𝑦 − (0.9)𝐷_𝑥𝑦)² (2.15)

Penentuan skala deteksi SURF ditentukan dengan filter yang digunakan, skala dasar SURF menggunakan filter 9x9 dengan 𝜎=1.2 . Dengan menggunakan kotak filter dan citra integral, SURF tidak harus menggunakan filter yang sama ke output secara iteratif, SURF dapat menggunakan filter dengan ukuran berapapun dengan kecepatan yang sama terhadap citra asli dan bahkan secara parallel (Bay et al. 2006). Dengan itu SURF merupakan multiscale detector, dimana menggunakan 4 skala terhadap deteksi interest point pada citra dengan skala yang digunakan adalah 1.6, 3.2, 4.8 dan 6.4. Penentuan interest point diwakilkan dalam bentuk lingkaran kecil (blob), seperti berikut :

Gambar 2.6 100 Interest point tertinggi yang diwakilkan dengan bulatan (blob) pada citra.

Pada gambar 2.6 memperlihatkan deteksi dengan menggunakan 4 skala, dimana bulatan terkecil menunjukkan pendeteksian pada skala yang terkecil yaitu 1.6. pendeteksian ini merupakan pendeteksian fitur pada citra dengan menggunakan skala invarian, seperti yang dijelaskan pada bagian 2.5.

2.7 Histogram of Oriented Gradient (HOG)

Metode histogram of oriented gradient didasarkan pada evaluasi histogram lokal yang dinormalisasi dari orientasi gradien gambar dalam grid (Dalal & Triggs, 2005).Tahapan histogram of orientated gradient dapat digambarkan seperti berikut:

Hitung Kuantisasi Orientasi Gradien Dengan Skala 9 Biner

Gabungkan Histogram Konversi ke Citra Grayscale

Hitung Gradien Pixel Citra Blur

Fitur Histogram of Oriented Gradient

Gambar 2.7 Tahapan Histogram of oriented gradient

2.7.1. Konversi Citra Warna ke Citra Greyscale

Konversi greyscale merupakan tahap pertama dalam banyak algoritma analisis citra.

Walaupun citra greyscale memuat informasi yang lebih sedikit dibandingkan dengan citra warna, mayoritas penting pada citra tetap terjaga. Seperti tepi, region, dan gumpalan citra tetap ada.

Citra RGB dikonversikan ke citra greyscale menggunakan transformasi berikut:

(Salomon & Breckon. 2011)

𝐼_{𝑔𝑟𝑒𝑦−𝑠𝑐𝑎𝑙𝑒}(𝑛, 𝑚) = 𝛼 𝐼_{𝑐𝑜𝑙𝑜𝑢𝑟}(𝑛, 𝑚, 𝑟) + 𝛽𝐼_{𝑐𝑜𝑙𝑜𝑢𝑟}(𝑛, 𝑚, 𝑔) + 𝛾𝐼_{𝑐𝑜𝑙𝑜𝑢𝑟}(𝑛, 𝑚, 𝑏) (2.16)

dimana (n,m) individual index pixel dari citra greyscale dan (n,m,c) adalah individual chanel pada lokasi pixel (n,m) pada citra warna untuk chanel c, merah untuk chanel r, biru chanel b, dan hijau chanel g. dengan koefisien standar NTSC 𝛼=0.2989, 𝛽=0.587 dan 𝛾=0.1140.

2.7.2. Menghitung Gradien Pixel

Setelah citra blur dikonversikan menjadi citra greyscale, maka akan dihitung gradien secara vertical dan horizontal (memusatkan). Lalu akan dihitung arah sudut dengan membagi citra menjadi region yang lebih kecil (“cells"). Pada gambar 2.8 akan ditunjukkan tahap penentuan nilai gradien, dimana gradien dihitung secara vertikal dan horizontal dengan penentuan arah yang ditunjukkan pada gambar 2.9. Kemudian gradien akan dihitung satu-persatu dengan menggunakan cell block (grid) dengan memindahkan grid secara overlapping seperti yang ditunjukkan pada gambar 2.10. Tahap perhitungannya adalah seperti berikut (diadoptasi dari Dalal & Triggs, 2005):

 Gradien vertical dan horizontal :

-1 0 1

Gambar 2.8 Gradien terpusat pada angka 0

 Derajat : 𝑠 = √𝑠_𝑥²+ 𝑠_𝑦²

 Orientasi: 𝜃 = 𝑎𝑟𝑐𝑡𝑎𝑛 (^𝑠^𝑦

𝑠𝑥)

Gambar 2.9 Arah orientasi gradien

Untuk menentukan pixel mana yang harus dihitung, HOG menggunakan cells block dan overlapping terhadap citra, tahapannya dapat digambarkan sebagai berikut:

A11 A12 A13 A14

Gambar 2.10 Block grid dengan ukuran 2x2 dan overlapping sebesar 50% dari block sebelumnya.

2.7.3. Menghitung Kuantisasi Orientasi Biner dengan skala 9 bin (0-180)

Tahap selanjutnya dalam Histogram of oriented gradient adalah mengkuantisasi orientasi gradient dalam skala 9 bin (0-180) dengan menggunakan interpolasi trilinear (lihat Gambar 2.11). Metode interpolasi trilinear diterapkan untuk memilih sel spasial dan orientasi yang menemukan perbedaan bin tetangga terdekat dan menghasilkan rasio sesuai dengan bin terdekat, sehingga 9 bin digunakan dengan benar. Jadi jika dimisalkan 𝜃=85 maka jarak ke bin terpusat adalah bin 70 dan bin 90 maka derajat 5 dan 15 menghasilkan rasio ⁵

20=¹

4, ¹⁵

= ³

4, maka 𝜃=85 digolongkan kepada 𝜃=90, dapat diilustrasikan sebagai berikut (diadoptasi dari Dalal & Triggs, 2005):

10 30 50 70 90 110 130 150 170

1/4 3/4

Gambar 2.11 Contoh tahap kuantisasi orientasi biner dengan skala 9 bin (0-180)

2.7.4. Menggabungkan Histogram

Hasil perhitungan kuantisasi pada tiap blok yang dibentuk, akan digabungkan untuk menghasilkan histogram setiap cell pada blok. Tahap penggabungan histogram dapat digambarkan sebagai berikut (diadoptasi dari Dalal & Triggs, 2005):

A17 A18 A27 A28

Blok 1 Blok 2 ... ^{Blok N}

H(a16) H(a26) H(a17) H(a27) A16

A26

H(a16) H(a26) H(a17) H(a27) H(a17) H(a27) H(a18) H(a28)

Blok 1 Blok 2

HOG Blok 2x2 cell

Gambar 2.12 Penggabungan histogram dari setiap blok.

Pada Gambar 2.12, nilai histogram akan dihitung berdasarkan letak grid (block cells).

Blok 1 merupakan block cells yang berisikan cell A16, A17, A26 dan A27, blok 2

merupakan block cells yang berisikan cell A17,A18,A27 dan A28. A17 dan A18 dihitung pada blok 1 dan blok 1, hal ini dikarenakan oleh overlapping block sebesar 50%, yang artinya setengah nilai cell blok pada blok sebelumnya tetap digunakan untuk menghitung setengah nilai cell blok di depannya. Maka masing-masing blok tersebut dihitung nilai histogramnya dan digabungkan berdasarkan blok yang telah dibentuk.

2.8. K-means Clustering

K-means bertujuan meminimalkan fungsi tujuan kuadrat kesalahan sederhana secara iteratif dalam bentuk (Salomon & Breckon, 2011):

𝑗 = ∑^𝑘_𝑗=1∑_{𝑎𝑙𝑙 𝑖} |𝑥_𝑖^𝑗− 𝑐^𝑗|², in class j (2.17)

Dimana 𝑐_𝑘 menyatakan koordinat vektor dari j^thkluster dan {𝑥_𝑖^𝑗} adalah point yang ditetapkan kepada j^thkluster. Tahapan algoritma k-means clustering dapat dilihat pada Gambar 2.13 (diadoptasi dari Salomon & Breckon, 2011):

Secara acak menempatkan k poin dalam ruang fitur. Ini adalah lokasi pusat (centroid) awal

kelas k

Menetapkan setiap titik untuk kelas yang letak centroidnya paling dekat

Hitung ulang centroid dari masing-masing kelas Apakah ada point yang berubah

kelasnya sejak iterasi sebelumnya? ^Tidak

Start

End

Gambar 2.13 Tahapan k-means clustering

Gambar 2.14 Algoritma k-means (diadoptasi dari Salomon & Breckon, 2011).

Penjelasan k-means clustering dapat di lihat pada gambar 2.14, dimana secara konseptual untuk mempartisi sebuah data set ke dalam beberapa jumlah kluster k. pada gambar tersebut ditetapkan k=2. Yang berarti menetapkan 2 centroid sebagai pusat pembedaan antara 2 kelas pada gambar tersebut. Penetapan data atau titik vector pada gambar 2.14 disekitar centroid, menggunakan fungsi jarak. Fungsi jarak yang digunakan pada umumnya adalah menggunakan jarak euclidean.

2.9. Support Vector Machine (SVM)

Support vector machine menggunakan pemetaan nonlinear untuk mengubah data pelatihan asli ke dimensi yang lebih tinggi. Dalam dimensi baru ini, akan mencari hyperplane pemisah optimal linear (yaitu, "batas keputusan" memisahkan data dari satu kelas dengan kelas yang lain). Dengan pemetaan nonlinear yang tepat untuk dimensi yang cukup tinggi, data dari dua kelas dipisahkan dengan hyperplane. SVM menemukan hyperplane ini menggunakan vektor dukungan (batas kelas) dan margin (didefinisikan oleh vektor dukungan) (Han & Kamber, 2006).

Support vector machine mencari jarak margin maximum dari hyperplane, untuk memisahkan 2 kelas yang berbeda. Support vector machine dapat dilustrasikan sebagai berikut :

Gambar 2.15 Support vector machine dan hyperplane (diadoptasi dari Han & Kamber, 2006).

bobot dapat disesuaikan sehingga hyperplane mendefinisikan sisi margin dari data training yang ada, formulasinya dapat ditulis sebagai berikut (Han & Kamber, 2006):

𝐻₁: 𝑤₀+ 𝑤₁𝑥₁+ 𝑤₂𝑥₂ ≥ +1 𝑓𝑜𝑟 𝑦_𝑖 = +1 , dan

Dalam dokumen MODIFIKASI SPEED-UP ROBUST FEATURE (SURF) DENGAN HISTOGRAM OF ORIENTED GRADIENT (HOG) PADA KLASIFIKASI CITRA BLUR (Halaman 18-0)