MODIFIKASI SPEED-UP ROBUST FEATURE (SURF) DENGAN HISTOGRAM OF ORIENTED GRADIENT (HOG)
PADA KLASIFIKASI CITRA BLUR
TESIS
MAHARDIKA ABDI PRAWIRA TANJUNG NIM: 147038071
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2017
MODIFIKASI SPEED-UP ROBUST FEATURE (SURF) DENGAN HISTOGRAM OF ORIENTED GRADIENT (HOG)
PADA KLASIFIKASI CITRA BLUR
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika
MAHARDIKA ABDI PRAWIRA TANJUNG NIM: 147038071
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2017
PENGESAHAN
Judul : MODIFIKASI SPEED-UP ROBUST FEATURE (SURF)
DENGAN HISTOGRAM OF ORIENTED GRADIENT (HOG) PADA KLASIFIKASI CITRA BLUR
Kategori : Tesis
Nama : Mahardika Abdi Prawira Tanjung
Nomor Induk Mahasiswa : 147038071
Program Studi : Magister (S2) Teknik Informatika
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
Komisi Pembimbing : Pembimbing 2
Drs. Mahyuddin K.M. Nasution, M.IT, Ph.D
Pembimbing 1
Prof. Dr. Opim Salim Sitompul, M.Sc
Diketahui/disetujui oleh
Program Studi S2 Teknik Informatika Ketua,
Prof. Dr. Muhammad Zarlis NIP. 19570701 198601 1 003
iii
PERNYATAAN
MODIFIKASI SPEED-UP ROBUST FEATURE (SURF) DENGAN HISTOGRAM OF ORIENTED GRADIENT (HOG)
PADA KLASIFIKASI CITRA BLUR
TESIS
Saya mengakui bahwa tesis ini asalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing teleh disebutkan sumbernya.
Medan, 15 Juni 2017
Mahardika Abdi Prawira Tanjung 147038071
PERSETUJUAN PUBLIKASI
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan dibawah ini :
Nama : Mahardika Abdi Prawira Tanjung
Nim : 147038071
Program Studi : Magister (S2) Teknik Informatika Jenis Karya Ilmiah : Tesis
Dengan pengembangan ilmu penetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royaliti Non-Eksklusif (Non-Exclusive Royality Free Right) atas tesis saya yang berjudul:
MODIFIKASI SPEED-UP ROBUST FEATURE (SURF) DENGAN HISTOGRAM OF ORIENTED GRADIENT (HOG)
PADA KLASIFIKASI CITRA BLUR
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royaliti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 15 Juni 2017
Mahardika Abdi Prawira Tanjung 147038071
v
Telah diuji pada Tanggal : 15 Juni 2017
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Opim Salim Sitompul, M.Sc
Anggota : 1. Drs. Mahyuddin K.M. Nasution, M.IT, Ph.D 2. Prof. Dr. Muhammad Zarlis
3. Dr. Zakarias Situmorang
RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap : Mahardika Abdi Prawira Tanjung, S.Kom Tempat dan Tanggal Lahir : Medan, 17-08-1989
Alamat Rumah : Jalan Sidorukun No. 104 Pulo Brayan Darat II Telepon/Faks/Hp : 081370383059/082126787259
E-mail : [email protected]
Instansi Tempat Bekerja : -
Alamat Kantor : -
DATA PENDIDIKAN
SD : SD IKAL Medan Pindah : 1995
SD : SD N Kedungturi Sidoarjo Jatim Pindah : 1998
SD : SD Pertiwi Medan TAMAT : 2001
SMP : SMP Negeri 11 Medan TAMAT : 2004
SMA : SMA Negeri 3 Medan TAMAT : 2007
S1 : Universitas Komputer Indonesia TAMAT : 2013 S2 : Universitas Sumatera Utara TAMAT : 2017
vii
UCAPAN TERIMA KASIH
Puji Syukur kami panjatkan kehadirat Allah SWT, yang telah melimpahkan rahmat dan hidayahNya, sehingga tesis ini dapat diselesaikan sesuai dengan harapan. Selanjutnya shalawat beserta salam kami kirimkan kepada nabi Muhammad SAW, semoga kelak kita mendapat syafa’at darinya di yaumil akhir. Dengan selesainya penulisan tesis ini izinkanlah kami untuk mengucapkan terima kasih kepada :
1. Rektor Universitas Sumatera Utara, Bapak Prof. Dr. Runtung Sitepu, SH, M.Hum atas kesempatan yang telah diberikan kepada penulis untuk dapat mengikuti dan menyelesaikan pendidikan Program Magister.
2. Dekan Fakultas Ilmu Komputer Universitas Sumatera Utara, Bapak Prof. Dr. Opim Salim Sitompul, M.Sc atas kesempatan yang telah diberikan kepada penulis untuk menjadi mahasiswa Program Magister Teknik Informatika pada Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara.
3. Ketua Program Studi Magister Teknik Informatika, Bapak Prof. Dr. Muhammad Zarlis.
Sekretaris Program Studi Teknik Informatika, Bapak Dr. Syahril Efendi, S.Si., M.IT Beserta seluruh Staf Pengajar Program Studi Magister Teknik Informatika Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara.
4. Bapak Prof. Dr. Opim Salim Sitompul, M.Sc, selaku Promotor/Pembimbing Utama dan Bapak Drs. Mahyuddin K.M. Nasution, M.IT, Ph.Dselaku Promotor/Pembimbing kedua yang dengan penuh ketelitian dalam membimbing penulis hingga selesainya tesis ini.
5. Bapak Prof. Dr. Muhammad Zarlis dan Dr. Zakarias Situmorang selaku pembanding yang telah memberikan saran dan masukan serta arahan untuk penyelesaian tesis ini.
6. Terima kasih yang tak terhingga penulis ucapkan kepada Ayahanda tercinta Mahzar Tanjung, S.H., M.M., yang selalu mendo’akan dan mengarahkan penulis ke dunia pendidikan, Ibunda tercinta Maryanna Waty, S.H., yang tak pernah henti memberikan cinta dan kasih sayang serta do’anya kepada penulis hingga penulis dapat menyelesaikan penelitian ini.
7. Staf dan Pegawai Pasca Sarjana S2 Teknik Informatika serta rekan mahasiswa/i Program Studi Magister Teknik Informatika Program Pascasarjana Fasilkom-TI Universitas Sumatera Utara, khususnya Kom C (2014) yang telah banyak membantu penulis selama perkuliahan dan penyelesaian tesis. Serta seluruh pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, sekali lagi terima kasih atas segala bantuan dan doa yang telah diberikan. Semoga kiranya Allah SWT membalas kebaikan yang telah diberikan.
Akhir kata, penulis berharap semoga penelitian ini bermanfaat bagi penulis khususnya dan pembaca pada umumnya serta bagi perkembangan ilmu pengetahuan khususnya dibidang ilmu komputer.
Medan, 15 Juni 2017 Penulis,
Mahardika Abdi Prawira NIM. 147038071
ix
ABSTRAK
Mata manusia dapat secara langsung membedakan objek-objek pada citra. Seperti hewan, tumbuhan ataupun benda-benda mati yang telah dikenali secara langsung oleh manusia.
Namun, komputer tidak memiliki kemampuan seperti mata manusia yang dapat langsung mengenali objek pada citra tersebut. Karena komputer hanya mengenali bilangan biner yaitu 0 dan 1. Bag of visual words merupakan suatu metode untuk mempresentasikan citra berdasarkan fitur lokal, dimana sebuah citra dapat diambil karakteristiknya, sehingga dapat membedakan objek-objek pada citra. Dalam prosesnya, Bag of visual words memiliki tahapan penentuan karakteristik yaitu interest point. Dalam penelitian ini, penentuan interest point dimodifikasi menggunakan speed-up robust feature dengan histogram of oriented gradients. Kinerja modifikasi tersebut menghasilkan akurasi yang konsisten dengan menggunakan 5 skala pendeteksian interest point.
Kata kunci : Citra, Bag of Visual Words, Interest Point, Speed-up Robust Feature, Histogram of Oriented Gradients.
MODIFICATION OF SPEED-UP ROBUST FEATURE (SURF) METHOD WITH HISTOGRAM OF ORIENTED GRADIENT (HOG) IN IMAGE BLUR
CLASSIFICATION
ABSTRACT
The human eye can directly distinguish objects from images. Such as animals, plants or inanimate objects that have been directly recognized by humans. However, the computer does not have the capability of such a human eye that can instantly recognize objects in the image. Because computers only recognize binary numbers 0 and 1. Bag of visual words is a method to present the image based on local features, where an image can be taken its characteristics, so as to distinguish the objects in the image. In the process, bag of visual words has the stages of determining the characteristics of the interest points. In this study, the determination of the interest point is modified using the speed-up robust feature with histogram of oriented gradients. Performance of these modifications generate consistent accuracy by using 5-scale detection of interest points.
Keywords: Image, Bag of Visual Words, Interest Point, Speed-up Robust Feature, Histogram of Oriented Gradients.
xi
DAFTAR ISI
HALAMAN JUDUL.. ... i
PENGESAHAN.... ... ii
PERNYATAAN ORISINALITAS.... ... iii
PERSETUJUAN PUBLIKASI... ... iv
RIWAYAT HIDUP... ... vi
UCAPAN TERIMA KASIH.... ... vii
ABSTRAK... ... ix
ABSTRACT... ... x
DAFTAR ISI ... xi
DAFTAR TABEL ... xiv
DAFTAR GAMBAR ... xv
BAB I PENDAHULUAN ... 1
1.1. Latar Belakang ... 1
1.2. Rumusan Masalah ... 3
1.3. Batasan Masalah ... 4
1.4. Tujuan Penelitian ... 4
1.5. Manfaat Penelitian... 4
BAB II TINJAUAN PUSTAKA ... 5
2.1. Pengolahan Citra ... 5
2.2. Distribusi pixel (Histogram) ... 5
2.3. Deteksi Tepi (Edge detection) ... 5
2.3.1 Turunan Pertama deteksi tepi (First-order derivative) ... 6
2.3.2 Turunan kedua deteksi tepi (Second-order derivative) ... 8
2.4. Bag of visual words ... 9
2.5. Deteksi skala (scale detection) ... 9
2.6. Deteksi fitur Speed-up Robust Feature (SURF) ... 11
2.7. Histogram of Oriented Gradient (HOG) ... 13
2.7.1 Konversi Citra Warna ke Citra Greyscale ... 14
2.7.2 Menghitung Gradien Pixel ... 14
2.7.3 Menghitung Kuantisasi Orientasi Biner dengan skala 9 bin (0-180) ... 15
2.7.4 Menggabungkan Histogram ... 16
2.8 K-means Clustering ... 17
2.9 Support Vector Machine (SVM) ... 18
2.10 Klasifikasi ... 19
BAB III METODOLOGI PENELITIAN ... 21
3.1. Alur Kerja Penelitian ... 21
3.2. Data dan Peralatan Yang Digunakan ... 22
3.3. Tahapan Modifikasi Speed-up Robust Feature dengan Histogram Of Oriented Gradient ... 22
3.4. Modifikasi Speed-up Robust Feature dengan Histogram of Oriented Gradient (HOG) ... 23
3.5 Pembentukan Bag of Visual Words ... 27
3.6 Ukuran Performansi ... 28
BAB IV HASIL DAN PEMBAHASAN ... 29
4.1. Hasil ... 29
4.1.1. Sampel pelatihan dan sampel pengujian ... 29
4.1.2. Hasil bag of feature ... 31
4.1.3. Hasil klasifikasi support vector machine ... 36
4.1.4. Modifikasi Speed-up Robust Feature dengan Histogram of Oriented Gradients ... 37
4.2. Pengujian Dengan Variasi Skala Speed-up Robust Feature ... 40
4.3. Pembahasan ... 47
BAB V KESIMPULAN DAN SARAN ... 48
5.1. Kesimpulan ... 48
5.2. Saran ... 48
xiii
DAFTAR PUSTAKA ... 49 LAMPIRAN ... ... 52
DAFTAR TABEL
Halaman
Tabel 3.1 Tabel Confusion Matrix ... 27
Tabel 4.1 Nilai index gambar 4.1 ... 32
Tabel 4.2 Nilai index gambar 4.2 ... 32
Tabel 4.3 Nilai index gambar 4.3 ... 35
Tabel 4.4 Nilai index gambar 4.4 ... 36
Tabel 4.5 Hasil Klasifikasi Support Vector Machine ... 37
Tabel 4.6 Koordinat gridX ... 38
Tabel 4.7 Koordinat gridY ... 38
Tabel 4.8 Pengujian klassifikasi pada trainingSet1 dengan menggunakan 3 skala deteksi ... 41
Tabel 4.9 Pengujian klassifikasi pada testingSet1 dengan menggunakan 3 skala deteksi ... 41
Tabel 4.10 Pengujian klassifikasi pada trainingSet1 dengan menggunakan 4 skala deteksi ... 41
Tabel 4.11 Pengujian klassifikasi pada testingSet1 dengan menggunakan 4 skala deteksi ... 41
Tabel 4.12 Pengujian klassifikasi pada trainingSet1 dengan menggunakan 5 skala deteksi ... 42
Tabel 4.13 Pengujian klassifikasi pada testingSet1 dengan menggunakan 5 skala deteksi ... 42
Tabel 4.14 Percobaan 1 Menggunakan 3 Skala Pendeteksian Interest Point ... 44
Tabel 4.15 Hasil Keseluruhan 10 Kali Pengujian Pada testingSet1 Sebelum di Modifikasi ... 45
Tabel 4.16 Hasil Keseluruhan 10 Kali Pengujian Pada testingSet1 Setelah di Modifikasi ... 45
xv
DAFTAR GAMBAR
Halaman
Gambar 1.1 Citra mobil dan rumah ... 1
Gambar 1.2 Citra rumah dan tumbuhan ... 1
Gambar 2.1 Ilustrasi tepi ideal dan tepi lereng pada citra (Marques, 2011). ... 6
Gambar 2.2 Turunan pertama deteksi tepi (Nixon & Aguado, 2008) ... 7
Gambar 2.3 Tahapan Bag of visual words (diadoptasi dari Raza et al. (2011) ... 9
Gambar 2.4 Titik karakteristik pada citra (Mikolajczyk & Schmid, 2001). ... 11
Gambar 2.5 Orde kedua gaussian yang terdiskrit dan dikelompokkan secara derivatif parsial dalam arah y dan arah xy, (diambil dari Bay et al. 2006) ... 12
Gambar 2.6 100 Interest point tertinggi yang diwakilkan dengan bulatan (blob) pada citra ... 13
Gambar 2.7 Tahapan Histogram of oriented gradient ... 13
Gambar 2.8 Gradien terpusat pada angka 0 ... 14
Gambar 2.9 Arah orientasi gradien ... 15
Gambar 2.10 Block grid dengan ukuran 2x2 dan overlapping sebesar 50% dari block sebelumnya ... 15
Gambar 2.11 Contoh tahap kuantisasi orientasi biner dengan skala 9 bin (0-180) . 16 Gambar 2.12 Penggabungan histogram dari setiap blok ... 16
Gambar 2.13 Tahapan k-means clustering ... 17
Gambar 2.14 Algoritma k-means (diadoptasi dari Salomon & Breckon, 2011). . ... 18
Gambar 2.15 Support vector machine dan hyperplane (diadoptasi dari Han & Kamber, 2006) ... 19
Gambar 2.16 Tahap pertama klasifikasi ... 20
Gambar 2.17 Tahap kedua klasifikasi ... 20
Gambar 3.1 Diagram Alur Kerja Penelitian ... 21
Gambar 3.2 Tahapan Modifikasi speed-up robust feature dengan histogram of oriented gradient pada skema bag of visual word untuk klassifikasi citra blur ... 23
Gambar 3.3 Pendeteksian interest point dengan speed-up robust feature ... 24
Gambar 3.4 Grid x dan y pada speed-up robust feature mendeteksi fitur dengan membentuk bulatan kecil (blob) terhadap citra ... 25
Gambar 3.5 Histogram of oriented gradient membentuk cell blok pada citra dan menghitung gradien citra sebagai pendeteksian fitur ... 25
Gambar 3.6 Modifkasi Speed-up robust feature dengan Histogram of oriented gradient ... 26
Gambar 3.7 Histogram Feature Vector bag1 dengan K= 500 atau disebut dengan codebook ... 27
Gambar 4.1 Citra 8.jpg pada kategori average blur ... 29
Gambar 4.2 Citra 8.jpg pada kategori citra non blur ... 30
Gambar 4.3 Citra 8.jpg pada kategori gaussian blur... 30
Gambar 4.4 Citra 8.jpg pada kategori motion blur ... 30
Gambar 4.5 Bag of Feature TrainingSet1 ... 31
Gambar 4.6 Koordinat deteksi interest point ... 39
Gambar 4.7 Hasil pendeteksian speed-up robust feature dengan menggunakan 3 skala ... 39
Gambar 4.8 Ekstraksi Histogram of Oriented Gradients ... 40
Gambar 4.9 Bag of Visual Word yang dibentuk ... 43
Gambar 4.10 Hasil Klasifikasi Citra Blur Sebelum Modifikasi ... 46
Gambar 4.11 Hasil Klasifikasi Citra Blur Setelah Modifikasi ... 46
BAB 1 PENDAHULUAN
1.1 Latar Belakang Masalah
Bag of visual words merupakan suatu metode untuk mempresentasikan citra berdasarkan fitur lokal (Farhangi et al. 2013). Bag of visual words memaparkan bagaimana sebuah citra dapat diambil karakteristiknya. Setiap citra mempunyai karakteristik tertentu dalam nilai pixelnya, seperti contoh pada Gambar 1.1 dan Gambar 1.2 berupa citra mobil dan objek- objek lainnya. Secara kasat manusia dapat membedakan bahwa pada citra tersebut terdapat mobil dan objek lainnya, seperti tumbuhan, tanah dan rumah yang terdapat pada citra tersebut. Namun, komputer tidak memiliki kemampuan seperti mata manusia yang dapat langsung membedakan objek pada citra tersebut. Karena komputer hanya mengenali bilangan biner yaitu 0 dan 1. Untuk itu bag of visual words dapat digunakan untuk mengambil nilai-nilai pixel pada citra tersebut sebagai ciri karakteristik dalam membedakan objek-objek pada citra tersebut.
Tahapan bag of visual words dimulai dengan ekstraksi fitur lokal dari citra, ekstraksi fitur lokal pada bag of visual words terbagi menjadi 2 bagian, yaitu penentuan interest point detector dan interest point descriptor (Shuka et al. 2013). Ekstraksi fitur merupakan suatu
Gambar 1.1 Citra mobil dan rumah
Gambar 1.2 Citra rumah dan tumbuhan
proses seleksi informasi pada citra yang dinginkan, baik bentuk, warna, maupun sudut objek pada citra dengan menggunakan metode tertentu (Nixon & Aguado, 2008). Ekstraksi fitur adalah tahap pre-processing yang penting dalam klassifikasi, untuk menentukan ciri (feature) dari sebuah dataset yang akan diklassifikasikan. Secara teori, seleksi fitur dapat meminimalisasi tingkat error klassifikasi dan jumlah fitur untuk menjadi acuan pengetahuan klassifikasi (Han & Kamber, 2006).
Pada ekstrasi fitur lokal ini telah dikembangkan beberapa metode diantaranya menggunakan menggunakan Haris detector (Harris & Stephens, 1988), grid regular yang mensegmentasikan citra dengan garis horizontal dan vertikal untuk mendapatkan area local blur (Sivic, 2003.), scale invariant feature transform (Lowe, 2004), speed-up robust feature (Bay et al. 2006) dan variabel fitur persegi panjang berdasarkan area lokal blur (Khrisnamoorthy & Punidha, 2012). Scale invariant feature transform dan speed-up robust feature lebih sering digunakan sebagai interest point detector dan interest point descriptor pada skema bag of visual words, seperti yang dilakukan oleh Raza et al. 2011 dan Shukla et al. 2013. Hal ini disebabkan penggunaan rotasi invarian dan skala invarian dalam penentuan fitur pada citra yang dapat meningkatkan kecepatan komputasi dan akurasi klasifikasi citra. Namun ditemukan kekurangan dalam kedua metode tersebut, yaitu sulit menentukan interest point pada intensitas citra yang terdegradasi.
Dalam image processing, citra merupakan istilah lain untuk gambar yang merupakan bentuk informasi visual (Szelizki, 2011). Namun dalam perolehan data, citra yang didapat tidak selalu dalam kondisi yang berkualitas. Dapat terjadi suatu kesalahan atau keterbasan alat yang menyebabkan citra tidak berkualitas. Maka tidak jarang citra yang didapat terkadang tidak terlihat jelas, dikarenakan oleh noise atau blur di dalam citra tersebut. Citra yang blur merupakan citra yang tidak dikenali secara jelas, dikarenakan terjadi degradasi di dalam citra tersebut (Gonzalez & Woods, 2008).
Blur terbagi dalam beberapa jenis, diantaranya; average blur, motion blur, Gaussian blur, dan out of focus blur. Average Blur adalah jenis blur yang terdapat di seluruh permukaan gambar baik secara vertical maupun horizontal. Motion Blur adalah jenis blur yang terjadi karena pergerakan saat menangkap suatu citra. Gaussian blur adalah jenis blur yang terjadi dalam sisi interior dan eksterior pada tepi citra. Out of focus blur adalah jenis
3
blur yang terjadi ketika pengguna foto mengambil gambar dengan kamera, dan tiba-tiba gambar mendapat blur (Vignesh & Sivabalakrishnan, 2015).
Penelitian sebelumnya mengenai citra blur, berfokus terhadap prediksi model degradasi citra untuk mengklasifikasikan daerah blur pada citra. Seperti yang dilakukan oleh Tiwari et al. (2014) menggunakan wavelet transform untuk menemukan pola frekuensi blur pada citra sebagai fitur tekstur untuk klassifikasi citra blur. Sedangkan Suta & Vaida (2012) menggunakan deteksi tepi berdasarkan 3 tipe tepi yang berbeda pada citra yaitu dirac- sturucture egde, roof-structure edge dan step-structure edge untuk memprediksi daerah blur pada citra. Model degradasi citra menentukan prediksi dalam klassifikasi tekstur citra yang blur dimana proses ini akan menentukan keakuratan pada proses klassifikasi citra blur (Corburn, 2002).
Rassem & Khoo, 2015. menganalisa histogram of oriented gradient lebih stabil dalam mengenali perubahan pola tekstur pencahayaan dan degradasi citra dibandingkan metode lain yang menggunakan pixel sebagai interest point. Kelebihan histogram of oriented gradient ini berkaitan dengan speed-up robust feature, dimana speed-up robust feature menggunakan pixel untuk menentukan interest point (Bay et al. 2006). Karena histogram of oriented gradient menghitung gradient vertical dan horizontal yang terpusat (Dalal &
Triggs, 2005), yang dapat mendeteksi nilai intensitas pada citra.
Berdasarkan penelitian yang sudah pernah dilakukan oleh penulis lain dan dari uraian pada paragraf-paragraf diatas, diperlukan suatu modifikasi metode feature extractor speed- up robust feature dalam skema bag of visual words pada klassifikasi citra blur. Untuk itu penulis tertarik melakukan penelitian modifikasi metode speed-up robust feature dalam skema bag of visual words pada klassifikasi citra blur.
1.2. Perumusan Masalah
Dalam skema bag of visual words, speed-up robust feature memiliki kelemahan dalam menentukan interest point pada citra yang terdegradasi. Pada penelitian sebelumnya, histogram of oriented gradients mampu mengenali perubahan pola tekstur pencahayaan dan degradasi citra dibandingkan dengan metode lain yang menggunakan pixel sebagai interest point. Untuk itu perlu dilakukan penelitian modifikasi metode speed-up robust
feature dengan mengambil beberapa kelebihan metode histogram of oriented gradients dalam penentuan interest point pada citra yang terdegradasi.
1.3. Batasan Masalah
Karena keterbatasan waktu,sumber daya, dana dan kemampuan keilmuan penulis, maka dalam penelitian ini hanya akan dilakukan hal-hal sebagai berikut:
a. Resolusi citra yang digunakan adalah 640 width x 480 height pixel.
b. Penelitian menggunakan sumber daya berbasis opensource yang tidak melanggar hak cipta (license).
c. Menggunakan Support Vector Machine sebagai klassifier
1.4. Tujuan Penelitian
Penelitian ini bertujuan untuk menentukan interest point guna mengklasifikasi citra blur dengan menggunakan modifikasi metode speed-up robust feature dalam skema bag of visual words.
1.5. Manfaat Penelitian
Manfaat penelitian ini adalah untuk memperoleh cara baru dalam pendeteksian blur pada citra
BAB 2
TINJAUAN PUSTAKA
2.1 Pengolahan Citra
Pengolahan Citra Digital adalah teknologi menerapkan sejumlah algoritma komputer untuk memproses gambar digital. Hasil dari proses ini dapat berupa gambar atau suatu set perwakilan karakteristik atau properti dari gambar asli. Tujuan utama dari pengolahan citra digital adalah untuk memungkinkan manusia untuk mendapatkan gambar berkualitas tinggi atau karakteristik deskriptif dari gambar asli (Zhou et al. 2010).
2.2 Distribusi pixel (Histogram)
Sebuah histogram citra adalah alur dari frekuensi relatif dari peristiwa masing-masing nilai pixel yang diizinkan pada citra terhadap nilai-nilai itu sendiri (Salomon & Breckon, 2011).
Jika kita menormalkan sebuah alur frekuensi, sehingga total jumlah semua entri frekuensi selama rentang yang diperbolehkan adalah satu, kita dapat memperlakukan histogram citra sebagai fungsi probabilitas diskrit kepadatan yang mendefinisikan kemungkinan nilai pixel yang terjadi di dalam citra.
Histogram memberikan deskripsi global utama dalam citra (Acharya & Ray, 2005).
Sebagai contoh histogram citra greyscale, jika histogram citra sempit, maka dapat diartikan bahwa citra terlihat kurang baik (secara visual) karena perbedaan level grey yang ada pada citra umumnya rendah. Sedangkan jika histogram citra lebar, maka dapat diartikan hampir semua level grey, kontras dan visibilitas citra meningkat.
2.3 Deteksi Tepi (Edge detection)
Tepi atau edge dapat didefinisikan sebagai batas antara dua wilayah pada citra yang memiliki karakteristik berbeda berdasarkan beberapa fitur (misalnya tingkat abu-abu,
warna dan tekstur) (Marques, 2011). Seperti pada citra greyscale , yang biasanya berhubungan dengan variasi yang tajam dari intensitas di bagian citra. Gambar 2.1 mengilustrasikan konsep ini dan menunjukkan perbedaan antara tepi ideal (transisi tajam) dan tepi lereng (transisi bertahap antara daerah gelap dan terang pada citra).
Deteksi tepi biasanya bergantung pada perhitungan turunan pertama atau kedua sepanjang tampilan intensitas citra (Marques, 2011). Turunan pertama memiliki sifat berbanding lurus dengan perbedaan intensitas di tepi, sehingga turunan pertama dapat digunakan untuk mendeteksi keberadaan tepi pada titik tertentu dalam citra. Turunan kedua dapat digunakan untuk menentukan apakah pixel terletak pada sisi gelap atau terang pada tepi. Selain itu persimpangan nol antara puncak positif dan negatif dapat digunakan untuk menemukan pusat pada tepi yang tebal. Berikut adalah ilustrasi tepi :
Gambar 2.1 Ilustrasi tepi ideal dan tepi lereng pada citra (Marques, 2011).
2.3.1 Turunan Pertama deteksi tepi (First-order derivative)
Pada dasarnya, batas suatu objek adalah langkah perubahan dalam tingkat intensitas. Untuk mendeteksi posisi tepi dapat digunakan diferensiasi ordo pertama, diferensiasi ordo pertama tidak memberikan respon ketika diterapkan pada perubahan intensitas yang tidak berubah, sebuah perubahan intensitas dapat diungkapkan oleh perbedaan titik yang berdekatan (Nixon & Aguado, 2008).
Perbedaan perhitungan titik horizontal yang berdekatan akan mendeteksi perubahan vertikal dalam intensitas dan sering disebut detektor-tepi horizontal berdasarkan perlakuannya. Sebuah operator horizontal tidak akan muncul pada perubahan intensitas
7
horizontal karena perbedaannya adalah nol. Ketika diterapkan pada citra 𝑃 aksi detector- tepi horizontal membentuk perbedaan antara dua titik horizontal yang berdekatan, seperti mendeteksi tepi vertikal , 𝐸𝑥, seperti berikut: (Nixon & Aguado, 2008)
𝐸𝑥𝑥,𝑦= |𝑃𝑥,𝑦− 𝑃𝑥+1,𝑦| ∀𝑥 ∈ 1, 𝑁 − 1; 𝑦 ∈ 1, 𝑁 (2.1)
untuk mendeteksi tepi horizontal dibutuhkan detektor-tepi vertikal yang membedakan poin vertikal yang berdekatan. Hal ini akan menentukan perubahan intensitas horizontal, tetapi tidak yang vertikal, sehingga detektor-tepi vertikal mendeteksi tepi horisontal, 𝐸𝑦, seperti berikut:
𝐸𝑦𝑥,𝑦 = |𝑃𝑥,𝑦− 𝑃𝑥,𝑦+1| ∀𝑥 ∈ 1, 𝑁; 𝑦 ∈ 1, 𝑁 − 1 (2.2)
gambar 2.2 (b) dan (c) menampilkan aplikasi operator vertikal dan horizontal pada citra persegi pada gambar 2.2 (a).
Gambar 2.2 Turunan pertama deteksi tepi (Nixon & Aguado, 2008).
tepi kiri vertikal pada gambar 2.2 (b) muncul pada samping persegi (citra asli) yang disebabkan oleh proses diferensiasi. Demikian juga dengan tepi atas pada gambar 2.2(c) muncul diatas persegi (citra asli).
Mengkombinasikan kedua operator E yang dapat mendeteksi tepi vertikal dan horizontal secara bersamaan, yaitu,
𝐸𝑥,𝑦= |𝑃𝑥,𝑦− 𝑃𝑥+1,𝑦 + 𝑃𝑥,𝑦− 𝑃𝑥,𝑦+1| ∀𝑥, 𝑦 ∈ 1, 𝑁 − 1 (2.3)
menghasilkan
𝐸𝑥,𝑦= |2 𝑥 𝑃𝑥,𝑦− 𝑃𝑥+1,𝑦 − 𝑃𝑥,𝑦+1| ∀𝑥, 𝑦 ∈ 1, 𝑁 − 1 (2.4)
persamaan 2.4 memberikan koefisien diferensiasi yang dapat konvolusikan dengan gambar untuk mendeteksi semua poin tepi, seperti yang ditunjukkan pada gambar 2.2 (d). Titik cerah di sudut kanan bawah dari tepi pada Gambar 2.2 (d) jauh lebih terang dari titik-titik lainnya. Hal ini karena itu adalah satu-satunya titik yang dideteksi sebagai tepi oleh kedua operator vertikal dan horizontal dan karena itu jauh lebih terang dari titik tepi lainnya.
Sebaliknya, titik sudut kiri atas tidak terdeteksi oleh kedua operator sehingga tidak muncul di gambar 2.2 (d).
2.3.2 Turunan kedua deteksi tepi (Second-order derivative)
Prinsip deteksi tepi berdasarkan turunan kedua adalah hanya untuk mendeteksi titik tepi yang memiliki maxima lokal dalam nilai-nilai gradien (Acharya & Ray, 2005). Dalam hal ini, kita mendapatkan puncak di turunan pertama dan persimpangan nol pada turunan kedua pada titik-titik tepi. Oleh karena itu titik di mana turunan kedua memiliki persimpangan nol diperlakukan sebagai titik tepi. Operator Laplacian adalah operator tepi yang paling umum digunakan turunan kedua deteksi tepi. Dimana laplacian dari sebuah citra 𝑓(𝑥, 𝑦) dapat dirumuskan sebagai berikut : (Acharya & Ray, 2005)
9
∇2(𝑥, 𝑦) = 𝜕2(𝑥,𝑦)
𝜕𝑥2 + 𝜕2(𝑥,𝑦)
𝜕𝑦2 (2.5)
Dimana turunan kedua deteksi tepi :
𝜕2(𝑥,𝑦)
𝜕𝑥2 = 𝑓(𝑥 + 1, 𝑦) + 𝑓(𝑥 − 1, 𝑦) − 2𝑓(𝑥, 𝑦) (2.6) Dan
𝜕2(𝑥,𝑦)
𝜕𝑦2 = 𝑓(𝑥, 𝑦 + 1) + 𝑓(𝑥, 𝑦 − 1) − 2𝑓(𝑥, 𝑦) (2.7)
yang menghasilkan ekspresi laplacian yang dinyatakan sebagai jumlah produk :
∇2(𝑥, 𝑦) = 𝑓(𝑥 + 1, 𝑦) + 𝑓(𝑥 − 1, 𝑦) + 𝑓(𝑥, 𝑦 − 1) − 4𝑓(𝑥, 𝑦) (2.8)
2.4 Bag of visual words
Bag of words merupakan suatu skema yang digunakan untuk kategorisasi teks dan pencarian teks. Dalam penelitian ini bag of words digunakan untuk pembangunan codebook, yaitu kosakata visual dimana pola yang paling representative (codified) di dalam codebook sebagai kosakata visual. Kemudian representasi gambar yang dihasilkan melalui analisis frekuensi sederhana setiap codeword dalam citra. Representasi ini telah digunakan dalam berbagai jenis klassifikasi citra diantaranya dalam penelitian Cruz-Roa et al. (2009) menganalisis pola visual histopathology menggunakan bag of word. Penelitian tersebut mengidentifikasi koleksi citra menggunakan bag of word yang berhubungan dengan konsep semantik gambar histopatologi. Raza et al. (2011) menganalisis pengaruh skala dan rotasi invariant descriptor dalam skema bag of word.
Terdapat tiga langkah utama dalam skema bag of word, diantaranya adalah deteksi fitur dan deskrispi citra, cluster fitur, dan pembangunan kantong fitur (bag of feature). Gambar 2.3 akan menunjukkan langkah-langkah bag of visual words:
Citra Keabuan (Grayscale) Deteksi Interest Point Menggunakan Speed-Up Robust Feature
Ekstraksi Interest Point meggunakan Speed-Up Robust Feature
Penentuan Cluster pada fitur dengan nilai k yang telah ditentukan Histogram Feature Vector
Citra Blur
Bag of Visual Words
Gambar 2.3 Tahapan Bag of visual words (diadoptasi dari Raza et al. (2011).
2.5 Deteksi skala (scale detection)
Representasi ruang skala adalah serangkaian citra yang diwakili pada tingkat resolusi yang berbeda (Mikolajczyk & Schmid, 2001). Resolusi yang berbeda dibentuk dengan konvolusi menggunakan kernel Gaussian (Mikolajczyk & Schmid, 2001):
𝐿(𝑥, 𝑠) = 𝐺(𝑠) ∗ 𝐼(𝑥) (2.9)
dimana I adalah citra dan x = (x,y). Dengan demikian dapat direpresentasikan fitur (seperti tepi atau sudut) pada resolusi yang berbeda dengan menerapkan fungsi yang sesuai (kombinasi turunan) pada skala yang berbeda.
Derivatif Amplitudo spasial, secara umum, menurun berdasarkan skala. Dalam kasus bentuk invarian skala, derivatif harus konstan atas skala. Untuk mempertahankan nilai invarian fungsi skala turunan harus dinormalisasi sehubungan dengan observasi skala.
Skala yang dinormalisasikan derivatif D atas orde m didefenisikan sebagai berikut (Mikolajczyk & Schmid, 2001):
𝐷𝑖1…….𝑖𝑚 = 𝑠𝑚 𝐿𝑖1…….𝑖𝑚(𝑥, 𝑠) = 𝑠𝑚 𝐺𝑖1…….𝑖𝑚(𝑠) ∗ 𝐼(𝑥) (2.10)
Derivatif yang dinormalisasi berjalan baik pada skala pola intensitas. Pertimbangkan dua gambar dan dicitrakan pada skala yang berbeda. Hubungan antara dua gambar ini kemudian didefinisikan 𝐼(𝑥) = 𝐼′(𝑥′), dimana 𝑥′ = 𝑡𝑥. Derivatif citra kemudian terkait sebagai berikut (Mikolajczyk & Schmid, 2001):
𝑠𝑚 𝐺𝑖1…….𝑖𝑚(𝑠) ∗ 𝐼(𝑥) = 𝑡𝑚𝑠𝑚𝐺𝑖1…….𝑖𝑚(𝑡𝑠) ∗ 𝐼(𝑥′) (2.11)
kemudian untuk derivatif yang dinormalisasikan, didapatkan : (Mikolajczyk & Schmid, 2001)
𝐷𝑖1……𝑚(𝑥, 𝑠) = 𝐷′𝑖1……𝑚(𝑥, 𝑡𝑠) (2.12)
Dengan nilai-nilai yang sama diperoleh pada skala relatif yang sesuai. Untuk menjaga perubahan informasi yang seragam antara tingkat resolusi yang berurut dan factor skala harus didistribusikan secara eksponensial.
Gambar 2.4 menampilkan titik-titik pada citra yang menampilkan seleksi skala yang memungkinkan (citra hitam putih). Titik-titik hitam adalah point untuk fungsi laplacian
11
yang tidak mempunyai nilai maximum. Titik-titik ini terletak pada daerah yang homogen dan tidak mempunyai nilai maximum dalam jangkauan jarak yang dianggap dalam skala.
Skala yang dipilih untuk titik adalah benar jika rasio antara skala karakteristik dalam poin yang sesuai adalah sama dengan faktor skala dalam citra. Titik yang sesuai ditentukan oleh proyeksi dengan perkiraan transformasi matrik. Dalam beberapa kasus skala maxima, titik dianggap benar, jika salah satu dari maxima sesuai dengan rasio yang benar. Titik dengan skala yang benar ditampilkan dalam titik putih.
Gambar 2.4 Titik karakteristik pada citra (Mikolajczyk & Schmid, 2001).
2.6 Deteksi fitur Speed-up Robust Feature (SURF)
Untuk mendeteksi fitur pada citra, digunakan SURF dalam bag of visual words. SURF mengambil interest point pada citra, dimana interest point ini adalah deskripsi pada setiap bagian citra.
Penentuan interest point SURF feature menggunakan matrix hessian, dimana matrix hessian didefenisikan sebagai berikut: (Bay et al. 2006).
𝐻(𝑋, 𝜎) = [𝐿𝑥𝑥(𝑋, 𝜎) 𝐿𝑥𝑦(𝑋, 𝜎)
𝐿𝑥𝑦(𝑋, 𝜎) 𝐿𝑦𝑦(𝑋, 𝜎) ] (2.13)
dimana 𝐿𝑥𝑥(𝑋, 𝜎) = 𝜕2𝑔(𝜎)/ 𝜕2𝑥 adalah konvolusi dari orde kedua derivatif Gaussian dengan input citra pada point 𝑋 = (𝑥, 𝑦), dan serupa untuk 𝐿𝑦𝑦(𝑋, 𝜎) (Bay et al. 2006).
Dengan menggunakan perkiraan orde kedua derivative Gaussian dapat dievaluasi dengan
sangat cepat menggunakan citra yang dintegralkan. Seperti yang ditunjukkan pada gambar 2.5 dengan menggunakan filter kotak 9x9 memperkirakan orde kedua derivative Gaussian dengan skala (𝜎=1.2) .
Gambar 2.5 Orde kedua gaussian yang terdiskrit dan dikelompokkan secara derivatif parsial dalam arah y dan arah xy, (diambil dari Bay et al. 2006).
Dengan pendekatan perkiraan adalah 𝐷𝑥𝑥, 𝐷𝑦𝑦, dan 𝐷𝑥𝑦, dimana determinan hessian (diambil dari Bay et al. 2006)
|𝐿𝑥𝑦(1,2)|𝐹||𝐷𝑥𝑥(9)|𝐹
|𝐿𝑥𝑥(1,2)|𝐹||𝐷𝑥𝑦(9)|𝐹=0.912..≅0.9, (2.14)
dimana ||𝑥|𝐹 adalah norma frobenius yang menghasilkan (diambil dari Bay et al. 2006)
𝐷𝑒𝑡(𝐻𝑎𝑝𝑝𝑟𝑜𝑥) = 𝐷𝑥𝑥𝐷𝑦𝑦 − (0.9)𝐷𝑥𝑦)2 (2.15)
Penentuan skala deteksi SURF ditentukan dengan filter yang digunakan, skala dasar SURF menggunakan filter 9x9 dengan 𝜎=1.2 . Dengan menggunakan kotak filter dan citra integral, SURF tidak harus menggunakan filter yang sama ke output secara iteratif, SURF dapat menggunakan filter dengan ukuran berapapun dengan kecepatan yang sama terhadap citra asli dan bahkan secara parallel (Bay et al. 2006). Dengan itu SURF merupakan multiscale detector, dimana menggunakan 4 skala terhadap deteksi interest point pada citra dengan skala yang digunakan adalah 1.6, 3.2, 4.8 dan 6.4. Penentuan interest point diwakilkan dalam bentuk lingkaran kecil (blob), seperti berikut :
13
Gambar 2.6 100 Interest point tertinggi yang diwakilkan dengan bulatan (blob) pada citra.
Pada gambar 2.6 memperlihatkan deteksi dengan menggunakan 4 skala, dimana bulatan terkecil menunjukkan pendeteksian pada skala yang terkecil yaitu 1.6. pendeteksian ini merupakan pendeteksian fitur pada citra dengan menggunakan skala invarian, seperti yang dijelaskan pada bagian 2.5.
2.7 Histogram of Oriented Gradient (HOG)
Metode histogram of oriented gradient didasarkan pada evaluasi histogram lokal yang dinormalisasi dari orientasi gradien gambar dalam grid (Dalal & Triggs, 2005).Tahapan histogram of orientated gradient dapat digambarkan seperti berikut:
Hitung Kuantisasi Orientasi Gradien Dengan Skala 9 Biner
Gabungkan Histogram Konversi ke Citra Grayscale
Hitung Gradien Pixel Citra Blur
Fitur Histogram of Oriented Gradient
Gambar 2.7 Tahapan Histogram of oriented gradient
2.7.1. Konversi Citra Warna ke Citra Greyscale
Konversi greyscale merupakan tahap pertama dalam banyak algoritma analisis citra.
Walaupun citra greyscale memuat informasi yang lebih sedikit dibandingkan dengan citra warna, mayoritas penting pada citra tetap terjaga. Seperti tepi, region, dan gumpalan citra tetap ada.
Citra RGB dikonversikan ke citra greyscale menggunakan transformasi berikut:
(Salomon & Breckon. 2011)
𝐼𝑔𝑟𝑒𝑦−𝑠𝑐𝑎𝑙𝑒(𝑛, 𝑚) = 𝛼 𝐼𝑐𝑜𝑙𝑜𝑢𝑟(𝑛, 𝑚, 𝑟) + 𝛽𝐼𝑐𝑜𝑙𝑜𝑢𝑟(𝑛, 𝑚, 𝑔) + 𝛾𝐼𝑐𝑜𝑙𝑜𝑢𝑟(𝑛, 𝑚, 𝑏) (2.16)
dimana (n,m) individual index pixel dari citra greyscale dan (n,m,c) adalah individual chanel pada lokasi pixel (n,m) pada citra warna untuk chanel c, merah untuk chanel r, biru chanel b, dan hijau chanel g. dengan koefisien standar NTSC 𝛼=0.2989, 𝛽=0.587 dan 𝛾=0.1140.
2.7.2. Menghitung Gradien Pixel
Setelah citra blur dikonversikan menjadi citra greyscale, maka akan dihitung gradien secara vertical dan horizontal (memusatkan). Lalu akan dihitung arah sudut dengan membagi citra menjadi region yang lebih kecil (“cells"). Pada gambar 2.8 akan ditunjukkan tahap penentuan nilai gradien, dimana gradien dihitung secara vertikal dan horizontal dengan penentuan arah yang ditunjukkan pada gambar 2.9. Kemudian gradien akan dihitung satu- persatu dengan menggunakan cell block (grid) dengan memindahkan grid secara overlapping seperti yang ditunjukkan pada gambar 2.10. Tahap perhitungannya adalah seperti berikut (diadoptasi dari Dalal & Triggs, 2005):
Gradien vertical dan horizontal :
-1 0 1
-1 0 1
Gambar 2.8 Gradien terpusat pada angka 0
15
Derajat : 𝑠 = √𝑠𝑥2+ 𝑠𝑦2
Orientasi: 𝜃 = 𝑎𝑟𝑐𝑡𝑎𝑛 (𝑠𝑦
𝑠𝑥)
Gambar 2.9 Arah orientasi gradien
Untuk menentukan pixel mana yang harus dihitung, HOG menggunakan cells block dan overlapping terhadap citra, tahapannya dapat digambarkan sebagai berikut:
A11 A12 A13 A14
A21 A22 A23 A24
A15 A16 A17 A18 A25 A26 A27 A28 Block
A12 A13
A22 A23
Overlapping Block
Cells
A11 A12 A13 A14 A21 A22 A23 A24
A15 A16 A17 A18 A25 A26 A27 A28 A31 A32 A33 A34
A41 A42 A43 A44
A35 A36 A37 A38 A45 A46 A47 A48 A51 A52 A53 A54
A61 A62 A63 A64
A55 A56 A57 A58 A65 A66 A67 A68
Ukuran Citra 640x480
Gambar 2.10 Block grid dengan ukuran 2x2 dan overlapping sebesar 50% dari block sebelumnya.
2.7.3. Menghitung Kuantisasi Orientasi Biner dengan skala 9 bin (0-180)
Tahap selanjutnya dalam Histogram of oriented gradient adalah mengkuantisasi orientasi gradient dalam skala 9 bin (0-180) dengan menggunakan interpolasi trilinear (lihat Gambar 2.11). Metode interpolasi trilinear diterapkan untuk memilih sel spasial dan orientasi yang menemukan perbedaan bin tetangga terdekat dan menghasilkan rasio sesuai dengan bin terdekat, sehingga 9 bin digunakan dengan benar. Jadi jika dimisalkan 𝜃=85 maka jarak ke bin terpusat adalah bin 70 dan bin 90 maka derajat 5 dan 15 menghasilkan rasio 5
20=1
4, 15
20
= 3
4, maka 𝜃=85 digolongkan kepada 𝜃=90, dapat diilustrasikan sebagai berikut (diadoptasi dari Dalal & Triggs, 2005):
10 30 50 70 90 110 130 150 170
85
1/4 3/4
Gambar 2.11 Contoh tahap kuantisasi orientasi biner dengan skala 9 bin (0-180)
2.7.4. Menggabungkan Histogram
Hasil perhitungan kuantisasi pada tiap blok yang dibentuk, akan digabungkan untuk menghasilkan histogram setiap cell pada blok. Tahap penggabungan histogram dapat digambarkan sebagai berikut (diadoptasi dari Dalal & Triggs, 2005):
A17 A18 A27 A28
Blok 1 Blok 2 ... Blok N
H(a16) H(a26) H(a17) H(a27) A16
A26
H(a16) H(a26) H(a17) H(a27) H(a17) H(a27) H(a18) H(a28)
Blok 1 Blok 2
HOG Blok 2x2 cell
Gambar 2.12 Penggabungan histogram dari setiap blok.
Pada Gambar 2.12, nilai histogram akan dihitung berdasarkan letak grid (block cells).
Blok 1 merupakan block cells yang berisikan cell A16, A17, A26 dan A27, blok 2
17
merupakan block cells yang berisikan cell A17,A18,A27 dan A28. A17 dan A18 dihitung pada blok 1 dan blok 1, hal ini dikarenakan oleh overlapping block sebesar 50%, yang artinya setengah nilai cell blok pada blok sebelumnya tetap digunakan untuk menghitung setengah nilai cell blok di depannya. Maka masing-masing blok tersebut dihitung nilai histogramnya dan digabungkan berdasarkan blok yang telah dibentuk.
2.8. K-means Clustering
K-means bertujuan meminimalkan fungsi tujuan kuadrat kesalahan sederhana secara iteratif dalam bentuk (Salomon & Breckon, 2011):
𝑗 = ∑𝑘𝑗=1∑𝑎𝑙𝑙 𝑖 |𝑥𝑖𝑗− 𝑐𝑗|2, in class j (2.17)
Dimana 𝑐𝑘 menyatakan koordinat vektor dari jth kluster dan {𝑥𝑖𝑗} adalah point yang ditetapkan kepada jth kluster. Tahapan algoritma k-means clustering dapat dilihat pada Gambar 2.13 (diadoptasi dari Salomon & Breckon, 2011):
Secara acak menempatkan k poin dalam ruang fitur. Ini adalah lokasi pusat (centroid) awal
kelas k
Menetapkan setiap titik untuk kelas yang letak centroidnya paling dekat
Hitung ulang centroid dari masing-masing kelas Apakah ada point yang berubah
kelasnya sejak iterasi sebelumnya? Tidak
Ya
Start
End
Gambar 2.13 Tahapan k-means clustering
Gambar 2.14 Algoritma k-means (diadoptasi dari Salomon & Breckon, 2011).
Penjelasan k-means clustering dapat di lihat pada gambar 2.14, dimana secara konseptual untuk mempartisi sebuah data set ke dalam beberapa jumlah kluster k. pada gambar tersebut ditetapkan k=2. Yang berarti menetapkan 2 centroid sebagai pusat pembedaan antara 2 kelas pada gambar tersebut. Penetapan data atau titik vector pada gambar 2.14 disekitar centroid, menggunakan fungsi jarak. Fungsi jarak yang digunakan pada umumnya adalah menggunakan jarak euclidean.
2.9. Support Vector Machine (SVM)
Support vector machine menggunakan pemetaan nonlinear untuk mengubah data pelatihan asli ke dimensi yang lebih tinggi. Dalam dimensi baru ini, akan mencari hyperplane pemisah optimal linear (yaitu, "batas keputusan" memisahkan data dari satu kelas dengan kelas yang lain). Dengan pemetaan nonlinear yang tepat untuk dimensi yang cukup tinggi, data dari dua kelas dipisahkan dengan hyperplane. SVM menemukan hyperplane ini menggunakan vektor dukungan (batas kelas) dan margin (didefinisikan oleh vektor dukungan) (Han & Kamber, 2006).
19
Support vector machine mencari jarak margin maximum dari hyperplane, untuk memisahkan 2 kelas yang berbeda. Support vector machine dapat dilustrasikan sebagai berikut :
Gambar 2.15 Support vector machine dan hyperplane (diadoptasi dari Han & Kamber, 2006).
bobot dapat disesuaikan sehingga hyperplane mendefinisikan sisi margin dari data training yang ada, formulasinya dapat ditulis sebagai berikut (Han & Kamber, 2006):
𝐻1: 𝑤0+ 𝑤1𝑥1+ 𝑤2𝑥2 ≥ +1 𝑓𝑜𝑟 𝑦𝑖 = +1 , dan 𝐻2: 𝑤0 + 𝑤1𝑥1 + 𝑤2𝑥2 ≤ −1 𝑓𝑜𝑟 𝑦𝑖 = −1
maka dari itu, data manapun yang setara atau diatas 𝐻1 tergolong ke dalam kelas +1, dan data manapun yang setara atau dibawah 𝐻2tergolong ke dalam kelas -1.
2.10 Klasifikasi
Klasifikasi merupakan tahapan analisa data untuk menentukan label atau kelas data dengan menggunakan suatu model atau klasifier (Han & Kamber, 2006). Klasifikasi data dilakukan dengan 2 tahapan. Tahapan pertama menggunakan klasifier untuk suatu set kelas atau konsep data atau yang disebut learning step (training phase). Dimana algoritma klasifikasi membangun klasifier dengan manganalisis atau “belajar dari” satu set pelatihan yang terdiri
dari tupel database dan label kelas terkait. Tahap pertama klassifikasi digambarkan pada Gambar 2.16.
Aturan Klasifikasi
Algoritma Klasifikasi
Input Data Training Output (Klasifier yang
telah di training)
Gambar 2.16 Tahap pertama klasifikasi.
Tahap kedua model digunakan untuk klasifikasi. pertama keakuratan prediksi dari classifier diperkirakan. jika kita menggunakan training set untuk mengukur keakuratan classifier, perkiraan ini kemungkinan akan optimis, karena classifier cenderung overfit data (dalam “pembelajaran data” memungkinkan untuk menggabungkan beberapa anomali tertentu dari training data yang tidak ada dalam data set secara keseluruhan). Oleh karena itu, satu set tes digunakan, terdiri dari tupel tes dan label kelas. Tupel tersebut dipilih secara acak dari kumpulan data umum. Tupel tersebut independen dari tupel pelatihan, yang berarti bahwa tidak digunakan untuk membangun classifier. Keakuratan classifier pada set tes yang diberikan adalah persentase dari uji set tupel yang diklasifikasikan dengan benar oleh classifier. Tahap kedua klassifikasi dapat digambarkan pada Gambar 2.17.
Klasifier yang telah di training Input Data Training
Output (Hasil Klasifikasi)
Input Data Baru (selain data testing)
Gambar 2.17 Tahap kedua klasifikasi
BAB 3
METODOLOGI PENELITIAN
3.1. Alur Kerja Penelitian
Alur Kerja Penelitian ini di ilustrasikan pada gambar 3.1 :
Mengidentifikasi Masalah Melakukan Studi Pustaka Menentukan Tujuan Penelitian Mengumpulkan Data
Merancang dan Mengimplementasi Metode
Menguji Coba Metode Menganalisa dan Mengevaluasi Metode
Menyimpulkan Penelitian
Gambar 3.1 Diagram Alur Kerja Penelitian
Berdasarkan gambar 3.1 dapat dijelaskan bahwa alur kerja penelitian ini dimulai dengan tahapan mengidentifikasi sebuah masalah yang akan diteliti, kemudian dilakukan studi pustaka yang berkaitan dengan masalah yang akan diteliti dilanjutkan dengan menentukan tujuan penelitian agar penelitian tidak menyebar ke ruang lingkup yang lain, selanjutnya dilakukan pengumpulan data atau sampel yang akan diteliti khususnya citra blur berdasarkan jenisnya dilanjutkan dengan merancang dan mengimplementasi motode menggunakan sampel yang telah dikumpulkan dimana perancangan dan pengimplementasian sesuai dengan tujuan penelitian yang telah ditentukan. Selanjutnya dilakukan pengujian terhadap metode yang telah dirancang dan diimplementasikan dan pada tahapan akhir dilakukan analisa dan evaluasi metode sehingga dapat diambil kesimpulan terhadap penelitian.
22
3.2. Data dan Peralatan Penelitian Yang Digunakan
Data yang digunakan dalam penelitian ini berjumlah 392 citra dengan ukuran 640x480 pixel yang diklassifikasikan menjadi 4 kategori, yaitu average blur, motion blur, gaussian blur dan citra non blur. Data yang digunakan sebagai training set adalah 60 % dari total imageset yang digunakan dan 40 % imageset sebagai testing set dimana pembagiannya ditentukan secara acak. Sedangkan alat yang digunakan dalam penelitian ini adalah matlab versi 2016b, dan file citra yang digunakan yaitu file yang berformat .jpg . Alasan pemilihan file citra .jpg adalah untuk menjaga keaslian citra yang diperoleh, dimana citra diperoleh menggunakan kamera.
3.3. Tahapan Modikifkasi Speed-up Robust Feature Dengan Histogram of Oriented Gradient
Penelitian ini memodifikasi speed-up robust feature sebagai pendeteksi interest point dengan histogram of oriented gradient sebagai interest deskriptor. Dengan speed-up robust feature sebagai interest point detector, mendeteksi interest point pada citra yang blur dengan skala yang berbeda-beda (multiscale). Setelah interest point diperoleh, maka akan diextract dengan menggunakan histogram of oriented gradient (HOG). Dengan mendapatkan intesitas histogram pada deskriptor akan diperoleh pola degradasi pada tiap interest point. Tahapan modifikasi speed-up robust feature dengan histogram of oriented gradient dalam skema bag of visual word dapat digambarkan seperti berikut:
23
Input Citra Citra Keabuan (Grayscale) Deteksi Interest Point Speed-Up Robust Feature
Ekstraksi Interest Point meggunakan Histogram of Oriented Gradients
Histogram Feature Vector Training Pola
Bag Of Visual Words Testing Pola
Input Citra
Citra Keabuan (Grayscale)
Menyimpan Pola Bag of Visual Words pada Support Vector Machine Deteksi Interest Point Speed-Up Robust
Feature
Ekstraksi Interest Point meggunakan Histogram of Oriented Gradients
Pencocokan Model Pola Pada Support
Vector Machine Output (Klasifikasi Citra Blur)
Gambar 3.2 Tahapan Modifikasi speed-up robust feature dengan histogram of oriented gradient pada skema bag of visual word untuk klassifikasi citra blur.
3.4. Modifikasi Speed-up Robust Feature (SURF) Dengan Histogram of Oriented Gradient (HOG)
Skala pendeteksian interest point pada speed-up robust feature mempengaruhi klassifikasi citra blur jika dimodifikasikan dengan histogram of oriented gradien sebagai ekstraksi fiturnya. Hal ini disebabkan oleh proses ekraksi fitur yang berbeda pada kedua metode ini. Speed-up robust feature mengintegralkan citra dalam proses pendeteksian keypoint, sedangkan histogram menggunakan cell blok pada citra secara satu per satu atau single detector. Seperti pada Gambar 3.3, speed-up robust feature sebagai deteksi fitur menggunakan pengintegralan citra, dengan menggunakan skala invarian pada citra. Proses ini mendeteksi fitur pada citra dengan membentuk bulatan-bulatan sebagai deteksi fitur dalam citra.
24
Gambar 3.3 Pendeteksian interest point dengan speed-up robust feature
Bulatan pada citra pada Gambar 3.3 dihasilkan dari integral grid speed-up robust feature dengan menggunakan fast hessian matrix. Gambar 3.4 akan menunjukkan grid yang telah dibentuk oleh speed-up robust feature. Pengintegralan grid tersebut dapat mengurangi waktu komputasi dalam pendeteksian fitur yang diperoleh pada citra. Sedangkan Histogram of oriented gradient, membentuk Cell block yang menghasilkan gradient sebagai fitur citra. Gambar 3.5, menunjukkan penggunakan grid oleh Histogram of oriented gradient yang berbeda dengan speed-up robust feature dalam proses pendeteksian fitur.
Proses pendeteksian Hitogram of oriented gradient, lebih lama waktu komputasinya dibandingkan dengan speed-up robust feature, hal ini dikarenakan Histogram of oriented gradient membentuk cell blok terhadap keseluruhan citra dan menghitung gradien sebagai pendeteksian fitur terhadap cell blok yang telah dibentuk (lihat Gambar 3.5).
25
Gambar 3.4 Grid x dan y pada speed-up robust feature mendeteksi fitur dengan membentuk bulatan kecil (blob) terhadap citra.
Gambar 3.5 Histogram of oriented gradient membentuk cell blok pada citra dan menghitung gradien citra sebagai pendeteksian fitur.
26
Dengan memodifikasi Speed-up robust feature dengan Histogram of oriented gradient menghasilkan pendeteksian fitur seperti yang ditunjukkan pada Gambar 3.6. Dengan modifikasi ini dapat mengklasifikasikan citra blur berdasarkan tipe blur pada skema bag of visual word dengan lebih akurat.
Gambar 3.6 Modifikasi Speed-up robust feature dengan Histogram of oriented gradient
3.5. Pembentukan Bag Of Visual Words
Setelah di dapat fitur dengan menggunakan modifikasi speed-up robust feature dengan histogram of oriented gradients maka fitur-fitur dibentuk bag visual words atau codebook fitur dari citra blur yang telah diinputkan. Fitur-fitur yang telah didapatkan akan di cluster menggunakan k-means algorithm, untuk membedakan kelas fitur-fitur tersebut dengan k = 500. Dimana feature vector yang telah di clusterkan ini akan menjadi bag of visual words atau codebook fitur untuk mengklasifikasikan citra pada training set maupun test set menggunakan klassifer support vector machine seperti yang dicontohkan pada Gambar 3.7.
27
Gambar 3.7 Histogram Feature Vector bag1 dengan K= 500 atau disebut dengan codebook
3.6. Ukuran Performansi
Pada penelitian ini, pengukuran performansi klassifikasi menggunakan confusion matrix.
Confusion matrix adalah sebuah array 2 dimensi berukuran K x K (dimana K adalah total jumlah kelas) yang digunakan untuk melaporkan hasil mentah dari eksperimen klasifikasi (Marques, 2011). Nilai pada baris i, kolom j mengindikasikan berapa kali sebuah objek yang tergolong benar pada kelas I yang berlabel kelas j. Tabel confusion matrix berisikan empat kemungkinan keluaran sebagai bahan acuan dalam membandingkan antara kejadian yang sebenarnya (aktual) dengan kejadian yang terprediksi. Berikut adalah ilustrasinya:
Tabel 3.1 Tabel Confusion Matrix Prediksi
Average Blur Motion Blur Aktual Average Blur True Positive (TP) False Negative (FN)
Motion Blur False Positive (FP) True Negative (TN)
28
dimana :
True Positive (TP) adalah jumlah data average blur yang diprediksi average blur False Negative (FN) adalah jumlah data average blur yang diprediksi motion blur False Positive (FP) adalah jumlah data motion blur yang diprediksi average blur True Negative (TN) adalah jumlah data motion yang diprediksi motion blur
Untuk menghitung akurasi menggunakan confusion matrix dapat dirumuskan sebagai berikut:
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 = ( 𝑇𝑃 + 𝑇𝑁 𝑇𝑜𝑡𝑎𝑙 𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖)
Sedangkan untuk menghitung tingkat kesalahan klassifikasi adalah sebagai berikut:
𝑀𝑖𝑠𝑠 𝑐𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑜𝑛 𝑟𝑎𝑡𝑒 = ( 𝐹𝑃 + 𝐹𝑁 𝑇𝑜𝑡𝑎𝑙 𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖)
BAB 4
HASIL DAN PEMBAHASAN
4.1. Hasil
Hasil yang dibahas meliputi modifikasi speed-up robust feature dengan histogram of oriented gradients, pengujian dengan variasi skala speed-up robust feature, perbandingan modifikasi metode dengan penelitian sebelumnya dan pembahasan.
4.1.1. Sampel pelatihan dan sampel pengujian
Imageset pada penelitian ini terbagi menjadi sampel pelatihan dan sampel pengujian.
Sampel pelatihan yang digunakan dalam penelitian ini berjumlah 236 citra, sedangkan sampel pengujian terdiri dari 156 citra, yang terdiri dari 4 kategori citra. Yaitu kategori average blur, citra non blur, gaussian blur dan motion blur, dimana penentuannya dilakukan secara acak dan ukuran citra pada imageset penelitian ini sebesar 640 width x 480 height pixel. Berikut adalah 4 contoh citra yang digunakan dalam sampel pelatihan:
Gambar 4.1 Citra 8.jpg pada kategori average blur
30
Gambar 4.2 Citra 8.jpg pada kategori citra non blur
Gambar 4.3 Citra 8.jpg pada kategori gaussian blur
Gambar 4.4 Citra 8.jpg pada kategori motion blur
31
4.1.2. Hasil bag of feature
Setelah menginput training set dan testing set, selanjutnya citra-citra pada training set akan dideteksi interest pointnya menggunakan speed-up robust feature dan di ekstrak fiturnya menggunakan histogram of oriented gradients. Bag of feature yang dibentuk pada trainingSet1 adalah sebagai berikut:
Gambar 4.5 Bag of Feature TrainingSet1
Nilai masing-masing index pada gambar 4.5 menjadi acuan terhadap nilai fitur citra lainnya. Dimana nilai index diatas merupakan nilai fitur yang telah sudah melalui tahapan deteksi dan ekstraksi fitur, serta clustering nilai fitur-fitur, yang dikelompokkan menjadi nilai visual word index. Nilai index tersebut, dapat dilihat pada nilai index masing-masing citra, dimana nilai index pada gambar 4.1, gambar 4.2, gambar 4.3 dan gambar 4.4 tidak lebih dari 200. Hal ini sesuai dengan penetapan jumlah index pada bag of feature yang dibentuk, yaitu K=200. Berikut adalah nilai index gambar 4.1, gambar 4.2, gambar 4.3 dan gambar 4.4 :