APLIKASI METODE DUAL-TREE COMPLEX FILTER BANK PADA SEGMENTASI OBYEK BERGERAK
Ferry Iswono dan Imam Mukhlash
Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim, Surabaya 60111
Email: [email protected]
Abstrak---Segmentasi citra merupakan proses yang mendasar dalam bidang pemrosesan citra dan video.
Segmentasi merupakan proses yang dilakukan untuk memisahkan obyek dengan latar belakangnya. Segmentasi obyek bergerak, dilakukan dengan cara membagi video menjadi frame-frame, kemudian setiap frame disegmentasi dengan teknik segmentasi citra untuk kemudian frame- frame tersebut dibangun kembali menjadi video yang utuh.
Manfaat dari penelitian ini adalah dapat memperoleh gerakan obyek pada suatu video sehingga dapat digunakan untuk keperluan pelacakan dan pendeteksian obyek. Dalam tugas akhir ini digunakan metode Dual-Tree Complex Filter Bank untuk mendapatkan segmentasi obyek bergerak.
Proses dekomposisi pada metode ini dilakukan dengan 3 pilihan filter yaitu filter 9/7-10/8, filter Haar, dan filter Daubechies. Uji coba dilakukan dengan dua jenis video yaitu video dengan gerakan obyeknya sebagian dan video dengan obyek yang bergerak seluruhnya. Berdasarkan hasil uji coba yang telah dilakukan, diperoleh hasil bahwa perangkat lunak ini mampu melakukan segmentasi obyek pada sebuah video. Dengan penilaian akurasi pengukuran secara visual terhadap segmentasi yang dihasilkan, maka filter 9/7-10/8 dan Haar memberikan hasil segmentasi yang lebih baik jika dibandingkan dengan filter Daubechies. Dalam hal waktu komputasi, ketiga filter mencatat waktu yang relatif sama.
Kata Kunci--9/7-10/8, Daubechies, Dual-Tree Complex Filter Bank, Haar, Segmentasi Obyek Bergerak, Wavelet
I. PENDAHULUAN
Penggunaan aplikasi berbasis video berkembang dengan pesat seiring dengan rasa aman yang ingin diperoleh oleh masyarakat. Saat ini banyak sekali ditemukan pemasangan cctv di berbagai perkantoran, pusat perbelanjaan, maupun rumah pribadi. Hal ini bertujuan untuk mendapatkan hasil rekaman kegiatan yang terjadi di sekitar tempat pemasangan sehingga seseorang yang melakukan kegiatan yang mencurigakan dapat diketahui dengan mudah. Aplikasi yang demikian membutuhkan sistem pelacakan gerakan sehingga obyek yang dimaksud dalam rekaman dapat tertangkap dengan baik.
Pelacakan gerakan dalam video digital bertujuan untuk memperoleh lintasan dari obyek bergerak dari waktu ke waktu[5]. Tujuan pelacakan adalah memperkirakan posisi obyek atau orientasi obyek pada citra tertentu. Sehingga pelacakan obyek bergerak dapat dikatakan sebagai proses yang dilakukan untuk memperoleh arah gerakan dan posisi obyek pada video yang dimaksud. Pelacakan obyek dapat digunakan pada berbagai aplikasi seperti pengenalan obyek, sistem navigasi, dan sistem surveilans. Aplikasi-aplikasi tersebut membutuhkan algoritma untuk mendeteksi, membagi (segment), dan melacak obyek bergerak (track moving
objects) sehingga pemrosesan tingkat tinggi dapat dilakukan.
Proses pelacakan obyek pada video dilakukan dengan memisahkan obyek dengan latar belakangnya pada setiap frame yang membentuk video tersebut. Proses pemisahan ini biasa disebut dengan segmentasi. Segmentasi adalah proses membagi sebuah citra berdasarkan komponen region atau obyeknya[6]. Berdasarkan definisi tersebut dapat dikatakan bahwa segmentasi berfungsi untuk memisahkan latar belakang suatu citra dengan obyek pada citra tersebut.
Dalam Tugas Akhir ini, akan diterapkan salah satu metode segmentasi obyek bergerak yaitu metode Dual Tree Complex Filter Bank yang bekerja dalam domain wavelet. Tujuan metode Dual Tree Complex Filter Bank adalah untuk mendeteksi tepi obyek yang bergerak. Filter wavelet yang digunakan adalah filter 9/7-10/8 yang kemudian pada penelitian ini ditambahkan dengan filter Haar dan filter Daubechies, untuk selanjutnya akan dibandingkan hasil kerjanya. Filter bank dilakukan di dalam proses dekomposisi yang akan mengubah citra pada domain wavelet. Langkah selanjutnya adalah memproses dengan operasi edge detector, kemudian operasi binary morphological, dan langkah terakhirnya adalah rekonstruksi frame-frame yang telah melalui proses di atas.
Tujuan dari penelitian ini adalah membuat perangkat lunak yang dapat digunakan untuk segmentasi obyek bergerak dengan menggunakan metode Dual Tree Complex Filter Bank. Program yang akan dibuat diharapkan dapat berkontribusi dalam mendapatkan gerakan obyek pada suatu video sehingga dapat digunakan untuk keperluan pelacakan dan pendeteksian obyek.
II. TINJAUAN PUSTAKA A. Citra
Citra terbagi atas dua macam yaitu citra diskrit (citra digital) dan citra kontinu. Citra diskrit diperoleh melalui proses digitalisasi misalnya kamera digital dan scanner, sedangkan citra kontinu diperoleh melalui sistem optik yang menerima sinyal analog misalnya mata manusia dan kamera analog. Citra merupakan fungsi kontinu dari intensitas cahaya pada bidang dua dimensi yang dinyatakan dalam bentuk fungsi berikut[6]:
𝑓(𝑥, 𝑦) = 𝑖(𝑥, 𝑦). 𝑟(𝑥, 𝑦) (1) dengan 𝑖(𝑥, 𝑦) : iluminasi, 0 < 𝑖(𝑥, 𝑦) < ∞
𝑟(𝑥, 𝑦) : refleksi, 0 < 𝑟(𝑥, 𝑦) < ∞
𝑓(𝑥, 𝑦) : intensitas cahaya pada titik (𝑥, 𝑦), besarnya adalah 0 < 𝑓(𝑥, 𝑦) < ∞
B. Video
Video adalah teknologi pemrosesan sinyal elektronik yang mewakilkan gambar bergerak[4]. Terdapat dua kategori video, yaitu video analog dan video digital.
Video Analog
Video analog mengkodekan informasi gambar dengan memvariasikan voltase dan/atau frekuensi dari sinyal[4].
Sebuah sinyal video analog berwarna mengandung luminance (iluminasi), brightness (kecerahan), dan chrominance (krominansi). Video analog memiliki dua format, yaitu format elektrik dan format kaset.
Video Digital
Video digital sebenarnya terdiri atas serangkaian citra digital yang ditampilkan dengan cepat pada kecepatan yang konstan[4]. Dalam video digital, informasi citra yang ditampilkan, didigitalisasi dengan teknik spasial dan temporal dan intensitas piksel yang dihasilkan akan dikuantisasi.
Dalam konteks video, gambar yang ada dalam video tersebut disebut dengan frame. Satuan ukuran untuk menghitung frame rata-rata yang ditampilkan disebut frame per second (FPS). Setiap frame merupakan citra digital yang terdiri dari banyak piksel. Setiap piksel direpresentasikan oleh tiga komponen yaitu komponen luminansi (luminance component) Y dan dua komponen krominan (chrominance component) Cb dan Cr. Berikut ini diberikan konversi RGB ke YcbCr[7]:
Y = 0,299R + 0,587G + 0,114B Cb = -0,1687R - 0,3313G + 0,5B + 128 Cr = 0,5R - 0,4187G - 0,0813B + 128 Untuk lebih jelasnya, berikut ini ditampilkan dalam bentuk matriks.
[𝑌 𝐶𝑏 𝐶𝑟] = [𝑅 𝐺 𝐵] �0,299 −0,1687 0,5 0,587 −0,3313 −0,418531
0,114 0,5 0,0813 �
C. Segmentasi Obyek Bergeraks
Segmentasi merupakan teknik yang digunakan untuk membagi suatu citra menjadi beberapa daerah (region) dimana setiap daerah memiliki kemiripan atribut[9].
Beberapa teknik segmentasi yang digunakan adalah pengembangan, penandaan komponen terhubung, segmentasi berbasis cluster, dan transformasi hough.
Segmentasi pada sebuah video yang biasa disebut dengan segmentasi obyek bergerak dapat dilakukan dengan cara memproses setiap frame yang terdapat pada video tersebut. Frame-frame yang berupa citra tunggal tersebut disegmentasi satu persatu kemudian dibangun kembali menjadi sebuah video utuh. Sehingga video yang dihasilkan berupa tampilan obyek bergerak yang telah terpisah dari latar belakangnya.
D. Wavelet
Wavelet dapat dipandang sebagai suatu alat matematika yang memiliki banyak kegunaan. Wavelet dapat digunakan untuk memproses sinyal (suara ataupun citra) dan digunakan dalam analisis numerik.
Transformasi wavelet memiliki kemampuan untuk menganalisis suatu data dalam domain waktu dan domain frekuensi secara simultan. Analisis data pada transformasi
wavelet dilakukan dengan mendekomposisikan suatu sinyal ke dalam komponen-komponen frekuensi yang berbeda-beda dan selanjutnya masing-masing komponen frekuensi tersebut dapat dianalisis sesuai dengan skala resolusinya atau level dekomposisinya. Sifat ini dapat berfungsi pada proses penyaringan dimana sinyal dalam domain waktu dilewatkan ke dalam filter high-pass dan filter low-pass untuk memisahkan antara komponen frekuensi tinggi dan komponen frekuensi rendah.
Dalam penelitian ini, digunakan 3 filter wavelet, yaitu filter 9/7-10/8, filter Haar, dan filter Daubechies.
• 9/7 – 10/8
Filter ini diperkenalkan oleh Cohen, Daubechies dan Feauveau, sehingga seringkali disebut dengan CDF 9/7.
CDF 9/7 ini merupakan family pertama dari wavelet biortogonal. Filter ini termasuk dalam wavelet biortogonal dan symmetric[3].
• Haar
Haar mendekomposisikan sinyal diskrit menjadi dua subsignal yang berukuran setengah dari panjangnya[11].
Satu subsignal adalah running average atau trend, sedangkan satu subsignal lainnya adalah running difference atau fluctuation.
• Daubechies
Daubechies didefinisikan dengan cara yang sama dengan Haar, yaitu dengan cara menghitung running average dan difference average melalui scalar product dengan sinyal perbesaran dan wavelet[11]. Namun perbedaan diantara keduanya adalah bagaimana sinyal perbesaran dan wavelet didefinisikan. Daubechies menawarkan seperangkat alat yang lebih baik dalam menyajikan pemrosesan sinyal, seperti kompresi, penghilangan noise, image enhancement, dan signal recognition.
E. Dual Tree Complex Filter Bank
Untuk memperoleh segmentasi obyek bergerak, sebuah video perlu diproses sehingga segmentasi yang dihasilkan sesuai dan akurat. Karena proses segmentasi obyek bergerak membutuhan pendeteksian obyek, maka perlu dilakukan proses deteksi tepi untuk mendapatkan daerah obyek dan latar belakang. Begitu pentingnya proses ini, maka perlu digunakan suatu metode yang mampu membantu proses pendeteksian tepi obyek dengan baik, yaitu metode Dual Tree Complex Filter Bank.
Algoritma Segmentasi Obyek Bergerak menggunakan metode Dual Tree Complex Filter Banks diberikan sebagai berikut:
a. Dekomposisi citra
b. Perataan nilai matriks dalam domain wavelet pada setiap frame yang diproses (Soft thresholding in wavelet domain).
c. Operasi deteksi tepi menggunakan Canny Edge.
d. Menyusun elemen yang digunakan dengan menggunakan operasi binary morphological.
e. Operasi penggabungan dan rekonstruksi.
Algoritma diatas ditunjukkan pada Gambar 1 dan langkah-langkahnya dijelaskan pada bagian ini.
Tiga frame berurutan
Soft thresholding dalam domain wavelet
Citra dengan intensitas yang mirip
Operasi deteksi tepi menggunakan Canny Edge
Citra biner
Hasil binary morphological Operasi Binary Morphological
Segmentasi Obyek Bergerak
Rekonstruksi Dekomposisi citra
Citra pada domain wavelet
Gambar 1. Diagram Alir Proses Segmentasi
• Dekomposisi Citra
Proses ini bertujuan untuk mengubah nilai citra kedalam domain wavelet yaitu domain skalar dan translasi. Dekomposisi dilakukan dengan cara mengenakan proses filter pada citra yang dimaksud.
• Perataan Nilai (Soft Thresholding)
Proses soft thresholding dilakukan untuk meratakan nilai intensitas citra, yang bertujuan untuk menghilangkan noise yang mungkin terdapat pada citra tersebut. Dengan adanya proses ini, maka tingkat terjadinya kesalahan akan semakin kecil. Terdapat dua metode thresholding pada domain wavelet, yaitu soft thresholding dan hard thresholding.
• Deteksi Tepi
Pertemuan antara bagian obyek dan bagian latar belakang disebut tepi obyek[2]. Deteksi tepi adalah proses yang dilakukan untuk mendeteksi tepi obyek yang berbatasan dengan latar belakangnya. Deteksi tepi mempunyai konstribusi penting dalam proses analisis fitur-fitur citra, segmentasi citra, dan analisis pergerakan.
Sebuah titik yang disebut tepi obyek dalam sebuah citra
adalah sebuah titik dimana terdapat perubahan lokal pada intensitasnya.
• Operasi Binary Morphological
Morfologi digital adalah suatu cara yang dilakukan untuk menganalisis dan mendeskripsikan bentuk dari obyek digital dari suatu citra digital[2]. Operasi dalam morfologi digital adalah dilasi dan erosi dimana operasi ini dapat dikenakan pada citra biner, citra grayscale, dan citra RGB. Operasi binary morphological adalah operasi morfologi yang dikenakan pada citra biner. Secara umum, tujuan dari operasi binary morphological adalah memperbaiki bentuk obyek agar dapat menghasilkan fitur-fitur yang lebih akurat ketika dilakukan proses analisis terhadap obyek.
• Rekonstruksi
Rekonstruksi adalah proses membangun ulang citra.
Pada bagian ini, dilakukan proses membangun kembali citra yang telah diproses dalam metode Dual Tree Complex Filter Bank, yaitu mengubah citra dari domain wavelet menjadi domain spasial kembali.
III. ANALISIS SISTEM DAN PERANCANGAN PERANGKAT LUNAK
A. Analisis sistem
Analisis sistem bertujuan untuk memberikan gambaran mengenai keseluruhan proses kerja dari perangkat lunak yang akan dibangun dan bagaimana sistem ini akan berinteraksi dengan pengguna mulai dari memasukkan data video hingga menghasilkan hasil segmentasi pada video masukan. Perangkat lunak ini menangani proses Segmentasi Obyek Bergerak dengan masukan data berupa video dengan 3 alat filter wavelet yang dapat dibandingkan, yaitu 9/7—10/8, Haar, dan Daubechies. Seluruh proses yang dilakukan dalam segmentasi obyek bergerak ditunjukkan pada Gambar 2.
Memasukkan video berformat .avi
Mengisi nilai thresholding
Segmentasi per frame/semua
frame?
Memilih frame yang akan diproses
Segmentasi Obyek Bergerak
Hasil segmentasi
Per frame
Semua frame Memilih alat filter
wavelet Mulai
Mulai
Gambar 2. Diagram alir proses keseluruhan pada sistem
B. Perancangan Perangkat Lunak
Bagian ini akan menjelaskan tentang perancangan perangkat lunak yang akan dibangun. Perancangan perangkat lunak ini akan digambarkan melalui data flow diagram berikut ini:
Gambar 3. Data flow diagram
Diagram di atas menggambarkan proses interaksi antara sistem dengan pengguna, dimana pengguna perlu menginputkan sebuah video yang akan diproses oleh sistem dengan keluaran berupa video yang telah di segmentasi.
IV. UJI COBA DAN PEMBAHASAN
Uji coba dilakukan dengan dua inputan video yang berbeda, yang akan diuji dengan sistem segmentasi frame dengan menggunakan filter wavelet yang berbeda-beda.
Video pertama adalah video yang berisi sebuah obyek dengan gerakan sebagian, sedangkan video kedua adalah video yang berisi sebuah obyek yang bergerak semua dari kanan ke kiri.
A. Pelaksanaan Uji Coba
Uji coba terhadap video pertama dilakukan dengan video berjudul akiyo.avi dengan keterangan sebagai berikut:
Data uji coba 1
Video : akiyo.avi Banyak Frame : 300 Index Frame : 79 Alat Filter Wavelet : 9/7-10/8 Nilai Threshold : 0,5
Jenis Uji Coba : segmentasi per frame Waktu komputasi : 0.171 detik
Hasilnya ditunjukkan melalui gambar 4.
Gambar 4. Hasil uji coba 1 terhadap video pertama
Data uji coba 2
Video : akiyo.avi Banyak Frame : 300 Index Frame : 79 Alat Filter Wavelet : Haar Nilai Threshold : 0,1
Jenis Uji Coba : segmentasi per frame Waktu komputasi : 0.218 detik
Hasilnya ditunjukkan melalui gambar 5.
Gambar 5. Hasil uji coba 2 terhadap video pertama
Data uji coba 3
Video : akiyo.avi Banyak Frame : 300 Index Frame : 79
Alat Filter Wavelet : Daubechies Nilai Threshold : 0,2
Jenis Uji Coba : segmentasi per frame Waktu komputasi : 0.223 detik
Hasilnya ditunjukkan melalui gambar 6.
Gambar 6. Hasil uji coba 3 terhadap video pertama
Uji coba terhadap video kedua dilakukan dengan video berjudul video.avi dengan keterangan sebagai berikut:
Data uji coba 1
Video : orangberjalan.avi Banyak Frame : 86
Index Frame : 31 Alat Filter Wavelet : 9/7-10/8 Nilai Threshold : 0,5
Jenis Uji Coba : segmentasi per frame Waktu Komputasi : 0.421 detik
Hasilnya ditunjukkan melalui gambar 7.
Gambar 7. Hasil uji coba 1 terhadap video kedua
Data uji coba 2
Video : orangberjalan.avi Banyak Frame : 86
Index Frame : 31 Alat Filter Wavelet : Haar Nilai Threshold : 0,1
Jenis Uji Coba : segmentasi per frame Waktu Komputasi : 0.358 detik
Hasilnya ditunjukkan melalui gambar 8.
Gambar 8. Hasil uji coba 2 terhadap video kedua Data uji coba 3
Video : orangberjalan.avi Banyak Frame : 86
Index Frame : 31
Alat Filter Wavelet : Daubechies Nilai Threshold : 0,5
Jenis Uji Coba : segmentasi per frame Waktu komputasi : 0.394 detik
Hasilnya ditunjukkan melalui gambar 9.
Gambar 9. Hasil uji coba 3 terhadap video kedua
B. Evaluasi
Berdasarkan uji coba yang telah dilakukan, program segmentasi obyek bergerak mampu mendeteksi pergerakan obyek dengan cukup baik. Dalam tugas akhir ini, penilaian akurasi pengukuran didasarkan pada pengamatan secara visual. Pada percobaan pertama, dimana video yang digunakan adalah video yang berisi obyek dengan gerakan sebagian, filter Haar mampu mendeteksi obyek dengan cukup baik. Dapat dikatakan bahwa filter Haar memberikan hasil segmentasi yang paling baik jika dibandingkan dengan dua filter lainnya.
Filter 9/7-10/8 memberikan hasil yang kurang tepat jika dibandingkan dengan Haar, sedangkan Daubechies memberikan hasil yang paling buruk diantara ketiga filter yang digunakan. Pada percobaan kedua, dimana video yang digunakan adalah video yang berisi obyek dengan gerakan keseluruhan, filter Haar mampu mengungguli kedua filter lainnya, yaitu 9/7-10/8 dan Daubechies. Hasil percobaan ini menunjukkan bahwa filter Haar mampu mendeteksi gerakan obyek dengan baik dan cukup tepat.
Untuk filter 9/7-10/8 juga memberikan hasil yang cukup memuaskan, meskipun hasil segmentasi dari 9/7-10/8 terlihat melebar dan kurang tepat pada obyek yang dimaksud, sedangkan hasil dari filter Daubechies kurang memuaskan jika dibandingkan dengan kedua filter lainnya. Untuk waktu komputasi, ketiga filter membutuhkan waktu yang relatif sama. Hal ini terlihat melalui hasil pencatatan waktu komputasinya.
V. KESIMPULAN DAN SARAN A. Kesimpulan
Berdasarkan hasil pengujian perangkat lunak yang dilakukan pada Bab V, maka diperoleh kesimpulan sebagai berikut:
a. Segmentasi obyek bergerak menggunakan metode Dual-Tree Complex Filter Bank menghasilkan pendeteksian yang lebih akurat jika menggunakan filter 9/7-10/8 dan Haar.
b. Segmentasi obyek bergerak dengan metode Dual-Tree Complex Filter Bank memiliki waktu komputasi yang relatif sama.
c. Filter Daubechies kurang sesuai digunakan pada metode Dual-Tree Complex Filter Bank.
B. Saran
Saran yang dapat diberikan untuk pengembangan Tugas Akhir ini antara lain:
a. Untuk mendapatkan hasil yang lebih baik, perlu dilakukan uji coba segmentasi menggunakan filter wavelet yang lain, seperti symlets, biorsplines, dan keluarga wavelet yang lain.
b. Untuk pengembangan perangkat lunak, uji coba dilakukan menggunakan video yang menampilkan obyek lebih dari satu atau video real time.
c. Uji coba segmentasi menggunakan parameter akurasi yang lebih terukur, misalnya spatial accuracy.
DAFTAR PUSTAKA
[1] Agustina, S.E. 2012. “Implementasi Metode Scale Invariant Feature Transform (SIFT) dan Metode Continuosly Adaptive Mean-Shift (Camshift) pada Penjejakan Objek Bergerak”. Tugas Akhir, Institut Teknologi Sepuluh Nopember.
[2] Ahmad, U. 2005. “Pengolahan Citra Digital dan Teknik Pemrogramannya”. Yogyakarta: Graha Ilmu.
[3] Baradarani, Aryaz. 2008. “Moving Object Segmentation Using the 9/7-10/8 Dual-Tree Complex Filter Bank”. IEEE.
[4] Binanto, I. 2010. “Multimedia Digital - Dasar Teori dan Pengembangannya”. Yogyakarta: Penerbit ANDI.
[5] Bovik, Al. 2009. “The Essential Guide to Video Processing”. ELSEVIER.
[6] Gonzales, RC. Woods, RE. 2002. “Digital Image Processing”. New Jersey : Prentice Hall, Inc.
[7] Hamilton E. 1992. “JPEG File Interchange Format, Version 1.02”. McCarthy: C-Cube Microsystems.
[8] Haslinda, A.S. 2012. “Implementasi Algoritma Block Matching (BMA) pada Ekstraksi Objek Bergerak”. Tugas Akhir, Institut Teknologi Sepuluh Nopember.
[9] Putra, D. 2010. “Pengolahan Citra Digital”
Yogyakarta: Penerbit ANDI.
[10] Sigit, R. Basuki, A. Ramadijanti, N. Pramadihanto, D. 2005. “Step by Step Pengolahan Citra Digital”.
Yogyakarta: Penerbit ANDI.
[11] Walker, J. S. 2002. “A Primer on Wavelets and Their Scientific Applications”. London: Taylor &
Francis.