BAB 2 TINJAUAN PUSTAKA - Deteksi Dan Pencarian Fitur-Fitur Wajah Manusia Dengan Menggunakan Metode Principal Component Analysis (PCA).

(1)

BAB 2

TINJAUAN PUSTAKA

2.1. Motion Capture

Pada saat ini motion capture banyak ditemukan dalam berbagai bidang,

terutama pada dunia animasi dalam pembuatan film, industri game, analis bio

mekanik dan lain–lain [3]. Dengan semakin berkembangnya industri film dan game

maka saat ini bidang motion capture telah mengalami perkembangan yang sangat

pesat pula. Produk motion capture yang ada saat ini biasanya menggunakan optik,

magnetik ataupun alat mekanikal motion capture dengan menggunakan pakaian

khusus ataupun marker di seluruh tubuh. motions capture didefinisikan sebagai

pembentukan representasi objek 3D secara live, game development adalah pasar

terbesar untuk motion capture dengan pendapatan seperti pendapatan produksi film

[1].

Pada umumnya ada dua tipe utama karakter animasi objek 3D yang digunakan

dalam permainan yaitu: real-time playback dan cinematics, real-time playback

memungkinkan pemain untuk memilih dari pre-created moves, sehingga

pengendalian bergerak dalam real-time. Sedangkan cinematics adalah animasi full

render yang biasa digunakan untuk intro dan cut-scenes dalam game. Cinematics

umumnya tidak penting untuk game-play, tetapi menambahkan banyak visualisasi ke

permainan dan sangat membantu dalam pengembangan cerita. Motion capture

(2)

menciptakan karakter yang bergerak secara realistis, dalam situasi yang tidak praktis

atau terlalu berbahaya untuk aktor. Beberapa karakter film memerlukan penggunaan

motion capture supaya gerakan animasi tampak nyata [3]. Motion capture dapat

memberikan penghematan waktu yang besar untuk proyek animasi. Motion capture

dapat membuat proses animasi lebih mudah, terutama ketika menciptakan karakter

animasi yang realistis, seperti interaksi dari beberapa karakter 3D, atau ketika

karakter terlibat dalam aktifitas olahraga. Animasi sederhana, seperti karakter yang

sedang berdiri tanpa melakukan hal yang jauh lebih mudah dan lebih realistis ketika

menggunakan motion Capture [6].

2.1.1. Bidang aplikasi

Video game sering menggunakan motion capture untuk menganimasikan atlet,

seniman bela diri, dan karakter dalam game, hal ini telah dilakukan sejak game Atari

Jaguar berbasis CD Highlander: The Last dari MacLeods, dirilis pada tahun 1995.

Motion capture mulai digunakan secara intensif untuk memproduksi film yang

mensimulasikan tampilan bioskop secara live-action, dengan hasil hampir mendekati

fotorealistik dari model karakter digital [9].

The Polar Express menggunakan motion capture untuk memungkinkan Tom

Hanks dapat tampil beberapa karakter dalam bentuk berbeda. Film adaptasi tentang

Beowulf tahun 2007 adalah karakter animasi digital yang penampilanmnya didasarkan

sebagian pada para aktor yang memberikan gerakan mereka dan suara. James

(3)

Pandora. Walt Disney Company telah mengumumkan bahwa mereka akan

mendistribusikan Robert Zemeckis's A Christmas Carol dan Tim Burton's Alice in

Wonderland menggunakan teknik ini. Disney juga telah melakukan akuisisi Zemeckis

Image Movers digital yang memproduksi film motion capture. Film seri televisi yang

diproduksi sepenuhnya dengan animasi motion capture termasuk Laflaque di Kanada,

Sprookjesboom dan Cafe de Wereld di Belanda, dan Headcases di Inggris [9]. Selama

pembuatan film James Cameron's Avatar semua adegan yang dilakukan pada proses

ini di diarahkan secara realtime dengan menggunakan kostum pada aktor dengan

motion cupture yang terlihat seperti di film, sehingga memudahkan Cameron untuk

mengarahkan film seperti pada viewer. Metode ini memungkinkan Cameron untuk

melihat adegan-adegan yang tidak dapat dilihat dari pandangan dan sudut dari

animasi.

2.1.2. Sistem dan metode motion capture

Motion tracking atau motion capture dimulai sebagai sebuah alat analisis

fotogrametri dalam penelitian biomekanika pada 1970-an dan 1980-an, dan diperluas

ke pendidikan, pelatihan, olahraga, animasi, bioskop, dan video game sebagai

teknologi baru. Seorang aktor memakai penanda atau marker pada masing-masing

joint untuk mengidentifikasi gerak seperti pada Gambar 2.1. Akustik, inertial, LED,

marker magnetik atau reflektif, atau kombinasi dari semua gerakan ini diulang

beberapa kali sesuai dengan tingkat frekuensi yang diinginkan, untuk posisi

(4)

Gambar 2.1. Reflektif marker menempel pada kulit untuk mengidentifikasi landmark tulang dan gerakan 3D dari bagian tubuh [9]

2.1.3. Optical system

Sistem optik memanfaatkan data yang diambil dari sensor untuk melakukan

tracking pada posisi 3D dari sebuah objek dengan satu atau beberapa kamera yang

telah dikalibrasi. Pengambilan data secara tradisional dilaksanakan dengan

menggunakan marker khusus yang melekat pada aktor yang menyebabkan data yang

dihasilkan tidak akurat. Namun dengan sistem terbaru dari optical system mampu

(5)

identifikasi secara dinamis untuk setiap objek. Dalam memperluas area tracking dan

daerah capture para aktor melakukan dengan penambahan kamera, sistem ini

menghasilkan data dengan pergeseran 3 derajat untuk setiap marker [9].

2.1.4. Marker pasif

Sistem marker pasif menggunakan marker yang dilapisi dengan material yang

bersifat “retroreflective” yang mampu merefleksikan kembali cahaya yang dihasilkan

dekat dengan lensa kamera. Threshold dari kamera bisa diatur sedemikian rupa

hingga hanya cahaya terang hasil refleksi marker yang akan disampel dan tidak

melakukan sampling terhadap kulit dan kain yang ada pada aktor.

Centroid dari marker adalah hasil estimasi dari perhitungan image dua

dimensi yang ditangkap. Nilai keabuan atau graysclae value dari setiap piksel dapat

digunakan untuk menyediakan akurasi dari sub piksel dengan menemukan centroid

dari Gaussian. Sebuah objek dengan posisi marker yang telah diketahui digunakan

untuk melakukan kalibrasi kamera dan mendapatkan posisinya dengan distorsi lensa

setiap kamera telah diukur [9].

Secara umum sistem yang ada menggunakan 6 sampai 24 kamera. Vendor

memiliki kendala perangkat lunak untuk mengurangi masalah dari marker swapping

karena semua marker tampak identik. Tidak seperti sistem marker aktif dan sistem

magnetik, sistem pasif tidak membuat aktor untuk menggunakan kawat atau peralatan

(6)

Gambar 2.2. Contoh beberapa marker ditempatkan di titik-titik tertentu pada tubuh dan wajah aktor selama adegan motion capture [9]

Sebaliknya, ratusan bola karet melekat dengan selotip reflektif yang perlu

diganti secara berkala. Marker biasanya menempel langsung ke kulit seperti dalam

biomekanik, atau mereka dipasang pada pakain actor yang mengenakan full body

yang dirancang khusus untuk motion capture seperti pada Gambar 2.2[9].

2.1.5. Marker aktif

Sistem optikal aktif melakukan triangulasi posisi dengan memperlihatkan satu

LED dengan waktu yang sangat cepat atau beberapa LED dengan software untuk

mengidentifikasi LED terhadap posisi relatif dengan memantulkan kembali cahaya

yang dihasilkan secara eksternal, pada marker sendiri mempunyai kemampuan untuk

memancarkan cahayanya sendiri. Salah satu penerapan nya adalah pada serial TV

(7)

Effects). Aktor harus berjalan di sekitar alat peraga hal ini akan menyulitkan untuk

penggunaan sistem marker aktif [9].

2.1.6. Time modulated active marker

Sistem marker aktif adalah sistem marker dengan menyalakan satu penanda

pada waktu tertentu, atau melakukan tracking beberapa marker dalam waktu tertentu

dengan melakukan modulasi dari amplitudo untuk mendapatkan indentitas. Resolusi

spasial 12 megapiksel pada sistem yang termodulasi menunjukkan pergerakan lebih

halus dari sistem optik 4 megapiksel yang memiliki resolusi yang lebih tinggi.

Dengan sistem ini sutradara dapat melihat gerakan aktor secara real time pada

motion capture, penempatan marker yang akurat akan mengurangi nilai error

sehingga dapat menghasilkan data yang lebih bersih [1].

2.1.7. Semi-passive imperceptible marker

Sebuah sistem yang didasarkan pada kamera kecepatan tinggi, sistem ini

menggunakan multi-LED proyektor berkecepatan tinggi yang murah. Sistem ini

dirancang secara khusus pada ruang motion capture. Dibandingkan penggunaan

retro-reflektif atau LED marker, sistem ini menggunakan tag marker foto sensitif

untuk memproses sinyal optik pada poin scene, tag dapat menghitung tidak hanya

(8)

2.1.8. Markerless motion capture

Teknik dan penelitian dalam visi komputer menuju perkembangan pesat dari

pendekatan motion capture beralih ke markerless motion capture, sistem seperti yang

dikembangkan di Stanford, University of Maryland, MIT, dan Max Planck Institute

dalam melakukan tacking objek tidak memakai peralatan khusus akan tetapi dengan

system komputer yang dirancang khusus dan diterapkan pada sistem untuk

menganalisisa beberapa aliran input optik dan mengidentifikasi bentuk tersebut untuk

tracking [10], seperti pada Gambar 2.3.

(9)

2.2. Principal Component Analysis (PCA)

Principal Component Analysis (PCA) adalah teknik reduksi dimensi yang

umum digunakan pada aplikasi pemorosesan citra dan sinyal processing seperti pada

Gambar 2.4 [4]. Untuk mewakili benda yang mampu terdeformasi, baik dalam 2D

dan 3D. Tujuan utama dari PCA adalah untuk pemadatan data atau pengurangan

dimensi. Komponen yang tidak berkorelasi diberi nama “Principal Component”,

yang terbukti sesuai dengan nilai-nilai eigen terbesar dan eigen vektor dari matrik

varians-kovarians dari data sampel [4].

Gambar 2.4. Contoh PCA dari distribusi Gaussian multivariat [4]

Sumbu panjang menunjukkan arah sebaran titik dengan varians terbesar

sedangkan sumbu pendek menunjukkan luas sebaran titik, untuk sumbu panjang

dijadikan sebagai komponen utama (Principal Component) dan kemudian baru sumbu arah sebaran titik

luas sebaran titik

(10)

yang pendek. Principal Component Analysis (PCA) merupakan teknik linier untuk

memproyeksikan data vektor yang berdimensi tinggi ke vektor yang mempunyai

dimensi lebih rendah, Principal Component Analysis (PCA) lebih banyak digunakan

untuk keperluan ektraksi fitur gambar, dimana jumlah dimensi dari gambar jauh lebih

besar dibandingkan dengan jumlah data sampel yang digunakan. Untuk melakukan

proyeksi sampel vektor dari gambar pelatihan, semua gambar pelatihan disusun

dalam bentuk vektor baris. Apabila vektor gambar pelatihan mempunyai dimensi mxn

tersebut diortogonalisasi dengan menentukan eigenvector dan eigenvalue, maka

dimensinya akan berubah menjadi mxm, dimana m<n. Pengurangan dimensi yang

sangat signifikan ini akan sangat membantu untuk mempercepat proses komputasi

saat melakukan klasifikasi fitur. Sebelum klasifikasi fitur dilakukan maka akan

dilakukan penyelesaian eigenface untuk data pelatihan. Model matrik data pelatihan

dapat ditulis dalam persamaan (2.1).

...(2.1)

jika n>>m dimana n merupakan dimensi gambar, dan m adalah jumlah gambar yang

dilatih. Berdasarkan persamaan (2.1) maka rata-rata seluruh data sampel dapat

dihitung dengan menggunakan persamaan (2.2). Hasil persamaan (2.2) merupakan

vektor yang berbasis nilai rata-rata, karena jumlah dimensi adalah n, maka nilai

(11)

...(2.2)

Nilai rata-rata nol (zero mean) dari suatu sampel data dapat dihitung dengan

mengurangkan nilai masing-masing data sampel dengan rata-rata data jumlah seluruh

data sampel. Persoalannya adalah dimensi yang tidak sama antara data sampel (mxn),

sedangkan dimensi dari rata-rata seluruh data sampel (1xm). Matrik rata-rata gambar

data sampel yang telah digandakan sebanyak m kali dapat ditulis menggunakan

persamaan (2.3).

... (2.3)

Dan nilai dari pada baris ke i = nilai baris ke i + 1 dan

berlaku , maka hasil persamaan (2.3) dapat digunakan

untuk menghitung zero mean. Zero mean data dapat dimodelkan menggunakan

persamaan (2.4) [4].

...(2.4)

(12)

...(2.5)

Hasil perhitungan zero mean digunakan untuk mendapatkan nilai matrik

konvarian selain dapat dimodelkan menggunakan persamaan (2.5), juga dilakukan

dengan mengalikan transpos zero mean, seperti pada persamaan (2.6).

...(2.6)

Matrik konvarian disusun dari nilai-nilai varian yang telah ditentukan, dengan

model simetris. Untuk dua parameter yaitu xidan xi+1, maka matrik konvarian dapat

ditulis seperti pada persamaan (2.4). Untuk 3 parameter dan n parameter persamaan

dapat ditulis seperti pada persamaan (2.7) dan (2.8).

(13)

....(2.8)

Berdasarkan persamaan (2.8), maka dimensi dari konvarian menjadi mxn,

dengan berkurangnya jumlah dimensi yang sangat signifikan pada matrik konvarian,

maka akan menyebabkan berkurangnya dimensi pada saat menentukan eigenvector.

...(2.9)

... (2.10)

Untuk mendapatkan ciri dari suatu data sampel yang di representasikan dalam

bentuk matrik, maka dihitung eigenvector dan eigenvalue dari matrik konvarian. Jika

C adalah matrik bujur sangkar dengan ukuran sembarang m>1, maka vektor tidak nol

pada Rn disebut eigenvector dari C jika suatu penggandaan skalar dari ,

(14)

disebut sebagai eigenvector dari C yang berpadanan terhadap , untuk mendapatkan

eigenvector dan eigenvalue, maka dapat ditunjukan pada persamaan (2.11).

... (2.11)

...(2.12)

Atau dapat dituliskan menggunakan persamaan (2.13) berikut:

...(2.13)

...(2.14)

Hasil dari persamaan (2.14) adalah berupa vektor, yaitu eigenvalue

diurutkan secara menurun dari nilai paling besar menuju nilai yang paling kecil

. Eigenvector yang bersesuaian dengan nilai terbesar dari

eigenvalue mempunyai ciri yang paling dominan, sedangkan nilai eigenvector yang

bersesuaian dengan eigenvalue yang paling kecil mempunyai ciri paling tidak

(15)

2.3. Active Appearance Models (AAM)

AAM erat terkait dengan konsep aktif blobs dan modelmorphable, non-linear,

generatif, dan parametrik model dari fenomena visual tertentu untuk memaksimalkan

"match point" antara contoh model dan citra masukan [11,14]. Model parameter yang

kemudian digunakan dalam aplikasi tertentu. Sebagai contoh, parameter dapat

dimasukkan ke classifier untuk menghasilkan algoritma pada pengenalan wajah [12].

Pendekatan yang biasa secara iteratif memecahkan update aditif tambahan untuk

parameter (bentuk dan koefisien penampilan). Mengingat perkiraan parameter bentuk

citra masukan ke koordinat frame model dan kemudian untuk menghitung kesalahan

model. AAM merupakan metode pembelajaran statistik, yang dilatih dari sebuah kelas

obyek non-rigid dalam hal ini wajah. AAM bekerja dengan fitting model untuk sebuah

parameter gambar suatu optimasi pencari jenis obyek [13]. Tujuan dari pencarian ini

adalah untuk mencapai deskripsi parameter obyek dalam citra. Active Appearance

Models memiliki sekumpulan model template deformable, dan dapat dipahami sebagai

metode pencocokan template yang canggih [1].

2.4. Analisis Procrustes

Korespondensi dan analisis bentuk memainkan peran yang penting dalam

bidang komputer vision, tidak hanya dalam menentukan korespondensi, tetapi juga

menentukan validitas algoritma yang digunakan untuk menempatkan landmark di

lokasi yang akurat. Analisis harus didefinisikan dengan baik sehingga tidak bias dan

menyeluruh dalam evaluasi. Procrustes analisis yang digunakan adalah analisis bentuk

(16)

adanya kesesuaian antara dua atau lebih bentuk landmark. Analisis procrustes adalah

orthogonal atau biasa disebut Generalized Orthogonal Procrustes Analysis (GPA)

digunakan untuk korespondensi bentuk karena sifat orthogonal rotasi matriks. Gower

telah memerankan peran penting dalam pengenalan dan derivasi dari analisis

Procrustes ortogonal pada tahun 1971-1975. Meskipun Hurley dan Cattell pertama

kali menggunakan istilah analisis procrustes pada tahun 1962 dengan metode yang

tidak membatasi untuk transformasi sebuah matriks ortogonal [15]. Pada teknik ini

mengeksplorasi bentuk dan mempertahankannya.

Tabel 2.1. Algoritma generalized orthogonal procrustes analysis (GPA) [15]

1. Memililih satu bentuk menjadi bentuk perkiraan rata-rata awal (yaitu set bentuk pertama).

2. Menyejajarkan posisi bentuk dengan bentuk mean perkiraan.

a.Menghitung centroid masing-masing bentuk (atau sekumpulan Landmark). b.Menyelaraskan semua bentuk centroid ke bentuk asal.

c.Menormalkan centroid setiap bentuk ukuran.

d.Memutar bentuk masing-masing untuk menyelaraskan dengan rata-rata perkiraan terbaru.

3. Mengitung rata-rata perkiraan baru dari bentuk selaras.

4. Jika rata-rata perkiraan dari langkah 2 dan 3 berbeda kembali ke langkah 2, jika tidak, berarti telah menemukan bentuk mean sebenarnya dari himpunan.

Analisis procrustes memiliki beberapa keunggulan, terutama pada pendekatan

proses korespondensi pada bentuk, kompleksitas algoritmanya rendah sehingga

memungkinkan untuk diimplementasi dengan mudah. Selain ituGeneralized

Orthogonal Procrustes Analysis (GPA) merupakan solusi praktis untuk penyelarasan

obyek yang mirip. Analisis Procrustes adalah cara yang efektif untuk menyesuaikan

(17)

brutal terhadap pengambilan hampir semua data [15]. Gambar 2.5 distribusi titik yang

merepresentasikan bentuk tangan setelah dilakukan proses rata-rata yang diberikan

pada warna merah [15].

Gambar 2.5. Distribusi titik yang merepresentasikan bentuk tangan setelah dilakukan proses rata-rata yang diberikan pada warna merah [15]

(18)

2.4.1. Translasi

Tahap translasi memindahkan semua bentuk ke pusat dasarnya, titik awalnya

adalah (0,0) ini adalah yang paling mungkin untuk mewakili titik pusat umumnya,

namun tidak secara eksklusif begitu. Sebagai contoh berikut ini titik asal yang akan

menjadi pusat umum.

...(2.15)

...(2.16)

Dimana:

X: k x m matriks koordinat dari Landmark k dalam dimensi m (m=2 atau 3)

Xc: baru koordinat dari X berpusat pada titik asal

Titik pusat dihitung dari jumlah kolom matriks X dibagi dengan jumlah

landmark (sejumlah baris). Setelah titik pusat dihitung kemudian mengurangkan titik

pusat dari setiap elemen di pusat akan matriks itu pada titik asal [1].

2.4.2. Isomorphic Scaling

Skala isomorfik adalah teknik manipulasi yang mentransformasikan bentuk

(19)

Normalisasi adalah jenis transformasi isomorfik yang berguna untuk skala bentuk

Bila matriks telah disesuaikan dan diskalakan selanjutnya akan dilakukan

proses rotasi. Pada saat melakukan rotasi perlu dilakukan penyelarasan semua bentuk

ke satu bentuk target.

X: koordinat X berpusat dan normalisasi.

Q: rotasi ortogonal matriks untuk menyelaraskan X dengan rata-rata.

: rata-rata matriks.

Rotasi akan menggunakan eucidean/frobenius normal di mana ||A||=trace

(A'A), yang merupakan jumlah kuadrat dari elemen A[2]. Jadi, akan meminimalkan

perbedaan antara rata-rata dan merotasikan bentuk matriks dengan menggunakan

jumlah kuadrat.

...(2.18)

(20)

...(2.19)

Oleh karena bagian pertama tidak mengandung Q, maka:

...(2.20)

Dengan Menggunakan dekomposisi nilai singular dari dan properti

cyclic dari trace maka dapat dilihat pada persamaan ( 2.21).

…....(2.21)

H=V'QU adalah ortogonal (pxp) matriks karena merupakan produk dari orthogonal

matriks. Dengan demikian, memiliki persamaan (2.22).

...(2.22)

Oleh karena itu, karena si adalah bilangan tidak-negatif dan trace (SH) adalah

maksimum pada saat hii= 1 untuk i = 1, 2 ... p (nilai maksimal dari suatu matriks

ortogonal), memiliki persamaan (2.23).

...(2.23)

Sehingga Q minimum || XQ - || adalah:

...(2.24)

Oleh karena itu rotasi tersebut diselesaikan dengan mengalikan VU' ke X matriks agar