PENGENALAN WAJAH DENGAN METODE INTERPERSONAL
DIFFERENCE BERBASIS GAUSSIAN MIXTURE MODEL DAN
ANALISIS DISKRIMINAN
Made Ika* dan Rully Soelaiman**Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember, Surabaya
[email protected]*; [email protected]**
ABSTRAK
Pengembangan sistem pengenalan wajah yang optimal akan sangat bergantung pada proses seleksi ciri yang digunakan sebagai basis pada pengenalan pola. Penelitian ini berupaya untuk meningkatkan kemampuan diskriminasi dan mendapatkan akurasi pengenalan wajah yang lebih baik dengan menggunakan Metode Gaussian Mixture Model.
Pada Penelitian ini, Metode yang digunakan diantaranya Metode Principal Component Analysis (PCA) yang digunakan untuk mereduksi dimensi untuk menghasilkan vektor basis orthogonal yang disebut vektor eigen (eigenfaces). Metode pengenalan wajah Bayesian, dimana metode ini menjadikan tugas pengenalan wajah menjadi permasalahan klasifikasi biner yang masing-masing kelas, yaitu variasi intrapersonal dan variasi ekstrapersonal, yang dimodelkan sebagai distribusi Gaussian.
Hasil pengujian sistem pengenalan wajah Bayesian yang berdasarkan pada Gaussian mixture model ini menunjukkan bahwa metode ini memiliki tingkat pengenalan yang lebih baik dibandingkan metode Bayesian dan EigenFace, terutama pada penggunaan data pelatihan yang sedikit.
Kata kunci : Metode Gaussian Mixture Model, analisis diskriminan, pengenalan wajah
PENDAHULUAN
Pengenalan wajah menarik banyak perhatian hingga sampai saat ini. Banyak penelitian-penelitian yang sudah dilakukan untuk mendapatkan algoritme dan metode yang tangguh dalam proses pengenalan wajah. Bagaimanapun, hal ini masih menyisakan berbagai masalah yang kompleks yang masih jauh untuk dipecahkan. Diantara permasalahan tersebut adalah adanya variasi intrapersonal yang signifikan. Citra wajah dari orang yang sama bisa jadi memiliki penampakkan yang sangat berbeda pada kondisi-kondisi yang berbeda. Adanya ekspresi wajah, pencahayaan dan pose wajah mengubah dengan mudah sekumpulan wajah menjadi distribusi yang sangat kompleks. Permasalahan yang lain adalah ketersediaan citra wajah yang digunakan sebagai data pelatihan dari tiap kelas wajah sehingga dapat menangkap semua jenis variasi. Sehingga desain dari system pengenalan wajah seharusnya fokus pada bagaimana mengurangi variasi intrapersonal menggunakan data pelatihan yang terbatas.
TINJAUAN PUSTAKA
Pengenalan Wajah dengan Metode Bayesian
Implementasi Analisis Bayesian pada Sistem Pengenalan Wajah
Sistem pengenalan wajah yang ada, secara umum berdasarkan pada kesamaan matriks yang seringkali berdasar pada jarak Euclidean atau korelasi ternormalisasi. Sebagai contoh, tingkat kesamaan S(I1,I2) antara dua citra wajah I1 dan I2 bisa didapatkan dengan nilai norm
2 1 I
I − . Metode Bayesian merupakan metode pengenalan
wajah yang menggunakan perhitungan peluang tingkat kesamaan antara citra testing (probe) dengan citra pada training set (gallery) dengan menggunakan perbedaan intensitas antara 2 citra (difference image), dinotasikan dengan ∆=I1−I2, yang merupakan karakteristik penting yang menggambarkan variasi citra wajah seseorang. Difference image dapat diklasifikasikan ke dalam 2 class, yaitu intrapersonal variation class (
Ω
I) yang ditentukan oleh perbedaan citra wajah dari individu yang sama, dan extrapersonal variation class (ΩE) yang ditentukan oleh perbedaan citra wajah dari individu yang berbeda (B. Moghaddam dkk, 2000).Perhitungan Similarity Score (tingkat kesamaan) maksimum yang lebih efisien dari metode pengenalan wajah Bayesian yang menggunakan Maximum Likelihood bisa didapatkan dengan memodelkan kelas intrapersonal ΩI sebagai distribusi Gaussian dimensi tinggi. Σ ∆ Σ ∆ − = Ω ∆ − 2 / 1 2 / 1 ) 2 ( 2 1 exp ) | ( I D I T I P π (1) I
Σ merupakan kovarian dari kelas intrapersonal, D merupakan jumlah vektor eigen terbesar.
Tahapan metode pengenalan wajah metode Bayesian dengan menggunakan perhitungan tingkat kesamaan yang lebih efisien adalah sebagai berikut:
Tahap I : Tahap Pelatihan
Mendapatkan Citra Pelatihan
Pada tahap ini ditentukan sejumlah citra wajah X yang akan digunakan sebagai citra pelatihan yang terdiri dari R citra wajah yang berbeda untuk setiap S subyek berukuran h× w piksel. Sehingga total citra yang terdapat pada data pelatihan adalah RS citra.
Mengatur Citra Pelatihan
Citra pelatihan yang sudah didapatkan pada tahap sebelumnya disimpan menjadi sebuah bentuk matriks citra pelatihan (CP) berukuran N× M, dimana M merupakan jumlah seluruh citra wajah (RS) dan N merupakan jumlah piksel tiap citra (h× w). Setiap citra pada data pelatihan menempati satu kolom matriks citra pelatihan. Matriks citra pelatihan (CP) memiliki bentuk sebagai berikut,
= MN N N M M x x x x x x x x x CP K K K K K L K 2 1 2 22 12 1 21 11
x merupakan intensitas piksel dari tiap citra wajah, dan N merupakan jumlah piksel dari tiap citra wajah.
Mendapatkan Matriks Intrapersonal Difference Image
Matriks intrapersonal difference image (MI) didapatkan dari selisih dua citra dalam satu subyek. Satu subyek menghasilkan sejumlah RC2. Sehingga ukuran matriks
intrapersonal difference image adalah N× L dimana L merupakan RC2 × S. Matriks
intrapersonal difference image (MI) memiliki bentuk sebagai berikut,
= LN N N L L y y y y y y y y y MI K K K K K L K 2 1 2 22 12 1 21 11
Melakukan proses PCA
Pada tahap ini dilakukan analisis komponen utama (PCA) terhadap matriks intrapersonal difference image sehingga didapatkan sejumlah L vektor eigen ℑ dan nilai eigen Λ terbesar yang digunakan untuk proses selanjutnya. Berikut ini adalah bentuk matriks sejumlah L vektor eigen ℑ dan nilai eigen Λ terbesar,
= ℑ LN N N L L v v v v v v v v v K K K K K L K 2 1 2 22 12 1 21 11 = Λ LL d d d K K K K K L K 0 0 0 0 0 0 22 11
Transformasi Whitening Citra Pelatihan
Untuk menyederhanakan perhitungan maka dilakukan proses transformasi whitening terhadap setiap citra yang ada pada data pelatihan dengan menggunakan persamaan berikut .
X P
Xtrans =Γ−1/2 T (2) Sehingga matriks citra transformasi berukuran L X M. Menghitung Konstanta Pembagi ternormalisasi
Pada tahap ini dilakukan perhitungan konstanta pembagi ternormalisasi yang merupakan konstanta yang digunakan sebagai pembagi pada perhitungan maximum likelihood. Persamaan (3) merupakan persamaan konstanta pembagi ternormalisasi (KPT). 2 / 1 2 / ) 2 ( Σ = D KPT π (3)
D merupakan jumlah nilai eigen terbesar, dan Σ merupakan matriks kovarian dari matriks intrapersonal difference image. Determinan dari matriks kovarian, bisa dihitung dengan product nilai eigen.
Tahap II : Pengenalan Citra Wajah
Mengatur Citra Inputan
Citra inputan yang ada dibentuk menjadi vektor kolom dalam sebuah matriks citra input. Bentuk matriks citra input adalah sebagai berikut,
= N i i i I 1 12 11 ...
i merupakan intensitas piksel, dan N merupakan jumlah piksel. Transformasi Whitening Citra Input
Menghitung Similarity Score dan mendapatkan nilai maksimum
Tahap terakhir dari tahap pengenalan citra wajah metode Bayesian adalah proses untuk mendapatkan Similarity Score maksimum dengan menghitung Maximum Likelihood untuk tiap difference image citra input dan pelatihan.
KPT e P Trans Trans X I I 2 2 1 ) | ( − − = Ω ∆ (4)
Pada persamaan (2.5) dilakukan penyederhanaan nilai eksponensial yaitu dengan menggunakan jarak Euclidean sederhana.
Pengenalan Wajah dengan Metode Bayesian Berbasis Gaussian Mixture Model
Pada bagian ini akan dijelaskan mengenai Gaussian mixture model yang merupakan metode yang digunakan pada pengembangan pengenalan wajah dengan metode Bayesian dan implementasi Gaussian mixture model pada metode pengembangan ini.
Gaussian Mixture Model
Distribusi Gaussian/ distribusi normal merupakan distribusi kontinu yang paling penting dalam seluruh bidang statistika (Ronald E.W dan Raymond H.M) Pada satu dimensi, grafiknya berbentuk lonceng disebut kurva normal yang didefinisikan oleh dua parameter, mean (rata-rata) µ dan variance (variansi/ragam) σ2. Pada ruang dimensi D, distribusi Gaussian didefinisikan pada bentuk matriks sebagai berikut:
− Σ − − Σ = Σ − ) ( ) ( 2 1 exp ) 2 ( 1 ) , ; ( 1 2 / 1 2 / µ µ π µ x x x N T D (5)
µ adalah vektor rata-rata (mean) dan Σ adalah matriks kovarian.
Implementasi Gaussian Mixture Model pada Sistem Pengenalan Wajah dengan Metode Bayesian
Pada saat perbedaan intrapersonal pada himpunan data wajah cukup besar, ragam variasi intrapersonal akan menjadi sangat kompleks untuk dimodelkan sebagai sebuah Distribusi Gaussian Tunggal,
Pada metode ini, tingkat kesamaan antara dua citra bisa diukur dengan perkiraan dari intrapersonal likelihood Pk(∆|ΩI) untuk setiap subruang intrapersonal lokal seperti yang dilakukan pada metode Bayesian. Subruang Intrapersonal lokal dengan Pk(∆|ΩI) paling maksimum adalah model terbaik dari ∆ ,
{
}
Kk k
I P
P(∆|Ω )=max (∆) =1 (6)
Estimasi Pk(∆|ΩI) yang lebih stabil adalah dengan menggunakan persamaan (7). )) ( exp( ) | (∆ ΩI = − k2 ∆ k P ε (7) ) ( 2 ∆ k
ε DFFS dari masing masing subruang intrapersonal yang dihitung dengan menggunakan sejumlah vektor eigen terbesar.
2 2 || ) ( ) ( ) ( || ) ( k k T k k k ∆ = ∆−m −W W ∆−m ε (8) k
m merupakan rata-rata difference image dari tiap kelas, dan Wk merupakan sejumlah vektor eigen terbesar yang didapat dari proses PCA/ pembelajaran tiap kelas.
Analisis Komponen Utama
Analisis Komponen Utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier
sehingga terbentuk sistem koordinat baru dengan variansi maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. PCA juga dikenal dengan Transformasi Karhunen-Loève (dinamakan untuk menghormati Kari Karhunen dan Michel Loève) atau Transformasi
Hotelling (dinamakan untuk menghormati Harold Hotelling). PCA juga merupakan
salah satu teknik statistik multivariat yang dapat menemukan karakteristik data yang tersembunyi.
DESAIN SISTEM Blok Diagram Sistem
Secara garis besar, sistem terdiri dari 3 bagian yaitu pra proses (preprocessing), pelatihan data (training), dan pengenalan (identification). Gambar 1 adalah gambar garis besar sistem pengenalan wajah. Hasil akhir dari proses pengenalan wajah ini adalah citra wajah yang diidentifikasi sebagai orang yang sama dari citra
[
Gambar 1 Garis besar sistem pengenalan wajah
Data
Data masukan yang digunakan dalam sistem merupakan data citra wajah yang mempunyai format bmp. Tipe citra wajah yang digunakan adalah grayscale, yaitu citra wajah hitam putih dengan derajat keabuan 0 – 255. Basis data citra wajah yang digunakan adalah 3 jenis basis data citra wajah baku yaitu, The University of Bern , The Yale Face Database and ORL / AT&T Database. Basis Data Bern memuat 28 orang yang masing-masing memiliki 10 citra wajah frontal. Basis Data Bern memiliki karakteristik adanya perubahan yang relatif kecil pada ekspresi wajah (facial expression) serta perubahan posisi kepala kearah kiri, kanan, atas dan bawah sebesar ± 30 derajat. Ukuran citra asli dari basis data Bern adalah 88x64, namun sebagai data masukan, citra yang digunakan terlebih dahulu akan dinormalisasi dengan melakukan reduksi ukuran citra asal (cropping) menjadi berukuran 73x56. Basis Data Yale memuat 15 orang dengan masing-masing memiliki 11 citra. Subyek bervariasi terhadap jenis kelamin, ekspresi wajah, pencahayaan (lighting) dan asesoris wajah (misalnya kacamata). Ukuran citra wajah dari basis data Yale adalah 88x64. citra yang digunakan sebagai data masukan terlebih dahulu akan dinormalisasi dengan melakukan reduksi ukuran citra asal menjadi berukuran 58x42. Untuk basis data yang terakhir, yaitu basis data ORL, memiliki 40 subyek dengan masing-masing memiliki 10 citra wajah. Subyek bervariasi terhadap jenis kelamin, ekspresi wajah, kacamata dan perubahan posisi (pose) yang lebih tajam. Citra dari basis data ini berukuran 112x92, dan dinormalisasi dengan
PREPROCESSING TRAINING
melakukan reduksi ukuran citra asal menjadi berukuran 83x70. Untuk basis data ORL hanya digunakan 20 subyek pertama sebagai data masukan.
HASIL dan PEMBAHASAN
Pengujian pada sistem pengenalan wajah yang dikembangkan pada penelitian ini dilakukan dengan memisahkan data citra wajah menjadi dua himpunan yang saling pisah (disjoint) yaitu himpunan citra pelatihan dan citra pengujian. Perhitungan persentase dari keberhasilan pengenalan wajah dilakukan pada himpunan citra pengujian.
Proses pembelajaran untuk seluruh basis data wajah yaitu, Bern, Yale dan ORL dilakukan pada tiga variasi pengujian, yaitu
1. Variasi pengujian Basis Data Bern, yaitu Bern 3, Bern 4 dan Bern 5. 2. Variasi pengujian Basis Data Yale, yaitu Yale 3, Yale 4 dan Yale 5. 3. Variasi pengujian Basis Data ORL, yaitu ORL 3, ORL 4 dan ORL 5
Pernyataan angka pada model variasi pengujian dari masing-masing basis data menggambarkan sebagai jumlah pose dari setiap kelas individu dari setiap basis data yang digunakan sebagai data pelatihan.
Pengujian terhadap ketiga basis data wajah dilakukan pada tiga metode yaitu masing-masing dengan metode Bayesian Gaussian Mixture Model, Bayesian dan Eigenface. Tiap metode diuji untuk tiap variasi pengujian pada masing-masing basis data wajah. Berikut ini adalah tabel hasil pengujian dari ketiga basis data wajah
Tabel 1. Hasil Pengujian Pengenalan Wajah (%) pada basis data Bern, Yale, ORL
Basis Variasi
Bayesian
GMM Bayesian GMM Bayesian Eigenface data Pengujian with reference
3 75 72,96 72,96 69,39 Bern 4 80,95 76,79 77,38 75 5 82,86 80,71 85,71 77,86 3 73,33 70 72,50 65,83 Yale 4 78,10 73,33 72,38 64,76 5 77,78 77,78 73,33 63,33 3 74,29 72,14 73,57 65,71 ORL 4 73,33 74,17 78,33 69,17 5 79 82 86 80
Selanjutnya grafik tingkat keberhasilan pengenalan dari hasil pengujian terhadap setiap basis data wajah disajikan sebagai berikut :
75% 81% 83% 73% 77% 81% 73% 77% 86% 69% 75% 78% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% Bern3(70%) Bern4(60%) Bern5(50%) D a ta U ji Tingkat Pengenalan
Bayesian GMM Bayesian GMM with Reference Bayesian EigenFace
73% 78% 78% 70% 73% 78% 73% 72% 73% 66% 65% 63% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% Yale3(72.73%) Yale4(63.64%) Yale5(54.55%) D a ta U ji Tingkat Pengenalan
Bayesian GMM Bayesian GMM with Reference Bayesian EigenFace
Gambar 2. Tingkat Keberhasilan Pengenalan pada Uji Bem
Gambar 3 Tingkat Keberhasilan Pengenalan pada Uji Yale
74% 73% 79% 72% 74% 82% 74% 78% 86% 66% 69% 80% 0% 20% 40% 60% 80% 100% ORL3(70%) ORL4(60%) ORL5(50%) D a ta U ji Tingkat Pengenalan
Bayesian GMM Bayesian GMM with Reference Bayesian EigenFace
Akumulasi akurasi pengenalan pada tiap-tiap himpunan pengujian setiap basis data. Dari grafik akumulasi akurasi tersebut dapat diperoleh bahwa pada rank 2, akurasi pengenalan meningkat untuk semua skenario uji pada setiap basis data.
1 2 3 4 5 6 7 8 0.75 0.8 0.85 0.9 0.95 1 Uji Bern 3 Uji Bern 4 Uji Bern 5 Rank A k u ra s i
Akurasi Metode Bayesian GMM pada Uji Bern
1 2 3 4 5 6 7 8 0.7 0.75 0.8 0.85 0.9 0.95 1 Uji Yale 3 Uji Yale 4 Uji Yale 5 Rank A k u ra s i
Akurasi Metode Bayesian GMM pada Uji Yale
1 2 3 4 5 6 7 8 0.7 0.75 0.8 0.85 0.9 0.95 1 Uji ORL 3 Uji ORL 4 Uji ORL 5 Rank A k u ra s i
Akurasi Metode Bayesian GMM pada Uji ORL
KESIMPULAN
Berdasarkan uji coba dan evaluasi hasil pengujian terhadap sistem pengenalan wajah dengan metode Bayesian berbasis Gaussian mixture model dan terhadap metode pembanding lainnya dapat disimpulkan sebagai berikut :
• Pengenalan wajah dengan metode Bayesian berbasis Gaussian mixture model memiliki tingkat pengenalan yang lebih baik dibandingkan dengan metode Bayesian dan EigenFace, terutama pada penggunaan data training yang sedikit. • Pengenalan wajah dengan metode Bayesian berbasis Gaussian mixture model tidak
memperhatikan batasan nilai similarity score, sehingga citra inputan selalu dikenali sebagai salah satu dari citra pelatihan yang ada meskipun citra inputan bukan merupakan citra subyek yang digunakan untuk pelatihan.
REFERENCE
B. Moghaddam, T. Jebara, and A. Pentland, Bayesian Face Recognition, Pattern Recognition, Vol. 33, pp. 1771-1782, 2000.
Howard Anton, Aljabar Linear Elementer, Edisi Kelima, Penerbit Erlangga, 2005. M. Turk, A. Pentland, Eigenfaces for Recognition, Journal of Cognitive Neurosicence,
Vol. 3, No. 1, 1991, pp. 71-86.
Gambar 4Tingkat Keberhasilan Pengenalan pada Uji ORL
Gambar 5. Akumulasi akurasi pengenalan
pada Uji Bern
Gambar 6. Akumulasi akurasi pengenalan
pada Uji Yale
Gambar 5. Akumulasi akurasi pengenalan pada
Ronald E Walpole, Raymond H Myers, Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi ke-4, Penerbit ITB Bandung.
Rully Soelaiman, Sistem Pengenalan Wajah dengan Penerapan Algoritma Genetika pada Optimasi Basis Eigenface dan Proyeksi Fisherface, Universitas Indonesia, 2003.
Xiaoyang Tan, Jun Liu, Songcan Chen, Sub-intrapersonal space analysis for face recognition, Department of Computer Science & Engineering, Nanjing University of Aeronautics & Astronautics, 2005.
X. Wang and X. Tang, Bayesian Face Recognition Based on Gaussian Mixture Models, in Proceedings of ICPR, 2004.