PENGENALAN WAJAH DENGAN METODE INTERPERSONAL DIFFERENCE BERBASIS GAUSSIAN MIXTURE MODEL DAN ANALISIS DISKRIMINAN

(1)

PENGENALAN WAJAH DENGAN METODE INTERPERSONAL

DIFFERENCE BERBASIS GAUSSIAN MIXTURE MODEL DAN

ANALISIS DISKRIMINAN

Made Ika* dan Rully Soelaiman**

Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember, Surabaya

ABSTRAK

Pengembangan sistem pengenalan wajah yang optimal akan sangat bergantung pada proses seleksi ciri yang digunakan sebagai basis pada pengenalan pola. Penelitian ini berupaya untuk meningkatkan kemampuan diskriminasi dan mendapatkan akurasi pengenalan wajah yang lebih baik dengan menggunakan Metode Gaussian Mixture Model.

Pada Penelitian ini, Metode yang digunakan diantaranya Metode Principal Component Analysis (PCA) yang digunakan untuk mereduksi dimensi untuk menghasilkan vektor basis orthogonal yang disebut vektor eigen (eigenfaces). Metode pengenalan wajah Bayesian, dimana metode ini menjadikan tugas pengenalan wajah menjadi permasalahan klasifikasi biner yang masing-masing kelas, yaitu variasi intrapersonal dan variasi ekstrapersonal, yang dimodelkan sebagai distribusi Gaussian.

Hasil pengujian sistem pengenalan wajah Bayesian yang berdasarkan pada Gaussian mixture model ini menunjukkan bahwa metode ini memiliki tingkat pengenalan yang lebih baik dibandingkan metode Bayesian dan EigenFace, terutama pada penggunaan data pelatihan yang sedikit.

Kata kunci : Metode Gaussian Mixture Model, analisis diskriminan, pengenalan wajah

PENDAHULUAN

Pengenalan wajah menarik banyak perhatian hingga sampai saat ini. Banyak penelitian-penelitian yang sudah dilakukan untuk mendapatkan algoritme dan metode yang tangguh dalam proses pengenalan wajah. Bagaimanapun, hal ini masih menyisakan berbagai masalah yang kompleks yang masih jauh untuk dipecahkan. Diantara permasalahan tersebut adalah adanya variasi intrapersonal yang signifikan. Citra wajah dari orang yang sama bisa jadi memiliki penampakkan yang sangat berbeda pada kondisi-kondisi yang berbeda. Adanya ekspresi wajah, pencahayaan dan pose wajah mengubah dengan mudah sekumpulan wajah menjadi distribusi yang sangat kompleks. Permasalahan yang lain adalah ketersediaan citra wajah yang digunakan sebagai data pelatihan dari tiap kelas wajah sehingga dapat menangkap semua jenis variasi. Sehingga desain dari system pengenalan wajah seharusnya fokus pada bagaimana mengurangi variasi intrapersonal menggunakan data pelatihan yang terbatas.

(2)

TINJAUAN PUSTAKA

Pengenalan Wajah dengan Metode Bayesian

Implementasi Analisis Bayesian pada Sistem Pengenalan Wajah

Sistem pengenalan wajah yang ada, secara umum berdasarkan pada kesamaan matriks yang seringkali berdasar pada jarak Euclidean atau korelasi ternormalisasi. Sebagai contoh, tingkat kesamaan S(I₁,I₂) antara dua citra wajah I₁ dan I₂ bisa didapatkan dengan nilai norm

2 1 I

I − . Metode Bayesian merupakan metode pengenalan

wajah yang menggunakan perhitungan peluang tingkat kesamaan antara citra testing (probe) dengan citra pada training set (gallery) dengan menggunakan perbedaan intensitas antara 2 citra (difference image), dinotasikan dengan ∆=I₁−I₂, yang merupakan karakteristik penting yang menggambarkan variasi citra wajah seseorang. Difference image dapat diklasifikasikan ke dalam 2 class, yaitu intrapersonal variation class (

Ω

_I) yang ditentukan oleh perbedaan citra wajah dari individu yang sama, dan extrapersonal variation class (Ω_E) yang ditentukan oleh perbedaan citra wajah dari individu yang berbeda (B. Moghaddam dkk, 2000).

Perhitungan Similarity Score (tingkat kesamaan) maksimum yang lebih efisien dari metode pengenalan wajah Bayesian yang menggunakan Maximum Likelihood bisa didapatkan dengan memodelkan kelas intrapersonal Ω_I sebagai distribusi Gaussian dimensi tinggi.             Σ       ∆ Σ ∆ − = Ω ∆ − 2 / 1 2 / 1 ) 2 ( 2 1 exp ) | ( I D I T I P π (1) I

Σ merupakan kovarian dari kelas intrapersonal, D merupakan jumlah vektor eigen terbesar.

Tahapan metode pengenalan wajah metode Bayesian dengan menggunakan perhitungan tingkat kesamaan yang lebih efisien adalah sebagai berikut:

Tahap I : Tahap Pelatihan

Mendapatkan Citra Pelatihan

Pada tahap ini ditentukan sejumlah citra wajah X yang akan digunakan sebagai citra pelatihan yang terdiri dari R citra wajah yang berbeda untuk setiap S subyek berukuran h× w piksel. Sehingga total citra yang terdapat pada data pelatihan adalah RS citra.

Mengatur Citra Pelatihan

Citra pelatihan yang sudah didapatkan pada tahap sebelumnya disimpan menjadi sebuah bentuk matriks citra pelatihan (CP) berukuran N× M, dimana M merupakan jumlah seluruh citra wajah (RS) dan N merupakan jumlah piksel tiap citra (h× w). Setiap citra pada data pelatihan menempati satu kolom matriks citra pelatihan. Matriks citra pelatihan (CP) memiliki bentuk sebagai berikut,

            = MN N N M M x x x x x x x x x CP K K K K K L K 2 1 2 22 12 1 21 11

x merupakan intensitas piksel dari tiap citra wajah, dan N merupakan jumlah piksel dari tiap citra wajah.

(3)

Mendapatkan Matriks Intrapersonal Difference Image

Matriks intrapersonal difference image (MI) didapatkan dari selisih dua citra dalam satu subyek. Satu subyek menghasilkan sejumlah RC2. Sehingga ukuran matriks

intrapersonal difference image adalah N× L dimana L merupakan RC2 × S. Matriks

intrapersonal difference image (MI) memiliki bentuk sebagai berikut,

            = LN N N L L y y y y y y y y y MI K K K K K L K 2 1 2 22 12 1 21 11

Melakukan proses PCA

Pada tahap ini dilakukan analisis komponen utama (PCA) terhadap matriks intrapersonal difference image sehingga didapatkan sejumlah L vektor eigen ℑ dan nilai eigen Λ terbesar yang digunakan untuk proses selanjutnya. Berikut ini adalah bentuk matriks sejumlah L vektor eigen ℑ dan nilai eigen Λ terbesar,

            = ℑ LN N N L L v v v v v v v v v K K K K K L K 2 1 2 22 12 1 21 11             = Λ LL d d d K K K K K L K 0 0 0 0 0 0 22 11

Transformasi Whitening Citra Pelatihan

Untuk menyederhanakan perhitungan maka dilakukan proses transformasi whitening terhadap setiap citra yang ada pada data pelatihan dengan menggunakan persamaan berikut .

X P

X_trans =Γ−1/2 T (2) Sehingga matriks citra transformasi berukuran L X M. Menghitung Konstanta Pembagi ternormalisasi

Pada tahap ini dilakukan perhitungan konstanta pembagi ternormalisasi yang merupakan konstanta yang digunakan sebagai pembagi pada perhitungan maximum likelihood. Persamaan (3) merupakan persamaan konstanta pembagi ternormalisasi (KPT). 2 / 1 2 / ) 2 ( Σ = D KPT π (3)

D merupakan jumlah nilai eigen terbesar, dan Σ merupakan matriks kovarian dari matriks intrapersonal difference image. Determinan dari matriks kovarian, bisa dihitung dengan product nilai eigen.

Tahap II : Pengenalan Citra Wajah

Mengatur Citra Inputan

Citra inputan yang ada dibentuk menjadi vektor kolom dalam sebuah matriks citra input. Bentuk matriks citra input adalah sebagai berikut,

            = N i i i I 1 12 11 ...

i merupakan intensitas piksel, dan N merupakan jumlah piksel. Transformasi Whitening Citra Input

(4)

Menghitung Similarity Score dan mendapatkan nilai maksimum

Tahap terakhir dari tahap pengenalan citra wajah metode Bayesian adalah proses untuk mendapatkan Similarity Score maksimum dengan menghitung Maximum Likelihood untuk tiap difference image citra input dan pelatihan.

KPT e P Trans Trans X I I 2 2 1 ) | ( − − = Ω ∆ (4)

Pada persamaan (2.5) dilakukan penyederhanaan nilai eksponensial yaitu dengan menggunakan jarak Euclidean sederhana.

Pengenalan Wajah dengan Metode Bayesian Berbasis Gaussian Mixture Model

Pada bagian ini akan dijelaskan mengenai Gaussian mixture model yang merupakan metode yang digunakan pada pengembangan pengenalan wajah dengan metode Bayesian dan implementasi Gaussian mixture model pada metode pengembangan ini.

Gaussian Mixture Model

Distribusi Gaussian/ distribusi normal merupakan distribusi kontinu yang paling penting dalam seluruh bidang statistika (Ronald E.W dan Raymond H.M) Pada satu dimensi, grafiknya berbentuk lonceng disebut kurva normal yang didefinisikan oleh dua parameter, mean (rata-rata) µ dan variance (variansi/ragam) σ2. Pada ruang dimensi D, distribusi Gaussian didefinisikan pada bentuk matriks sebagai berikut:

    − Σ − − Σ = Σ − ) ( ) ( 2 1 exp ) 2 ( 1 ) , ; ( 1 2 / 1 2 / µ µ π µ x x x N T D (5)

µ adalah vektor rata-rata (mean) dan Σ adalah matriks kovarian.

Implementasi Gaussian Mixture Model pada Sistem Pengenalan Wajah dengan Metode Bayesian

Pada saat perbedaan intrapersonal pada himpunan data wajah cukup besar, ragam variasi intrapersonal akan menjadi sangat kompleks untuk dimodelkan sebagai sebuah Distribusi Gaussian Tunggal,

Pada metode ini, tingkat kesamaan antara dua citra bisa diukur dengan perkiraan dari intrapersonal likelihood P_k(∆|Ω_I) untuk setiap subruang intrapersonal lokal seperti yang dilakukan pada metode Bayesian. Subruang Intrapersonal lokal dengan P_k(∆|Ω_I) paling maksimum adalah model terbaik dari ∆ ,

{

}

K

k k

I P

P(∆|Ω )=max (∆) ₌₁ (6)

Estimasi P_k(∆|Ω_I) yang lebih stabil adalah dengan menggunakan persamaan (7). )) ( exp( ) | (∆ Ω_I = − _k2 ∆ k P ε (7) ) ( 2 ∆ k

ε DFFS dari masing masing subruang intrapersonal yang dihitung dengan menggunakan sejumlah vektor eigen terbesar.

2 2 || ) ( ) ( ) ( || ) ( k k T _k k k ∆ = ∆−m −W W ∆−m ε (8) k

m merupakan rata-rata difference image dari tiap kelas, dan Wk merupakan sejumlah vektor eigen terbesar yang didapat dari proses PCA/ pembelajaran tiap kelas.

Analisis Komponen Utama

Analisis Komponen Utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier

(5)

sehingga terbentuk sistem koordinat baru dengan variansi maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. PCA juga dikenal dengan Transformasi Karhunen-Loève (dinamakan untuk menghormati Kari Karhunen dan Michel Loève) atau Transformasi

Hotelling (dinamakan untuk menghormati Harold Hotelling). PCA juga merupakan

salah satu teknik statistik multivariat yang dapat menemukan karakteristik data yang tersembunyi.

DESAIN SISTEM Blok Diagram Sistem

Secara garis besar, sistem terdiri dari 3 bagian yaitu pra proses (preprocessing), pelatihan data (training), dan pengenalan (identification). Gambar 1 adalah gambar garis besar sistem pengenalan wajah. Hasil akhir dari proses pengenalan wajah ini adalah citra wajah yang diidentifikasi sebagai orang yang sama dari citra

[

Gambar 1 Garis besar sistem pengenalan wajah

Data

Data masukan yang digunakan dalam sistem merupakan data citra wajah yang mempunyai format bmp. Tipe citra wajah yang digunakan adalah grayscale, yaitu citra wajah hitam putih dengan derajat keabuan 0 – 255. Basis data citra wajah yang digunakan adalah 3 jenis basis data citra wajah baku yaitu, The University of Bern , The Yale Face Database and ORL / AT&T Database. Basis Data Bern memuat 28 orang yang masing-masing memiliki 10 citra wajah frontal. Basis Data Bern memiliki karakteristik adanya perubahan yang relatif kecil pada ekspresi wajah (facial expression) serta perubahan posisi kepala kearah kiri, kanan, atas dan bawah sebesar ± 30 derajat. Ukuran citra asli dari basis data Bern adalah 88x64, namun sebagai data masukan, citra yang digunakan terlebih dahulu akan dinormalisasi dengan melakukan reduksi ukuran citra asal (cropping) menjadi berukuran 73x56. Basis Data Yale memuat 15 orang dengan masing-masing memiliki 11 citra. Subyek bervariasi terhadap jenis kelamin, ekspresi wajah, pencahayaan (lighting) dan asesoris wajah (misalnya kacamata). Ukuran citra wajah dari basis data Yale adalah 88x64. citra yang digunakan sebagai data masukan terlebih dahulu akan dinormalisasi dengan melakukan reduksi ukuran citra asal menjadi berukuran 58x42. Untuk basis data yang terakhir, yaitu basis data ORL, memiliki 40 subyek dengan masing-masing memiliki 10 citra wajah. Subyek bervariasi terhadap jenis kelamin, ekspresi wajah, kacamata dan perubahan posisi (pose) yang lebih tajam. Citra dari basis data ini berukuran 112x92, dan dinormalisasi dengan

PREPROCESSING TRAINING

(6)

melakukan reduksi ukuran citra asal menjadi berukuran 83x70. Untuk basis data ORL hanya digunakan 20 subyek pertama sebagai data masukan.

HASIL dan PEMBAHASAN

Pengujian pada sistem pengenalan wajah yang dikembangkan pada penelitian ini dilakukan dengan memisahkan data citra wajah menjadi dua himpunan yang saling pisah (disjoint) yaitu himpunan citra pelatihan dan citra pengujian. Perhitungan persentase dari keberhasilan pengenalan wajah dilakukan pada himpunan citra pengujian.

Proses pembelajaran untuk seluruh basis data wajah yaitu, Bern, Yale dan ORL dilakukan pada tiga variasi pengujian, yaitu

1. Variasi pengujian Basis Data Bern, yaitu Bern 3, Bern 4 dan Bern 5. 2. Variasi pengujian Basis Data Yale, yaitu Yale 3, Yale 4 dan Yale 5. 3. Variasi pengujian Basis Data ORL, yaitu ORL 3, ORL 4 dan ORL 5

Pernyataan angka pada model variasi pengujian dari masing-masing basis data menggambarkan sebagai jumlah pose dari setiap kelas individu dari setiap basis data yang digunakan sebagai data pelatihan.

Pengujian terhadap ketiga basis data wajah dilakukan pada tiga metode yaitu masing-masing dengan metode Bayesian Gaussian Mixture Model, Bayesian dan Eigenface. Tiap metode diuji untuk tiap variasi pengujian pada masing-masing basis data wajah. Berikut ini adalah tabel hasil pengujian dari ketiga basis data wajah

Tabel 1. Hasil Pengujian Pengenalan Wajah (%) pada basis data Bern, Yale, ORL

Basis Variasi

Bayesian

GMM Bayesian GMM Bayesian Eigenface data Pengujian with reference

3 75 72,96 72,96 69,39 Bern 4 80,95 76,79 77,38 75 5 82,86 80,71 85,71 77,86 3 73,33 70 72,50 65,83 Yale 4 78,10 73,33 72,38 64,76 5 77,78 77,78 73,33 63,33 3 74,29 72,14 73,57 65,71 ORL 4 73,33 74,17 78,33 69,17 5 79 82 86 80

Selanjutnya grafik tingkat keberhasilan pengenalan dari hasil pengujian terhadap setiap basis data wajah disajikan sebagai berikut :

75% 81% 83% 73% 77% 81% 73% 77% 86% 69% 75% 78% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% Bern3(70%) Bern4(60%) Bern5(50%) D a ta U ji Tingkat Pengenalan

Bayesian GMM Bayesian GMM with Reference Bayesian EigenFace

73% 78% 78% 70% 73% 78% 73% 72% 73% 66% 65% 63% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% Yale3(72.73%) Yale4(63.64%) Yale5(54.55%) D a ta U ji Tingkat Pengenalan

Gambar 2. Tingkat Keberhasilan Pengenalan pada Uji Bem

Gambar 3 Tingkat Keberhasilan Pengenalan pada Uji Yale

(7)

74% 73% 79% 72% 74% 82% 74% 78% 86% 66% 69% 80% 0% 20% 40% 60% 80% 100% ORL3(70%) ORL4(60%) ORL5(50%) D a ta U ji Tingkat Pengenalan

Akumulasi akurasi pengenalan pada tiap-tiap himpunan pengujian setiap basis data. Dari grafik akumulasi akurasi tersebut dapat diperoleh bahwa pada rank 2, akurasi pengenalan meningkat untuk semua skenario uji pada setiap basis data.

1 2 3 4 5 6 7 8 0.75 0.8 0.85 0.9 0.95 1 Uji Bern 3 Uji Bern 4 Uji Bern 5 Rank A k u ra s i

Akurasi Metode Bayesian GMM pada Uji Bern

1 2 3 4 5 6 7 8 0.7 0.75 0.8 0.85 0.9 0.95 1 Uji Yale 3 Uji Yale 4 Uji Yale 5 Rank A k u ra s i

Akurasi Metode Bayesian GMM pada Uji Yale

1 2 3 4 5 6 7 8 0.7 0.75 0.8 0.85 0.9 0.95 1 Uji ORL 3 Uji ORL 4 Uji ORL 5 Rank A k u ra s i

Akurasi Metode Bayesian GMM pada Uji ORL

KESIMPULAN

Berdasarkan uji coba dan evaluasi hasil pengujian terhadap sistem pengenalan wajah dengan metode Bayesian berbasis Gaussian mixture model dan terhadap metode pembanding lainnya dapat disimpulkan sebagai berikut :

• Pengenalan wajah dengan metode Bayesian berbasis Gaussian mixture model memiliki tingkat pengenalan yang lebih baik dibandingkan dengan metode Bayesian dan EigenFace, terutama pada penggunaan data training yang sedikit. • Pengenalan wajah dengan metode Bayesian berbasis Gaussian mixture model tidak

memperhatikan batasan nilai similarity score, sehingga citra inputan selalu dikenali sebagai salah satu dari citra pelatihan yang ada meskipun citra inputan bukan merupakan citra subyek yang digunakan untuk pelatihan.

REFERENCE

B. Moghaddam, T. Jebara, and A. Pentland, Bayesian Face Recognition, Pattern Recognition, Vol. 33, pp. 1771-1782, 2000.

Howard Anton, Aljabar Linear Elementer, Edisi Kelima, Penerbit Erlangga, 2005. M. Turk, A. Pentland, Eigenfaces for Recognition, Journal of Cognitive Neurosicence,

Vol. 3, No. 1, 1991, pp. 71-86.

Gambar 4Tingkat Keberhasilan Pengenalan pada Uji ORL

Gambar 5. Akumulasi akurasi pengenalan

pada Uji Bern

Gambar 6. Akumulasi akurasi pengenalan

pada Uji Yale

Gambar 5. Akumulasi akurasi pengenalan pada

(8)

Ronald E Walpole, Raymond H Myers, Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Edisi ke-4, Penerbit ITB Bandung.

Rully Soelaiman, Sistem Pengenalan Wajah dengan Penerapan Algoritma Genetika pada Optimasi Basis Eigenface dan Proyeksi Fisherface, Universitas Indonesia, 2003.

Xiaoyang Tan, Jun Liu, Songcan Chen, Sub-intrapersonal space analysis for face recognition, Department of Computer Science & Engineering, Nanjing University of Aeronautics & Astronautics, 2005.

X. Wang and X. Tang, Bayesian Face Recognition Based on Gaussian Mixture Models, in Proceedings of ICPR, 2004.