• Tidak ada hasil yang ditemukan

Analisis Jejaring Sosial untuk Rekomendasi Personal pada Komunitas Online

PERBANDINGAN PCA DAN KPCA PADA PENGENALAN JENIS KELAMIN

Rima Tri Wahyuningrum

Laboratorium Komputasi dan Sistem Cerdas Prodi Teknik Informatika

Universitas Trunojoyo Madura, Bangkalan, Indonesia rimatriwahyuningrum@gmail.com

ABSTRAK. Pengenalan jenis kelamin sebagai salah satu penelitian di bidang biometrik dan computer vision yang cukup popular, dimana penelitian ini merupakan pengembangan dari penelitian mengenai pengenalan wajah.

Databaseang digunakan pada penelitian ini terdiri dari 400 citra, dengan rincian 200 citra perempuan dan 200 citra laki-laki. Ada dua tahapan penting dalam penelitian ini, yaitu ektraksi fitur dan pengukuran kemiripan atau pengenalan. Pada penelitian ini membandingkan metode ekstraksi fitur

Principal Component Analysis (PCA) dan Kernel Principal Component Analysis (KPCA). Sedangkan metode pengukuran kemiripan yang digunakan adalah Mahalanobis Distance. Metode KPCA berjalan cukup baik karena memperoleh akurasi lebih tinggi dari metode PCA. Akurasi tertinggi yang dihasilkan pada penelitian ini mencapai 94.35%.

Kata Kunci: pengenalan jenis kelamin, PCA, KPCA, Mahalanobis Distance

1. PENDAHULUAN

Jenis kelamin pada manusia itu terdiri dari laki-laki dan perempuan. Manusia dengan mudah dapat mengklasifikasikan atau mengenali jenis kelamin dengan banyak cara. Contohnya dengan membedakan dari bentuk tubuh, cara berpakaian, bentuk wajah dan lain sebagainya. Dari beberapa cara pengenalan yang dapat dilakukan oleh manusia tersebut, cara mengenali dari bentuk wajah digunakan oleh sistem cerdas secara otomatis. Citra wajah memiliki fitur karakteristik dari manusia yang berupa identitas dan emosi. Selain itu antara wajah laki-laki dan perempuan secara umum mempunyai ciri yang mencolok dan berbeda sehingga dapat dibedakan oleh sistem cerdas ini.

Secara umum pada pengenalan wajah maupun pengenalan jenis kelamin mempunyai tiga macam pendekatan, yaitu: pendekatan holistik yang berdasarkan ciri secara keseluruhan citra, pendekatan feature-based yang berdasarkan ciri lokal seperti mata dan hidung, dan pendekatan

hybrid yang berdasarkan gabungan dari holistik dan feature-based. Pada penelitian ini menggunakan pendekatan holistik. Pada pendekatan holistik seluruh bagian atau ciri global wajah digunakan sebagai data masukan untuk pengenalan.

Secara garis besar terdapat tiga tahapan dalam proses pengenalan yaitu pra pemrosesan,

ekstraksi fitur dan klasifikasi/pengenalan. Pada penelitian ini tidak melakukan tahap pra pemrosesan karena data base ini telah dilakukan pra pemrosesan sehingga data tersebut dapat langsung dilakukan proses berikutnya. Oleh karena itu, metode yang digunakan untuk ekstraksi fitur dan klasifikasi sangat menentukan dalam penelitian ini.

Metode ekstraksi fitur PCA maupun KPCA telah banyak digunakan dalam beberapa penelitian mengenai pengenalan wajah seperti yang dilakukan oleh (Zhang R, 2010; Zhang C, 2010; Wen Y, 2012; Kekre, H.B., 2010). PCA seringkali mengalami kesulitan untuk memodelkan data yang sangat kompleks. Kernel PCA (KPCA) merupakan pengembangan non linear dari PCA. Dengan menggunakan representasi non-linear data pada KPCA akan lebih mudah dimodelkan. Demikian pula, metode pengenalan Mahalanobis Distance juga telah banyak digunakan seperti oleh (Todeschinia, R. 2013; Melnykov, I. 2014). Pada penelitian ini telah berhasil melakukan ujicoba dengan membandingkan metode PCA dan KPCA menggunakan metode pengenalan Mahalanobis Distance.

2. METODE PENELITIAN

Pada penelitian ini menggunakan database citra jenis kelamin yaitu JAVE sebanyak 400 citra yang terdiri dari 200 citra laki-laki dan 200 citra perempuan dengan dimensi matrik 200 x 200 diambil dari website http://www.advancedsourcecode.com. Penelitian ini membandingkan antara ekstraksi fitur PCA dan KPCA untuk mendapatkan matrik bobot kemudian menghitung klasifikasi atau pengenalannya menggunakan metode Mahalanobis Distance. Berikut penjelasan masing-masing metode tersebut:

1. Principal Component Analysis (PCA)

Metode PCA pertama kali diperkenalkan oleh M. Turk pada tahun 1991. Metode ini merupakan salah satu metode ekstraksi fitur yang paling banyak diminati oleh para peneliti. PCA merupakan teknik reduksi menggunakan teori-teori sederhana dari statistik, seperti varian, standar deviasi,

zeromean, kovarian dan persamaan karakteristik. Dengan ditemukannya PCA telah membawa perubahan yang sangat besar pada ekstraksi fitur yang berbasis appearance. Pada Gambar 1 menunjukkan diagram alir sistem pengenalan jenis kelamin menggunakan PCA dan

Mahalanobis Distance. Sebelum dilakukan perhitungan rata-rata baik database citra pelatihan dan database citra uji, maka dilakukan perubahan matrik menjadi 1 dimensi.

Prosiding ISBN 978-602-18580-3-5

Seminar Nasional Matematika, Sains dan Informatika 2015 543

Gambar 1. Diagram alir pengenalan jenis kelamin menggunakan PCA - Mahalanobis Distance

2. Mahalanobis Distance

Mulai

Data citra pelatihan (A)

� ∑���

Hitung rata-rata matrik seluruh citra ( )

Hitung nilai zeromean (Φ) Φ = xj,i - µi

Menghitung nilai kovarian matrik (C) C = Φj,i–ΦT

ji

Hitung nilai eigen vector (Q) dan eigen value (λ) [Q, λ] = svd(C)

Hitung nilai proyeksi (P) P = ΦT Q

Hitung nilai bobot pelatihan Bt = AP

T

Mulai

Data citra uji (B)

Hitung nilai matrik bobot uji Bu = BPT

Pengenalan

Mahalanobis Distance

Akurasi Hasil Pengenalan Wajah

Mahalanobis Distance merupakan suatu metode statistika yang digunakan untuk mengelompokkan data dengan jarak tertentu. Dalam penelitian ini Mahalanobis Distance

digunakan untuk membandingkan dua buah matrik fitur dari suatu citra wajah yang sudah dilakukan proses ekstraksi fiturnya. Untuk menghitung Mahalanobis Distance menggunakan rumus pada persamaan 1.

(1) Dimana Bp adalah nilai matrik bobot pelatihan, Bu adalah nilai matrik bobot uji, dan C adalah

nilai matrik kovarian pelatihan.

3. Kernel Principal Component Analysis (KPCA)

Metode PCA sampai sekarang terus mengalami perubahan disesuaikan dengan kebutuhan data yang digunakan oleh para peneliti. Salah satunya metode KPCA. KPCA mampu mengatasi kesulitan dalam memodelkan data yang sangat kompleks seperti data non linear. Pada penelitian ini membandingkan dua kernel yang digunakan yaitu kernel polynomial dan kernel Gaussian,

masing-masing ditunjukkan pada persamaan 2 dan 3. Diagram alir KPCA menggunakan kernel polynomial seperti ditunjukkan pada Gambar 2.

K(A,B)= (A.B + b)d (2) dimana K(x,y) = matrik polynomial, A = matrik asli dari wajah, B = matrik transpose dari matrik wajah asli, b = kostanta 1, d = ordo maksimal dari monomial adalah 1 namun pada penelitian ini menggunakan konstanta d = 5.

‖ ‖ ⁄ (3) dimana L(A,B) = matrik Gaussian, = varian namun pada penelitian ini menggunakan konstanta = 3.105

3. HASIL PENELITIAN DAN PEMBAHASAN

Pada penelitian ini menggunakan empat skenario uji coba. Dari keempat skenario uji coba ini yang membedakan adalah jumlah data yang digunakan baik pada proses pelatihan maupun uji. Pada Tabel 1 menunjukkan skenario uji coba, sedangkan pada Tabel 2 menunjukkan akurasi hasil akhir eksperimen yang telah dilakukan. Masing-masing skenario baik pada PCA maupun KPCA melakukan pengurangan dimensi yaitu hanya dengan menggunakan eigen value (v) 25

dan 50 saja. ) , ( ) , ( ) , ( T p u u p u p B B B C B B B d 