Metodologi yang digunakan pada penelitian ini terdiri atas beberapa tahap. Tahapan-tahapan tersebut disajikan pada Gambar 7.
Berikut ini penerapan algoritme klasifikasi VFI5 disajikan pada Gambar 5. Pada Gambar 5(a) dapat dilihat terdapat dua instance data uji yang belum diketahui label kelasnya. Langkah pertama pada tahap klasifikasi yaitu dicari pada interval mana instance data uji berada. Setelah itu, pada Gambar 5(b) nilai vote yang diperoleh dari tahap pelatihan pada interval itu diambil untuk tiap kelasnya. Pada Gambar 5(c) dapat dilihat kelas yang memiliki nilai vote terbesar (semua nilai vote dijumlah untuk tiap kelasnya) maka diduga sebagai kelas prediksi.
(a)
(b)
(c)
Gambar 5 Contoh penerapan algoritme klasifikasi VFI5, (a) Data uji dengan dua
instance. (b) Nilai vote hasil tahap pelatihan. (c) Nilai vote data uji dan kelas hasil prediksi.
Penerapan VFI5 Berbasis Histogram
Menurut Purwaningrum (2009), penerapan VFI5 berbasis histogram adalah penggunaan nilai histogram sebagai fitur pada algoritme VFI5. Selang histogram yang memiliki nilai 0- 255 (256 interval) dibagi ke dalam beberapa interval kemudian dihitung jumlah piksel yang mempunyai derajat keabuan pada interval tertentu. Nilai pada interval-interval ini yang dijadikan fitur pada algoritme VFI5.
Contohnya, jika dibagi ke dalam 64 interval, maka selang 0-3 menjadi 1 interval, selang 4-7 menjadi 1 interval, dan seterusnya sampai interval 64, yaitu selang 252-255. Jumlah piksel yang mempunyai derajat keabuan pada interval- interval tersebut dijadikan sebagai fitur pada algoritme VFI5. Contoh histogram hasil
pembagian menjadi 64 interval disajikan pada Gambar 6.
Gambar 6 Contoh citra dengan histogram asli (256 interval) dan histogram hasil pembagian
menjadi 64 interval. Confusion Matrix
Confusion matrix merupakan sebuah tabel yang terdiri dari banyaknya baris data uji yang diprediksi benar dan tidak benar oleh model klasifikasi. Tabel ini diperlukan untuk menentukan kinerja suatu model klasifikasi (Tan et al. 2005). Contoh confusion matrix
dapat dilihat pada Tabel 1.
Tabel 1 Confusion matrix untuk data 2 kelas Kelas Prediksi Kelas 1 Kelas 2 Kelas Aktual Kelas 1 K 11 K12 Kelas 2 K 21 K 22 Akurasi hasil klasifikasi dari confusion matrix dihitung dengan rumus:
Akurasi =
METODE PENELITIAN
Metodologi yang digunakan pada penelitian ini terdiri atas beberapa tahap. Tahapan-tahapan tersebut disajikan pada Gambar 7.
Gambar 7 Metodologi Penelitian.
Data
Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh dari url ftp://plucky.cs.yale.edu/CVC/pub/images/yalefa cesA/. Data berupa 120 citra wajah yang terdiri atas 15 orang yang berbeda yang selanjutnya disebut kelas. Masing-masing kelas terdiri atas 8 ekspresi, yaitu:
Memakai kacamata (ekspresi 1) Tersenyum (ekspresi 2) Tanpa kacamata (ekspresi 3) Normal/biasa (ekspresi 4) Cemberut (ekspresi 5) Menutup mata (ekspresi 6) Terkejut (ekspresi 7) Kerling (ekspresi 8)
Seluruh citra memiliki latar belakang berwarna putih yang seragam. Data pada penelitian ini adalah data citra dengan ukuran 243 x 320 piksel. Contoh citra 8 ekspresi yang berbeda pada satu kelas disajikan pada Gambar 8 dan keseluruhan citra yang digunakan pada penelitian ini disajikan pada Lampiran 1.
ekspresi 1 ekspresi 2
ekspresi 3 ekspresi 4
ekspresi 5 ekspresi 6
ekspresi 7 ekspresi 8
Gambar 8 Contoh citra wajah dengan 8 ekspresi yang berbeda.
Partisi Citra
Data citra wajah yang digunakan pada penelitian ini terdiri atas dua macam, yaitu citra wajah utuh dengan ukuran asli seperti yang diambil dari sumbernya dan citra wajah yang dipartisi menjadi tiga bagian secara horizontal sehingga citra tiap bagian berukuran 81 x 320 piksel. Hal ini mengacu pada hasil penelitian Muttaqien (2009) yang menyebutkan bahwa pembagian secara horizontal lebih mampu meningkatkan akurasi dibandingkan pembagian secara vertikal. Begitu pula dalam kehidupan sehari-hari dapat kita lihat bahwa mata, hidung, dan bibir merupakan penciri seseorang.
Ekstraksi Fitur
Pada tahapan ini semua citra yang digunakan dihitung histogramnya, yaitu jumlah piksel pada tiap derajat keabuan. Histogram citra tersebut kemudian dibagi menjadi interval- interval. Banyaknya interval yang digunakan pada penelitian ini adalah 64 interval berdasarkan hasil penelitian Purwaningrum (2009). Nilai-nilai pada interval (fitur) inilah yang digunakan sebagai data latih dan data uji (input algoritme VFI5).
Data Latih dan Data Uji
Nilai-nilai pada fitur hasil tahapan ekstraksi fitur dibagi menjadi data latih dan data uji.
Perbandingan antara data latih dan data uji yang digunakan adalah 3:1.
Algoritme VFI5
Algoritme VFI5 terdiri atas dua tahap, yaitu tahap pelatihan dan tahap klasifikasi. Pada tahap pelatihan yang menjadi input adalah jumlah piksel pada tiap derajat keabuan yang diperoleh dari tahap ekstraksi fitur yang telah dibagi ke dalam interval-interval. Pada tahap ini nilai vote
tiap interval dari data latih dihitung pada masing-masing kelasnya.
Adapun tahap klasifikasi dimulai dengan mencari interval yang sesuai dengan nilai tiap fitur dari data uji pada interval-interval data latih. Nilai vote pada interval tersebut kemudian dikumpulkan dan dijumlahkan untuk tiap kelasnya. Kelas yang memiliki nilai total vote
terbesar menjadi kelas prediksi bagi data uji tersebut.
Pada percobaan citra dengan partisi, tahap pelatihan dan klasifikasi dilakukan pada tiap partisinya (partisi bagian atas, tengah, dan bawah). Nilai vote yang dikumpulkan pada tahap klasifikasi tiap partisi citra dari citra yang sama dijumlahkan. Setelah itu nilai vote
dijumlahkan untuk tiap kelasnya. Kelas yang memiliki nilai total vote terbesar juga yang menjadi kelas prediksi bagi data uji tersebut.
Analisis Hasil Klasifikasi
Kinerja algoritme VFI5 pada percobaan ini dapat diketahui dari analisis hasil klasifikasi. Analisis dilakukan menggunakan tabel
confusion matrix, kemudian menghitung besaran akurasi yang berhasil dicapai, dan diambil suatu kesimpulan. Tingkat akurasi diperoleh dengan rumus:
akurasi =
Lingkungan Pengembangan
Perangkat lunak yang digunakan dalam penelitian ini ialah sistem operasi Microsoft Windows XP Professional SP2, Matlab 7.0.1, Sedangkan perangkat keras yang digunakan ialah processor Intel Pentium Dual Core 2.8 Ghz dan 2.79 Ghz, memori 512 MB DDR 2 RAM, dan hardisk 80 GB..
HASIL DAN PEMBAHASAN