5 BAB II LANDASAN TEORI
2.1 Tinjauan Pustaka
Yessi Hartiwi dkk telah melakukan penelitian mengenai Pengenalan Wajah dengan fitur Indoor Positioning System menggunakan Algoritma CNN. Hasil dari penelitian ini yaitu proses pengenalan wajah yang dilakukan pengujian mampu menghasilkan nilai yang baik akan tetapi tidak mampu menghasilkan nilai estimasi posisi. Pada pengambilan citra wajah penelitian ini menggunakan data sinyal WiFi untuk memperoleh posisi pengambilan posisi pemilik citra wajah, dimana proses pengenalan wajah menggunakan data citra wajah dengan ukuran 80×80 piksel sebanyak 200 citra wajah yang diambil di gedung kampus Universitas Dinamika Bangsa Jambi dengan menggunakan Gadget Laptop[5]
Muhammad Zufar dan Budi Setiyono telah melakukan penelitian mengenai Convolutional Neural Networks untuk Pengenalan Wajah Secara Real-Time. Hasil dari penelitian ini yaitu dengan munggunakan konstruksi model Convolutional Neural Networks sampai kedalaman 7 lapisan dengan input dari hasil ekstraksi Extended Local Binary Pattern dengan radius 1 dan neighbor 15 menunjukkan kinerja pengenalan wajah meraih rata-rata tingkat akurasi lebih dari 89% dalam ∓ 2 frame per detik[6].
Warnia Ningsih telah melakukan penelitian mengenai CNN Modelling Untuk Deteksi Wajah Berbasis Gender Menggunakan Pyhton. Hasil dari penelitian ini yaitu model yang dibangun menggunakan transfer learning dari Inception V3 dan menambahkan lapisan kustom berhasil mengenali jenis kelamin sehingga dapat mendeteksi image gender untuk membedakan laki-laki dan wanita dengan baik.
Pada penelitian ini dataset yang digunakan adalah data set citra wajah, secara keseluruhan terdapat 202. 599 jumlah gambar wajah dan data set yang digunakan memiliki 40 anotasi atribut untuk mendeskripsikan image wanita dan pria. Pada penelitian ini menggunakan Dataset CelebA, yang mencakup gambar 178×218 px.
BATCH_SIZE digunakan untuk membagi dataset menjadi sejumlah atau satu set
satu bagian. NUM_EPOCH digunakan untuk menentukan banyak literasi yang akan digunakan dalam proses training data[7].
Fenti Endrianti dkk telah melakukan penelitian mengenai Sistem Pencatatan Kehadiran Otomatis di Ruang Kelas Berbasis Pengenalan Wajah Menggunakan Metode Convolutional Neural Network. Hasil dari penelitian ini yaitu bahwa sistem pencatatan kehadiran otomatis diruang kelas berbasis pengenalan wajah menggunakan metode Convolutional Neural Network (CNN) lebih praktis, efesien dan akurat. Akurasi pengenalan wajah yang dihasilkan bergantung kepada kondisi pengambilan citra masukan, pendeteksian wajah dan proses klarifikasi. Pada penelitian ini membutuhkan data berupa citra/gambar wajah mahasiswa yang diambil didalam ruang kelas. Data yang digunakan yaitu sebanyak 20 mahasiswa.
Sebelum melakukan simulasi pengambilan gambar tempat duduk pada ruang kelas sudah terlebih dahulu diatur letak dan jarak antar mahasiswa satu dengan yang lainnya. Penelitian ini dilakukan dengan beberapa tahapan dari mulai deteksi wajah (face detection), proses perbaikan citra (preprocessing), dan pembuatan model dari data latih. Eksperimen dilakukan dengan menggunakan 2400 data citra wajah yang terbagi menjadi dua yaitu 1200 data citra wajah lihat kamera dan 1200 data citra wajah tidak lihat kamera[8]
Ni Kadek Ayu Wirdiani dkk telah melakukan penelitian mengenai Real-Time Face Recognition with Eigenface Method. Hasil dari penelitian ini yaitu pengujian berdasarkan jumlah wajah dengan melakukan pengujian satu wajah, dua wajah, tiga wajah, dan empat wajah. Pengujian berdasarkan threshold. Nilai threshold yang digunakan untuk mendeteksi wajah secara real time adalah 3500, 2500, 4000, dan 1000. Pengujian berdasarkan jarak tatap kamera yang menghasilkan pada jarak 100cm wajah dapat terdeteksi dengan baik, Kurangnya akurasi pengenalan wajah dipengaruhi oleh tingkat pencahayaan, posisi wajah, dan jarak wajah yang berbeda, sehingga kedepannya dapat mengatasi pengurangan akurasi pengenalan yang disebabkan oleh kondisi sekitar selama akuisisi citra[9]
2.2 Penelitian Terkait
Penulis mencantumkan beberapa jurnal penelitian yang telah dilakukan sebelumnya sebagai referensi dapat dilihat pada Tabel 2.1.
Tabel 2. 1 Penelitian Terkait
No Peneliti Judul Metode Hasil
1 Yessi Hartiwi, Errissya Rasywir, Yovi Pratama, dan Pareza Alam Jusia (2020)
Eksperimen Pengenalan Wajah dengan Fitur Indoor Possitioning System
Menggunakan Algoritma CNN
Metode CNN Evaluasi pengenalan wajah
menggunakan CNN
memperoleh nilai maksimum = 92,89% dan nilai error akurasi 7,11 %.
Sedangkan akurasi untuk rata-rata akurasi yang diperoleh adalah 91,86%.
2 Muhammad Zufar dan Budi Setiyono
Convolutional Neural Networks untuk
Pengenalan Wajah Secara Real-Time
Metode CNN Munggunakan konstruksi model Convolutional Neural Networks sampai kedalaman 7 dengan radius 1 dan neighbor 15 mendapatkan akurasi lebih dari 89% dalam ∓ 2 frame per detik.
3 Warnia Ningsih (2020)
CNN Modelling Untuk Deteksi Wajah Berbasis Gender
Menggunakan Pyhton.
Metode CNN Permodelan yang dibangun dapat mendeteksi image gender untuk membedakan laki-laki dan wanita dengan baik dimana dengan tingkat akurasi 92,6% atas data uji (data testing)
No Peneliti Judul Metode Hasil 4 Poppy Julianti,
Yeni Anistyasari
Studi Literatur Metode
Pengenalan Wajah Untuk Presensi Siswa
Metode Systematic Literature Review (SLR)
Hasil akurasi terbaik dalam peroses pengenalan wajah untuk prsensi siswa adalah metode Local Binary Pattern yang dipadukan dengan metode Cascade Classifer dengan persentase akurasi sebesar 99% dengan memadukan berbagai metode akan membuat hasil akurasi dalam pengenalan wajah selama proses presensi siswa menjadi lebih baik
5 Fenti Endrianti, Wawan Setiawan, Yaya Wihardi
Sistem Pencatatan Kehadiran
Otomatis di Ruang Kelas Berbasis
Pengenalan Wajah
Menggunakan Metode Convolutional Neural Network
Metode CNN Hasil penelitian ini didapat bahwa sistem pencatatan kehadiran otomatis di ruang kelas berbasis pengenalan wajah menggunakan metode Convolutional Neural Network (CNN) lebih praktis, efesien, dan akurat dengan akurasi sebesar 93,33% akurasi pengenalan wajah yang dihasilkan bergantung kepada kondisi pengambilan citra masukan, pendeteksian
No Peneliti Judul Metode Hasil
wajah dan proses klarifikasi.
6 Ni Kadek Ayu Wirdiani, Tita Lattifia, I Kadek
Supadma, Boy Jehezekiel Kemanang Mahar, Dewa Ayu Nadia Taradhita dan Adi Fahmi (2019)
Real-Time Face Recognition with Eigenface
Method
Metode eigenface
Hasil dari penelitian ini yaitu metode eigenface dapat mendeteksi 4 orang secara bersamaan dengan akurat. Dalam penggunaan metode eigenface tingkat pencahayaan dan jarak
wajah sangat
mempengaruhi.
7 Muhammad Rizki Oktarlis Setia Budi
Face Recognition Untuk Sistem Keamanan Rumah Menggunakan
Esp32 Cam
Dengan Metode NN (Neural Network)
Metode Neural Network (NN)
Hasil dari penelitian ini yaitu dapat mengetahui akurasi dalam mendeteksi wajah dengan jarak tertentu dengan menggunakan ESP32 Cam serta dapat memberikan notifikasi apabila terdapat orang yang tidak di kenal pada pengguna melalui device sehingga pengguna dapat melihat secara real time keadaan rumah tersebut.
2.3 Biometrik
Biometrik secara garis besar studi literatur tentang mengetahui karakteristik biologi yang terdapat pada manusia dan dapat diukur variabelnya. Pada perkembangan teknologi informasi, biometrik merupakan teknologi yang sedang di kembangkan untuk proses menganalisis fisik dan gerak pada manusia secara biologis dalam proses autentikasi dan identifikasi[4].
Pengidentifikasian biometrik pada teknologi informasi memiliki ciri khusus, karena setiap fisik biologi pada manusia memiliki ciri fisiologis yang unik yaitu setiap individu memiliki ciri biologi yang berbeda-beda. Biometrik memiliki 2 kategori antara lain, menganalisis suatu karakteristik fisiologis pada manusia yang berkaitan dengan bentuk biologis, seperti pengenalan wajah, mata, hidung, sidik jari, telinga.
Kategori lainnya yaitu perilaku manusia yang terkait dengan sikap dari setiap individu dengan individu lainnya seperti ekspresi wajah[4].
2.4 Pengenalan Wajah
Pengenalan wajah merupakan salah satu proses autentikasi maupun identifikasi, selain pengenalan retina mata, pengenalan sidik jari dan iris mata yang banyak diaplikasikan dalam sistem biometrik. Ruang lingkup pada aplikasinya sendiri pengenalan wajah dibantu oleh perangkat lain yaitu kamera dalam proses pengambilan gambarnya, selanjutnya citra gambar yang telah diambil dibandingkan dengan wajah yang telah di latih (training) sebelumnya[10].
Pengenalan wajah merupakan teknologi dari komputer yang dapat mengidentifikasi atau memverifikasi suatu citra wajah seseorang melalui citra digital. Hasil pada sistem biometrik pada pengenalan wajah yaitu model bisa berupa landmark wajah seperti pada Gambar 2.1.
Gambar 2. 1 Landmark Wajah
2.5 Computer Vision
Computer vision merupakan bidang teknik informatika atau ilmu komputer yang melibatkan computer agar dapat melihat objek sekitarnya. Computer vision juga merupakan bidang ilmu yang dapat meniru seperti manusia contohnya penglihatan, pembelajaran dan mengambil sebuah keputusan atau kesimpulan berdasarkan masukan visual[11]. Proses pada computer vision secara garis besar dapat dibagi menjadi:
1. Proses mengakuisisi citra digital (Image Acquisition)
Pada proses mengakusisi citra digital dilakukan dengan cara menangkap (capture) atau memindai (scan) citra analog kemudian mengkonversinya menjadi citra digital agar dapat disimpan dan juga diolah melalui computer.
2. Proses pengolahan citra (Image Processing)
Pada proses pengolahan citra merupakan proses yang melibatkan input gambar dan menghasilkan output berupa gambar sesuai kebutuhan[12].
3. Proses analisis data citra (Image Analysis)
Pada proses analisis data citra merupakan proses yang menggabungkan banyak fase deteksi dan identifikasi. Tahap ini berfokus pada penjelasan interpretasi citra.
4. Proses pemahaman data citra (Image Understanding)
Pada proses pemahaman data citra merupakan proses menginterpretasikan area/objek yang sebenarnya untuk mengetahui apa yang sebenarnya terjadi pada foto.
2.6. Citra Digital
Citra digital merupakan representasi, kemiripan atauimitasi dari suatu objek. Secara umum citra digital didefinisikan sebagai suatu fungsi 2 dimensi 𝑓(𝑥, 𝑦) dimana x dan y merupakan koordinat spasial dan amplitudo fungsi dari setiap pasangan titik (𝑥, 𝑦) merupakan intensitas atau kecerahan gambar. Gambar digital dikodekan dalam bentuk matriks yang dimana indeks baris dan kolom menyatakan suatu titik yang disebut pixel[11]. Pada Gambar 2.2 dibawah ini merupakan sistem koordinat pada sebuah citra digital.
Gambar 2. 2 Sistem Koordinat Citra Digital
Berdasarkan penelitian pada citra digital bahwa sebuah warna merupakan kombinasi dari tiga warna dasar, yaitu merah (Red), hijau (Green) dan biru (Blue) atau lebih dikenal sebagai RGB. RGB adalah model warna yang terdiri dari merah, hijau, dan biru, digabungkan untuk membentuk berbagai warna. Setiap warna dasar, seperti merah, dapat diberi rentang nilai. Untuk layar komputer, rentang nilai terkecil = 0 dan terbesar = 255. Pilihan skala 256 didasarkan pada cara menyatakan bilangan biner 8 digit yang digunakan oleh komputer, dengan begitu akan didapatkan warna campuran 256 x 256 x 256 = 1677726 macam warna. Suatu jenis warna, dapat dianggap sebagai vektor dalam ruang tiga dimensi yang biasanya digunakan dalam matematika, koordinatnya dinyatakan dalam tiga bilangan, yaitu komponen x, komponen y, dan komponen z. Misalkan sebuah vektor ditulis dalam bentuk r = (x, y, z). Untuk warna, komponen ini diganti dengan komponen R (red), G (reen), B (read). Sehingga jenis warna dapat ditulis sebagai berikut: warna = RGB (30, 75, 255) Putih = RGB (255,255,255), sedangkan untuk hitam = RGB (0,0,0).
Representasi warna dari citra digital ditunjukkan pada Gambar 2.3.
Gambar 2. 3 Representasi Warna RGB Pada Citra Digital
2.6.1. Pengolahan Citra Digital
Pengolahan citra merupakan suatu proses dalam pengolahan dan analisis citra yang selalu melibatkan persepsi visual. Pada proses ini memiliki ciri data masukan dan keluaran berupa citra. Meskipun citra memiliki banyak informasi, namun sering kali citra mengalami sebuah penurunan intensitas mutu, seperti mengandung cacat atau derau (noise), warna yang kurang tajam, dan kabur (blur) sehingga dapat mengurangi informasi yang didapat[13]. Pengolahan citra digital digambarkan sebagai sebuah citra yang terdiri dari banyaknya piksel. Piksel tersebut merupakan koordinat spasial yang menunjukan posisi titik-titik dan nilai intensitas keabuan dari sebuah citra digital. Hasil dari proses pengolahan citra tersebut dapat berupa gambar atau karakteristik yang merepresentasikan citra. Sedangkan tujuan dari pengolahan citra untuk memperbaiki kualitas citra agas mudah diinterpetasi oleh manusia maupun mesin. Cara kerja dari pengolahan citra yaitu mentransformasikan citra menjadi citra lain. Sehingga masukan dari pengolahan citra berupa citra dan keluarannya juga citra, namun citra keluaran kualitasnya lebih baik daripada citra masukan. Pengolahan citra digunakan untuk memudahkan pengguna (user) dalam mendapatkan sebuah informasi yang terkandung pada sebuah citra[13].
2.7 Deep Learning
Deep learning merupakan salah satu algoritma pembelajaran mesin yang yang tersusun dari berbagai model penggambaran model abstraksi yang memiliki
performa tinggi, serta menggunakan beberapa jenis fungsi transformasi non-linear yang diatur secara layer per layer dan mendalam.Teknik dan model pada deep learning pengembangannya dapat diaplikasikan kebutuhan (supervised learning), (unsupervised learning) dan (semi-supervised learning), lalu diintegrasikan dengan berbagai jenis aplikasi yang mendukung seperti face recognition, voice recognition, image proccessing, dan lain-lain. Deep learning termasuk algoritma yang dapat digunakan sebagai alat untuk memodelkan hubungan yang kompleks antara masukan (input) dan keluaran (output) pada sebuah sistem untuk menemukan pola- pola pada data. Deep learning dapat diaplikasikan pada permasalahan yang membutuhkan pengawasan (supervised), tanpa pengawasan (unsupervised) dan semi learning. Penerapan Deep Learning dapat diintegrasikan dengan penggunaan pengenalan wajah sebagai pembanding citra lalu ditrasnformasikan menjadi further processing, dimension reduction, feature extraction[14]. Proses deteksi wajah dalam metode deep learning meliputi 3 hal antara lain:
2.7.1. Supervised Learning
Supervised learning atau pembelajar arahan bertujuan untuk menentukan nilai bobot-bobot koneksi didalam jaringan sehingga jaringan dapat melakukan pemetaan (mapping) dari input ke output sesuai dengan yang diinginkan. Besarnya perbedaan antara nilai vektor target dengan output aktual diukur dengan nilai error yang disebut juga dengan cost function seperti yang ditunjukan pada persamaan 2.1 dimana 𝑛 adalah banyaknya unit pada output layer.
(2.1) 2.7.2. Multi-Layer Perceptron
Multi-Layer Perceptron merupakan jaringan syaraf tiruan feed-forward terdiri dari beberapa neuron yang dihubungkan oleh bobot-bobot penghubung. Neuron-neuron kemudian disusun dalam banyak lapisan yang terdiri dari lapisan input (input layer), satu atau lebih lapisan tersembunyi (hidden layer), dan satu lapisan output (output layer). Lapisan input menerima sinyal dari luar, kemudian meneruskannya ke lapisan tersembunyi pertama, yang akan ditransmisikan ulang sehingga akhirnya
mencapai lapisan output. Struktur dari multi-layer perceptron ditunjukkan pada Gambar 2.4.
Gambar 2. 4 Struktur Multi-Layer Perceptron Tahap ini dapat dijelaskan oleh persamaan 2.2 sebagai berikut:
(2.2)
dimana pred (𝑖) melambangkan suatu himpunan predesesor dari unit 𝑖, 𝑊𝑖𝑗 melambangkan bobot.
2.7.3. Algoritma Backpropagation
Algoritma ini digunakan untuk mengeneralisasi Widrow-Hoff learning rule pada multiple-layer network dan fungsi transfer differensial nonlinear. Vektor input dan vektor target digunakan untuk melatih JST hingga dapat menghasilkan sebuah fungsi yang diinginkan.
Sistem kerja Neural Network terdiri dari dua tahap: Pertama-tama seperangkat filter berbasis jaringan netral untuk gambar dan kemudian menggunakan arbiter untuk menggabungkan output. Tahap ke dua Filter memeriksa tiap-tiap lokasi dalam area gambar dengan skala, kemudian mencari lokasi yang terdeteksi mengandung wajah.
Arbiter kemudian yang akan menggabungkan deteksi dari filter individual dan menghilangkan deteksi yang berulang-ulang.
2.8 Convolutional Neural Network
Convolutional Neural Network (CNN) merupakan suatu pengembangan dari metode Multi-Layer Perceptron (MLP) yang digunakan untuk pengolahan data dua
dimensi[15]. Konsep pada CNN didasari berdasarkan pemodelan Artificial Neural Network (ANN) yang digunakan untuk image recognition atau video recognition[10]. CNN termasuk dalam jenis Deep Neural Network dikarenakan tingkat kedalaan jaringan pada CNN yang tinggi, terstruktur dan sering di aplikasikan pada data citra gambar dari secara langsung ataupun secara tidak langsung. Konsep CNN secara garis besar dibagi menjadi 3 bagian yaitu input, feature learning dan classification. Proses input pada CNN berupa citra digital.
Sedangkan untuk feature learning merupakan pemrosesan suatu gambar dengan menggunakan metode convolutional yaitu dengan cara mengambil nilai binary / vector yang terdapat pada gambar. CNN memiliki beberapa layer yang digunakan sebagai tahap proses filtering pada setiap masing-masing proses training citra image digital. Adapun proses training pada CNN antara lain.
2.8.1 Convolutional Layer
Konsep convolutional layer digambarkan sebagai pemrosesan dari semua data yang terintegrasi dengan lapisan konvolusi dan akan mengkonversi setiap binary ke semua bagian proses filter yang menghasilkan activation map atau disebut juga dengan feature map 2D[15]. Pada proses convolutional layer memiliki tinggi dan panjang yang sering disebut juga pixel. Pixel tersebut akan digunakan untuk melakukan proses filtering berupa perhitungan matrik yang menggunakan 3 parameter yaitu depth, stride, zero padding.
Gambar 2. 5 Konsep Filtering
Pada gambar 2.5 menggambarkan bahwa pada proses input citra digital yang berukuran 32x32x3 akan dilakukan proses konvolusi (filtering) dengan ukuran 5x5x3 sehingga dari proses tersebut akan menghasilkan activation map. Rumus pada proses filtering digambarkan sebagai berikut.
Gambar 2. 6 Proses Perhitungan Binary
Pada gambar 2.6 merupakan contoh konsep pada proses filtering dengan inputan citra image digital berupa binary. Panjang dan lebar dari inputan citra image digital dilambangkan dengan huruf N, sedangkan untuk proses filtering dilambangkan dengan huruf F. Apabila proses matrik 3x3 telah selesai maka matrik 3x3 tersebut bergeser 1 pixcel setelahnya. Setelah melakukan filtering binary matrix akan melakukan perhitungan dengan filter RGB. Filter tersebut dijadikan acuan dalam menentukan hasil Convolved feature RGB matrix. Proses filter tersebut dilakukan bersamaan. Jika semua kernel telah terisi, semua hasil yang didapat pada RGB akan dijumlahkan dengan bias sehingga mendapatkan hasil convolution feature output yang dapat dilihat pada gambar 2.7.
Gambar 2. 7 Proses Convolution Feature RGB Matrix 2.8.2 Max Pooling
Max Pooling adalah proses lanjutan dari hasil Convolution Feature RGB Matrix yang mengambil nilai dengan jumlah variable terbesar. Penentan jumlah matrik output untuk Max pooling bergantung pada model dari hasil Convolution Feature RGB Matrix[14]. Pada Gambar 2.8 merupakan contoh gambar proses max pooling.
Gambar 2. 8 Contoh proses Max Pooling 2.8.3 Flatten
Flatten adalah proses pengubahan hasil matrik max pooling yang berawal 2 Dimensi (2D) menjadi 1 Dimensi (1D). Proses ini bertujuan untuk mentransformasikan data, menjadi bentuk linier untuk mempermudah dalam proses Fully Connected Layer[14]. Berikut adalah contoh proses Flatten seperti Gambar 2.9.
Gambar 2. 9 Contoh Proses Flatten
2.8.4 Fully Connected Layer
Fully Connected Layer adalah proses lanjutan dari hasil Flatten yang akan ditrasformasikan data menjadi bentuk linier kemudian menghubungkan antar neuron untuk melakukan classification[15]. Berikut contoh gambara fully connected layer.
Gambar 2. 10 Contoh Model Fully Connected 1 Layer
Pada gambar 2.10 menggambarkan konsep dari model fully connected layer yang dimana pada model tersebut menggabungkan parameter yang sudah ada menjadi proses deep learning yang terdiri dari input layer, full connected layer (filtering), dan output layer. Jika diterapkan pada model algoritma convolutional neural network dengan proses berurutan berawal dari convolutional layer, max pooling, flatten, dan fully connected layer. Berikut contoh gambaran penerapan fully connected layer pada model algoritma convolutional neural network.
Gambar 2. 11 Contoh Penerapan Fully Connected Layer pada algoritma CNN Gambar 2.11 tersebut menggambarkan proses keseluruhan dari penerapan fully connected layer dari awal hingga akhir. Dapat diambil kesimpulan bahwa dari hasil input berupa matrik 3x3 dan dilakukan proses perhitungan dapat menghasilkan sebuah prediksi pola X yang paling tepat.