BAB II
LANDASAN TEORI
2.1 Tinjauan Pusataka
Dalam penelitian ini akan digunakan referensi atau tinjauan pustaka berdasarkan uraian latar belakang sebelumnya, berikut tinjauan pustaka dalam penelitian ini:
2.1.1 Tinjuan Terhadap Literatur 1
Oleh (Irfan and Widodo, 2020) Melakukan penelitian dengan judul
“Penerapan Metode Deep Learning Convolution Neural Network pada Robot KRSBI Humanoid R-SCUAD”. Dalam penelitiannya membahas tentang penerapan metode Deep Learning untuk melakukan deteksi bola berwarna putih dan bercorak hitam diatas rumput hijau. Menggunakan arsitektur Convolutional Neural Network yang dirancang memiliki 6 hidden layer dengan menggunakan library Tensorflow. Dalam proses training memiliki 9 jenis gambar berdasarkan tempat pengambilan gambar dan tiap gambar terbagi menjadi 2 class, yaitu citra sebagai data pelatihan dan citra sebagai data validasi. Pengujian dilakukan secara real time dengan tingkat accuracy deteksi sebesar 67% dengan kecepatan pengolahan gambar maksimal adalah 13 FPS.
2.1.2 Tinjuan Terhadap Literatur 2
Oleh (Younis et al., 2020) Melakukan penelitian dengan judul “Real-Time Object Detection Using Pre-Trained Deep Learning Models MobileNet- SSD”. Dalam penelitiannya membahas tentang identifikasi objek dengan mempertimbangkan Deep Learning model pra-terlatih untuk Singgle Shot
Multi-Box Detector (SSD) dan MobileNet secara real time. Menggunakan kamera WebCam 6 Fps, sistem oprasi Ubuntu 18.04.2, OpenCV 3.4.2 dan Python bahasa pemrograman. Data diambil dari video yang direkam melalui WebCam dan dikonversikan ukuran yang dianggap 300x300 pixel. sehingga dapat menguraikan accuracy yang memiliki hasil tertinggi yang telah dicapai menggunakan MobileNet detector SSD untuk deteksi objek.
Eksperimental menunjukan bahwa Average Precision (AP) dari algoritma untuk mendeteksi kelas yang berbeda seperti mobil 99,76%, orang 97,76%, dan kursi 71,7%. Tujuan dari penelitian ini adalah untuk mengembangkan sistem otonom.
2.1.3 Tinjuan Terhadap Literatur 3
Oleh (Pajar et al., 2017) Melakukan penelitian dengan judul “Deteksi Bola Multipola Pada Robot Krakatau Fc”. Dalam penelitiannya membahas tentang pendeteksian bola multipola dengan metode Learning, karna perubahan rule dalam RoboWorld Cup 2016 peningkatan tantangan mengenai bola yang sebelumnya bewarna jingga menjadi bewarna putih 50% dan sisanya random pola yang beragam, sehingga bola cendrung sama dengan gawang dan garis lapangan. Pengujian dilakukan menggunakan bola bewarna putih 50% dan sisanya random pola yang beragam (multipola) dan kondisi pencahayaan lapangan yang beragam dengan 2 metode Learning yaitu Local Binary Pattern (LBP) digunakan untuk ekstraksi fitur dari citra bola yang diperoleh dari sampel yang diberikan, dan AdaBoost untuk proses pembelajaran untuk mendapatkan parameter yang dapat digunakan untuk membedakan objek bola dan bukan bola. Metode ini dinilai efektif untuk
mengenali pola bola yang beragam. Berdasarkan hasil pengujian dan pembahasan, kondisi eksternal robot didapat melalui sensor passive berupa digital kamera Logitech c920 dan komputer dengan processor Intel Cherry Trail yang bekerja pada clock 1.8 GHz, didapat bahwa hasil strategi yang diajukan terbukti mampu mendeteksi, mengeliminasi gangguan, serta menentukan bola yang paling baik dalam waktu 30 ms, sehingga robot masih dapat merespon perubahan kondisi lingkungan secara real-time.
2.1.4 Tinjuan Terhadap Literatur 4
Oleh (Ma et al., 2017) Melakukan penelitian dengan judul “Multiple Object Detection and Tracking in Complex Background”. Dalam penelitiannya membahas tentang menggabungkan pemodelan untuk mendeteksi dan melacak beberapa target otomatis dengan latar belakang yang kompleks.
Tantangan utama adalah latar belakang yang berantakan, cepat target bergerak, gerakan objek tiba-tiba, dan oklusi objek sebagian atau penuh di sebuah video. Dalam percobaan ini, data citra pada urutan video menggunakan objek mobil dan orang dengan menggunakan ruang warna HSV yaitu tidak berubah terhadap perubahan iluminasi. Metode yang dipakai berbasis pada pemodelan campuran Gaussian (GMM) dan filter partikel ganda (MPFs) algoritma, metode GMM untuk membangun back- models dasar untuk segmentasi objek bergerak sedangkan MPFs untuk mengimplementasikan multi pelacakan objek. Hasil dari metode yang diusulkan beradaptasi dengan perubahan adegan video lebih cepat dari pada GMM asli. Metode pelacakan berbasis multi-fitur yang diusulkan mencapai accuracy pelacakan objek dari pada pendekatan MPF asli. Selain itu, hasil
eksperimen menunjukkan bahwa metode baru memiliki kemampuan beradaptasi yang tinggi untuk situasi yang berbeda seperti adegan kompleks dengan atau tanpa informasi mendalam. Akhirnya, metode yang diusulkan dapat diterapkan untuk memecahkan masalah pelacakan beberapa target, bahkan ketika target semakin dekat atau dalam kasus oklusi parsial antara target pelacakan. Dengan membandingkan dengan berbagai pendekatan filter partikel, hasil eksperimen menunjukkan bahwa pendekatan kami dapat melacak beberapa target dengan latar belakang yang kompleks secara otomatis dan akurat.
2.1.5 Tinjuan Terhadap Literatur 5
Oleh (Garg et al., 2021) Melakukan penelitian dengan judul “Face Mask Detection using MobileNet v2”. Dalam penelitiannya membahas tentang Gagasan dan algoritma mendeteksi dan memastikan pemakaian masker yang tepat. Dengan adanya virus baru pendemi Covid-19 untuk meminimalisir penyebaran oleh WHO. Bertujuan untuk memahami dalam mengunakan masker atau tidak. Jika memakai masker maka dipesilahkan untuk masuk ke gedung dan jika tidak mengunakan masker maka akan dikirim pesan berupa peringatan kekeamanan personal. Dengan cara mengidentifikasikan daerah wajah, jika ada penghalang wajah maka dilakukan proses perlakuan buruk dari Multi -Task Cascaded Convolution Neural Network, selanjutnya dilakukan penghilang kakteristik wajah dengan Model Google Face Net implant Models, sampai akhir klasifikasi telah dilakukan oleh Support Vector Machines. Dengan semua proses di atas menunjukkan bahwa itu memberikan identifikasi masker wajah. Sistem
hardware menggunakan kamera HD sabagai pemantau dan terintegrasi untuk mengirim video masukan ke model, dibangun dengan perpustakaan OpenCV, Sistem identifikasi menggunakan Deep Learning MobileNet v2.
Penelitian berfokus membatasi Covid-19 dengan memiliki pengamatan orang yang tidak memiliki penutup wajah (masker) dikamera pemantau.
Sebuah model Deep Learning dicapai 98,7%. Tujuan deteksi masker untuk mengurangi serta menghentikan penyebaran virus Covid-19.
2.1.6 Tinjuan Terhadap Literatur 6
Oleh (Akkas, Maini and Qiu, 2019) Melakukan penelitian dengan judul “A Fast Video Image Detection using TensorFlow Mobile Networks for Racing Cars”. Dalam penelitiannya membahas tentang deteksi dan prediksi untuk meningkatkan keselamatan balapan dan mengembangkan strategi yang lebih baik untuk memenangkan perlombaan di balapan Seri Mobil Indy. Seri Balap Mobil Indy salah satu balapan terkenal di Amerika. deteksi menggunakan lebih dari 150 kamera yang terpasang dimobil dan lainya data dari trek yang akan digunakan untuk deteksi dan prediksi serta data diberi label. Pengujian data dilakukan menggunakan Cuda 10, Cudnn 7.6.2, TensorFlow 1.14.0, dan TensorFlow MKL 1.14.0, TensorFlow Lite 1.14.0, Intel(R) Xeon(R) E5-2x12-core Prosesor 2670 v3 (Haswell) dengan memori utama 128 GB. Setelah melakukan berbagai pengujian inisial menunjukan bahwa hasil waktu inferensi terbaik untuk balapan deteksi mobil diperoleh dengan SSD MobileNet v2 di EdgeTPU memberikan waktu inferensi yang terbaik, dan lebih cocok untuk pembelajaran mesin waktu nyata model kuantisasi SSD MobileNet v2 pada EdgeTPU memiliki waktu inferensi
terbaik dan dapat memproses sebagian besar gambar mampu memproses 51 gambar per detik pada EdgeTPU dengan model Kuantisasi SSD MobileNet v2.
2.2 Deep Learning
Deep Learning adalah bidang dari Machine Learning yang memanfaatkan jaringan syaraf tiruan untuk implementasi permasalahan dengan dataset yang dianggap cukup besar. Teknik Deep learning memberikan arsitektur yang amat kuat untuk Supervised Learning. Dengan menambahkan lebih banyak lapisan maka model pembelajaran ini bisa mewakili sebagai data dari citra yang berlabel dengan lebih baik (Danukusumo, 2017).
2.3 Artificial Intelligence
Artificial Intelligence atau Kecerdasan Buatan merupakan salah satu dari ilmu komputer yang membuat agar mesin (komputer) dapat memaksimalkan suatu pekerjaan yang lebih baik. Dan yang dimaksud Kecerdasan Buatan ialah kemampuan yang digabungan untuk melakukan:
1. Learning : semua memiliki ciri pembelajaran formal maupun informal melalui gabungan dari pendidikan, pelatihan maupun pengalaman. Learning manampilkan perubahan didalam sistem dan mengirim perintah yang memungkinkan untuk menyelesaikan tugas yang hasilnya lebih efisien.
2. Pose Problems : mengenali situasi masalah yang belum terlalu jelas dan sistem akan melakukan transformasi menjadi masalah yang lebih jelas (Rich, E., and Knight, K., 2009).
2.4 Computer Vision
Computer Vision adalah disiplin ilmu dan teknologi yang bisa menginterpretasikan sebuah informasi dari gambar untuk mengetahui tugas tertentu yang harus diselesaikan. Salah satu teori Kercerdasan Buatan yang diekstrak informasi dari gambar dan hasil tersebut bisa berupa banyak bentuk, urutan video, sudut pandangan dari berbagai kamera yang difungsikan untuk scanning. Bagian dari Artificial Intelligence yang memahami objek dan mampu menghasilkan sebuah visual intellegence system. Computer Vision adalah gabungan Image Processing yang bersangkutan dengan transformasi citra yang bertujuan mendapatkan hasil yang berkualitas dan gabungan dari pattern recoginition atau pengenalan pola yang bertujuan mengidentifikasi objek pada interpretasi citra untuk mengekstrak sebuah informasi yang disampaikan ke citra/gambar. (Informatika, 2018). Alur Computer Vision dapat dilihat pada gambar 2.1 berikut:
Gambar 2.1 Alur Computer Vision
2.5 Image / Citra
Image / citra yaitu merupakan suatu data digital yang dihasilkan oleh sistem deteksi disebut kamera. Dalam pengolahan data digital, image direpresentasikan dalam bentuk matrik yang memiliki jumlah baris, kolom sesuai dengan resulusi sebuah image yang diwakilinya. Pemisahan antara baris dengan kolom disebut pixel, dan berisi nilai (RGB, Binary, HSL, HSV atau CMYK) sesuai dengan warna satu pixel yang mewakili sebuah image. Semisal image 8 bit, nilai entri matriks dirange 0-255 jadi, yang menghasilkan warna pada sebuah image, semisal nilai entrinya 0 mewakili warna hitam dan 1 mewakili warna putih (Arthayaa, Sadiyokob and Wiejaya, 2008). Reprentasi Image dapat dilihat pada gambar 2.2 berikut:
Gambar 2.2 Reprentasi Image Sebagai Matriks
2.6 Convolutional Neural Network (CNN)
Convolutional Neural Network (CNN) adalah jenis dari jaringan saraf yang berorientasi Deep Learning yang telah mencapai berbagai pengujian dan mendapat hasil yang sangat baik dalam aplikasi praktis, salah satunya pengenalan suatu objek berbasis citra atau gambar. Nyatanya, CNN dirancang khusus untuk memproses data yang direpresentasikan dalam bentuk array. Contoh, sebuah gambar berwarna, dapat direpresentasikan melalui array dua dimensi yang berisi intensitas warna
pixel. Hasil input CNN tidak seperti jaringan saraf yang akan menjadi dua dimensi, dan fitur menjadi pixel input citra atau gambar. Convolutional Neural Network (CNN) dikatakan pendekatan yang paling dominan untuk semua masalah pengenalan (Kapoor and Jaokar, 2019). Alur CNN dapat dilihat pada gambar 2.3 berikut:
Gambar 2.3 Alur Convolutional Neural Network
2.7 Convolutional Layer
Convolutional Layer merupakan bagian yang melakukan tugas operasi konvolusi yaitu menggabungkan linier filter kepada daerah lokal. Bagian layer ini pertama kali menerima gambar yang diinputkan pada sebauah arsitektur. Bentuk layer adalah sebuah filter yang memiliki panjang pixel, lebar pixel dan tebal pixel yang menyesuaikan channel image inputkan. Masing massing filter akan bergeser penuh ke bagian gambar. Teknik Pergeseran disebut “DOT” antara input dan nilai dari sebuah filter tersebut, sehingga mendapatkan output yang disebut activation map (Nurfita and Ariyanto, 2018). Alur serta rumus konvolusi pada gambar 2.4 berikut:
Gambar 2.4 Alur dan Rumus Menghitung Konvolusi 2.8 Pooling Layer
Pooling layer ialah lapisan yang memanfaatkan fungsi dan feature map sebagai inputan lalu mengolahnya dengan bermacam macam operasi statistik dengan acuan nilai pixel yang paling terdekat. Pada Convolutional Neural Network (CNN), lapisan pooling umumnya disisipkan secara urut setelah beberapa lapisan melakukan konvolusi. lapisan pooling yang diinputkan diantara lapisan konvolusi secara berangsur angsur dalam arsitektur Convolutional Neural Network (CNN), dapat secara progresif mengurangi jumlah volume output pada feature map, sehingga mengurangi jumlah parameter dan perhitungan, dan untuk mengendalikan overfitting (Danukusumo, 2017). Alur Pooling layer dapat dilihat pada gambar 2.5:
Gambar 2.5 Alur Pooling Layer
2.9 Fully Connected Layer
Fully connected layer mengambil sebuah inputan dari hasil outputan pooling layer yang berbentuk feature map. Feature map masih berbentuk multi dimensional array jadi lapisan ini akan melakukan sebuah reshape feature map dan menghasilkan vektor sebanyak n-dimensi dimana sebuah n itu jumlah kelas output yang dipilih program. Contoh kecil lapisan terdiri dari 500 neuron, maka akan diterapkan yang namanya sebuah softmax yang akan mengembalikan daftar probabilitas untuk masing-masing 10 label kelas sebagai klasifikasi diakhir dari sebuah jaringan (Dutt & Dutt, 2017). Alur Fully dapat dilihat pada gambar 2.6:
Gambar 2.6 Alur Fully Connected Layer
2.10 MobileNet v2
MobileNet v2 adalah arsitektur Convolutional Neural Network (CNN) yang dapat digunakan untuk mengatasi kebutuhan akan computing resource yang berlebih. MobileNet v2 ialah penyempurnaan dari arsitektur MobileNet. MobileNet dan CNN umumnya memiliki perbedaan pada cara penggunaan lapisan atau convolution layer. Convolution layer di MobileNet v2 menggunakan tenik penyesuaian ketebalan filter dari input image.(Sandler et al., 2018).
Gambar 2.7 Alur MobileNet v2
2.11 TensorFlow
TensorFlow adalah platform open source end-to-end diperuntukan machine learning. Yang memiliki circle ekosistem alat, pustaka, dan sumber daya komunitas yang sangat fleksibel dan komprehensif yang memungkinkan seorang ahli ataupun pemula untuk mengembangkan dan membangun aplikasi dengan menerapkan model machine learning di platform TensorFlow. Peneliti mendorong machine learning mutakhir dan pengembang dengan mudah membangun dan menerapkan aplikasi yang didukung machine learning. TensorFlow selalu menyediakan jalur langsung ke produksi. Baik di server, perangkat edge, atau web, TensorFlow memungkinkan Anda melatih dan menerapkan model dengan mudah, apapun bahasa yang Anda gunakan (tensorflow, 2021).
2.12 Adaptive Learning Rate
Adaptive learning rate merupakan metode yang tujuannya meningkatkan efektifitas dari parameter tingkat pembelajaran, dimana tingkat pembelajaran merupakan parameter yang fungsinya meningkatkan kecepatan belajar. Adaptive learning rate muncul ketika suatu riset yang dilakukan pada nilai yang konstan pada
tingkat pembelajaran menyebabkan suatu metode menjadi tidak efisien, dikarenakan sangat bergantung pada nilai tingkat pembelajaran yang dipilih.
Tingkat pembelajaran yang tidak tepat maka akan menyebabkan jaringan yang sangat lambat dan tidak mencapai local optimal. Jadi, alasan tersebutlah yang memunculkan pendekatan adaptive learning rate (Plagianakos, Sotiropoulos and Vrahatis, 1998).
2.13 Crossentropy Loss
Function loss merupakan sebuah intruksi yang menggambarkan kerugian terkait dengan semua kemungkinan yang dihasilkan oleh model saat learning. Loss function berfungsi ketika model pembelajaran memberikan kesalahan yang harus diperhatikan. Loss function dikatakan baik ketika fungsi yang dihasilkan error paling rendah. Ketika model memiliki kelas yang cukup banyak, perlu teknik mengukur jumlah perbedaan antara probabilitas hasil hipotesis dengan probabilitas kebenaran yang aslinya, dan pada saat pelatihan memiliki banyak algoritma yang dapat menyesuaikan parameter sehingga hasil memiliki perbedaan yang diminimalkan (Danukusumo, 2017).
2.14 Kontes RoboWorld Cup
Kontes RoboWorld Cup merupakan Kegiatan rutin setiap tahunnya yang diselenggarakan oleh RobotWorld Cup. Menawarkan arena yang menantang bagi generasi muda dan peneliti yang mengeluti sistem robot seluler otonom. Robot sepak bola dapat digambarkan sebagai kompetisi teknologi robot canggih bermain bola dan menyelesaikan misi tertentu dalam ruang terbatas. RoboWorld Cup yang dimulai pada tahun 1996, bersama dengan banyak acara RoboWorld Cup lainnya,
akan membangkitkan minat robotika di benak anak muda. Berikut ini RoboWorld Cup mencakup kompetisi seperti:
1. RoboWorld Cup Sports bertujuan untuk mengembangkan atlet robot yang dapat bersaing dengan manusia di ajang Olimpiade.
2. RoboWorld Cup Challenges berfokus pada tantangan kompleks dalam pengaturan robot industri, penyelamatan, dan layanan. Sejak didirikan, Roboord Cup telah memiliki tempat untuk Piala RoboWorld Cup tahunan di Australia, Brasil, Cina, Prancis, dan Korea. Membuat kemajuan selama bertahun-tahun berturut-turut sejak tahun 1996, RoboWorld Cup kini telah mencapai pengakuan dunia sebagai festival robot (firaworldcup, 2021).
Gambar 2.8 Kondisi Pertandingan Kontos RobotWorld Cup