PDF BAB II LANDASAN TEORI 2.1 Tabel 2

(1)

2.1 Tinjauan Pustaka

Dalam penelitian ini diperlukan beberapa tinjauan pustaka yang diambil dari beberapa jurnal penelitian sebelumnya yang berkaitan dengan judul penelitian dan pokok pembahasan, yang akan digunakan sebagai bahan rujukan atau pendukung penelitian, seperti yang tersaji pada Tabel 2.1 Daftar Jurnal :

Tabel 2.1 Daftar Jurnal No

Jurnal Penulis Tahun Judul

Jurnal 01

Ani Enggarwati, Yuita Arum Sari, Randy Cahya Wihandika

2019

Segmentasi Citra Kue Tradisional menggunakan Ruang Warna Hue Saturation Value dan Otsu Thresholding

Jurnal 02

Muhammad Resa Arif Yudianto, Kusrini, Hanif Al Fatta

2020

Analisis Pengaruh Tingkat Akurasi Klasifikasi Citra Wayang Dengan Algoritma Convolutional Neural Network

Jurnal 03

Regina Valentina, Silvia Rostianingsih, Alvin Nathaniel Tjondrowiguno

2020 Pengenalan Gambar Botol Plastik dan Kaleng Minuman Menggunakan Metode Convolutional Neural Network

Jurnal 04

Pulung Adi Nugroho, Indah Fenriana, Rudy Arijanto, M.Kom

2020 Implementasi Deep Learning Menggunakan Convolutional Neural Network (CNN) Pada Ekspresi

(2)

Manusia

Jurnal 05

Teguh Setiawan &

Donny Avianto

2020 Implementasi Convolutional Neural Network Untuk Pengenalan Warna Kendaraan

Jurnal 06

Tiara Shafira 2018 Implementasi Convolutional Neural Networks Untuk Klasifikasi Citra Tomat Menggunakan Keras

Jurnal 07

Triano Nurhikmat 2018 Implementasi Deep Learning Untuk Image Classification Menggunakan Algoritma Convolutional Neural Network (CNN) Pada Citra Wayang Golek

Jurnal 08

Fida Dwi Febriani 2020 Klasifikasi Cira Kue Tradisional Indonesia Berdasarkan Ekstraksi Fitur Warna RGB Color Moment dan K-Nearest Neighbor

Jurnal 09

Refi Fadholi, Yuita Arum Sari, Fitra Abdurrachman

Bachtiar

2019 Pengenalan Citra Makanan Tradisional menggunakan Fitur Hue Saturation Value dan Fuzzy k- Nearest Neighbor

Jurnal 10

Sarirotul Ilahiyah, Agung Nilogiri

2018 Implementasi Deep Learning Pada Identifikasi Jenis Tumbuhan Berdasarkan Citra Daun Menggunakan Convolutional Neural

(3)

Network

2.1.1. Tinjauan Terhadap Jurnal 01

Pada penelitian oleh Ani Enggarwati, Yuita Arum Sari, dan Randy Cahya Wihandika (2019) yang mengangkat judul “Segmentasi Citra Kue Tradisional menggunakan Ruang Warna Hue Saturation Value dan Otsu Thresholding”. Segmentasi dimulai dengan mengubah citra RGB menjadi citra HSV, kemudian melakukan thresholding Otsu untuk setiap komponen hue, saturation, dan color value. Hasil pengujian nilai komponen warna memberikan hasil yang berlawanan yaitu latar belakang putih dan latar depan hitam, sehingga komponen nilai warna dibalik. Dari komponen warna threshold diperoleh akurasi, spesifisitas dan sensitifitas hasil segmentasi.

Pada 50 citra kue tradisional yang digunakan, komponen warna memiliki tingkat ketelitian rata-rata 42,64%, komponen saturasi warna memiliki faktor ketelitian rata-rata 94,34%, komponen nilai warna memiliki tingkat ketelitian rata-rata 70,68%. Uji spesifisitas dan sensitivitas menunjukkan komponen saturasi warna memiliki nilai yang lebih tinggi dibandingkan komponen warna lainnya yaitu 82.08% dan 91.30%.

Pada penelitian Muhammad Resa Arif Yudianto dan Kusrini, Hanif Al Fatta (2020) dengan mengangkat judul “Analisis Pengaruh Tingkat Akurasi Klasifikasi Citra Wayang Dengan Algoritma Convolutional Neural Network”.

Pengenalan gambar digital figur wayang melalui sistem sangat diperlukan untuk memasuki generasi milenial anak-anak mengingat saat ini masyarakat sudah terbiasa dengan teknologi.

(4)

Agar dapat mengenali dengan benar berbagai citra wayang tersebut, diperlukan model yang baik. Kualitas model dapat diukur dengan berbagai akurasi, presisi, dan recall dalam proses pengujian model. Ada beberapa faktor yang mempengaruhi pembentukan model, diantaranya adalah pentingnya rasio pembagian dataset, jumlah iterasi (epoch) dalam training, dan pengolahan data tersebut sebelum digunakan dalam proses pembuatan model.

Dalam penelitian ini digunakan 400 dataset gambar wayang punakawan (bagong, gareng, petruk dan semar) yang terbagi secara rata menjadi 100 data untuk setiap kelasnya. Berdasarkan hasil percobaan yang dilakukan peneliti, akurasi terbaik adalah 97%, presisi 93% dan recall 87%

menggunakan kombinasi augmentasi, perubahan citra grayscale pada tahap pre-process, menggunakan dataset rasio 80:20 dan epoch 100, yang berpengaruh signifikan terhadap peningkatan nilai akurasi.

Pada penelitian oleh Regina Valentina, Silvia Rostianingsih, dan Alvin Nathaniel Tjondrowiguno (2020) berjudul “Pengenalan Gambar Botol Plastik dan Kaleng Minuman Menggunakan Metode Convolutional Neural Network”.

Peneliti mengangkat judul ini karena kesadaran masyarakat terhadap pemilahan sampah plastic dan kaleng masih kurang. Sebelum daur ulang sampah, pemilahan sampah sangat penting. Menurut Dinas Lingkungan Hidup, Kebersihan dan Pertamanan Kota Kediri, limbah seperti plastik dan kaleng memerlukan perlakuan khusus selama proses daur ulang.

(5)

Pada penelitian ini peneliti menggunakan metode convolutional neural network (CNN) untuk pengenalan objek. Telah ada beberapa penelitian tentang klasifikasi sampah, namun pada dua penelitian sebelumnya objek yang digunakan semuanya adalah sampah plastik.

Pada penelitian ini peneliti menggunakan tingkat learning rate denngan nilai 0.00001, tingkat dropout 0.8, dan jumlah epoch training 50 kali.. Tingkat akurasi yang didapatkan untuk mengklasifikasikan botol plastik dan kaleng dengan menggunakan CNN adalah 86% dengan waktu training 25 menit 12 detik.

Pada penelitian yang dilakukan oleh Pulung Adi Nugroho, Indah Fenriana, dan Rudy Arijanto, M.Kom (2020) berjudul “Implementasi Deep Learning Menggunakan Convolutional Neural Network (CNN) Pada Ekspresi Manusia”. Peneliti membuat Machine Learning dengan Metode Deep Learning, yang saat ini memiliki hasil paling signifikan dalam pengenalan citra adalah Convolutional Neural Network (CNN). CNN memiliki beberapa layer (lapisan) yang mengekstraksi informasi dari citra dan menentukan klasifikasi citra dalam bentuk skor klasifikasi. Aplikasi menggunakan bahasa pemrograman python, web berbasis flask, tensorflow dan opencv.

Peneliti menggunakan dataset yang terdiri dari ekspresi senang, sedih, takut, jijik, netral, marah, dan kaget. Hasil akurasi learning paling bagus ditunjukan pada proses epoch 100 dan batch size 128 yaitu didapatkan hasil sebesar 90% dan validation sebesar 65%. Hasil percobaan dari total 35

(6)

ekspresi, 28 ekspresi berhasil ditebak dengan benar dengan mendapatkan akurasi sebesar 80%.

Penelitian yang dilakukan oleh Teguh Setiawan & Donny Avianto (2020) berjudul “Implementasi Convolutional Neural Network Untuk Pengenalan Warna Kendaraan”. Convolutional Neural Network adalah salah satu metode machine learning dari pengembangan Multi Layer Perceptron (MLP) yang didesain untuk mengolah data dua dimensi.

Pengenalan kendaraan memainkan peran penting dalam penerapan sistem transportasi cerdas dan investigasi kriminal dengan mengidentifikasi jenis, warna, dan pelat nomor kendaraan sasaran. Warna merupakan salah satu atribut dasar kendaraan, sehingga pengenalan warna berperan penting dalam pengenalan kendaraan.

Dalam penelitian ini digunakan metode CNN untuk klasifikasi warna kendaraan. Rancangan dataset untuk penelitian ini diambil dari stanford cars datasets. Peneliti ini hanya empat warna mobil yang digunakan yaitu putih, abu-abu, hitam, dan silver, keempat warna tersebut memiliki rentang warna yang berdekatan, dan digunakan 2000 data citra yang dibagi menjadi, 1600 citra sebagai data latih. , 400 citra sebagai data validasi yang diatur menggunakan train data split. Penggunaan GPU saat komputasi dengan CUDA dan CuDNN berdampak pada percepatan proses pelatihan dan pengujian. Hasil yang diperoleh cukup baik yaitu menunjukkan akurasi sebesar 73% selama proses pelatihan.

(7)

Peneliti melakukan proses pengujian model menggunakan input data menggunakan data gambar sebanyak 360 dengan masing masing kelas berisi 90 data gambar, dan menghasilkan akurasi sebesar 76.94%.

Pada penelitian yang dilakukan oleh Tiara Shafira (2018) dengan judul

“Implementasi Convolutional Neural Network untuk Klasifikasi Citra Tomat Menggunakan Keras”. Penelitian dilakukan untuk mengetahui tingkat ketelitian dan tingkat kelayakan yang didapatkan dengan metode CNN menggunakan Keras pada citra buah tomat.

Keras merupakan merupakan salah satu package dalam tensorflow yang digunakan untuk menyelesaikan studi kasus mengenai jaringan syaraf.

Membuat model jaringan neural dengan Keras tidak mengharuskan peneliti menulis kode untuk mengekspresikan kalkulasi matematis. Ini karena Keras telah menyediakan beberapa model dasar untuk CNN dan telah dioptimalkan untuk memfasilitasi penelitian deep learning. Proses komputasi dengan Keras berjalan lancar dengan CPU maupun GPU.

Dalam penelitian ini, peneliti menggunakan RStudio yang merupakan program open source yang akan memudahkan pengguna R untuk menjalankan program R agar lebih menyenangkan, karena RStudio memberikan informasi tentang instruksi apa yang harus dilakukan.

Hasil yang diperoleh adalah tingkat akurasi data uji yang diperoleh dari model yang dibuat yaitu 90% pada klasifikasi citra tomat yang diyakini mampu mengidentifikasi buah tomat.

(8)

Pada penelitian Triano Nurhikmat (2018) dengan judul “Implementasi Deep Learning Untuk Image Classification Menggunakan Algoritma Convolutional Neural Network (CNN) Pada Citra Wayang Golek”. Wayang merupakan seni tradisional yang bekembang terutama di pulau Jawa dan Bali.

Di dunia, wayang telah tercatat sebagai karya seni budaya adiluhung, yaitu oleh UNESCO. Hasil survei dengan menunjukkan tokoh wayang kulit menunjukkan bahwa 71% dari 60 orang tidak mengetahuinya. Penelitian ini diangkat peneliti untuk membantu mengklasifikasikan objek tokoh pewayangan berdasarkan gambar digital Salah satu metode pengenalan citra adalah dengan menggunakan metode Convolutional Neural Network.

Model CNN pada penelitian ini menggunakan ukuran input shape 64x64, learning rate 0,001, ukuran filter 3x3, dan jumlah epoch 20. Dengan 240 data latih, dan 60 data uji. Citra Wayang Golek sebesar 95% training dan 90% testing. Pada pengujian peneliti menggunakan 60 data uji baru dengan hasil pengujian yang meningkatkan akurasi klasifikasi citra Wayang Golek sebesar 93%.

Pada Penelitian oleh Fida Dwi Febriani (2020) berjudul “Klasifikasi Cira Kue Tradisional Indonesia Berdasarkan Ekstraksi Fitur Warna RGB Color Moment dan K-Nearest Neighbor”. Peneliti menggunakan dataset gambar kue tradisional Indonesia dengan cara mengambil foto. Gambar yang diambil menunjukkan beberapa warna berbeda untuk ekstraksi. Metode ekstraksi warna yang digunakan peneliti adalah Color Moment yang

(9)

menghasilkan 3 nilai utama yaitu nilai rata-rata dan standar deviasi, dan kemiringan (skewness).

Ekstraksi fitur ini disertai algoritma K-Nearest Neighbor (K-NN) yang akan mengklasifikasikan warna berdasarkan data latih sebanyak nilai k.

Peneliti menggunakan 29 objek kue yang dibagi menjadi 29 kategori, 8 kategori, 5 kategori dan 3 kategori. Dengan menggabungkan metode K-NN dengan fitur Color Moment, pada skenario pengujian dari ketiga kategori nilai evaluasi tertinggi adalah 60%.

Pada penelitian oleh Refi Fadholi, Yuita Arum Sari, dan Fitra Abdurrachman Bachtiar (2019) yang berjudul “Pengenalan Citra Makanan Tradisional menggunakan Fitur Hue Saturation Value dan Fuzzy k-Nearest Neighbor”. Makanan dan jajanan tradisional merupakan makanan khas yang biasanya digunakan saat acara atau tradisi. Beberapa orang menganggap makanan dan jajanan tradisional sudah ketinggalan zaman, sehingga banyak makanan dan jajanan tradisional ditinggalkan oleh masyarakat.

Pada penelitian ini citra yang digunakan merupakan hasil segmentasi citra dengan menguji tiga jenis data yaitu 300 data citra dengan hasil segmentasi terbaik, 300 data citra dengan jumlah data yang hampir sama untuk tiap kelas, dan 400 data citra dengan hasil segmentasi terbaik. hasil segmentasi. Ciri citra yang digunakan adalah Hue Saturation Value (HSV) yang meliputi mean, deviasi standar, skewness dan kurtosis dari masing- masing dimensi warna. Klasifikasi dilakukan memakai metode Fuzzy k-NN dan k-Fold Cross Validation.

(10)

Berdasarkan penelitian tersebut didapatkan hasil akurasi yang diperoleh tergolong rendah yaitu 53,33% dikarenakan jumlah kelas yang ganjil dan kualitas citra hasil segmentasi yang digunakan kurang baik.

2.1.10. Tinjauan Terhadap Jurnal 10

Pada penelitian Sarirotul Ilahiyah dan Agung Nilogiri (2018) yang berjudul “Implementasi Deep Learning Pada Identifikasi Jenis Tumbuhan Berdasarkan Citra Daun Menggunakan Convolutional Neural Network” ini menggunakan arsitektur CNN dari Krizhevsky et al.(2012) yang disebut dengan AlexNet. Secara garis besar, cara kerja sistem arsitektur Alexnet dipecah menjadi dua kelompok lapisan. Bagian pertama adalah lapisan ekstraksi ciri yang terdiri dari convolution layer dan pooling layer, dan bagisan kedua adalah lapisan klasifikasi.

Pada penelitian ini pengujian model menggunakan cross validation.

Cross validation merupakan metode statistik untuk mengevaluasi dan membandingkan algoritma pembelajaran dengan membagi data menjadi dua segmen, satu segmen digunakan untuk mempelajari atau melatih data, dan segmen lainnya digunakan untuk memvalidasi model.

Dari hasil pengamatan peneliti dapat diambil kesimpulan percobaan menggunakan K-fold cross validation dengan nilai k=10 didapatkan rata-rata nilai akurasi sebesar 85.21% sampai 90.8%.

2.2 Kue Tradisional Indonesia

Indonesia memiliki ragam jajanan dan kue yang gurih dan manis. Kue yang populer antara Kue Dadar Gulung, Kue Kastengel, Kue Klepon, Kue Lapis, Kue Lumpur, Kue Putri Salju, Risoles, dan Serabi. Kue khas Indonesia bisa kita

(11)

jumpai di pasar tradisional, sehingga sering disebut jajanan pasar atau jajanan tradisional (Agustina & Sutisna, 2020)

Menurut Kamus Besar Bahasa Indonesia, kue artinya jajanan yang terbuat dari berbagai bahan yang dapat diolah dalam berbagai bentuk. Kata "kue", yang berasal dari kata serapan bahasa Hokkien, menunjukkan pengaruh seni masakan Tionghoa di Nusantara. Beberapa kue yang menunjukkan ciri khas masakan Tionghoa seperti kue bakpia.. Sebagian besar kue basah merupakan kue khas nusantara, sedangkan kue lainnya menunjukkan pengaruh Eropa, yaitu Belanda dan Portugis. Awalnya, istilah kue digunakan untuk merujuk pada kue tradisional dan kue khas asal Tiongkok, namun dalam bahasa Indonesia, istilah tersebut telah diperluas hingga mencakup istilah umum untuk makanan ringan, termasuk kue, biskuit dan tart atau kue bolu.

Kue di Indonesia biasanya diklasifikasikan berdasarkan keadaannya yaitu kue basah dan kue kering. Pada umumnya kue basah bertekstur lembut dan tidak tahan lama, hal ini disebabkan komposisi kue basah seperti tepung beras, gula pasir dan santan sehingga mudah busuk dan juga diolah dengan cara dikukus, direbus atau digoreng. Nama "kue basah" mencerminkan sifat kue khas Indonesia yang biasanya dimatangkan dalam air mendidih dengan cara dikukus, membuat adonan menjadi lembab dan tampak basah. Inilah keistimewaan yang membedakan kue Indonesia dengan kue ala Barat (Agustina & Sutisna, 2020)

2.3 Klasifikasi

Klasifikasi adalah bentuk analisis data yang mengekstrak model atau fungsi yang digunakan untuk menjelaskan atau membedakan konsep kelas data. Proses klasifikasi terbagi menjadi dua tahapan yaitu tahap pembelajaran (learning) yaitu

(12)

tahapan pembelajaran data yang diketahui kelas, dan tahap pengujian (testing) yaitu menilai tingkat kinerja model hasil dari tahapan learning dengan data baru yang disebut data uji (Resa et al., 2020)

“Keakuratan suatu model klasifikasi dapat diketahui dari seperangkat tes yang diberikan dengan menghitung persentase dari data uji yang diklasifikasikan dengan benar oleh model klasifikasi, jika keakuratan klasifikasi dianggap dapat diterima, klasifikasi dapat digunakan untuk mengklasifikasikan data lainnya yang label kelasnya tidak diketahui” (Han dan Kamber, 2006).

Setiap teknik dari klasifikasi tersebut terdapat kekurangan dan kelebihan.

“Tetapi prinsip dari masing-masing teknik tersebut sama, yaitu melakukan suatu pelatihan sehingga di akhir pelatihan, model dapat memprediksi setiap vektor masukan ke label kelas output dengan tepat” (Prasetyo, 2012). Mengklasifikasi citra kue tradisional Indonesia adalah salah satu cara untuk mengorganisasikan citra-citra tersebut. Citra yang memiliki kesamaan gambar dan lainnya akan dikelompokkan ke dalam kategori yang sama.

2.4 Citra Digital

Citra adalah gabungan antara titik, garis, bidang dan warna untuk menciptakan suatu imitasi dari suatu objek. Citra terbagi dua yaitu ada citra yang bersifat analog dan ada citra yang bersifat digital. Citra analog tidak dapat direpresentasikan dalam komputer, sehingga tidak bisa diproses oleh komputer secara langsung. Citra analog harus dikonversi menjadi citra digital terlebih dahulu agar dapat diproses di komputer (Sutojo, 2017).

“Citra bisa didefinisikan sebagai suatu fungsi dua dimensi, f(x,y), dimana x dan y adalah kooordinat spasial, dan f(x,y) adalah nilai pada koordinat (x,y) yang

(13)

sering disebut intensitas. Citra digital adalah citra f(x,y) yang telah didigitalisasi baik dari segi koordinat area maupun pada nilai intensitasnya. Sebuah citra digital terdiri dari sejumlah elemen, yang masing-masing mempunyai lokasi dan nilai tertentu. Masing-masing elemen disebut picture elements atau pixel” (Gonzales, Rafael C., Richard E. Woods dan Steven L. Eddins, 2008).

Posisi piksel dapat ditunjukkan dengan koordinat (0,0) yang digunakan untuk posisi kiri atas pada bidang citra. Tingkat pencahayaan piksel dapat direpresentasikan sebagai bilangan bulat dengan ukuran 8 bit dan lebar mulai dari 0-255, di mana 0 adalah hitam dan 255 putih. (Abdullah & Pahrianto, 2017).

2.5 Deep Learning

Deep Learning merupakan salah satu jenis algoritma jaringan saraf tiruan yang menggunakan metadata sebagai masukan dan mengolahnya menggunakan sejumlah lapisan tersembunyi (hidden layer) transformasi non-linier dari data masukan untuk menghitung nilai keluaran. Deep learning memungkinkan model komputasi yang terdiri dari beberapa lapisan pemrosesan untuk mempelajari representasi data dengan berbagai tingkat abstraksi. Metode-metode ini telah secara signifikan meningkatkan kemampuan pengenalan kata-kata, pengenalan objek visual, deteksi objek dan banyak lainnya (Asrafil et al., 2020)

Deep Learning merupakan metode learning yang memanfaatkan artificial neural network yang berlapis-lapis (multi layer). Artifical Neural Network ini didesain menyerupai otak manusia, dimana neuron-neuron saling berhubungan membentuk sebuah jaringan neuron yang sangat rumit (Nugroho et al., 2020).

Dalam menghadapi kasus klasifikasi, salah satu fungsi deep learning yang sering digunakan adalah feature engineering, yang merupakan teknik penting

(14)

untuk mendapatkan hasil yang baik dalam tugas prediksi dengan mengekstraksi pola yang berguna dari data, sehingga lebih mudah untuk membedakan antar kelas. Dalam pengertian ini, metode Convolutional Neural Network sangat bagus untuk menemukan fitur gambar yang baik hingga lapisan berikutnya pada kasus klasifikasi dalam deep learning. Metode ini menciptakan hipotesis nonlinier dan karenanya dapat meningkatkan kompleksitas model (Shafira, 2018).

2.6 Artificial Neural Network

Artificial Neural Network (ANN) adalah model komputasi paralel yang meniru fungsi sistem jaringan saraf biologis otak manusia (Setiawan & Avianto, 2020). Konsep dasar dari ANN diawali dari otak manusia yang memuat sekitar 10¹¹ neuron yang berfungsi untuk memproses setiap informasi yang masuk (Shafira T, 2018).

Otak manusia terdiri dari milyaran neuron yang terhubung bersama.

Hubungan ini disebut sinapsis. Komponen saraf terdiri dari satu inti sel yang akan memproses informasi, satu akson (axon), dan setidaknya satu dendrite. Informasi yang masuk akan diambil oleh dendrit. Selanjutnya, dendrite menyertai axon sebagai hasil pemrosesan informasi.

Gambar 2.1 Jaringan Syaraf Manusia (Sumber : Setiawan & Avianto, 2020)

(15)

Setiap sel saraf terhubung dengan saraf lain yang akan menghasilkan kemampuan tertentu dalam kerja otak manusia, dengan total sekitar 10⁴ bobot.

Informasi ini akan diambil oleh neuron lain jika mencapai ambang tertentu yang disebut treshold atau nilai ambang. Dalam kasus ini, neuron dikatakan telah aktif.

Ketika sebuah neuron diaktifkan, neuron mengirimkan output-nya melalui bobotnya ke semua neuron berikutnya yang terhubung.

Gambar 2.2 Struktur Neuron Neural Network (Sumber : Pramatio et al., 2020)

Pada gambar diatas menggambarkan struktur ANN secara mendasar yaitu input berfungsi sebagai dendrite, output berfungsi sebagai axon, dan fungsi aktifasi berfungsi sebagai sinapsis .

ANN merupakan sistem adatif yang dapat mengubah strukturnya untuk memecahkan suatu masalah berdasarkan informasi internal maupun eksternal.

Menurut Pham dalam jurnal Hermantoro (Pham, 1994) mengatakan bahwa ANN bersifat fleksibel terhadap masukan data dan menghasilkan output respon konsisten. Menurut Kumar & Haynes (Kumar, 2003) dalam jurnal Ulil Hamida (Hamida, 2014) menjelaskan, penerapan ANN dapat mengidentifikasi beberapa aplikasi yaitu:

1. Estimasi/prediksi

2. Pengenalan Pola (klasifikasi, diagnosis)

3. Clustering (pengelompokan tanpa adanya pengetahuan sebelumnya).

(16)

Pada lapisan neuron, distribusi neuron akan terkumpul pada lapisan neuron.

Kemudian neuron dalam satu lapisan akan terhubung ke lapisan sebelum dan sesudah, kecuali lapisan input dan ouput. Informasi yang dibawa dari lapisan masukan awal akan disebarkan dari lapisan ke lapisan dari lapisan input ke lapisan output. Lapisan ini sering disebut dengan hidden layer (lapisan tersembunyi) (Nurhikmat, 2018).

Gambar 2.3 Contoh Jaringan Syaraf dalam 3 layer (Sumber : Nurhikmat, 2018)

Arsitektur berikut biasa disebut sebagai Multi Layer Perceptron (MLP).

Arsitektur pertama memiliki 4 neuron pada lapisan input dan 2 node lapisan output. Antara input dan output, ada lapisan tersembunyi dengan 3 neuron.

Neuron ini akan langsung terhubung ke neuron lain di lapisan berikutnya

2.7 Convolutional Neural Network

Convolutional Neural Network (CNN) merupakan salah satu algoritma deep learning yang merupakan perpanjangan dari Multi Layer Perceptron (MLP) yang dirancang untuk mengolah data dalam bentuk grid, salah satunya adalah citra dua dimensi, misalnya sebagai gambar (Resa et al., 2020). Multi Layer perceptron sendiri merupakan pengembangan dari Artificial Neural Network (ANN) yang

(17)

bertujuan untuk menutupi kekurangan dari Artificial Neural Network (ANN) dengan single layer perceptron dalam menyelesaikan operasi logis yang kompleks (M. A. Pangestu & Bunyamin, 2018).

Secara teknis, convolutional network memiliki arsitektur trainable yang terdiri dari beberapa tahapan. Masukan dan keluaran setiap tahap adalah serangkaian array yang disebut feature map. Misalnya, untuk citra grayscale, masukannya adalah matriks dua dimensi. Keluaran dari tiap langkah adalah feature map hasil pengolahan dari semua lokasi citra masukan. Tiap tahapan terdiri dari tiga layer yaitu konvolusi, aktivasi dan pooling.

CNN melatih dan menguji setiap gambar masukan melalui serangkaian proses, yaitu lapisan konvolusi yang diikuti dengan pooling (penggabungan) untuk mengekstrak fitur dari gambar masukan yang berurutan. Setelah operasi pooling, gambar diratakan dan kemudian diteruskan ke proses fully connected- layer untuk tugas klasifikasi (Felix et al., 2019).

Gambar 2.4 Arsitektur CNN (Sumber : Felix et al., 2019)

CNN digunakan untuk mengklasifikasikan data yang diberi label menggunakan metode supervised learning, dimana cara kerjanya dengan supervised learning terdapat data latih dan variabel target sehingga tujuan dari

(18)

metode tersebut adalah untuk mengelompokkan data tersebut ke dalam data yang sudah ada. Secara umum tipe lapisan CNN ada dua, diantaranya :

1. Feature Extraction Layer

Lapisan ini ada di awal arsitektur. Neuron di lapisan ini terhubung ke area local layer sebelumnya. Layer konvolusi adalah lapisan tipe pertama dan pooling layer adalah lapisan kedua. Lapisan ini menerima gambar masukan secara langsung dan kemudian memprosesnya untuk menghasilkan keluaran vektor untuk diproses di lapisan berikutnya.

2. Classification Layer

Lapisan ini terdiri dari beberapa lapisan yang di setiap lapisan terdiri dari neuton yang terhubung sepenuhnya (fully connected) dengan lapisan lainnya. Lapisan ini menerima masukan dari lapisan ekstraksi ciri citra sebagai vektor, yang kemudian ditransformasikan seperti pada Multi Neural Network dengan penambahan beberapa lapisan tersembunyi.

Keluarannya adalah akurasi kelas untuk klasifikasi.

2.7.1. Convolution Layer

Pada lapisan konvolui dilakukan operasi konvolusi diikuti dengan operasi detektor bertahap menggunakan fungsi aktivasi. Konvolusi adalah operasi matematis berupa perkalian antara dua buah matriks yang dilakukan pada setiap piksel masukan dengan menggunakan kernel atau filter (Valentina et al., 2020). Prosesnya terdiri dari pengurangan dimensi gambar menggunakan operasi konvolusi untuk mengekstrak fitur-fitur dari gambar seperti tepi, warna, orientasi gradien, dll. dalam proses pengkodean (Resa et al., 2020).

(19)

Secara matematis, konvolusi adalah jumlah total produk antara tiap elemen yang bersesuaian (dengan posisi koordinat yang sama) dalam dua matriks atau dua vektor, seperti yang ditunjukkan pada Gambar 2.5 (Rohim et al., 2019). Operasi ini menggunakan fungsi keluaran sebagai feature map dari citra masukan (Ilahiyah & Nilogiri, 2018).

Gambar 2.5 Konvolusi (Sumber : Resa et al., 2020)

Gambar 2.6 Perhitungan konvolusi (Sumber : Rohim et al., 2019)

Secara formal operasi konvolusi dapat dituliskan dengan (1) Fungsi s(t) memberikan hasil tunggal dalam bentuk feature map.

Argumen pertama adalah masukan, yaitu x, dan argumen kedua adalah kernel atau filter. Melihat imasukan dua dimensi dari gambar, kita dapat mengatakan bahwa t adalah piksel dan mengubahnya menjadi i dan j (Shafira T, 2018). Oleh karena itu, operasi untuk konvolusi ke input dengan lebih dari satu dimensi dapat ditulis sebagai berikut

𝑆(𝑖,𝑗) = (𝐾 ∗ 𝐼)(𝑖,𝑗) = ∑∑𝐼(𝑖−𝑚,𝑗−𝑛)𝐾(𝑚.𝑛) (2)

(20)

Persamaan di atas adalah perhitungan dasar dalam operasi konvolusi dimana i dan j adalah piksel dari citra. Perhitungannya bersifat komutatif dan muncul saat K sebagai kernel, I sebagai input dan kernel yang dapat dibalik relatif terhadap input. Sebagai alternatif, operasi konvolusi dapat dilihat sebagai perkalian matriks antara citra masukan dan kernel dimana keluarannya dapat dihitung dengan dot product (Rismiyati, 2016).

2.7.2. Pooling Layer

Layer ini ada setelah lapisan konvolusi. Lapisan terdiri dari sebuah filter dengan ukuran dan stride tertentu yang akan bergeser pada semua activation map. Pooling yang digunakan adalah max dan average pooling.

Misal kita gunakan max pooling 2x2 dengan stride 2, maka disetiap pergeseran filter, nilai max pooling pada area 2x2 pixel tersebut yang akan dipilih, sedangkan average pooling akan memilih nilai rata-ratanya (Setiawan & Avianto, 2020).

Gambar 2.7 Max Pooling (Sumber : Kusumaningrum, 2018)

Bidang yang berwarna merah, hijau, kuning, dan biru di sebelah kiri adalah kelompok bidang dimana nilai maksimum akan dipilih. Sehingga hasil dari proses ini bisa dilihat di kotak di sebelah kanan. Proses ini memastikan bahwa fitur yang diperoleh akan tetap sama meskipun objek gambar bergeser (translasi) (Kusumaningrum, 2018). Tujuan dari

(21)

penggunaan pooling layer adalah mengurangi dimensi dari feature map (downsampling), sehingga mempercepat komputasi karena parameter yang harus diupdate semakin sedikit dan mengatasi over-fitting (Pujoseno, 2018).

2.7.3. Dropout Layer

Dropout adalah suatu teknik regulasi jaringan saraf yang bertujuan untuk memilih beberapa neuron secara acak dan tidak akan digunakan selama proses pembelajaran, dengan kata lain neuron tersebut dibuang secara acak (Nurhikmat, 2018). Lapisan ini digunakan untuk menghindari adanya over-fitting.

Over-fitting merupakan kondisi dimana hampir semua data yang telah lolos proses training mencapai persentase yang baik, namun terjadi ketidaksesuaian pada proses prediksi (Nugroho et al., 2020). Proses over- fitting dapat dihindari dengan menggunakan dropout layer karena peningkatan generalisasi data dalam model (Valentina et al., 2020).

Dropout tersebut dilakukan melalui proses training dimana neuron pada jaringan saraf tiruan tidak akan digunakan berdasarkan probabilitas dropout rate. Dropout-rate biasanya berupa parameter float (Valentina et al., 2020). Berikut adalah gambar proses dropout.

Gambar 2.8 Proses Dropout (Sumber : Shafira, 2018)

(22)

2.7.4. Fully Connected Layer

Feature map yang dihasilkan dari lapisan ekstraksi fitur masih berupa multi-dimention array (Nugroho et al., 2020). Keluaran dari convolution layer dan pooling layer adalah matriks 3D, sedangkan masukan yang diharapkan untuk fully-connected layer adalah matriks 1D. Oleh karena itu, hasil dari convolution layer dan pooling layer akan diproses terlebih dahulu dalam operasi “flattening” untuk diubah ukurannya menjadi matriks 1D (Valentina et al., 2020). Output dari proses ini dapat membedakan fitur yang berpengaruh dan fitur dominan dengan fitur tingkat rendah pada citra, dan menggunakan teknik sotmax classifier untuk mengklasifikasikannya (Resa et al., 2020).

2.8 Fungsi Aktivasi ReLu

Fungsi aktivasi yang sering digunakan untuk model CNN adalah fungsi aktivasi ReLU (Rectified Linear Unit). ReLU merupakan fungsi aktivasi pada model CNN yang mengaplikasikan fungsi

f(x) = max (0,x) (3)

yang berarti fungsi ini melakukan thresholding dengan nilai 0 terhadap nilai piksel pada input citra. Aktivasi ini membuat seluruh nilai piksel yang bernilai kurang dari 0 pada suatu citra akan dijadikan 0 (Ilahiyah & Nilogiri, 2018).

Gambar 2.9 Grafik ReLu (Sumber : Illahiyah & Nilogiri, 2018)

(23)

2.9 Softmax Classifier

Softmax Classifier merupakan bentuk lain dari algoritma regresi logistik yang dapat digunakan untuk mengklasifikasi lebih dari dua kelas. Standar klasifikasi yang biasanya dilakukan oleh algoritma regresi logistik adalah tugas klasifikasi kelas biner (Ilahiyah & Nilogiri, 2018). Bentuk persamaan softmax adalah sebagai berikut.

(4)

Nilai fj menginterpretasikan hasil fungsi untuk setiap elemen ke-j pada vektor keluaran kelas. Argumen z adalah hipotesis yang diberikan oleh model pelatihan agar dapat diklasifikasi oleh fungsi softmax. Softmax memungkinkan untuk menghitung probabilitas pada semua label. Dari label yang ada, akan diambil vektor nilai riil dan mengubahnya menjadi vektor dengan nilai antara nol dan satu, yang jika dijumlahkan akan menjadi satu (Ilahiyah & Nilogiri, 2018).

2.10 Cross Entropy Loss Function

Cross entropy loss merupakan fungsi yang digunakan untuk menghitung kinerja model dengan menghitung kesalahan yang dihasilkan dari model (R. A.

Pangestu et al., 2020). Deskripsi umum algoritma ini adalah untuk meminimalkan kemungkinan log negatif dari dataset, yang merupakan ukuran langsung dari kinerja prediktif model (Shafira T, 2018).

2.11 Tensorflow

TensorFlow adalah open source library untuk machine learning yang diluncurkan oleh Google yang mendukung beberapa bahasa pemrograman (Devikar, 2016). Dalam proses Transfer Learning, tensorflow berperan untuk

(24)

memproses model untuk training ulang dengan data baru kemudian membangun classifier dengan penghitungan cepat dan akurasi yang baik.

Tensorflow dapat digunakan di semua sistem operasi. TensorFlow digunakan untuk bereksperimen dengan model deep learning, melatih model pada dataset yang besar, dan menyesuaikannya dengan produksi (M. A. Pangestu &

Bunyamin, 2018).

2.12 MobilenetV2

MobilenetV2 adalah suatu model deep learning yang telah dilatih terlebih dahulu menggunakan dataset Pascal VOC2012 (Visual Object Classes 2012) yang diiterasi sebanyak 152,59 Miliyar kali dengan CPU runtime selama 26,9 detik dan mendapatkan akurasi sebesar 80,25% (Dewi & Rafiqi, 2019). MobileNetV2 masih menggunakan depthwise dan pointwise convolution. MobileNetV2 menambahkan dua fitur baru yaitu linear bottleneck, dan shortcut connections antar bottlenecks.

Gambar 2.10 Konvolusi standard (a) depthhwise convolution (b) pointwise convolution (c)

(Sumber : Andrew G. Howard, 2017)

(25)

MobileNetV2 mengganti lapisan konvolusional standar dengan blok depthwise convolution dimana setiap blok terdiri dari lapisan konvolusional 3 x 3 yang menyaring masukan, diikuti oleh pointwise convolution 1 x 1 yang menggabungkan nilai-nilai yang difilter untuk menciptakan sebuah fitur baru (Sandler et al., 2018).

Arsitektur MobileNetV2 yang lengkap terdiri dari 17 blok residual bottleneck berturut-turut diikuti oleh konvolusi standar 1 × 1, lapisan AveragePooling, dan lapisan klasifikasi.

Gambar 2.11 Arsitektur MobilenetV2 (Sumber : Sandler et al., 2018)

Setiap baris menggambarkan urutan dari 1 atau lebih lapisan identik (modulo stride), yang diulang n kali. Semua lapisan dalam urutan yang sama memiliki kesamaan jumlah c output channel. Lapisan pertama masing-masing urutan memiliki stride (langkah) s dan yang lainnya menggunakan stride 1.

Semua konvolusi spasial menggunakan kernel 3 × 3 (Sandler et al., 2018).

MobileNetV2 menggunakan k = 3 (3 x 3 depthwise separable convolutions) sehingga biaya komputasi 8 hingga 9 kali lebih kecil dari standar konvolusi hanya dengan sedikit pengurangan akurasi.