ISSN 2686-6099 – SCAN VOL. XVII NOMOR 3 – OKTOBER 2022
PEMILAHAN JENIS SAMPAH MENGGUNAKAN ALGORITMA CNN
1Andreas Nugroho Sihananto, 2Muhammad Muharrom Al Haromainy, 3Anggraini Puspita Sari,
4Ade Husni Mubarrok, 5Dedy Ramadhan
Program Studi Informatika, Fakultas Ilmu Komputer, UPN ”Veteran” Jawa Timur Email: [email protected]
Abstrak. Penelitian ini bertujuan untuk mengembangkan model deep learning yang mendeteksi jenis sampah sehingga sampah dapat dipisahkan dan didaur ulang dengan sistem computer vision. Pelatihan dan pengujian akan dilakukan dengan data citra yang terdiri dari beberapa kelas yaitu karton, botol kaca, kain, plastik, dan kertas.
Dataset yang digunakan selama pelatihan dan pengujian akan dihasilkan dari frame asli yang diambil dari citra sampah. Kumpulan data yang digunakan untuk struktur deep learning memiliki total 6333 gambar dengan 6 kelas yang berbeda. Setengah dari kumpulan data citra digunakan untuk proses pelatihan dan sisanya digunakan untuk prosedur pengujian. Sebagai model yang menggunakan Image Classification berbasis kecerdasan buatan, sistem telah mampu mengidentifikasi jenis-jenis sampah dengan baik menggunakan metode klasifikasi CNN. Model CNN dibangun dengan membuat model yang terdiri dari sejumlah layer seperti Convolutional Layers, Max Pooling Layers dan Relu. Setelah model dibangun dan dilakukan pelatihan, model diuji untuk melakukan klasifikasi. Hasil kinerja sistem hasil pelatihan dan pengujian model yang memuaskan dengan akurasi data 83% dan akurasi validasi 61%.
Abstrak memuat uraian mengenai masalah dan tujuan penelitian, metode yang digunakan, dan hasil penelitian.
Tekanan terutama diberikan kepada hasil penelitian. Panjang abstrak adalah 100-200 kata, ditulis dengan 1 kolom, ukuran font 10 Times New Roman, huruf cetak miring.
Kata Kunci: .Convolutional Neural Network, image classification, daur ulang, sampah
Indonesia merupakan negara yang memiliki jumlah penduduk terbesar ke-4 di dunia, yaitu 264 juta jiwa. Jumlah penduduk yang besar berpengaruh pada jumlah sampah yang dihasilkan. Semakin tinggi jumlah penduduk maka semakin besar pula jumlah sampah yang dihasilkan. Sampah, sebagaimana emisi karbon dioksida (CO2) dan metana (CH4) lahir sebagai efek samping perkembangan industri dan teknologi[1]. Selain itu di masa kini selain pertambahan kuantitas, sampah menjadi semakin beragam dari sisi volume, jenis, dan karakteristiknya. Karena itu diperlukan suatu metode atau algoritma untuk meningkatkan efisiensi dalam proses pemilahan limbah yang selama ini sangat sulit dibedakan [2],[3].
Fasilitas daur ulang dalam kehidupan masyarakat modern sangat penting. Dalam proses daur ulang saat ini, pemisahan limbah sebagian besar masih menggunakan tenaga manusia. Hal ini membuat sering sekali terjadi kesalahan pemilahan di lapangan karena tenaga manusia rentan bingung memilah sampah jika kuantitas sampah yang mereka pilah sangat banyak [4]. Dalam ruang lingkup penelitian pemilahan sampah, beberapa algoritma telah digunakan untuk mengembangkan sistem klasifikasi sampah. Beberapa algoritma sudah
diterapkan antara lain SVM, KNN, CNN, MLP, dll.[5].
SVM dan KNN sangat bagus untuk diimplementasikan pada pemilahan sampah pada kondisi normal dimana citranya jelas dan mudah dibedakan [6], tetapi dalam industri pengolahan sampah, terkadang tidak mudah untuk membedakan objek. Dan sejauh ini, di antara algoritma yang diimplementasikan, algoritma berbasis neural network merupakan algoritma yang paling menjanjikan, karena bisa diimplementasikan secara lintas platform, tidak terpaku pada satu platform. [7]. Beberapa peneliti seperti [8]–[10] menemukan CNN sebagai algoritma berbasis neural network paling menjanjikan dalam hal klasifikasi citra.
Hal ini karena CNN memiliki akurasi yang tinggi untuk mendeteksi objek dan mengklasifikasikan kriteria dan fitur-fitur tersebut sesuai dengan tujuan kami untuk meningkatkan efisiensi fasilitas pengolahan sampah dan untuk mengidentifikasi sampah yang tidak dapat didaur ulang karena proses pemisahan sampah sangat sulit dilakukan terutama di Indonesia. Sampah seringkali tidak dipisahkan dengan kriteria seperti sampah organik dan sampah non-organik.
I. Metodologi
Tujuan dari penelitian ini adalah untuk membangun sebuah metode yang mendeteksi sampah jenis ini. Untuk mencapai tujuan tersebut, kami mengembangkan modul klasifikasi yang menggunakan model CNN.
Kami melatih model CNN dengan kumpulan data gambar jenis sampah. Untuk tujuan evaluasi, kami juga menggunakan kumpulan data yang sama untuk melatih model MLP dengan satu lapisan tersembunyi dan model MLP dengan dua lapisan tersembunyi. [1], [11].
Di CNN kita akan membandingkan ketiga model dalam akurasi klasifikasi dan waktu pelatihan.
Pada bagian ini, rincian metode penelitian yang digunakan dalam makalah ini dijelaskan. Metodologinya terdiri dari a) akuisisi data untuk citra jenis sampah, b) membangun model CNN, c) pelatihan model dan pengujian model.
Akuisisi Data
Untuk melatih model CNN, diperlukan kumpulan data gambar yang terdiri dari jenis sampah. Dataset terdiri dari 6333 data milik 6 kelas jenis sampah. Setiap kelas jenis sampah terdiri dari 337 data latih. Setiap data dalam dataset adalah gambar yang memiliki dimensi 150 x 150 piksel.
Gambar 1. Contoh dataset citra sampah
Model CNN
Arsitektur model CNN terdiri dari lapisan khusus untuk mengekstraksi fitur dari ruang input mentah dan model jaringan saraf yang sepenuhnya terhubung dengan pengklasifikasi regresi logistik. Fitur yang biasa disebut peta fitur diperoleh dari lapisan khusus tersebut dan kemudian menjadi input untuk jaringan saraf yang sepenuhnya terhubung yang
sebenarnya merupakan model MLP. Gambar 2 menunjukkan contoh arsitektur model CNN yang diambil dari [12].
Gambar 2. CNN model architecture Dari Gambar 2 terlihat bahwa sebelum diproses di classifier, input untuk CNN akan diproses dalam dua tahap. Kedua tahap tersebut terdiri dari operasi konvolusi dan subsampling.
Dapat juga dilihat bahwa operasi konvolusi dan subsampling akan mengurangi dimensi input.
Operasi konvolusi akan mengubah matriks input dua dimensi menjadi beberapa matriks dua dimensi atau peta fitur yang lebih kecil.
Pada akhir tahap kedua, suatu fungsi dilakukan untuk meratakan atau mengubah setiap peta fitur dari matriks dua dimensi menjadi matriks satu dimensi sehingga peta fitur siap untuk diklasifikasikan dengan MLP atau jaringan saraf yang sepenuhnya terhubung.
Di CNN, tujuan utama dari operasi konvolusi dan subsampling adalah untuk mengekstrak fitur dari data input mentah. Untuk mencapai tujuan ini, operasi konvolusi yang merupakan perkalian dari matriks kernel kecil dan area tertentu dari matriks input dua dimensi dilakukan. Untuk menghasilkan satu dimensi yang lebih kecil dari peta fitur matriks input, kernel akan digeser dan beberapa perkalian akan dilakukan dari kiri ke kanan dan dari atas ke bawah pada area tertentu dari matriks input.
Persamaan operasi konvolusi ke didefinisikan dalam persamaan (1) sebagai berikut:
𝑄𝑗 = 𝑓(∑𝑁𝑖=1𝐼𝑖,𝑖∗ 𝐾𝑖,𝑗+ 𝐵𝑗) (1) Dimana adalah elemen matriks keluaran tunggal dari operasi konvolusi. Matriks keluaran dihasilkan dari fungsi aktivasi.
Pertama, jumlah semua perkalian matriks kernel dan matriks input dihitung, selanjutnya nilai bias ditambahkan ke elemen matriks yang dihasilkan. Akhirnya, itu menjadi input untuk . Dalam penelitian ini, fungsi aktivasi yang digunakan adalah rectified linear unit (ReLU) yang didefinisikan pada persamaan (2).
𝑓(𝜒) = { 𝜒 (𝜒 < 0).
𝜒 (𝜒 ≥ 0)
(2)
Setelah operasi konvolusi, operasi subsampling atau pooling akan diterapkan ke setiap peta fitur untuk pengurangan dimensi. Dalam penelitian ini, fungsi subsampling yang
digunakan adalah fungsi max pooling sehingga didapatkan fitur-fitur yang menonjol.
Untuk mengurangi dimensi peta fitur tunggal, kernel dua dimensi m x n akan memilih nilai tertinggi dari (m x n) elemen tetangga dan menghasilkan satu elemen tunggal dalam matriks peta fitur baru. Mirip dengan operasi konvolusi, kernel juga akan digeser dari kiri ke kanan dan dari atas ke bawah untuk menghasilkan peta fitur baru.
Untuk mencegah overfitting dan meningkatkan kinerja model CNN, algoritma dropout regularization [13] juga diterapkan dalam fase pelatihan model. Menggunakan algoritma dropout regularization, beberapa neuron di lapisan CNN akan dinonaktifkan secara acak dengan distribusi Bernoulli.
Selanjutnya pada tahap pengujian, semua neuron pada semua layer pada model CNN akan diaktifkan kembali. Srivastava dkk. [14]
menyatakan bahwa algoritma dropout regularization dapat meningkatkan kinerja jaringan saraf tiruan di berbagai kumpulan data benchmark.
Setelah beberapa operasi konvolusi dan subsampling, peta fitur akan diratakan sehingga siap untuk diklasifikasikan dengan MLP atau jaringan saraf yang sepenuhnya terhubung.
MLP atau jaringan saraf yang sepenuhnya terhubung terdiri dari beberapa lapisan. Setiap layer terdiri dari beberapa neuron yang akan melakukan perkalian matriks antara matriks input dan bobot internal seperti yang didefinisikan pada persamaan (3) sebagai berikut:
𝑢𝑗= 𝑓 (∑𝑛𝑖=1𝑤𝑗,𝑖𝑥𝑖+ 𝑏𝑗 ) (3) dimana uj adalah nilai bias, adalah jumlah neuron dalam satu lapisan, dan merupakan fungsi aktivasi, seperti fungsi ReLU yang telah didefinisikan sebelumnya dalam persamaan.
Setelah diproses di beberapa lapisan, peta fitur akan diproses di lapisan output. Lapisan output dari jaringan saraf yang sepenuhnya terhubung atau MLP adalah fungsi softmax yang menghasilkan kelas probabilitas yang mungkin dimiliki oleh masukan CNN. Fungsi softmax didefinisikan dalam persamaan (4) sebagai berikut:
𝑝(𝑥) = 𝑒𝑥
𝛴𝑘=1𝑘 𝑒𝑥 (4)
Implementasi CNN
Dalam penelitian kali ini, tahapan yang dilalui digambarkan sebagaimana tampil pada Gambar 3.
Gambar 3. Proses Implementasi
Untuk data input, baik untuk training dan uji kita akan mengacak sejumlah dataset gambar di mana komposisi dataset tersebut tampak seperti pada Gambar 4.
Gambar 4. Proporsi dataset sampah
Data kemudian dibagi dua bagian yakni 70% (4433 gambar) data latih atau training dan 30% (1900 gambar) data uji. Data kemudian akan diproses dalam CNN dan pada saat testing akan diimplementasikan dropout regularization. Setelah proses training selesai akan dilakukan proses testing dan validasi.
II. Hasil dan Pembahasan
Proporsi dataset dalam sampah yang dibagi rata sebagaimana ditunjukkan pada Gambar 4.
berguna untuk meningkatkan akurasi pelatihan sebagaimana tampak pada Gambar 5.
Input 6333 Data Gambar
Bagi data menjadi 70% data training dan 30% testing
Masukkan dalam CNN Dropout
Regularization
Training Validasi dan Testing
Gambar 5. Hasil Training dataset
Hasil dari dataset pelatihan yang telah dijalankan selama 50 epoch dan dengan ukuran batch 128 gambar per pelatihan. Disini terlihat bahwa semakin banyak epoch yang dilewati maka train_accuracy semakin besar dan sebaliknya dengan train_loss, maka dapat disimpulkan bahwa data training yang telah diberikan cukup baik dan tidak ada miss data atau error yang hilang.
Gambar 6. Contoh hasil prediksi
Gambar 7.Contoh data
Tampilan pada gambar 7 menunjukkan contoh data prediksi dari beberapa input. Dapat kita lihat pada sejumlah gambar hasil prediksi tampak meleset. Hasil perhitungan akhir menunjukkan bahwa pada fase training didapat hasil akurasi 89%, hasil validasi 61% dan hasil uji 83%.
Hasil validasi yang rendah menunjukkan bahwa telah terjadi kerancuan deteksi yang cukup besar pada objek-objek yang mirip misalnya ada karton yang mirip plastik namun secara umum akurasinya memuaskan dengan akurasi data uji mencapai 83%.
III. Kesimpulan
Berdasarkan semua proses penelitian, dapat disimpulkan bahwa sistem mampu mendeteksi jenis sampah pada sampah dengan mendeteksi objek pada citra yang kemudian diproses dengan algoritma CNN. Sistem telah mampu mengidentifikasi jenis waste yang sudah terdeteksi dengan baik dengan menggunakan metode klasifikasi CNN dengan membuat model menggunakan beberapa Convolutional Layers, Max Pooling Layers dan Relu kemudian melakukan pelatihan dan pengujian pada model kemudian mengklasifikasikan huruf-hurufnya. Kinerja sistem sudah memuaskan dengan mendapatkan hasil pelatihan dan pengujian model yang memuaskan dengan akurasi 83% dan akurasi validasi 61%.
IV. Daftar Pustaka
[1] A. P. Sari, H. Suzuki, T. Kitajima, T.
Yasuno, and D. A. Prasetya, “Prediction Model of Wind Speed and Direction Using Deep Neural Network,”
JEEMECS (Journal Electr. Eng.
Mechatron. Comput. Sci., vol. 3, no. 1,
pp. 1–10, 2020, doi:
10.26905/jeemecs.v3i1.3946.
[2] S. Sendari et al., “Environmental monitoring action for community surrounding garbage center in Indonesia,” IOP Conf. Ser. Earth Environ. Sci., vol. 245, no. 1, 2019, doi:
10.1088/1755-1315/245/1/012034.
[3] A. Sai et al., “Personal Hygiene , Dignity , and Economic Diversity among Garbage Workers in an Urban Slum of Indonesia,” Sanit. Value Chain, vol. 4, no. 2, pp. 51–66, 2020, doi:
https://doi.org/10.34416/svc.00019.
[4] Z. Nie, W. Duan, and X. Li, “Domestic garbage recognition and detection based on Faster R-CNN,” J. Phys. Conf. Ser., vol. 1738, no. 1, 2021, doi:
10.1088/1742-6596/1738/1/012089.
[5] L. Yan, X. Wang, and S. Yin, “Campus Garbage Image Classification Algorithm Based on New Attention Mechanism,” Int. J. Electron. …, vol.
13, no. 4, pp. 131–141, 2021, doi:
10.6636/IJEIE.202112.
[6] G. Alimjan, T. Sun, Y. Liang, H.
Jumahun, and Y. Guan, “A New Technique for Remote Sensing Image Classification Based on Combinatorial Algorithm of SVM and KNN,” Int. J.
Pattern Recognit. Artif. Intell., vol. 32,
no. 7, 2018, doi:
https://doi.org/10.1142/S021800141859 0127.
[7] J. Wang, Y. Yang, J. Mao, Z. Huang, C.
Huang, and W. Xu, “CNN-RNN: A Unified Framework for Multi-label Image Classification,” Proc. IEEE Comput. Soc. Conf. Comput. Vis.
Pattern Recognit., vol. 2016-Decem, pp.
2285–2294, 2016, doi:
10.1109/CVPR.2016.251.
[8] I. G. S. M. Diyasa, A. D. Alhajir, A. M.
Hakim, and M. F. Rohman, “Reverse image search analysis based on pre- trained convolutional neural network model,” Proceeding - 6th Inf. Technol.
Int. Semin. ITIS 2020, pp. 1–6, 2020,
[9] R. Vinayakumar, K. P. Soman, and P.
Poornachandrany, “Applying convolutional neural network for network intrusion detection,” 2017 Int.
Conf. Adv. Comput. Commun.
Informatics, ICACCI 2017, vol. 2017- Janua, pp. 1222–1228, 2017, doi:
10.1109/ICACCI.2017.8126009.
[10] Z. Cheker et al., “Performance analysis of VEP signal discrimination using CNN and RNN algorithms,” Neurosci.
Informatics, vol. 2, no. 3, p. 100087, 2022, doi: 10.1016/j.neuri.2022.100087.
[11] J. Lasmono, A. P. Sari, E. Kuncoro, and I. Mujahidin, “Optimasi Kerja Peluncur Roket Pada Robot Roda Rantai Untuk Menentukan Ketepatan Sudut Tembak,”
JASIEK (Jurnal Apl. Sains, Informasi, Elektron. dan Komputer), vol. 1, no. 1,
pp. 50–56, 2019, doi:
10.26905/jasiek.v1i1.3149.
[12] P. Sermanet, S. Chintala, and Y. Lecun,
“Convolutional neural networks applied to house numbers digit classification,”
Proc. - Int. Conf. Pattern Recognit., pp.
3288–3291, 2012.
[13] I. Jindal, M. Nokleby, and X. Chen,
“Learning deep networks from noisy labels with dropout regularization,” in Proceedings - IEEE International Conference on Data Mining, ICDM, 2017, pp. 967–972, doi:
10.1109/ICDM.2016.124.
[14] N. Srivastava, G. Hinton, A.
Krizhevsky, I. Sutskever, and R.
Salakhutdinov, “Dropout: A simple way to prevent neural networks from overfitting,” J. Mach. Learn. Res., vol.
15, pp. 1929–1958, 2014.