Kinerja Algoritma Convolutional Neural Network dalam Klasifikasi Covid-19 Varian Omicron Berdasarkan Citra Ct-Scan Thoax
Odi Nurdiawan1,*, Ruli Herdiana2, Irfan Ali3, Melia4, Mia Fijriani5
1Program Studi Manajemen Informatika, STMIK IKMI Cirebon, Cirebon, Indonesia.
2Program Studi Teknik Informatika, STMIK IKMI Cirebon, Cirebon, Indonesia.
3Program Studi Rekayasa Perangkat Lunak, STMIK IKMI Cirebon, Cirebon, Indonesia.
4,5Program Studi Sistem Informasi, STMIK IKMI Cirebon, Cirebon, Indonesia.
Email: 1,*[email protected], 2[email protected], 3[email protected], 4[email protected],
Email Penulis Korespondensi: [email protected] Submitted 23-10-2022; Accepted 30-10-2022; Published 31-10-2022
Abstrak
Tsunami Covid gelombang ke dua di India telah memecahkan rekor angka penambahan kasus dan kematian tertinggi didunia. Mutasi varian menjadi salah satu faktor penyebabnya. Infection Crown varian Delta (B.1.617.2) adalah mutasi dari infection Covid-19 yang selama ini mewabah (SARS-CoV.2 B.1.617). Permasalahan dalam penelitian ini tingkat akurasi yang masih rendah dalam menentukan covid-19 varian omicron mengakibatkan ketidakpastian dalam pengambil keputusan oleh para ahli sehingga penelitian ini diperlukan dalam membantu pengukuran akurasi yang sangat baik. Tujuan penelitian ini untuk dapat mengetahui model yang baik dengan menerapkan algoritma Convolutional Neural Network sehingga dapat meningkatkan akurasi yang tinggi dan dapat dimanfaatkan dalam pengambilan keputusan oleh para ahli medis. Hasil penelitian ini memberikan informasi penting bahwa ukuran citra dan banyaknya data inputan sangat berpengaruh terhadap tingkat akurasi dalam metode Convolutional Neural Network dengan tahapan pengumpulan data, preprocesing, Image Augmentation, Resize, Split Data, Arsitektur Convolutional Neural Network, Convolution, Pooling, Flattening, Full Connection, dan Evaluation. Hasil akurasi dengan data input sebanyak 400 data menghasilkan training dan uji coba (validation) pada dataset citra chest xray dengan menggunakan arsitektur Convolutional Neural Network yang telah dibuat, iterasi (epoch) sebanyak 30 kali, serta step_per_epoch sebanyak 30 menunjukkan nilai akurasi sebesar 0.88 atau 88% dan nilai loss sebesar 0.3119 dan Hasil akurasi dengan data input sebanyak 800 data, menghasilkan training dan uji coba (validation) pada dataset citra chest xray dengan menggunakan arsitektur Convolutional Neural Network yang telah dibuat, iterasi (epoch) sebanyak 30 kali, serta step_per_epoch sebanyak 30 menunjukkan nilai akurasi sebesar 0.93 atau 93% dan nilai loss sebesar 0.2711
Kata Kunci : Covid-19; Omicron; Deep Learning; Convolutional Neural Network; Google Colaboratory Abstract
The second wave of the Covid-19 tsunami in India has broken the record for the highest number of additional cases and deaths in the world. Variant mutations are one of the contributing factors. Infection Crown variant Delta (B.1.617.2) is a mutation of the Covid-19 infection that has been endemic (SARS-CoV.2 B.1.617). The problem in this study is that the level of accuracy is still low in determining the covid-19 variant of the omicron resulting in uncertainty in decision makers by experts so that this research is needed to help with excellent accuracy measurements. The purpose of this study is to find a good model by applying the Convolutional Neural Network algorithm so that it can increase high accuracy and can be used in decision making by medical experts. The results of this study provide important information that the image size and the amount of input data greatly affect the level of accuracy in the Convolutional Neural Network method with the stages of data collection, preprocessing, Image Augmentation, Resize, Split Data, Convolutional Neural Network Architecture, Convolution, Pooling, Flattening, Full Connections, and Evaluations. Accuracy results with 400 input data produce training and testing (validation) on a chest x-ray image dataset using the Convolutional Neural Network architecture that has been created, 30 iterations (epochs) and 30 step_per_epochs showing an accuracy value of 0.88 or 88 % and the loss value is 0.3119 and the accuracy results with input data are 800 data, resulting in training and testing (validation) on the chest x- ray image dataset using the Convolutional Neural Network architecture that has been created, iterations (epochs) 30 times, and step_per_epoch as many as 30 shows an accuracy value of 0.93 or 93% and a loss value of 0.2711
Keywords: Covid-19; Omicron; Deep Learning; Convolutional Neural Network; Google Collaboratory
1. PENDAHULUAN
Tsunami Covid gelombang ke dua di India telah memecahkan rekor angka penambahan kasus dan kematian tertinggi didunia. Mutasi varian menjadi salah satu faktor penyebabnya. Infection Crown varian Delta (B.1.617.2) adalah mutasi dari infection Covid-19 yang selama ini mewabah (SARS-CoV.2 B.1.617). Varian Delta pertama kali ditemukan di India pada Oktober 2020, saat awal negeri itu dilanda gelombang kedua pandemi. WHO (World Wellbeing Organization) melabeli varian delta sebagai variation of concern (VOC) atau varian yang perlu diwaspadai pada 11 Mei 2021. Sejak 14 Juni 2021, varian ini telah menyebar ke 74 negara di seluruh dunia, termasuk Indonesia. Berdasarkan hasil dari proses Entirety Genome Sequencing (WGS) per 20 Juni 2021, Kementerian Kesehatan RI mencatat 211 kasus dari 2.242 sampel yang harus diwaspadai, 160 kasus (76%) di antaranya adalah varian Delta. Itu berarti varian Delta mendominasi di Indonesia dan bukan tidak mungkin jumlahnya akan terus bertambah, kemudian tanggal 16 Desember 2021 kementriaan kesehatan mengumumkan varian omicron telah masuk indonesia, sampai tanggal 06 February 2022 pukul 12.00 wib bertambah 25.431kasus dan kumulatifnya menjadi 188.899 kasus.[1]
Permasalahan dalam penelitian ini tingkat akurasi yang masih rendah dalam menentukan covid-19 varian omicron mengakibatkan ketidakpastian dalam pengambil keputusan oleh para ahli sehingga penelitian ini diperlukan dalam membantu pengukuran akurasi yang sangat baik. Tujuan penelitian ini untuk dapat mengetahui model yang baik
dengan menerapkan algoritma Convolutional Neural Network sehingga dapat meningkatkan akurasi yang tinggi dan dapat dimanfaatkan dalam pengambilan keputusan oleh para ahli medis
Banyak penelitian yang telah dilakukan berkaitan dengan Covid-19 diantaranya yang dilakukan agus eko marino bahwa dalam melakukan klasifikasi menggunakan filter gabor dan convolutional neural network dengan hyperparameter tuning, dengan data data yang digunakan yaitu citra ct-scan sarscov-2 berjumlah 2481 gambar. Sebelum melatih model, dilakukan preprocessing data, seperti pelabelan, pengubahan ukuran, dan augmentasi gambar. Pengujian model dilakukan dengan beberapa skenario uji. Hasil terbaik diperoleh pada skenario untuk model filter gabor dan convolutional neural network dengan hyperparameter tuning mendapatkan akurasi sebesar 97,9% dan auc sebesar 99% dibandingkan dengan model tanpa hyperparameter tuning dan filter gabor[2].
Sedangkan menurut mohammad farid naufal dalam melakukan perbadingan algoritma k-nearest neighbors (knn), support vector machine (svm), dan convolutional neural network menghasilkan pengujian menggunakan 5 cross validation, convolutional neural network merupakan algoritma yang memiliki rata-rata performa terbaik yaitu akurasi 0,9591, precision 0,9592, recall 0,9591, dan f1 score 0,959 dengan waktu eksekusi rata-rata sebesar 3102,562 detik[3].
Kemudian peneliitan yang dilakukan oleh Adhitio Satyo dalam menganalisa COVID-19 Chest X-Ray menghasilkan penelitian dengan trainning 50 epoch diperoleh nilai yang sangat baik untuk akurasi trainning dan validasi sebesar 95,5% dan 91,8%. Uji testing dengan jumlah data uji 4000 image diperoleh akurasi testing 98%, dengan presisi tiap kelas adalah Covid (99%), Lung_Opacity (97%), Normal (99%) dan Viral pneumonia (99%)[4]
Lalu Menurut Budi Nugroho Dalam Mengukur Kinerja Convolutional Neural Network Pada Ukuran Citra Input 200x200, Metode Convolutional Neural Network Dan Convolutional Neural Network-Elm Menunjukkan Kinerja Paling Tinggi Mencapai 8,81% Dan Selisih F1 Score Mencapai 0,0729 dan menurut Novanto Yudistira Deteksi Covid-19 Pada Citra Sinar-X menggunakan 1125 citra sinar-x dan mencapai akurasi 86.93 % dengan jumlah parameter model yang 18.55 kali lebih sedikit dari EfficientNet dan 22.36 kali lebih sedikit dari ResNet50 untuk mendeteksi 3 kategori yaitu Covid- 19, Pneumonia, dan normal melalui uji 5-fold crossvalidation[5]
Berdasarkan tinjauan berbagai penelitian sebelumnya, data yang digunakan menggunakan citra Chest X-Ray dengan memperkecil ukuran citra, akan tetapi belum ada uraian dalam menggunakan citra yang lebih kecil dengan 150x150, kemudian dalam arsitektur Convolutional Neural Network menggunakan Proses convolution yang pertama mengunakan layer filter 16 dan kernel 3x3. Proses convolution yang kedua mengunakan layer filter 32 dan kernel 3x3.
2. METODOLOGI PENELITIAN
Pendekatan klasifikasi pneumonia yang digunakan dalam penelitian ini adalah metode Convolutional Neural Network dengan modifikasi layer yang berbeda dengan penelitian-penelitian sebelumnya. Metode Convolutional Neural Network menggunakan 2 layer konvolusi. Proses convolution yang pertama mengunakan layer filter 16 dan kernel 3x3. Proses convolution yang kedua mengunakan layer filter 32 dan kernel 3x3. Proses klasifikasi menggunakan fungsi Polling, flattening, Full Connection.
Proses eksperimen dilakukan dengan menggunakan dataset citra sinar-X yang bersumber dari Kaggle, yang juga digunakan oleh banyak peneliti di lapangan. Skenario pengujian dijalankan dengan beberapa ukuran gambar input untuk menentukan dampak kinerja teknik jaringan saraf convolutional. Oleh karena itu, hasil pengujian memberikan informasi penting tentang jaringan saraf convolutional mana yang berkinerja lebih baik dan ukuran gambar optimal untuk kinerja klasifikasi pneumonia yang optimal.
2.1 Metode Klasifikasi
Klasifikasi merupakan suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan.
Teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan hasilnya untuk memberikan sejumlah aturan. Aturan aturan tersebut digunakan pada data-data baru untuk diklasifikasi. Teknik ini menggunakan supervised induction, yang memanfaatkan kumpulan pengujian dari record yang terklasifikasi untuk menentukan kelas-kelas tambahan[6]
Deep Learning adalah salah satu fungsi kecerdasan buatan yang meniru cara kerja otak manusia dalam memproses data dan menciptakan pola untuk digunakan dalam pengambilan keputusan. Deep Learning merupakan bagian dari Machine Learning. Deep Learning terdiri dari banyak kelas atau jenis, beberapa yang paling sering digunakan adalah Convolutional Neural Network (CNN), Multilayer Perceptrons (MLP), dan Recurrent Neural Network (RNN)[7].
Convolutional Neural Network (CNN) merupakan salah satu kelas dari deep learning yang mampu melakukan pengenalan gambar dan klasifikasi gambar. Metode CNN merupakan suatu kelas pada neural network yang berspesialisasi dalam memproses data yang memiliki topologi seperti grid, misalnya gambar. Metode CNN dapat digunakan dalam pengenalan wajah, analisis dokumen, klasifikasi gambar, klasifikasi video, dsb[8].
Metode CNN mengklasifikasi gambar dengan memproses gambar yang diinput, kemudian mengklasifikasikannya pada kategori tertentu misalnya pada citra manusia, terdapat wajah, mata, bibir, hidung, tangan, dll. Gambar akan dibuat menjadi array berisi nilai pada setiap pixel dengan resolusi tinggi*panjang*dimensi yang disebut channel. Dimana, channel ini biasanya terdiri dari 3 buah yang berarti citra merupakan gambar RGB dengan masing-masing lapisan (channel) merepresentasikan Red-Green Blue atau 1 lapisan jika gambar grayscale. Akan tetapi, jumlah lapisan juga bisa melebihi 3, bahkan hingga ratusan yang merepresentasikan berbagai warna lainnya dengan arsitektur RGB[9].
Gambar 1. Ilustrasi Arsitektur Convolutional Neural Network
Seperti yang ditampilkan pada Gambar 1 Arsitektur Convolutional Neural Network dibagi menjadi dua bagian besar, yaitu Feature Extraction Layer dan Fully Connected Layer. Pada Feature Extraction Layer terjadi “encoding” dari sebuah image menjadi feature map yang berupa angka-angka yang merepresentasikan citra tersebut (Feature Extraction)[10]
Google Colaboratory atau disebut juga Colab adalah tools baru yang dikeluarkan oleh yang dibuat oleh Google Internal Research. Tools ini membantu para Researcher dalam mengolah data untuk keperluan belajar pada pengolahan data menggunakan Machine Learning. Penggunaan tools ini mirip dengan Jupyter Notebook dimana tools ini dibuat diatas envirounment Jupyter . Google Colab memiliki penyimpanan berupa Google Drive dimana tools ini berjalan dengan sistem Cloud. Google Colab ini menyediakan layanan GPU gratis kepada penggunanya sebagai backend komputasi dan dapat digunakan selama 12 jam pada suatu waktu.
2.2 Data Set
Dataset proses eksperimental untuk penelitian ini menggunakan kumpulan gambar paru-paru dari sinar-X (sinar-X) yang tersedia di Kaggle. Data ini juga akan digunakan oleh peneliti lain di lapangan untuk berbagi pengalaman dan saling membantu menghasilkan penelitian yang lebih baik.
2.3 Tahapan Penelitian
Tahapan pada penelitian untuk dapat memudahkan dalam melakukan penyeseaian penelitian ini, diagram penelitian ini dapat dilihat pada gambar dibawah ini.
Gambar 2. Alur Penelitian
Berdasarkan gambar 2. Tentang alur penelitian ini menggambarkan desain penelitian dengan tahap pertama data set x-ray yang bersumber dari kaggle, kedua preprocessing data, tahap ketiga data image augmetation, keempat resize image menjadi 150x150, kelima split data, keenam arsitektur data Convolutional Neural Network dengan Conculation, pooling, flattening, Full Connection.
3. HASIL DAN PEMBAHASAN
3.1 Data Set
Data yang digunakan adalah data yang diambil dari sumber kaggle. Data ini berupa data citra mengenai chest xray yang diambil pada 1 September 2022.
Gambar 3. Input Data
Data memiliki 2 kategori, yaitu pneumonia dan normal. Chest xray yang termasuk kategori pneumonia sebanyak 200 citra dan yang termasuk kategori normal sebanyak 200 citra juga.
3.2 Preprocessing
Preprocesing pada penelitian ini bertujuan untuk membersihkan noise data yang tidak dapat dipakai dalam metode Convolutional Neural Network, sebagai berikut :
a. Image Augmentation
Proses yang dilakukan yaitu, Rescale sebesar 1./255. Rotation_range = 30. Rotation_range = 30.
Width_shift_range = 0.2. Height_shift_range = 0.2. Zoom_range = 0.1. Shear_range = 0.3. Brightness_range = [0,1].
Horizontal_flip = True. Vertical_flip = True. Fill_mode = 'nearest'
Gambar 4. Image Augmentation b. Resize
Citra chest xray yang digunakan memiliki ukuran resolusi pixel yang berbeda-beda. Sebelum dilakukan tahap feature extraction pada arsitektur CNN yang akan digunakan, dilakukan resize ukuran resolusi pixel menjadi 150 x 150.
Tujuan dilakukan resize adalah untuk menyamakan ukuran input citra chest xray yang digunakan.
Gambar 5. Resize c. Split Data
Pada Convolutional Neural Network akan dilakukan pembelajaran (training) dan uji (validasi) sehingga dilakukan pembagian data menjadi dua yaitu data training sebesar 90% dan data validasi sebesar 10%. Pembagian data dilakukan secara acak (random) pada tiap jenis kategori (pneumonia dan normal).
Gambar 6. Split Data 3.3 Arsitektur Convolutional Neural Network
Convolutional Neural Network merupakan salah satu metode pada algoritma deep learning yang mengimplementasikan jaringan saraf tiruan pada makhluk hidup. Metode yang digunakan pada Convolutional Neural Network yaitu metode backpropagation (pembelajaran) dan feedforward (klasifikasi). Tahapan dalam membangun arsitektur Convolutional Neural Network diantaranya adalah
a. Convolution
Pada arsitektur Convolutional Neural Network yang dibuat, melakukan 3 kali proses convolution. Proses convolution yang pertama mengunakan layer filter 16 dan kernel 3x3. Proses convolution yang kedua mengunakan layer filter 32 dan kernel 3x3. Proses convolution yang pertama mengunakan layer filter 64 dan kernel 3x3. Fungsi aktivasi yang dilakukan pada convolution dan hidden layer yaitu dengan Relu (Rectified Linear Unit).
b. Pooling
Pada arsitektur Convolutional Neural Network yang dibuat, melakukan 2 kali proses pooling menggunakan max- pooling dengan bentuk matriks 2x2
c. Flattening
Data pooling yang miliki berupa array 2 dimensi kemudian dikonversi menjadi data satu dimensi single vector.
d. Full Connection
Selanjutnya dilakukan proses dense. Proses dense dilakukan sebanyak 3 kali. Pada proses dense pertama dan kedua menggunakan 200 unit node dan menggunakan fungsi aktivasi relu. Sedangkan proses dense yang ketiga menggunakan 2 unit dan menggunakan fungsi aktifasi sigmoid. Dilakukan juga proses dropout, dimana proses ini digunakan untuk meregulasi parameter dengan tujuan terhindar dari overfitting. Proses dropout dilakukan sebanyak 2 kali.
Gambar 7. Full Connection 3.4 Evaluation
a. Experimen dengan 400 data
Hasil training dan uji coba (validation) pada dataset citra chest xray dengan menggunakan arsitektur Convolutional Neural Network yang telah dibuat, iterasi (epoch) sebanyak 30 kali, serta step_per_epoch sebanyak 30 menunjukkan nilai akurasi sebesar 0.88 atau 88% dan nilai loss sebesar 0.3119.
Gambar 8. Hasil dengan Data 400
Gambar 9. Hasil Epoch b. Experimen dengan 800 data
Hasil training dan uji coba (validation) pada dataset citra chest xray dengan menggunakan arsitektur Convolutional Neural Network yang telah dibuat, iterasi (epoch) sebanyak 30 kali, serta step_per_epoch sebanyak 30 menunjukkan nilai akurasi sebesar 0.93 atau 93% dan nilai loss sebesar 0.2711.
Gambar 10. Hasil dengan Data 800
Gambar 11. Hasil Epoch
4. KESIMPULAN
Hasil penelitian ini memberikan informasi penting bahwa ukuran citra dan banyaknya data inputan sangat berpengaruh terhadap tingkat akurasi dalam metode Convolutional Neural Network dengan tahapan pengumpulan data, preprocesing, Image Augmentation, Resize, Split Data, Arsitektur Convolutional Neural Network, Convolution, Pooling, Flattening, Full Connection, dan Evaluation. Hasil akurasi dengan data input sebanyak 400 data menghasilkan training dan uji coba (validation) pada dataset citra chest xray dengan menggunakan arsitektur Convolutional Neural Network yang telah dibuat, iterasi (epoch) sebanyak 30 kali, serta step_per_epoch sebanyak 30 menunjukkan nilai akurasi sebesar 0.88 atau 88% dan nilai loss sebesar 0.3119 dan Hasil akurasi dengan data input sebanyak 800 data, menghasilkan training dan uji coba (validation) pada dataset citra chest xray dengan menggunakan arsitektur Convolutional Neural Network yang telah dibuat, iterasi (epoch) sebanyak 30 kali, serta step_per_epoch sebanyak 30 menunjukkan nilai akurasi sebesar 0.93 atau 93% dan nilai loss sebesar 0.2711.
REFERENCES
[1] Worldometers, “Coronavirus Update (Live): 86,248,818 Cases and 1,863,861 Deaths from COVID- 19 Virus Pandemic,”
Worldometer, 2021.
[2] H. Wibi Bagas N, E. Mailoa, and H. D. Purnomo, “Deteksi Buah untuk Klasifikasi Berdasarkan Jenis dengan Algoritma CNN Berbasis yolov3,” J. RESTI (Rekayasa Sist. Dan Teknol. Informasi), vol. 4, no. 3, pp. 476–481, 2020.
[3] N. Yudistira et al., “Deteksi Covid-19 Pada Citra Sinar-X Dada Menggunakan Deep Covid-19 Detection on X-Ray Images Using Efficient Deep Learning,” J. Teknol. Inf. Dan Ilmu Komput., vol. 7, no. 6, pp. 1289–1296, 2020, doi: 10.25126/jtiik.202073651.
[4] A. E. MINARNO, M. H. C. MANDIRI, and M. R. ALFARIZY, “Klasifikasi COVID-19 menggunakan Filter Gabor dan CNN dengan Hyperparameter Tuning,” ELKOMIKA J. Tek. Energi Elektr. Tek. Telekomun. Tek. Elektron., vol. 9, no. 3, p. 493, 2021, doi: 10.26760/elkomika.v9i3.493.
[5] B. Nugroho and E. Y. Puspaningrum, “Kinerja Metode CNN untuk Klasifikasi Pneumonia dengan Variasi Ukuran Citra Input,”
J. Teknol. Inf. Dan Ilmu Komput., vol. 8, no. 3, p. 533, 2021, doi: 10.25126/jtiik.2021834515.
[6] A. S. B. K. Satyo, D. Arif, I. S. Kusuma Wardhana, and E. S. Moreta, “Diagnosa COVID-19 Chest X-Ray Menggunakan Arsitektur Inception Resnet,” J. Inform. Inf. Secur., vol. 2, no. 1, pp. 57–66, 2021, doi: 10.31599/jiforty.v2i1.646.
[7] M. F. Naufal et al., “Analisis Perbandingan Algoritma Klasifikasi Citra Chest X-ray Untuk Deteksi Covid-19,” Teknika, vol. 10, no. 2, pp. 96–103, 2021, doi: 10.34148/teknika.v10i2.331.
[8] L. Rahma, H. Syaputra, A. H. Mirza, and S. D. Purnamasari, “Objek Deteksi Makanan Khas Palembang Menggunakan Algoritma YOLO (You Only Look Once),” J. Nas. Ilmu Komput., vol. 2, no. 3, pp. 213–232, 2021, doi: 10.47747/jurnalnik.v2i3.534.
[9] J. X, “Feature extraction for image recognition and computer vision,” Int. Conf. Comput. Sci. Inf. Technol. ICCSIT, vol. 2009, 2019.
[10] H. Shi, “Radiological Findings From 81 Patients With COVID-19 Pneumonia in Wuhan, China: a Descriptive Study,” Lancet Infect. Dis., vol. 20, no. 4, pp. 425–434, 2021.