KLASIFIKASI PARASIT FALCIPARUM PADA SEL DARAH MERAH MANUSIA MENGGUNAKAN RANDOMLY WIRED NEURAL NETWORK

(1)

KLASIFIKASI PARASIT FALCIPARUM

PADA SEL DARAH MERAH MANUSIA

MENGGUNAKAN RANDOMLY WIRED NEURAL NETWORK

SKRIPSI

KHARSMA MONARDO 11150940000015

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UIN SYARIF HIDAYATULLAH JAKARTA

2019 M / 1441

(2)

i

KLASIFIKASI GAMBAR SEL DARAH MERAH MANUSIA

YANG TERINFEKSI PARASIT FALCIPARUM

MENGGUNAKAN RANDOMLY WIRED NEURAL NETWORK

SKRIPSI

Diajukan kepada

Universitas Islam Negeri Syarif Hidayatullah Jakarta Fakultas Sains dan Teknologi

Untuk Memenuhi Persyaratan dalam Memperoleh Gelar Sarjana Matematika (S.Mat)

Oleh :

Kharisma Monardo

11150940000015

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UIN SYARIF HIDAYATULLAH JAKARTA

(3)

(4)

(5)

iv

PERSEMBAHAN DAN MOTTO

Segala Puji dan Syukur ku persembahkan kepada Allah Subhanahu Wata’ala. Seiring shalawat serta salam kepada sang pembangun peradaban manusia, Nabi

Muhammad Shallallahu ‘Alaihi Wassalam.

Persembahan kecil ini saya lantunkan untuk mereka yang senantiasa selalu mendoakan keberhasilan saya terutama kepada mama dan papa.

Skripsi ini saya persembahkan juga untuk para sahabat dan mereka yang dengan tulus memberikan doanya kepada saya.

“Hidup itu pilihan, apa yang membuat dirimu sedih tinggalkan dan apa yang buat mu bahagia pertahankan”

“Ridha Allah tergantung pada ridha orang tua dan murka Allah tergantung pada murka orang tua.” (Hasan. At-Tirmizi : 1899, HR. al-Hakim : 7249, ath-Thabrani

dalam al-Mu’jam al-Kabiir : 14368, Al-Bazzar : 2394)

“Keadaan tidak akan pernah salah, karena Allah pembuat skenarionya Yang Maha Benar.”

“Setiap jalan yang tidak sesuai harapan, merupakan sebaik-baik jalan yang Allah berikan”

(6)

v

KATA PENGANTAR

Alhamdulillah, puji syukur kehadirat Allah Subhanahu Wata’ala atas segala limpahan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penyusunan skripsi dengan judul “Klasifikasi Gambar Sel Darah Merah

Manusia Yang Terinfeksi Parasit Falciparum Menggunakan Randomly Wired

Neural Network”. Shalawat serta salam senantiasa tercurah kepada Nabi

Muhammad Sallalahu Alaihi Wassalam, para sahabat, keluarga serta muslimin dan muslimat. Semoga kita mendapatkan syafaat baginda Rasul kelak diakhirat. Penulis dapat menyelesaikan skripsi ini karena adanya banyak bimbingan, saran, kerjasama dan bantuan dari berbagai pihak. Untuk itu, pada kesempatan ini penulis ingin menyampaikan terima kasih kepada :

1. Prof Dr. Lili Surraya Putri, M.Env.Stud, selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta.

2. Dr. Suma’inna, M. Si , selaku Ketua Program Studi Matematika Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta, dan Ibu Irma Fauziah, M.Sc, selaku Sekretaris Program Studi Matematika Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta.

3. Muhaza Liebenlito, M.Si selaku Pembimbing I yang telah memberikan ilmu pengetahuan, pengarahan, bimbingan dan membantu penulis dalam menyelesaikan skripsi ini serta memberikan inspirasi dari mulai pemilihan topik hingga metode penelitian yang digunakan.

(7)

vi

4. Dr. Nur Inayah, M.Si selaku Pembimbing II yang telah memberikan ilmu pengetahuan, pengarahan, bimbingan dan membantu penulis dalam menyelesaikan skripsi ini.

5. Sanjaya dan Eti Buanawati sebagai orang tua penulis yang telah memberikan dukungan baik moril ataupun materil untuk penulis.

6. Alvin Refaldi, Arsy Arlina dan Abdul Hamid yang selalu memberikan motivasi serta dukungan lainnya kepada penulis.

7. Sahabat X yaitu Aulia, Ayu, Ery, Fitria, Hamid, Intan, Khusnul, Shinta, Vika dan Dino yang selalu memberikan semangat kepada penulis.

8. Seluruh mahasiswa matematika serta seluruh pihak yang telah membantu penulis dalam penyelesaian skripsi ini.

9. Keluarga Himpunan Mahasiswa yang telah memberikan ilmu, kepercayaan dan pengalaman yang luar biasa

10. Seluruh pihak yang telah membantu penulis dalam menyelesaikan skripsi yang tidak dapat disebutkan satu persatu.

Penulis menyadari bahwa masih banyak kesalahan dalam penyusunan skripsi ini. Oleh sebab itu, penulis sangat menerima kritik dan saran yang bersifat membangun agar kesalahan yang telah terjadi tidak terulang di masa yang akan datang. Penulis sangat berharap bahwa skripsi ini dapat bermanfaat bagi banyak pihak.

(8)

(9)

(10)

ix

ABSTRAK

Kharisma Monardo, Klasifikasi Gambar Sel Darah Merah Manusia Yang

Terinfeksi Parasit Falciparum Menggunakan Randomly Wired Neural Network, dibawah bimbingan Muhaza Liebenlito, M.Si dan Dr. Nur Inayah, M.Si .

Malaria merupakan salah satu penyakit yang ada di Indonesia yang disebabkan oleh parasit plasmodium salah satunya adalah parasite falciparum. Parasit ini ditularkan melalui nyamuk yang menginfeksi sel darah merah manusia. Cara standar dalam mendianosis malaria adalah dengan menguji sel darah merah dibawah mikroskop apakah terinfeksi penyakit atau tidak. Pengujian ini dilakukan oleh penguji yang kompeten, cara tersebut kurang efisien karena hasil ujinya dipengaruhi oleh pengalaman dan pengetahuan dari pengujinya. Penerapan machine learning untuk otomatisasi klasifikasi malaria tetap membutuhkan ahli sebagai feature extractor.

Penerapan deep learning pada permasalahan diagnosis malaria dibagi menjadi 3 tahap yaitu segmentation, stagging dan classification. Penelitian kali ini akan menerapkan salah satu model deep learning yaitu randomly wired neural network untuk mengklasifkasikan gambar yang terdapat parasite falciparum pada sel darah merah atau tidak.

Penelitian kali ini menggunakan data sebanyak 27.558 yang dibagi menjadi 5 bagian untuk memprosesnya dengan metode cross-validation. Klasifikasi menggunakan randomly wired neural network dengan menggunakan 4 random graf pada arsitekturnya menunjukkan rata-rata hasil sebesar 95.08% pada accuracy, 93.62% pada precision, 96.44% pada recall dan 95.05% pada f1-score. Performa dari randomly wired neural network dapat mengalahkan pre-trained model ResNet50 yang arsitekturnya menunjukkan rata-rata hasil sebesar 89.63% pada

accuracy, 80.80% pada precision, 92.12% pada recall dan 89.88% pada f1-score.

Kata Kunci: Deep Learning, Malaria, Parasite Falciparum, Randomly Wired Neural Network

(11)

x

ABSTRACT

Kharisma Monardo, Image Classification of Human Red Blood Cells Infected by

Falciparum Parasites Using Randomly Wired Neural Networks, under the guidance of Muhaza Liebenlito, M.Si dan Nur Inayah, M.Si.

Malaria is a disease in Indonesia caused by plasmodium parasites, one of which is falciparum parasite. This parasite is transmitted through mosquitoes that infect human red blood cells. The standard way to diagnose malaria is testing the red blood cells under a microscope whether they are infected with the disease or not. This test is carried out by competent examiner, this method is less efficient because the results of the test are influenced by the experience and knowledge of the examiner. The application of machine learning to automate malaria classification still requires experts as a feature extractor. The application of deep learning in malaria diagnosis problems is divided into 3 stages, namely segmentation, stagging and classification. This study will apply one of the deep learning models, namely randomly wired neural network to classify images that contain parasitic falciparum on red blood cells or not.

This research uses 27,558 data which is divided into 5 parts to process it using cross-validation method. Classification using randomly wired neural network using 4 random graphs in the architecture shows an average yield of 95.08% on accuracy, 93.62% on precision, 96.44% on recall and 95.05% on f1-score. The performance of randomly wired neural networks can beat the pre-trained ResNet50 model whose architecture shows an average yield of 89.63% in accuracy, 80.80% in precision, 92.12% in recall and 89.88% in f1-score.

Keywords: Deep Learning, Malaria, Parasite Falciparum, Randomly Wired Neural

(12)

xi

DAFTAR ISI

PERNYATAAN ... ii

LEMBAR PENGESAHAN ... iii

PERSEMBAHAN DAN MOTTO ... iv

KATA PENGANTAR ... v

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... viii

ABSTRAK ... ix

ABSTRACT ... x

DAFTAR ISI ... xi

DAFTAR GAMBAR ... xiii

BAB I PENDAHULUAN ... 1 1. 1.Latar Belakang ... 1 1. 2.Perumusan Masalah ... 3 1. 3.Tujuan Penelitian ... 4 1. 4.Batasan Masalah ... 4 1. 5.Manfaat Penelitian ... 4

BAB II LANDASAN TEORI ... 5

2. 1.Penyakit Malaria ... 5

2. 2. Feed Forward Neural Network ... 6

2. 3.Convolutional Neural Network ... 8

2. 4. Loss Function ... 10 2. 5.Activation Function ... 10 2. 6. Optimization ... 11 2. 7. Regularization ... 12 2. 8. Backpropagation ... 12 2.9. Random Graph ... 13 2.10. Evaluasi Model ... 14 2.11. Transformasi Gambar ... 15 2.12. Cross-Validation ... 16

(13)

xii

BAB III METODELOGI PENELITIAN... 18

3. 1.Sumber Data ... 18

3.2. Tahapan Penelitian ... 19

BAB IV HASIL DAN PEMBAHASAN ... 25

4. 1. Preprocessing Data ... 25 4.2. Membuat Model ... 26 4.3. Training ... 27 4.4. Testing ... 30 BAB V PENUTUP ... 31 5.1. Kesimpulan ... 31 5.2. Saran ... 32 REFERENSI ... 33

(14)

xiii

DAFTARGAMBAR

Gambar 1. 1 Annual Parasite Insidence (API) Per 1.000 Penduduk Menurut

Provinsi Tahun 2009-2018 [1][2] ... 2

Gambar 2. 1 Feed Forward Neural Network. ... 7

Gambar 2. 2 Proses Konvolusi. ... 9

Gambar 2. 3 Pooling ... 9

Gambar 2. 4 Ilustrasi Cross-Validation. ... 16

Gambar 3. 1 Sel Darah Merah Yang Terinfeksi P.Falciparum ... 18

Gambar 3. 2 Sel Darah Merah Yang Tidak Terinfeksi P.Falciparum ... 18

Gambar 3. 3 Diagram Alur Penelitian ... 20

Gambar 4. 2 Hasil Generate Random Graf Watts-Strogatsz. ... 26

Gambar 4. 3 Arsitektur RWNN untuk Klasifikasi Gambar Sel Darah Merah Manusia yang Terinfeksi P.Falciparum. ... 27

Gambar 4. 4 Loss Setiap Epoch Model RWNN. ... 28

Gambar 4. 5 Akurasi Setiap Epoch Model RWNN. ... 28

Gambar 4. 6 Loss Setiap Epoch Model Resnet50 ... 29

(15)

1

BAB I

PENDAHULUAN

1. 1. Latar Belakang

Pada ayat Al-Qur’an surah Al-Anbiya ayat 83-84 yang menurut kementrian agama Republik Indonesia terkait ayat-ayat Al-Qur’an tersebut memiliki arti“Dan

(ingatlah kisah) Ayub, ketika dia berdoa kepada Tuhannya, ‘(Ya Tuhanku), sungguh, aku telah ditimpa penyakit, padahal Engkau Tuhan Yang Maha Penyayang dari semua yang penyayang’.” (QS. Al-Anbiya’ : 83), “Maka Kami kabulkan (doa) nya, lalu Kami lenyapkan penyakit yang ada padanya dan Kami kembalikan keluarganya kepadanya, dan (Kami lipat gandakan jumlah mereka) sebagai suatu rahmat dari Kami, dan untuk menjadi peringatan bagi semua yang menyembah Allah.” (QS. al-Anbiya’ : 84). Berdasarkan ayat diatas yang

menceritakan kisah kaum Nabi Ayub ‘alaihissalam dengan ujian berupa penyakit, harapannya manusia dapat menjadikan kisah tersebut sebagai peringatan bahwa siapapun dapat mengalami ujian berupa penyakit. Upaya dalam melalui ujian tersebut, manusia dapat melakukan dua cara yaitu berdoa dan ikhtiar. Salah satu bentuk ikhtiar manusia dalam melalui ujian berupa penyakit yaitu dengan melalui dokter yang mengerti penyakit tersebut dan telah mempelajari cara penanganannya. Begitupun upaya penyembuhan pada penyakit malaria, dimana dokter harus melakukan diagnosa terlebih dahulu apakah pasien terinfeksi penyakit atau tidak untuk memutuskan tindakan yang harus segera dilakukan.

Penyakit malaria merupakan penyakit yang dapat menyerang semua golongan baik itu laki-laki atau perempuan baik dari umur bayi hingga dewasa. Penyakit malaria ini disebabkan oleh infeksi parasit plasmodium yang hidup dan berkembang biak pada sel darah merah manusia.

Sesuai dengan Keputusan Menteri Kesehatan RI Nomor 293/Menkes/SK/IV/2009 tanggal 28 April 2009 tentang “Eliminasi Malaria di Indonesia” dan Surat Edaran Menteri Dalam Negeri kepada seluruh gubernur dan bupati/walikota Nomor 443.41/465/SJ tanggal 8 Februari 2010 tentang “Pedoman

(16)

2

Pelaksanaan Program Eliminasi Malaria di Indonesia yang harus dicapai secara bertahap mulai dari tahun 2010 sampai seluruh wilayah Indonesia bebas malaria selambat-lambatnya tahun 2030”, maka program malaria di Indonesia bertujuan untuk mencapai eliminasi. Perkembangan dari program malaria tersebut terlihat pada Gambar 1.1. Pada Gambar 1.1 dapat dilihat bahwa jumlah API (Annua

Paracite Independence) / angka kesakitan per 1.000 penduduk mengalami

penurunan sejak tahun 2010 hingga tahun 2015, namun pada tahun 2016 hingga tahun 2017 API Malaria mengalami kenaikan. Data terakhir pada tahun 2018 mennjukkan penurunan yang signifikan, namun tidak menutup kemungkinan bahwa pada tahun selanjutnya akan terus menurun. Sehingga pihak terkait harus selalu waspada terhadap penyakit malaria.

Gambar 1. 1 Annual Parasite Insidence (API) Per 1.000 Penduduk Menurut

Provinsi Tahun 2009-2018 [1][2].

Di Indonesia penyakit malaria ditangani dengan pengobatan ACT

(Artemisinin-Based Combination Therapy) dengan dua cara mendiagnosis yaitu pemeriksaan

mikroskopik dan rapid diagnostic test kedua cara diagnosis tersebut masing-masing memiliki kelemahan. Hasil dari pemeriksaan mikroskopik dipengaruhi oleh keahlian dari pemeriksanya baik itu dari pengetahuan maupun pengalaman [3]. Cara kedua yaitu rapid diagnostic test namun setelah melakukan rapid diagnostic test hasilnya disarankan melakukan pemeriksaan mikroskopik untuk mengkonfirmasi hasilnya [4].

Proses otomatisasi klasifikasi malaria sudah dilakukan oleh beberapa peneliti, yaitu dengan menganalisa gambar perangkat lunak computer-aided

0 0.5 1 1.5 2 2.5 2009 2010 2011 2012 2012 2014 2015 2016 2017 2018 Annual Parasite Insidence (API) Malaria Per-1000 Penduduk

(17)

3 detection (CADx ) menggunakan traditional Machine Learning (ML) seperti Support Vector Machine (SVM). Pada tahun 2009, pengaplikasian SVM untuk

mendeteksi sel darah merah yang terinfeksi [5]. Namun untuk membuat keputusan memerlukan feature extraction sebelum mengolahnya dengan metode ML[6]. Pada proses feature extraction ini yaitu menganalisa variable-variabel dalam gambar seperti ukuran, background, angel dan posisi dari region of interest dan semua itu memerlukan keahlian baik itu pengetahuan atau pengalaman. Sedangkan deep

learning (DL) mampu melakukan proses feature extraction dengan keberhasilan

yang signifikan [7]. Tahun 2018 pengaplikasian DL yaitu melaluti pre-trained model untuk mendeteksi sel darah yang terinfeksi [8].

Pada penelitian kali ini penulis akan menggunakan Randomly Wired Neural

Network (RWNN) sebagai arsitektur modelnya. Dimana RWNN ini berhasil

mengalahkan pre-trained model di permasalahan image recognition pada ImageNet [9]. Penulis berharap arsitektur ini sesuai untuk permasalahan Klasifikasi Gambar Sel Darah Merah Manusia Yang Terinfeksi Parasit Falciparum (P.Falciparum) dn untuk lebih meykinkn bhw RWNN sesuai untuk permasalahan Klasifikasi Gambar Sel Darah Merah Manusia Yang Terinfeksi P.Falciparum model tersebut akan dibandinkan dengan pre-trained model yaitu ResNet50.

1. 2. Perumusan Masalah

Berdasarkan latar belakang di atas, maka didapatkan perumusan masalah sebagai berikut:

1. Bagaimana hasil implementasi RWNN jika di bandingkan dengan ResNet50 untuk klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum?

2. Bagaimana hasil training model RWNN jika di bandingkan dengan ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum?

3. Bagaimana hasil evaluasi testing (Akurasi, Precision dan Recall) dari RWNN jika di bandingkan dengan ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum?

(18)

4 1. 3. Tujuan Penelitian

Tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut:

1. Mengimplementasikan RWNN dan membandingkan dengan ResNet50 untuk klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum

2. Mengetahui hasil training model RWNN dan membandingkan dengan ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum

3. Mengetahui hasil evaluasi testing (Akurasi, Precision dan Recall) dari RWNN dan membandingkan dengan ResNet50 pada permasalahan klasifikasi gambar sel darah merah manusia yang terinfeksi P.Falciparum

1. 4. Batasan Masalah

Agar pembahasan tidak menyimpang dari apa yang telah ditetapkan, maka dibuat pembatasan masalah sebagai berikut :

1. Parasit yang dideteksi hanyalah parasite P.falciparum yang diwarnai giemsa 2. Data yang digunakan merupakan data sel darah merah manusia dari

National Library of Medicine (NLM) yang didapat di rumah sakit Medical

College Chittagong, Bangladesh

3. Model DL yang digunakan adalah RWNN

4. Arsitektur model RWNN yang digunakan menggunakan 4 random graf 5. Hyperparameter yang digunakan yaitu learning rate sebesar 0,0001 dan

batch size sebesar 8.

1. 5. Manfaat Penelitian

Melalui penelitian ini diharapkan dapat menjadi acuan untuk penelitian atau pengembangan dalam diagnosis penyakit malaria di seluruh dunia terutama di Indonesia. Instansi terkait diharapkan dapat melakukan pencegahan penyakit malaria jika menerapkan penelitian ini atau pengembangannya dalam bidang bioteknologi.

(19)

5

BAB II

LANDASAN TEORI

Bab ini akan membahas penjelasan tentan metode yang berkaitan satu sama lain serta pendekatan dengan penelitian yang akan dilakukan pada skripsi ini. Adapun teori-teori dalam bab ini meliputi pengetahuan tentang penyakit malaria, beberapa metode yang berkaitan dan beberapa istilah lainnya yang digunakan dalam penelitian.

2. 1. Penyakit Malaria

Penyakit malaria merupakan penyakit yang dapat menyerang semua golongan baik itu laki-laki atau perempuan baik dari umur bayi hingga dewasa. Dimana penyakit malaria ini disebabkan oleh infeksi parasite plasmodium yang hidup dan berkembangbiak pada sel darah merah manusia. Menurut Kamus Besar Bahasa Indonesia (KBBI), malaria adalah penyakit infeksi yang banyak dijumpai di daerah tropis yang disertai gejala demam fluktuasi suhu secara teratur dan ditularkan oleh nyamuk anopheles. Menurut WHO (World Health Organization) malaria adalah penyakit yang disebabkan oleh parasit pasodium, parasit menyebar ke manusia melalui gigitan nyamuk anofeles betina. Terdapat 5 spesies parasit yang menyebabkan malaria, dan 2 dari 5 itu merupakan ancaman terbesar yaitu

P.Falciparum dan P.Vivax.

Pada tahun 1996, penelitian terkait Klasifikasi penyakit malaira di dunia sudah mulai terlihat[10], di Indonesia penelitian terkait klasifikasi penyakit malaria dimulai tahun 1999 dengan mendeteksi P.Falciparum dan P.Vivax pada pasien yang mendudukin daerah timur Indonesia[11]. Pada Indonesia penelitian-penelitian tentang diagnosis penyakit malaria masih dilakukan salah satunya oleh lembaga Eijkman yang merupakan lembaga pemerintah terpercaya dalam melakukan penelitian terhadap penyakit malaria.

(20)

6

2. 2. Feed Forward Neural Network

Sebelum mengetahui RWNN dan convolutional neural network alangkah lebih baik jika kita mengetahui terlebih dahulu mengenali feed forward neural network. Feed forward neural network merupakan model DL klasik yang mempunyai tujuan mengaproksimasi nilai fungsi f*. Contoh misalkan kita mempunyai fungsi klasifikasi 𝑦 = 𝑓∗(𝑥) yang memetakan input 𝑥 pada kategori 𝑦, model ini memetakan 𝑦̂ = 𝑓∗(𝑥; 𝜃) dan belajar melalui parameter 𝜃 untuk menghasilkan aproksimasi fungsi yang terbaik [12]. Feed forward neural network ini terdiri dari beberapa layer perceptron dimana masing-masing perceptronnya mempunyai

weight dan bias yang dapat di optimasi melalui training untuk menyesuaikan pada

suatu permasalahan. Ilustrasi untuk feed forward neural network dapat dilihat pada Gambar 2.1.

Perceptron pada setiap layernya menggunakan persamaan dibawah untuk mnghitung outputnya. 𝑦 = 𝑓 (∑ 𝑖_𝑖𝑤_𝑖+ 𝑏 𝑛 𝑖=1 ) ( 1 ) Dimana : 𝑦 : output perceptron 𝑤_𝑖 : weight input i 𝑏 : bias perceptron 𝑓 : activation function

Parameter yang optimal diperoleh dengan mengoptimasi fungsi kesalahan supaya mencapai kesalahan yang terkecil, jadi untuk mendapatkan parameter yang optimal feed forward neural network membutuhkan fungsi kesalahan, Teknik optimasi dan memerlukan waktu untuk belajar dengan meminimalkan kesalahan.

(21)

7 Gambar 2. 1 Feed Forward Neural Network.

𝑙 = ∑ 𝑖𝑖𝑤𝑖+ 𝑏 𝑛

𝑖=1

(22)

8

2. 3. Convolutional Neural Network

Convolutional Neural Network (CNN) merupakan salah satu variasi dari feed forward neural network yang terinspirasi oleh pemahaman Hubel dan Weasel melalui cara kerja korteks visual kucing. Korteks visual ini memiliki daerah kecil yang terdiri dari beberapa sel yang peka terhadap daerah tertentu di bidang visual. Sel-sel didalam korteks visual tersebut aktif hanya pada bentuk dan orientasi objek tertentu pada bidang visual.

Sistem kerja ini menjadi dasar bagaimana salah satu jenis arsitektur feed forward neural network yaitu CNN dibuat, pada CNN memiliki struktur dasar yang nyaris serupa dengan feed forward neural network pada umumnya, seperti input layer, hidden layer hingga output[13], jadi CNN adalah feed forward neural network yang menggunakan perhitungan konvolusi terhadap setiap matriks pada setidaknya 1 dari layer pada network-nya [12].

Misalkan input pada layer ke 𝑞 memiliki ukuran dimensi (𝐿_𝑞 𝑥 𝐵_𝑞𝑥 𝑑_𝑞) dimana secara berturut-turut merupakan panjang, lebar dan kedalaman input. Filter 𝑝 pada layer 𝑞 adalah parameter yang di notasikan sebagai tensor 3 dimensi 𝑊(𝑝,𝑞) = [𝑤_𝑖𝑗𝑘(𝑝,𝑞)]. Index 𝑖,𝑗 dan 𝑘 menyatakan posisi sepanjang tinggi, lebar dan kedalaman. Ukuran dimensi pada filter tersebut adalah (𝐹_𝑞 𝑥 𝐹_𝑞 𝑥 𝑑_𝑞). Feature maps pada layer ke-𝑞 direpresentasikan dengan tensor 3 dimensi 𝐻(𝑞)_{= [ℎ}

𝑖𝑗𝑘 (𝑞)

] ,saat 𝑞 = 1 maka 𝐻(1)_{merepresentasikan sebagai layer input [13]. Berikut adalah persamaan}

matematis proses konvolusi pada layer ke-𝑞.

ℎ_𝑖𝑗𝑝(𝑞+1) = ∑ ∑ ∑ 𝑤_𝑟𝑠𝑘(𝑝,𝑞)ℎ_{𝑖+𝑟−1,𝑗+𝑠−1,𝑘}(𝑞) 𝑑𝑞 𝑘=1 𝐹𝑞 𝑠=1 𝐹𝑞 𝑟=1 ( 2 ) ∀𝑖 ∈ {1 … ,𝐿𝑞− 𝐹𝑞 𝑆 + 1} ∀𝑗 ∈ {1 … ,𝐵𝑞− 𝐹𝑞 𝑆 + 1} ∀𝑝 ∈ {1 … , 𝑑𝑞+1}

(23)

9 Gambar 2. 2 Proses Konvolusi.

Proses konvolusi memiliki beberapa parameter yang dapat diubah yaitu stride dan padding. Stride adalah pergeseran matriks kernel pada matriks input layernya, sementara padding adalah menambahkan suatu nilai pada sisi luar matriks input layernya. Contoh proses konvolusi dapat dilihat pada Gambar 2.2.

CNN tidak luput dari proses pooling yang biasanya dilakukan setelah proses konvolusi dimana pooling bekerja dengan memilih 1 diantara beberapa nilai yang ditentukan banyaknya dengan kriteria tertentu, secara ilustrasi pooling dapat dilihat pada Gambar 2.4.

(24)

10 2. 4. Loss Function

Fungsi yang menunjukkan seberapa buruk model yang dibentuk merupakan definisi dari Loss Function. Pemilihan loss function bergantung pada pemilihan activation function dan output layer suatu network. Pada ouput yang berupa bilangan asli biasanya menggunakan activation function softmax dan loss function cross-entropy, sedangkan pada ouput berupa bilangan real biasanya menggunkan activation function linear dan loss function squred error. Pada penelitian kali ini output yang dihasilkan akan berupa bilangan asli sehingga akan mengunakan loss function Cross Entropy Loss yang mempunyai rumus:

𝐿 = −1 𝑁(∑ 𝑦𝑖log (ŷ𝑖) 𝑁 𝑖=1 ) _{( 3 )} dimana:

N = banyaknya kelas yang diklasifikasikan 𝑦_𝑖 = kelas yang sesungguhnya

ŷ_𝑖 = hasil predisi dari model (berupa peluang).

2. 5. Activation Function

Fungsi yang digunakan untuk menghitung output pada sebuah layer sebuah network merupakan definisi dari Activation function. Seperti yang dijelaskan pada subab sebelumnya bahwa activation fuction dan loss function saling berhubungan. Namun pada penlititan kali ini tidak mengunakan activation function sofmax pada output nodenya, karena pada modul yang kita gunakan pada penelitian kali ini sebelum masuk loss function cross-entropy modul akan menjalankan activation fuction softmax. Jadi jika kita menerapkan activation function sotmax lagi makan program akan melakukan 2 kali activation function sofmax. Berikut beberapa output unit yang digunakan pada penelitian kali ini:

(25)

11 2.5.1. ReLU

ReLU adalah suatu fungsi linear namun memiliki batas bawah yang secara umum batasnya adalah 0. ReLU akan digunakan pada penelitian kali ini pada setiap simpul yang akan dibuat nantinya. secara matematis ReLU dapat di tulis menjadi:

𝑓(𝑥) = {𝑥, 𝑥 > 0

0 , 𝑥 ≤ 0 ( 4 )

2.5.2. Sigmoid

Fungsi aktivasi sigmoid biasa disebut sebagai fungsi penghalus, karena hasil dari fungsi ini terlihat halus. Karena fungsi ini akan selalu bernilai postif maka sigmoid pada penelitian kali ini akan untuk menjumlahkan input pada suatu simpul sebelum melakukan transformasi didalam simpul. Fungsi ini mempunyai rumus:

𝑓(𝑥) = 1

1 + 𝑒−𝑥 ( 5 )

2. 6. Optimization

Algoritma yang digunakan untuk mengoptimalkan parameter agar model yang dilatih dapat mengaproksimasi dengan baik merupakan definisi dari optimisasi. Pada penelitian kali ini optimisasi yang digunakan adalah SGD (stochastic gradien

descent) pemilihan optimisasi SGD adalah berdasarkan Nitish Shirish Keskar dkk

yang telah meneliti bahwa SGD lebih stabil dari ADAM [14]. Optimisasi SGD ini mempunyai cara kerja sebagai berikut:

𝜃 = 𝜃 − 𝜇. ∇𝐿(𝜃) ( 6 ) dimana :

𝜃 = parameter yang ingin dioptimalkan (weight, bias) 𝜇 = Learning Rate

𝐿 = Loss function

∇ = operasi turunan fungsi.

Pengoptimalan ini dilakukan pada setiap epoch hingga mencapai nilai yang optimal atau nilai dari Loss Function yang minimum.

(26)

12 2. 7. Regularization

Regularization adalah cara bagaimana agar model yang kita train mempuyai performa yang baik selain pada data train [12], dengan kata lain mencegah model kita untuk overfit. Banyak strategi yang digunakan untuk mengatasi hal ini namun pada penelitian kali ini peneliti menggunakan cara BatchNorm (BN). Secara umum BN dapat dijelaskan dengan melakukan standarisasi gaussian yang bertujuan agar tidak ada output dari suatu node yang mempunyai jarak yang berbeda terlalu jauh. Perbedaan jarak nilai dari suatu ouput node dapat berakibat pada saat melakukan optimization, dimana BN mempunyai algoritma sebagai berikut:

𝜇_𝛽← 1 𝑚∑ 𝑥𝑖 𝑚 𝑖=1 ( 7 ) 𝜎_𝛽2 ← 1 𝑚∑(𝑥𝑖 − 𝜇𝛽) 2 𝑚 𝑖=1 ( 8 ) 𝑥̂𝑖 ← 𝑥_𝑖− 𝜇_𝛽 √𝜎_𝛽2 ( 9 ) 2. 8. Backpropagation

Algoritma yang digunakan untuk meminimumkan fungsi loss adalah Algoritma Backpropagation. Algoritma backpropagation terdiri dari beberapa algoritma, dimana salah satunya adalah stochastic gradient descent (SGD). SGD merupakan suatu metode optimasi yang berbasis gradient. Backpropagation terdiri dari 2 fase yaitu forward phase dan backward phase [15].

a. Forward phase: Didalam forward phase, input digunakan untuk menghitung nilai dari setiap hidden layer berdasarkan nilai weight (w) dan bias (b) yang ada. Tujuan dari forward phase adalah untuk menghitung seluruh output dari hidden layer hingga ouput layer berdasarkan dari input yang diberikan. Setelah

(27)

13

perhitungan selesai dihitunglah loss function (𝐿) berdasarkan nilai output layer kemudian hitung gradient-nya berdasarkan nilai ouput layer [15].

b. Backward phase: Didalam backward phase perhitungan gradient dari L berdasarkan berbagai w dan b dilakukan. Pada tahapan ini gradient dihitung dengan turunan parsial secara mundur, yakni gradient dihitung dari 𝐿 hingga input layer dengan memperhatikan 𝑤 dan 𝑏 pada layer tersebut. Setelah itu gunakan nilai gradient dari fungsi loss terhadap w atau b dan dioptimasi menggunakan SGD [15].

Proses stochastic gradient descent (SGD) digunakan untuk memperbarui nilai parameter yang akan dioptimasi yaitu 𝜃 (weight dan bias), dimana learning rate (𝛼) adalah ukuran langkah untuk mencapat titik minimum dibawah ini merupakan persamaan untuk mengoptimasi parameter dengan SGD menggunakan persamaan (6). Proses backpropagation yang terdiri dari forward phase dan backward phase yang dilakukan 1 kali pada seluruh data merupakan siklus dari 1 epoch.

2.9. Random Graph

Kumpulan simpul bersama dengan sisi, dimana setiap sisi menghubungkan dua buah simpul merupakan defisini dari Graph. Random graph adalah graf dimana simpul dan sisinya diciptakan dengan suatu proses yang acak atau random. Random graph dapat dideskripsikan oleh peluang distrbusi atau hanya oleh suatu proses random. Pada penelitian kali ini penulis menggunakan model random graph Watts-Strogatz.

2.9.1. Watts-Strogatz

Random Graph Watts-Strogatz didefinisikan dengan membuat small-word graph. Small-world graph merupakan graf yang sebagian besar simpulnya dapat dicapai ke simpul lain dengan sejumlah kecil langkah [16]. Parameter yang dapat di atur yaitu banyaknya simpul, peluang simpul pada graf bertetangga dan maksimum simpul pada graf bertetangga. Cara pembuatan Random Graph Watts-Strogatz yaitu dengan algoritma sebagai berikut [17]:

(28)

14

a. Bentuk cincin kisi (lattice) regular dengan N buah simpul yang masing-masing terhubung dengan 2𝑚 buah tetangga (m buah pada masing-masing sisi). b. Setiap simpul 𝑛_𝑖 = 𝑛₁⋯ 𝑛_𝑁 ambil busur (𝑛_𝑖, 𝑛_𝑗) dengan 𝑖 < 𝑗, dan hubungkan

kembali dengan peluang P. Proses menghubungkan kembali dilakukan dengan menggantikan (𝑛_𝑖, 𝑛_𝑗) dengan (𝑛_𝑝, 𝑛_𝑞) dimana 𝑝, 𝑞 dipilih dengan peluang yang sama untuk semua kemungkinan nilai untuk menghindari self-loops dan koneksi yang terduplikasi (𝑝 = 𝑖 atau 𝑞 = 𝑗 diperbolehkan namun tidak boleh keduanya bersamaan).

2.10. Evaluasi Model

Melakukan evaluasi dalam kinerja sistem klasifikasi merupakan hal yang penting untuk menggambarkan seberapa baik sistem dalam mengkalsifikasikan data. Terdapat banyak evaluasi yang dapat di gunakan pada suatu penelitian namun pada penelitian kali ini penulis menggunakan salah satunya adalah Confusion

Matrix. Penulis menggunakan evaluasi confusion matrix karena pada penelitian kali

ini membutuhkan evaluasi recall yang didapat dari hasil confusion matrix. Cara kerjanya yakni membandingkan hasil klasifikasi yang dilakukan oleh sistem dengan hasil klasifikas yang seharusnya.

Terdapat 4 istilah dalam pengukuran kinerja menggunakan Confusion Matrix, sebagai representasi hasil proses klasifikasi yakni, True Positive (TP), True

Negative (TN), False Positive (FP), False Negative (FN), pada klasifikasi binary

confusion matrix disajikan dalam Tabel 2.1 [18]:

Tabel 2. 1 Confusion Matrix Klasifikasi Binary

Kelas Terklasifikasi Positif Terklasifikasi Negatif

Positif TP (True Positive) FN (False Negative)

Negatif FP (False Positive) TN (True Negative)

Berdasarkan Tabel 2.1 diatas dapat diperoleh nilai akurasi, presisi, dan recall. Tabel 2.2 menyajikan langkah-langkah yang digunakan untuk klasifikasi binary berdasarkan berdasarkan confusion matrix.

(29)

15 Tabel 2. 2 Ukuran Untuk Klasifikasi Binary

Ukuran Formula Fokus Evaluasi

Akurasi 𝑡𝑝 + 𝑡𝑛 𝑡𝑝 + 𝑓𝑛 + 𝑓𝑝 + 𝑡𝑛

Efektifitas keseluruhan dari sebuah classifier.

Presisi 𝑡𝑝

𝑡𝑝 + 𝑓𝑝

Efektifitas classifier untuk memprediksi kelas positif Recall 𝑡𝑝 𝑡𝑝 + 𝑓𝑛 Efektifitas classifier untuk mengidentifikasi label positif. 2.11. Transformasi Gambar

Transformasi menurut KBBI adalah perubahan rupa (bentuk,sifat, fungsi dan sebagainya), dengan kata lain transformasi gambar adalah perubahan rupa dari gambar baik itu perubahan bentuk, sifat maupun fungsi.

Fill Image adalah proses transformasi gambar yang mengubah gambar

menjadi kotak atau mempunyai panjang dan lebar yang sama dengan menyiapkan bidang polos yang berbentuk persegi lalu menempelkan objek kita diatas bidang itu, dengan lebar dari bidang itu adalah Panjang dari objeknya

Normalisasi merupakan salah satu transformasi gambar yang mengubah

nilai dari setiap pixel yang terdapat pada gambar dengan tujuan minimumkan jarak antara nilai maksimal dan nilai minimum dari pixel yang terdapat pada gambar namun tidak menghilangkan informasi yang terdapat pada gambar. Proses pengubahan nilai pixel gambar dengan normalisasi dihitung pada setiap channel-nya dengan menggunakan Z-Score parameter [19] :

𝑁𝑜𝑟𝑚𝑎𝑙𝑖𝑧𝑒 = 𝑛𝑖𝑙𝑎𝑖 𝑎𝑤𝑎𝑙 − 𝑚𝑒𝑎𝑛

(30)

16 Resize adalah proses transformasi gambar yang mengubah ukuran gambar

menjadi yang kita inginkan.

Selain fill image, normalize dan resize masih banyak lagi transformasi gambar yang dapat dilakukan, namun pada penelitian kali ini hanya akan menggunakan ketiga transformasi tersebut.

2.12. Cross-Validation

Cross-Validation adalah metode statistik untuk mengevaluasi dan membandingkan algoritma pembelajaran dengan membagi data menjadi dua segmen: satu digunakan untuk belajar atau melatih model dan yang lainnya digunakan untuk memvalidasi model. Dalam Cross-Validation, pelatihan dan validasi set harus menyeberang di putaran berturut-turut sehingga setiap titik data memiliki kesempatan untuk menjadi data validasi. Bentuk dasar dari Cross-Validation adalah k-fold Cross-Cross-Validation. Bentuk lain dari Cross-Cross-Validation adalah kasus khusus dari k-fold Cross-Validation atau melibatkan pengulangan Cross-Validation k-fold.

(31)

17

Pada k-fold Cross-Validation, data dipartisi menjadi k sama besar (atau hampir sama) ukuran segmen atau fold contohnya dapat dilihat pada Gambar 2.4. Selanjutnya k iterasi pelatihan dan validasi dilakukan sedemikian rupa sehingga dalam setiap iterasi lipatan data yang berbeda ditahan-Out untuk validasi sementara lipatan k − 1 yang tersisa digunakan untuk belajar.

(32)

18

BAB III

METODOLOGI PENELITIAN

Beberapa penelitian pengklasifikasian gambar dilakukan oleh para peneliti dengan berbagai tahapan untuk mendapatkan hasil pengklasifikasian terbaik seperti pada penelitian [6] dan [8]. Proses lebih jelasnya pada bab ini akan dipaparkan mulai dari sumber data dan tahapan penelitian yang dipilih penulis atas berbagai pertimbangan permasalahan yang dihadapi.

3. 1. Sumber Data

Data yang digunakan dalam penilitian kali ini adalah data sekunder yang di ambil di dokumentasi NLM [8]. Data tersebut diambil dari aplikasi android yang dikembangkan oleh peneliti di Lister Hill National Center for Biomedical Communications (LHNCBC) yang merupakan bagian dari NLM [20], aplikasi ini berguna untuk mengurangi beban bagi orang yang mendiagnostik di daerah terbatas sumber daya dan meningkatkan akurasi diagnostik. Aplikasi ini mengambil sel darah tipis yang di warnai Giemsa dari 150 pasien yang terinfeksi P.falciparum dan 50 pasien sehat di rumah sakit Medical College Chittagong, Bangladesh. Gambar sel yang diperoleh diidentifikasi secara manual oleh pembaca sel darah yang ahli di unit penelitian obat tropis Mahidol-Oxford di Bangkok. Gambar yang tidak bisa diidentifikasikan kemudian diarsipkan di NLM (IRB#12972). Tahap terakhir adalah menerapkan algoritma berbasis level-set untuk mendeteksi dan mensegmentasi sel darah merah[21]. Contoh data yang akan di gunakan dalam penelitian kali ini dapat dlihat pada Gambar 3.1 dan Gambar 3.2.

Gambar 3. 1 Sel Darah Merah Yang

Terinfeksi P.Falciparum

Gambar 3. 2 Sel Darah Merah Yang

(33)

19

3.2. Tahapan Penelitian

Pada sub bab tahapan penelitian ini berisikan tentang tahapan-tahapan yang dilakukan atau metode yang digunakan mulai dari mempersiapkan data, membuat model sampai dengan evaluasi serta interpretasi hasil penelitian sehingga dapat disimpulkan suatu hal yang bermanfaat. Pada skripsi ini penulis menggunakan aplikasi python versi 3.6.1 dengan bantuan beberapa modul diantaranya seperti

numpy, matplotlib, torch. Numpy digunakan untuk membuat bilangan random saat

proses pembagian data menjadi data latih, data validasi, dan data tes. Numpy juga digunakan untuk menghitung rata-rata dan variansi pada proses normalisasi gambar. Matplotlib digunakan untuk menampilkan plot hasil training model. Torch digunakan untuk memuat data yang terdapat pada folder agar di olah oleh python dan untuk mentransforasi gambar agar gambar mudah untuk diolah, serta digunakan untuk membuat model RWNN. Proses penelitian yang dilakukan dapat dilihat pada Gambar 3.3.

(34)

20 Gambar 3. 3 Diagram Alur Penelitian

(35)

21 3.2.1. Preprocessing

Sebelum mengolah data gambar sebaiknya dilakukan beberapa proses persiapan yang memudahkan pengolahan gambarnya, dimana proses itu dikenal dengan preprocessing data. Preprocessing data terdiri dari berbagai macam perlakuan sesuai dengan kebutuhan penelitian. Pada penelitian kali ini preprocessing yang digunakan adalah transformasi gambar. Pada peneilitian kali ini transformasi yang digunakan adalah Fill Image, Normalize, dan Resize.

Penelitian ini dilakukan fill image karena dalam melakukan diagnosis suatu sel darah terinfeksi atau tidak salah satunya dengan memperhatikan rasio p.falciparum yang telah diwarnai giemsa sebelumnya. Jadi jika kita melakukan fill image pada data, data akan mempunyai rasio seperti data awal ketika kita lakukan resize dengan rasio persegi. S. B. Kotsiantis dkk menyarankan melakukan data normalization dengan menggunakan persamaan (7) pada permasalahan supervised

learning terutama ketika kita menggunakan model neural network atau k-Nearest

Neighbouthood [22]. Dan resize menjadi ukuran 64 × 64 dilakukan agar proses training tidak memerlukan biaya yang terlalu besar.

3.2.2. Model

Setelah data siap diolah, selanjutnya pembentukan model RWNN meliputi menentukan jumlah random graph yang digunakan, penentuan arsitektur dari model yang akan digunakan penulis mengacu pada penelitian sebelumnya [9] hanya agak sedikit dimodifikasi. Berikut beberapa hyperparameter yang perlu di tentukan sebelum melatih model.

Loss function yang digunakan pada penelitian kali ini adalah Cross Entropy menggunakan persamaan (3) dengan output unit masing-masing adalah Linear. Pemilihan output unit sangat dipengaruhi oleh Loss Function yang digunakan, karena beberapa literature menunjukkan bahwa Cross Entropy merupakan gabungan dari Negative Likelihood dengan Log dari Softmax jadi output unit tidak perlu menggunakan Softmax lagi.

(36)

22

Optimasi yang dilakukan pada penelitian kali ini penulis menggunakan SGD seperti persamaan (6) dimana kelebihannya dibanding optimasi yang lain adalah kestabilannya yang konsisten (tergantung learning rate yang digunakan) meskipun kelemahanya model akan belajar lebih lama. Selanjutnya untuk mencegah model yang kita latih itu overfit penulis melakukan batchnorm yang menggunakan persamaan (7), (8) dan (9) pada setiap simpul pada graph yang ada pada model yang menormalisasikan setiap output-nya.

Arsitektur model pada penelitian kali ini penulis menggunakan RWNN. Dimana RWNN adalah suatu model yang menggunakan graf sebagai arsitektur neural network-nya. Dimana pada setiap garis graphnya melakukan perpindahan data dari simpul ke simpul lain dan pada setiap simpulnya melakukan operasi [9] :

Aggregation : data yang masuk (dari 1 garis atau lebih) ke simpul di

kombinasikan melalui weighted sum (menggunakan activation function sigmoid seperti persamaan (5)) bobotnya dapat di optimalkan dan positif.

Transformation : setelah data melalui persetujuan (aggregated) data dilakukan

proses transformasi yang didefinisikan sebagai ReLU (persamaan (4)) -convolution (persamaan(2)) – BatchNorm (persamaan (7), (8) dan (9)) triplet. Operasi ini dilakukan di setiap simpul.

Distribution : data setelah di transformasi di duplikasi dan dikirim ke setiap

garis output-nya

Peneliti menggunakan arsitektur dari penelitian sebelumnya yang sudah melakukan eksperimen pada beberapa jumlah graf yang digunakan dan membendingkannya dengan pre-trained model [9]. Spesifikasi arsitektur yang di gunakan pada penlitian kali ini yaitu terdiri dari 1 layer convolutional layer, 4 RWNN, dan 1 fully connected layer. Arsitekturnya dapat dilihat pada Tabel 3.1.

Tabel 3. 1 Arsitektur Model

Langkah Output Arsitektur

Conv1 32x32 3x3 Conv, C/2

Graf1 16x16 Graph N/2, C

(37)

23

Langkah Output Arsitektur

Graf3 4x4 Graph N, 4C

Graf4 2x2 Graph N, 8C

Pooling 1x1 Average Pool 1280C

Fully Connected 2 FC 2

Penjelasan dari Tabel 3.1 pada kolom arsitektur adalah sebagai berikut:

a. Proses Conv berarti operasi yang didalamnya terdapat ReLU-Convolution-BN. b. C merupakan banyaknya output channel yang digunakan di setiap layernya. c. Graph merupakan operasi RWNN pada graph yang sebelumnya sudah di

bangkitkan dimana N adalah jumlah simpul dari graph yang dibankitkan. d. Average Pool adalah pool dengan ketentuan mengambil rata-rata nya. e. FC adalah fully connected layer.

3.2.3. Training

Model yang telah terbentuk selanjutnya dilatih menggunakan komputer. Pada penelitian kali ini peneliti melakukan training pada model menggunakan komputer dengan spesifikasi menggunakan computer server dengan spesifikasi Intel ® Core ™ i9-9900k, RAM 31 GB, GeForce RTX 8GB / CUDA 10. Dengan hyperparameter yaitu learning rate sebesar 0,0001 dan batch size sebesar 8. Penggunaan learning rate sebesar 0,0001 merupakan pilihan pribadi dari penulis dikarenakan fungsi loss merupakan fungsi yang konveks seperti terlihat pada lampiran 1, maka berapapun nilai dari learning rate loss yang di optimalkan akan menuju nilai yang sama, yang membedakan hanya berapa lama fungsi loss-nya menuju nilai minimumnya dan pemilihan batch size sebesar 8 juga merupakan pilihan pribadi penulis untuk mencegah terjadinya overfit pada model.

Melatih model dimulai setelah data dilakukan preprocessing dan split data. Data train dijadikan input model setiap epoch untuk melakukan backpropagation yang terdiri dari forward pass dan backward pass. Sedangkan data validasi dijaikan input untuk model pada setiap epochnya namun hanya melakukan forward pass hingga

(38)

24

mendapat nilai dari loss. Penggunaan data validasi pada training model karena nilai loss dari data validasi dibutuhkan sebagai penentuan model terbaik selama training.

3.2.4. Evaluasi

Model yang telah dilatih kemudian dievaluasi. Pada penelitian kali ini, evaluasi yang digunakan yaitu menggunakan confusion matrix dan laporan klasifikasi yang menampilkan precision dan recall pada masing-masing kelasnya. Kemudian dari hasil evaluasi dapat kita lihat apakah RWNN cocok untuk permasalahan ini.

(39)

25

BAB IV

HASIL DAN PEMBAHASAN

Setelah meninjau banyak hal mulai dari teori sampai dengan metode-metode yang dilakukan para peneliti sebelumnya, maka penulis mulai mencoba melakukan penelitian sesuai dengan data yang diambil dan metodelogi yang dipilih. Adapun pokok pembahasan dari bab ini yaitu hasil preprocessing data, pembentukan model untuk Klasifikasi penyakit malaria melalui gambar sell darah merah, dan evaluasi model yang telah dilatih.

4. 1. Preprocessing Data

Prepocessing dilakukan ketika proses penyimpanan data pada folder kelas yang sesuai, dimana proses yang dilakukan adalah transformasi data meliputi Fill I mage, Normalize dan Resize menjadi berukuran 64x64. Hasil transformasi Fill Image, Resize dan Normalize terlihat seperti pada Gambar 4.1.

Gambar 4. 1 Beberapa contoh hasil transformasi Fill image Normalize dan Resize.

(40)

26

Proses transformasi gambar fill image dilakukan oleh penulis dengan menggunakan code yang dibuat sendiri, namun normalize dan resize dilakukan melalui library torchvision. Selanjutnya akan dilakukan pembagian pada data meliputi data latih yang kemudian akan dilatih untuk mendapatkan model terbaik, data validasi yang digunakan untuk memvalidasi model dan data tes untuk menguji model yang selesai dilatih. Pembagian data dilakukan secara acak, penelitian kali ini rasio yang digunakan untuk data train, data validasi dan data test berturut-turut yaitu 70%, 20% dan 10% dari data.

4.2. Membuat Model

Pembuatan model RWNN pada penelitian kali ini dibantu oleh beberapa library yang ada pada python yaitu torchvision dan network. Torchvision membantu peneliti dalam pembuatan arsitektur dasarnya seperti fully connected layer, optimization, regularization, loss function dan lain-lain. Sedangkan network membantu peneliti dalam membangkitkan random graf Watts-Strogatz.

Pembangkitan random graf Watts-Strogatz menggunakan library networkx dengan parameter peluang simpul bertetangga (P) itu sebesar 0.5, maksimal sisi dari setiap simpul adalah 4 dan banyaknya simpul dapat dilihat dari Hasil generate graf pada Gambar 4.2.

(41)

27

Pembuatan model menggunakan library torchvision dan graf yang sudah di generate sebelumnya menghasilkan arsitektur seperti terihat pada Gambar 4.3.

Gambar 4. 3 Arsitektur RWNN untuk Klasifikasi Gambar Sel Darah Merah

Manusia yang Terinfeksi P.Falciparum.

4.3. Training

Training yang dilakukan dengan metode cross-validation dengan membagi data menjadi 5 sama rata/hampir sama. Proses training tersebut memerlukan waktu 63370 detik (17.7 jam) dengan spesifikasi komputer yang di gunakan.

Hasil training dengan menggunakan 100 epoch, batch size sebesar 8 dan learning rate sebesar 0,0001 dalam grafik loss yang didapat pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat pada Gambar 4.4 dan grafik akurasi yang didapat pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat pada Gambar 4.5.

(42)

28 Gambar 4. 4 Loss Setiap Epoch Model RWNN.

Gambar 4. 5 Akurasi Setiap Epoch Model RWNN.

Berdasarkan Gambar 4.4 dan Gambar 4.5 dapat kita lihat bahwa seiring dengan menurunnya loss maka akurasinya juga akan meningkat jadi ini dapat membuktikan bahwa tidak ada kesalahan baik pada data, model ataupun classifier. Pada Gambar 4.4 dan Gambar 4.5 dapat kita lihat juga bahwa model yang dilatih menggunakan

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

LOSS SETIAP EPOCH RWNN

fold1 fold2 fold3 fold4 fold5

50 55 60 65 70 75 80 85 90 95 100 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

AKURASI SETIAP EPOCH RWNN

(43)

29

hyperparameter yang tepat dibuktikan engan grafik loss dan akurasi yang konvergen pada suatu nilai yang diharapkan.

Selain melakukan training pada model RWNN training terhadap pretrained model ResNet50 juga dilakukan dengan tujuan untuk membandingkan performa dari model RWNN dengan ResNet50. Menggunakan data yang samadan perlakuan yang sama baik itu preprocessing, hyperparameter maupun loss function dan optimizer. dalam grafik loss yang didapat pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat pada Gambar 4.4 dan grafik akurasi yang didapat pada setiap epoch-nya pada masing-masing fold-nya dapat dilihat pada Gambar 4.5.

Gambar 4. 6 Loss Setiap Epoch Model Resnet50

Berdasarkan Gambar 4.6 dan Gambar 4.7 dapat kita lihat bahwa seiring dengan menurunnya loss maka akurasinya juga akan meningkat jadi ini dapat membuktikan bahwa tidak ada kesalahan baik pada data, model ataupun classifier. Pada Gambar 4.6 dan Gambar 4.7 dapat kita lihat juga bahwa model yang dilatih menggunakan hyperparameter yang tepat dibuktikan engan grafik loss dan akurasi yang konvergen pada suatu nilai yang diharapkan.

0.29 0.31 0.33 0.35 0.37 0.39 0.41 0.43 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

LOSS SETIAP EPOCH RESNET50

(44)

30 Gambar 4. 7 Akurasi Setiap Epoch Model Resnet50.

4.4. Testing

Testing yang dilakukan pada data tes di setiap fold-nya menghasilkan hasil yang terlihat seperti Tabel 4.1 Menunjukkan bahwa model RWNN menunjukan performa yang lebih baik di bandingkan dengan ResNet50.

Tabel 4. 1 Hasil Evaluasi Training Dengan Cross-Validation.

Pengukuran RWNN ResNet50

Akurasi 95.08% 89.63% Presisi 93.62% 80.80% Recall 96.44% 92.12% F1-Score 95.05% 89.88%

Dengan melihat Tabel 4.1 dapat kita simpulkan bahwa model RWNN dengan 4 graph dapat melakukan klasifikasi penyakit malaria melalui sel darah merah dengan kesalahan yang kecil.

81 82 83 84 85 86 87 88 89 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

AKURASI SETIAP EPOCH RESNET50

(45)

31

BAB V

PENUTUP

Pada bab terakhir pada penulisan skripsi ini, berisikan tentang kesimpulan yang dapat diambil dari penelitian serta saran bagi para peneliti selanjutnya untuk dapat mengembangkan ilmu pengetahuan dibidang yang terkait pada masa yang akan datang.

5.1. Kesimpulan

Dari pemaparan hasil penelitian pada bab sebelumnya, dapat disimpulkan beberapa hal yang mungkin bisa diperhatikan dan ditelaah lebih lanjut yaitu : 1. 4 random graph dan hyperparaeter lain yang digunakan seperti loss function,

activation function dll pada RWNN mampu melakukan klasifikasi gambar sel darah merah manusia yang terinfeksi p.falciparum ibandingkan dengan pre-trained model.

2. RWNN dengan hyperparameter yang digunakan penulis mengasilkan training yang tidak terindikasi overfiting pada klasifikasi gambar sel darah merah manusia yang terinfeksi p.falciparum, begitu juga untuk pre-trained model ResNet50.

3. Hasil evaluasi model RWNN pada klasifikasi gambar sel darah merah manusia yang terinfeksi p.falciparum menunjukkan rata-rata hasil sebesar 95.08% pada

accuracy, 93.62% pada precision, 96.44% pada recall dan 95.05% pada f1-score. Performa dari Randomly Wired Neural Network dapat mengalahkan pre-trained model ResNet50 yang arsitekturnya menunjukkan rata-rata hasil

sebesar 89.63% pada accuracy, 80.80% pada precision, 92.12% pada recall dan 89.88% pada f1-score.

(46)

32 5.2. Saran

Pada penelitian kali ini, terdapat beberapa hal yang mungkin dapat dikembangkan dimasa yang akan datang. Oleh sebab itu, penulis ingin memberikan saran kepada para peneliti selanjutnya yang tertarik untuk melakukan penelitian dalam bidang yang terkait diantaranya yaitu:

1. Memperhatikan/mendeteksi p.falciparum yang telah diwarnai giemsa pada sel darah merah yang terinfeksi.

2. Dapat menggunakan data yang berasal dari Indonesia

3. Dapat melakukan perubahan pada arsitektur CNN, loss function, output

(47)

34

REFERENSI

[1] M. Kes et al., “Data dan Informasi Profil Kesehatan di Indonesia,” Jakarta. [2] K. Kesehatan and R. Indonesia, “Laporan Kesehatan Kementrian Kesehatan

2017,” Jakarta.

[3] “The reliability of blood film examination for malaria at the peripheral health unit.” .

[4] M. Hawkes, J. P. Katsuva, and C. K. Masumbuko, “Use and limitations of malaria rapid diagnostic testing by Congo,” vol. 8, pp. 1–8, 2009.

[5] G. Díaz, F. A. González, and E. Romero, “A semi-automatic method for quantification and classification of erythrocytes infected with malaria parasites in microscopic images,” J. Biomed. Inform., vol. 42, no. 2, pp. 296– 307, 2009.

[6] M. Poostchi, K. Silamut, R. J. Maude, S. Jaeger, and G. Thoma, “Image analysis and machine learning for detecting malaria,” Transl. Res., vol. 194, pp. 36–55, 2018.

[7] Y. Lecun, Y. Bengio, and G. Hinton, “Deep learning,” 2015.

[8] S. Rajaraman et al., “Pre-trained convolutional neural networks as feature extractors toward improved malaria parasite detection in thin blood smear images,” pp. 1–17, 2018.

[9] S. Xie and F. Ai, “Exploring Randomly Wired Neural Networks for Image Recognition.”

[10] D. C. Warhurst and J. E. Williams, “Laboratory diagnosis of malaria,” no. 148, pp. 533–538, 1996.

[11] E. Tjitra, S. R. I. Suprianto, M. Dyer, and B. J. Currie, “Field Evaluation of the ICT Malaria P . f / P . v Immunochromatographic Test for Detection of Plasmodium falciparum and Plasmodium vivax in Patients with a Presumptive Clinical Diagnosis of Malaria in Eastern Indonesia,” vol. 37, no. 8, pp. 2412–2417, 1999.

[12] I. Goodfellow, “Deep Learning.”

[13] A. Textbook, Neural Networks and Deep Learning. yorktown heigths: IBM T. J. Watson Research Center.

[14] N. Shirish and K. Richard, “Improving Generalization Performance by Switching from Adam to SGD,” no. 1, 2017.

(48)

34

Watson Research Center.

[16] D. J. Watts and S. H. Strogatz, “Collective dynamics of ‘small-world’ networks,” vol. 393, no. June, pp. 440–442, 1998.

[17] F. A. Ifdillah, “Representasi graf acak ( Watts and Strogatz model ) pada Small World Phenomenon : Degrees of Separation,” vol. 1, no. 13514010, 2016.

[18] M. Sokolova, G. L.-I. P. and, and undefined 2009, “A systematic analysis of performance measures for classification tasks,” www-rali.iro.umontreal.ca.

[19] S. G. K. Patro and K. K. Sahu, “Normalization: A Preprocessing Stage,” 2015.

[20] T. PoostchiM, SilamutK, MaudeRJ, JaegerS, “Aplikasi androidnya.pdf,”

Transl. Res., vol. 194, pp. 36–55, 2018.

[21] I. Ersoy, F. Bunyak, J. M. Higgins, and K. Palaniappan, “COUPLED EDGE PROFILE ACTIVE CONTOURS FOR RED BLOOD CELL FLOW ANALYSIS University of Missouri Columbia Department of Computer Science Columbia , MO 65201 Department of Systems Biology MGH Center for Systems Biology , Boston , MA 02114,” pp. 748–751, 2012. [22] S. B. Kotsiantis, D. Kanellopoulos, and P. E. Pintelas, “Data Preprocessing