Analisis Sentimen Covid-19 Menggunakan Metode Deep Neural Network dan Pembobotan Hybrid TF-IDF
Laporan Tugas Akhir
Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Informatika Universitas Muhammadiyah Malang
Mohamad Anton Budiarto (201610370311165)
Data Science
PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2021
i
LEMBAR PERSETUJUAN
Analisis Sentimen Covid-19 Menggunakan Metode Deep Neural Network dan Pembobotan Hybrid TF-IDF
Mohamad Anton Budiarto 201610370311165
Telah Direkomendasikan Untuk Diajukan Sebagai Judul Tugas Akhir Di
Program Studi Informatika Universitas Muhammadiyah Malang
Menyetujui,
Dosen I Dosen II
Christian Sri Kusuma, S.Kom, M.Kom NIP. 180.3270.2191
Galih Wasis Wicaksono S.Kom, M.Cs NIP. 180.1410.0541
ii
LEMBAR PENGESAHAN
Analisis Sentimen Covid-19 Menggunakan Metode Deep Neural Network dan Pembobotan Hybrid TF-IDF
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh:
Mohamad Anton Budiarto 201610370311165
Tugas Akhir Ini Telah Diuji dan Dinyatakan Lulus Melalui Sidang Majelis Penguji Pada Tanggal 00 Agustus 2021
Menyetujui,
Penguji I Penguji II,
Yufis Azhar, S.Kom., M.Kom NIP.108.1410.0544
Didih Rizki Chandranegara, S.Kom., M.Kom NIDN.0702109201
Mengetahui,
Ketua Jurusan Teknik Informatika
Gita Indah Marthasari, S.T., M.Kom NIP.108.0611.0442
vi
KATA PENGANTAR
مسب الله
رلا نمح رلا
ميح
Puji Syukur Alhamdulillah senantiasa penulis ucapkan atas kehadirat Allah SWT yang telah melimpahkan Rahmat, Taufik serta Hidayah-nya sehingga pada akhirnya mampu menyelesaikan tugas akhir dengan judul “Analisis Sentimen Covid-19 Menggunakan Metode Deep Neural Network dan Pembobotan Hybrid TF-IDF”, meskipun masih terdapat banyak kekurangan. Shalawat serta salam semoga selalu tercurah kepada junjungan kita Baginda Rasullah Muhammad SAW.
Penyusunan Tugas Akhir ini diajukan untuk memenuhi syarat akademis dalam rangka menyelesaikan Studi S1 Program Studi Teknik Informatika di Fakultas Teknik Universitas Muhammadiyah Malang. Penulis menyadari bahwa dalam penyusunan tugas akhir ini tidak lepas dari bimbingan dan bantuan dari berbagai pihak. Oleh karena itu, dalam kesempatan ini penulis ucapkan terima kasih kepada :
1. Kedua orang tua tercinta, Budairi dan Mariati. Dengan restu, doa, nasihat dan tidak lupa perjuangannya menjadi cambuk penyemangat untuk menuntaskan tugas akhir ini.
2. Bapak Christian Sri Kusuma, S.Kom, M.Kom., selaku Dosen Pembimbing 1 dan Bapak Galih Wasis Wicaksono, S.Kom, M.Cs., selaku Dosen Pembimbing 2 yang selalu bersedia meluangkan waktu dan tenaga untuk memberikan arahan, petunjuk, serta saran dengan sabar karena saya sadari terkadang perlu beberapa kali penjelasan agar saya dapat memahami.
3. Sahabat saya Nurudin, Royhan, Rizqi, Ilham, Taufik, Fauzi, Ical, Rofif. Sahabat seperjuangan dalam menuntut ilmu, yang selalu membantu tanpa pandang bulu.
4. Dan Segenap teman – teman yang tidak bisa disebutkan satu persatu yang memberikan motivasi selama penyusunan tugas akhir ini.
Penulis menyadari masih banyak kekurangan dalam penulisan tugas akhir ini. Untuk itu, penulis sangat mengharapkan saran yang membangun agar tulisan ini dapat berguna untuk perkembangan ilmu pengetahuan kedepannya.
Malang, 0 Agustus 2021 Penulis
Mohamad Anton Budiarto
vii DAFTAR ISI
LEMBAR PERSETUJUAN ... i
LEMBAR PENGESAHAN ... ii
LEMBAR PERNYATAAN ... iii
ABSTRAK... iv
ABSTRACT ... v
KATA PENGANTAR... vi
DAFTAR ISI ... vii
DAFTAR GAMBAR ... ix
DAFTAR TABEL ... x
BAB I ... 1
PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 3
1.3 Tujuan Penelitian ... 3
1.4 Cakupan Masalah ... 3
BAB II ... 4
TINJAUAN PUSTAKA ... 4
2.1 Studi Literatur ... 4
2.1.1 Penelitian Terdahulu ... 4
2.2 COVID-19 ... 5
2.3 Twitter ... 5
2.4 Twitter API (Application Programming Interface)... 6
2.5 Analisis Sentimen ... 6
2.6 Crawling Data ... 6
2.7 Anotasi Data ... 7
2.8 Preprocessing Data... 7
2.9 Hybrid TF-IDF(Term Frequency-Inverse Document Frequency) ... 8
2.10 Deep Neural Network ... 9
2.11 Pengujian (Confusion Matrix) ... 11
BAB III ... 12
METODE PENELITIAN ... 12
3.1 Identifikasi Masalah ... 12
3.2 Analisa Kebutuhan ... 12
3.3 Rancangan Penelitian ... 12
viii
3.3.1 Crawling Data ... 13
3.3.2 Preprocessing Data... 14
3.3.3 Hybrid TF-IDF ... 16
3.3.4 Klasifikasi DNN ... 18
3.3.5 Evaluasi ... 20
BAB IV... 21
HASIL DAN PEMBAHASAN ... 21
4.1 Crawling Data ... 21
4.1.1 Data Twitter ... 21
4.1.2 Crawling ... 22
4.2 Preprocessing Data ... 23
4.2.1 Cleansing ... 23
4.2.2 Case Folding ... 23
4.2.3 Tokenizing ... 24
4.2.4 Filtering dan Stemming ... 24
4.3 Pembobota Hybrid TF-IDF ... 25
4.4 Klasifikasi Deep Neural Network ... 26
4.5 Hasil dan Pembahasan... 27
4.5.1 Pengujian Distribusi Dataset ... 28
4.5.2 Pengujian Learning Rate ... 30
4.5.3 Pengujian Penambahan Epoch... 31
BAB V ... 34
PENUTUP ... 34
5.1 KESIMPULAN ... 34
5.2 SARAN ... 34
DAFTAR PUSTAKA ... 35
ix
DAFTAR GAMBAR
Gambar 2. 1 Alur Preprocessing Data ... 7
Gambar 2. 2 Alur Hybrid TF-IDF... 9
Gambar 2. 3 Contoh Arsitektur Deep Neural Network... 10
Gambar 2. 4 Alur Klasifikasi Deep Neural Network ... 10
Gambar 3. 1 Rancangan Penelitian ... 13
Gambar 3. 2 Arsitektur Deep Neural Network ... 19
Gambar 4. 1 Keys dan Access Tokens Twitter... 21
Gambar 4. 2 Import library dan inisialisasi API Twitter... 22
Gambar 4. 3 Crawling data ... 22
Gambar 4. 4 Implementasi Cleansing ... 23
Gambar 4. 5 Implementasi Case Folding ... 24
Gambar 4. 6 Implemetasi Tokenizing ... 24
Gambar 4. 7 Implentasi Filtering dan Stemming ... 25
Gambar 4. 8 Implentasi Hybrid TF-IDF ... 25
Gambar 4. 9 Implentasi Labeling Data ... 25
Gambar 4. 10 Implentasi Pembagian Data Train dan Data Test ... 26
Gambar 4. 11 Implentasi Pemodelan Klasifikasi DNN ... 26
Gambar 4. 12 Metode Optimizer Adam ... 27
Gambar 4. 13 Building Model ... 27
Gambar 4. 14 Output Model ... 28
Gambar 4. 15 Implementasi Evaluasi ... 29
Gambar 4. 16 Grafik Accuracy dan Grafik Loss ... 29
Gambar 4. 17 Penyebaran Varian Jumlah Kata ... 30
Gambar 4. 18 Diagram Bar Ouput Model Pengujian Tahap 2 ... 31
Gambar 4. 19 Diagram Bar Ouput Model Pengujian Tahap 3 ... 32
Gambar 4. 20 Grafik Accuracy dan Grafik Loss ... 32
x
DAFTAR TABEL
Tabel 2. 1 Confusion Matrix... 11
Tabel 3. 1 Contoh Dataset Hasil Crawling ... 13
Tabel 3. 2 Hasil Cleansing... 14
Tabel 3. 3 Hasil Case Folding... 14
Tabel 3. 4 Hasil Tokenizing ... 15
Tabel 3. 5 Hasil Filtering ... 15
Tabel 3. 6 Hasil Stemming ... 16
Tabel 3. 7 Contoh Kalimat ... 16
Tabel 3. 8 Contoh Perhitungan Hyrbrid TF-IDF ... 17
Tabel 3. 9 Distribusi Jumlah Data... 19
Tabel 3. 10 Penyesuaian Learning Rate ... 19
Tabel 3. 11 Penambahan Epoch ... 20
Tabel 4. 1 Ouput Model Pengujian Tahap 1 ... 28
Tabel 4. 2 Hasil Evaluasi Pengujian Tahap 1 ... 29
Tabel 4. 3 Ouput Model Pengujian Tahap 2 ... 30
Tabel 4. 4 Ouput Model Pengujian Tahap 3 ... 31
35
DAFTAR PUSTAKA
[1] G. A. Buntoro, “Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter,” INTEGER J. Inf. Technol., vol. 1, no. 1, pp. 32–41, 2017.
[2] E. Yulianto, “Virus Corona,” 7 January, 2021. [Online]. Available:
https://www.alodokter.com/virus-corona. [Accessed: 08-Jan-2021].
[3] S. Wahyunita, “Analisa Sentimen Tweet Berbahasa Indonesia dengan Menggunakan Metode Pembobotan Hybrid TF-IDF pada Topik Transportasi Online,” J. Repos., vol. 2, no. 7, p. 977, 2020.
[4] D. H. Wahid and A. SN, “Peringkasan Sentimen Esktraktif di Twitter Menggunakan Hybrid TF-IDF dan Cosine Similarity,” IJCCS (Indonesian J. Comput. Cybern. Syst., vol. 10, no. 2, p. 207, 2016.
[5] S. P. Perdana, B. Irawan, and C. Setianingsih, “Hate speech detection in indonesian language on instagram comment section using Deep Neural Network method,” Proc. - 2019 IEEE Int. Conf. Internet Things Intell. Syst.
IoTaIS 2019, pp. 98–104, 2019.
[6] M. Syarifuddin, “Analisis Sentimen Opini Publik Mengenai Covid-19 Pada Twitter Menggunakan Metode Naïve Bayes Dan Knn,” Inti Nusa Mandiri, vol. 15, no. 1, pp. 23–28, 2020.
[7] M. W. Pertiwi, “Analisis Sentimen Opini Publik Mengenai Sarana Dan Transportasi Mudik Tahun 2019 Pada Twitter Menggunakan Algoritma Naïve Bayes, Neural Network, KNN dan SVM,” Inti Nusa Mandiri, vol.
14, no. 1, pp. 27–32, 2019.
[8] R. Pebrianto, T. Rivanie, R. Nurfalah, W. Gata, and M. F. Julianto,
“Adopsi Algorithm Support Vector Machine untuk Analisis Sentimen Larangan Mudik Lebaran 2020 pada Twitter,” vol. VI, pp. 193–199, 2020.
[9] W. A. Luqyana, I. Cholissodin, and R. S. Perdana, “Analisis Sentimen Cyberbullying Pada Komentar Instagram dengan Metode Klasifikasi Support Vector Machine,” J. Pengemb. Teknol. Inf. dan Ilmu Komput.
Univ. Brawijaya, vol. 2, no. 11, pp. 4704–4713, 2018.
[10] I. Zulfa and E. Winarko, “Sentimen Analisis Tweet Berbahasa Indonesia Dengan Deep Belief Network,” IJCCS (Indonesian J. Comput. Cybern.
36 Syst., vol. 11, no. 2, p. 187, 2017.
[11] V. K. S. Que, A. Iriani, and H. D. Purnomo, “Analisis Sentimen Transportasi Online Menggunakan Support Vector Machine Berbasis Particle Swarm Optimization,” J. Nas. Tek. Elektro dan Teknol. Inf., vol. 9, no. 2, pp. 162–170, 2020.
[12] A. P. Giovani, A. Ardiansyah, T. Haryanti, L. Kurniawati, and W. Gata,
“Analisis Sentimen Aplikasi Ruang Guru Di Twitter Menggunakan Algoritma Klasifikasi,” J. Teknoinfo, vol. 14, no. 2, p. 115, 2020.
[13] D. Febryanto, “Pembuat Berita Otomatis dari Topik Populer pada Twitter Menggunakan Phrase Reinforcement Algorithm dan Pembobotan Hybrid TF-IDF,” 2011.
[14] B. Sharifi, M. A. Hutton, and J. K. Kalita, “Experiments in microblog summarization,” Proc. - Soc. 2010 2nd IEEE Int. Conf. Soc. Comput.
PASSAT 2010 2nd IEEE Int. Conf. Privacy, Secur. Risk Trust, pp. 49–56, 2010.
[15] A. Simsek and P. Karagoz, “Sentiment enhanced hybrid TF-IDF for microblogs,” Proc. - 4th IEEE Int. Conf. Big Data Cloud Comput.
BDCloud 2014 with 7th IEEE Int. Conf. Soc. Comput. Networking, Soc.
2014 4th Int. Conf. Sustain. Comput. C, no. December 2012, pp. 311–317, 2014.
[16] A. M. Ramadhani and H. S. Goo, “Twitter sentiment analysis using deep learning methods,” Proc. - 2017 7th Int. Annu. Eng. Semin. Ina. 2017, 2017.
[17] D. Xianzhi, “Research on Camera Calibration Technology Based on Deep Neural Network in Mine Environment,” Proc. - 2020 Int. Conf. Comput.
Vision, Image Deep Learn. CVIDL 2020, no. Cvidl, pp. 375–379, 2020.