Analisis Sentimen Masyarakat Terhadap Penerapan Work From Home Berdasarkan Data Twitter Menggunakan Metode Naïve
Bayes Classifier Berbasis PSO
TUGAS AKHIR
Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Pro- gram Studi Informatika Universitas Muhammadiyah Malang
Rista Azizah Arilya 201710370311184
Bidang Minat Data Science
PROGRAM STUDI INFORMATIKA UNIVERSITAS MUHAMMADIYAH MALANG
2021
i
LEMBAR PERSETUJUAN
Analisis Sentimen Masyarakat Terhadap Penerapan Work From Home Berdasarkan Data Twitter Menggunakan Metode Naïve
Bayes Classifier Berbasis PSO
TUGAS AKHIR
Sebagai persyaratan Guna Meraih Gelar Sarjana Strata 1 Program Studi Informatika Universitas Muhammadiyah Malang
Menyetujui, Malang,
Dosen II
Didih Rizki Chandranegara, S.Kom., M.Kom.
NIDN. 0702109201
Dosen I
Yufis Azhar, S.Kom., M.Kom.
NIP. 108.1410.0544
iii
LEMBAR PERNYATAAN
viii
KATA PENGANTAR
Dengan memanjatkan puji syukur kehadirat Allah SWT atas limpahan rahmat dan hi- dayah-Nya sehingga penulis mampu menyelesaikan tugas akhir yang berjudul
“Analisis Sentimen Masyarakat Terhadap Penerapan Work From Home Berdasarkan Data Twitter Menggunakan Metode Naïve Bayes
Classifier Berbasis PSO”
Di dalam penelitian ini disajikan pokok-pokok pembahasan yang meliputi pengambi- lan data tweet terkait penerapan work from home, pembersihan data (preprocessing), pemberian nilai atau pembobotan kata serta melakukan perbandingan dengan menggunakan dua metode. Tugas akhir ini merupakan salah satu syarat studi yang ha- rus ditempuh oleh seluruh mahasiswa Universitas Muhammadiyah Malang, guna untuk menyelesaikan studi pada jenjang program strata 1.
Penulis menyadari sepenuhnya bahwa dalam pengerjaan dan penulisan tugas akhir ini masih ada banyak kekurangan dan kesalahan. Oleh karena itu, penulis mengharapkan saran yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu dan pengetahuan.
Malang, 15 September 2021
Rista Azizah Arilya
viii
DAFTAR ISI
LEMBAR PERSETUJUAN ... i
LEMBAR PENGESAHAN ... i
LEMBAR PERNYATAAN ... iii
ABSTRAK ... iv
ABSTRACT ... v
LEMBAR PERSEMBAHAN ... vi
DAFTAR ISI ... viii
DAFTAR TABEL ... x
DAFTAR GAMBAR ... xi
BAB 1 PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 3
1.3 Tujuan ... 3
1.4 Batasan Masalah ... 3
BAB 2 TINJAUAN PUSTAKA ... 4
2.1 Kajian Pustaka ... 4
2.2 Pre-Processing Text ... 6
2.3 Analisis sentimen ... 7
2.4 Work From Home ... 8
2.5 Twitter ... 8
2.6 Pembobotan Kata (Term Weighting) ... 9
2.7 Seleksi Fitur ... 10
2.8 Metode Naïve Bayes ... 11
2.9 Evaluasi Model ... 12
BAB 3 METODE PENELITIAN ... 14
3.1 Pengumpulan Data ... 15
3.2 Manual Labelling ... 15
3.3 Pre-Processing Text ... 17
3.4 Pembobotan Kata (Term Weighting) ... 20
ix
3.5 Particle Swarm Optimization (PSO) ... 20
3.6 Metode Naïve Bayes ... 22
3.7 Analisa model ... 24
3.8 Skenario Pengujian ... 24
BAB 4 IMPLEMENTASI DAN PENGUJIAN ... 25
4.1 Pengumpulan data ... 25
4.2 Pre-Processing ... 27
4.3 Visualisasi WordCloud ... 30
4.4 Term Frequency-Inverse Document Frequency ... 32
4.5 Algoritma Particle Swarm Optimization (PSO) ... 34
4.6 Algoritma Naïve Bayes Classifier ... 35
4.7 Algoritma Naïve Bayes Classifier berbasis PSO ... 37
4.8 Implementasi ... 38
BAB 5 KESIMPULAN DAN SARAN ... 48
5.1 Kesimpulan ... 48
5.2. Saran ... 48
DAFTAR PUSTAKA ... 49
x
DAFTAR TABEL
Tabel 2.1 Jurnal Penelitian Terkait Sentimen Analisis ... 5
Tabel 3.1 Contoh Dataset ... 15
Tabel 3.2 Perbandingan data tweet pada proses case folding ... 17
Tabel 3.3 Perbandingan data tweet pada proses Tokenization ... 17
Tabel 3.4 Perbandingan data tweet pada proses Normalizing ... 18
Tabel 3.5 Perbandingan data tweet pada proses stop forward removal ... 18
Tabel 3.6 Perbandingan data tweet pada proses stemming ... 19
Tabel 3.7 Perbandingan data tweet pada proses cleaning ... 19
Tabel 3.8 Confusion Matrix ... 24
xi
DAFTAR GAMBAR
Gambar 3.1 Flowchart Metode Penelitian ... 14
Gambar 3.2 Flowchart Particle Swarm Optimization ... 22
Gambar 3.3 Flowchart pada alur Naïve Bayes ... 23
Gambar 4.1 Proses crawling data twitter... 26
Gambar 4.2 Proses pengambilan data manual dari twitter ... 26
Gambar 4.3 Syntax Cleaning ... 27
Gambar 4.4 Syntax Case Folding ... 28
Gambar 4.5 Syntax tokenizing ... 28
Gambar 4.6 Syntax normalizing ... 28
Gambar 4.7 Syntax Stopwords Removing ... 29
Gambar 4.8 Syntax Stemming ... 30
Gambar 4.9 Visualisasi WordCloud sentimen positif ... 31
Gambar 4.10 Visualisasi WordCloud sentimen negatif ... 31
Gambar 4.11 Syntax menggunakan TfidfVectorizer ... 32
Gambar 4.12 Syntax menghitung nilai TF ... 32
Gambar 4.13 Syntax menghitung nilai IDF ... 33
Gambar 4.14 Syntax menghitung nilai TF-IDF ... 34
Gambar 4.15 Hasil TF-IDF ... 34
Gambar 4.16 Syntax import library ... 34
Gambar 4.17 Syntax inisialisasi parameter ... 35
Gambar 4.18 Import library Naïve Bayes ... 35
Gambar 4.19 Syntax split data ... 36
Gambar 4.20 Tunning Hyperparameter MultinomialNB ... 36
Gambar 4.21 Syntax untuk performance ... 37
Gambar 4.22 Syntax algoritma Naïve Bayes Classifier berbasis PSO ... 37
Gambar 4.23 Syntax Particle Generating Function ... 38
Gambar 4.24 Prediksi label class pengujian 1 NB ... 39
Gambar 4.25 Prediksi label class pengujian 2 NB ... 40
Gambar 4.26 Prediksi label class pengujian 3 NB ... 40
xii
Gambar 4.27 Prediksi label class pengujian 1 NB+PSO ... 42
Gambar 4.28 Prediksi label class pengujian 2 NB+PSO ... 43
Gambar 4.29 Prediksi label class pengujian 3 NB+PSO ... 43
Gambar 4.30 Perbandingan hasil evaluasi dua skenario ... 46
49
DAFTAR PUSTAKA
[1] M. S. Hadna, P. I. Santosa, and W. W. Winarno, “Studi Literatur Tentang Perbandingan Metode Untuk Proses Analisis Sentimen Di Twitter,” Semin. Nas.
Teknol. Inf. dan Komun., vol. 2016, no. Sentika, pp. 57–64, 2016.
[2] S. A. Aaputra, Didi Rosiyadi, Windu Gata, and Syepry Maulana Husain,
“Sentiment Analysis Analisis Sentimen E-Wallet Pada Google Play Menggunakan Algoritma Naive Bayes Berbasis Particle Swarm Optimization,”
J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 3, no. 3, pp. 377–382, 2019.
[3] R. Aulianita, A. Maezar, B. Aji, and Y. E. Achyani, “Text Mining Menggunakan Naive Bayes Berbasis Particle Swarm Optimization Untuk Sentiment Restaurant,” vol. 6, no. 1, pp. 21–29, 2021.
[4] Majdah Zawawi1 and Noriah Ramli, “Penerapan Particle Swarm Optimization Untuk Seleksi Fitur Pada Analisis Sentimen Review Perusahaan Penjualan Online Menggunakan Naïve Bayes,” Evolusi, vol. 4, no. May, pp. 31–48, 2016.
[5] D. T. Lukmana, S. Subanti, and Y. Susanti, “Analisis Sentimen Terhadap Calon Presiden 2019 Dengan Support Vector Machine Di Twitter,” Semin. Nas.
Penelit. Pendidik. Mat. 2019 UMT, no. 2002, pp. 154–160, 2019.
[6] J. A. Septian, T. M. Fahrudin, and A. Nugroho, “Analisis Sentimen Pengguna Twitter Terhadap Polemik Persepakbolaan Indonesia Menggunakan Pembobotan TF - IDF dan K - Nearest Neighbor,” J. Intell. Syst. Comput., no.
September, pp. 43–49, 2019.
[7] D. Alita, Y. Fernando, and H. Sulistiani, “Implementasi Algoritma Multiclass SVM Pada Opini Publik Berbahasa Indonesia Di Twitter,” J. TEKNOKOMPAK, vol. 14, no. 2, p. 86, 2020.
[8] A. Fauzi, M. F. Akbar, and Y. F. A. Asmawan, “Sentimen Analisis Berinternet Pada Media Sosial dengan Menggunakan Algoritma Bayes,” J. Inform., vol. 6,
50
no. 1, pp. 77–83, 2019, doi: 10.31311/ji.v6i1.5437.
[9] R. Wati, “Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen Review Jasa Maskapai Penerbangan,” J. Evolusi, vol. 4, no. 1, pp. 25–
31, 2016.
[10] A. Nugroho, “Analisis Sentimen Pada Media Sosial Twitter Menggunakan Naive Bayes Classifier Dengan Ekstrasi Fitur N-Gram,” J-SAKTI (Jurnal Sains Komput. dan Inform., vol. 2, no. 2, p. 200, 2018, doi: 10.30645/j-sakti.v2i2.83.
[11] J. Ipmawati, Kusrini, and E. Taufiq Luthfi, “Komparasi Teknik Klasifikasi Teks Mining Pada Analisis Sentimen,” Indones. J. Netw. Secur., vol. 6, no. 1, pp. 28–
36, 2017.
[12] M. N. dan T. A. P. Alfareza, “Analisis Sentimen ZOOM Cloud Meetings Pada Google Play Store Review,” Semin. Nas. Tek. Ind. Univ. Gajah Mada, pp. 42–
45, 2020.
[13] S. Khairunnisa, A. Adiwijaya, and S. Al Faraby, “Pengaruh Text Preprocessing terhadap Analisis Sentimen Komentar Masyarakat pada Media Sosial Twitter (Studi Kasus Pandemi COVID-19),” J. Media Inform. Budidarma, vol. 5, no. 2, p. 406, 2021, doi: 10.30865/mib.v5i2.2835.
[14] N. T. Romadloni, I. Santoso, and S. Budilaksono, “Perbandingan Metode Naive Bayes , Knn Dan Decision Tree Terhadap Analisis Sentimen Transportasi Krl,”
J. IKRA-ITH Inform., vol. 3, no. 2, pp. 1–9, 2019.
[15] R. Ardianto, T. Rivanie, Y. Alkhalifi, F. S. Nugraha, and W. Gata, “Sentiment Analysis on E-Sports for Education Curriculum Using Naive Bayes and Support Vector Machine,” J. Ilmu Komput. dan Inf., vol. 13, no. 2, pp. 109–122, 2020, doi: 10.21609/jiki.v13i2.885.
[16] W. E. Nurjanah, R. S. Perdana, and M. A. Fauzi, “Analisis Sentimen Terhadap Tayangan Televisi Berdasarkan Opini Masyarakat pada Media Sosial Twitter menggunakan Metode K-Nearest Neighbor dan Pembobotan Jumlah Retweet,”
51
J. Pengemb. Teknol. Inf. dan Ilmu Komput. Univ. Brawijaya, vol. 1, no. 12, pp.
1750–1757, 2017.
[17] N. Hayatin, G. I. Marthasari, and L. Nuarini, “Optimization of Sentiment Analysis for Indonesian Presidential Election using Naive Bayes and Particle Swarm Optimization,” J. Online Inform., vol. 5, no. 1, pp. 81–88, 2020, doi:
10.15575/join.v5i1.558.
[18] A. R. Nur Shafiya, Ahmad Afif, “Analisis Sentimen Opini Mahasiswa Terhadap Saran Evaluasi Kinerja Dosen Menggunakan TF-IDF dan K-Nearest Neighbor,”
Progr. Stud. Sist. Informasi, Fak. Ilmu Komputer, Univ. Brawijaya, vol. 3, no.
6, pp. 5647–5655, 2019.
[19] A. Salam, J. Zeniarja, and R. S. U. Khasanah, “Analisis Sentimen Data Komentar Sosial Media Facebook Dengan K-Nearest Neighbor (Studi Kasus Pada Akun Jasa Ekspedisi Barang J&T Ekpress Indonesia),” Pros. SINTAK, pp.
480–486, 2018.
[20] R. Rasenda, H. Lubis, and R. Ridwan, “Implementasi K-NN Dalam Analisa Sentimen Riba Pada Bunga Bank Berdasarkan Data Twitter,” J. Media Inform.
Budidarma, vol. 4, no. 2, p. 369, 2020, doi: 10.30865/mib.v4i2.2051.
[21] M. Syarifuddin, “Analisis Sentimen Opini Publik Mengenai Covid-19 Pada Twitter Menggunakan Metode Naïve Bayes Dan Knn,” Inti Nusa Mandiri, vol.
15, no. 1, pp. 23–28, 2020.
[22] S. Rizkia, E. Budi Setiawan, and D. Puspandari, “Analisis Sentimen Kepuasan Pelanggan Terhadap Internet Provider Indihome di Twitter Menggunakan Metode Decision Tree dan Pembobotan TF-IDF,” e-Proceeding Eng., vol. 6, no.
2, pp. 9683–9693, 2019.
[23] R. Habibi, D. B. Setyohadi, and E. Wati, “Analisis Sentimen Pada Twitter Mahasiswa Menggunakan Metode Backpropagation,” J. Inform., vol. 12, no. 1, pp. 103–109, 2016, doi: 10.21460/inf.2016.121.462.
52
[24] E. Indrayuni, “Analisa Sentimen Review Hotel Menggunakan Algoritma Support Vector Machine Berbasis Particle Swarm Optimization,” J. Evolusi Vol.
4 Nomor 2 - 2016, vol. 4, no. 2, pp. 20–27, 2016.
[25] M. Badrul and M. M. A. Id, “Optimasi Algoritma Neural Network Dengan Algoritma Genetika Dan Particle Swarm Optimization Untuk Memprediksi Hasil Pemilukada,” Pilar Nusa Mandiri, vol. 13, no. 1, pp. 1–11, 2017.
[26] S. Suryono and E. Taufiq Luthfi, “Analisis sentimen pada Twitter dengan menggunakan metode Naïve Bayes Classifier,” Jnanaloka, pp. 81–86, 2021, doi: 10.36802/jnanaloka.2020.v1-no2-81-86.
[27] F. Ratnawati, “Implementasi Algoritma Naive Bayes Terhadap Analisis Sentimen Opini Film Pada Twitter,” INOVTEK Polbeng - Seri Inform., vol. 3, no. 1, p. 50, 2018, doi: 10.35314/isi.v3i1.335.