ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI
LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE
BAYES, DAN K - NN
SKRIPSI Savero Ramadhan
00000026795
PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG
2022
i
Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara
ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI
LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE
BAYES, DAN K - NN
SKRIPSI
Diajukan sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sistem Informasi
Savero Ramadhan 00000026795
PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG
2022
iii
Judul…, Nama Penulis, Universitas Multimedia Nusantara
HALAMAN PERSETUJUAN
Skripsi dengan judul
ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULILINDUNGI MENGGUNAKAN SUPPORT
VECTOR MACHINE, NAÏVE BAYES, DAN K – NN Oleh
Nama : Savero Ramadhan
NIM : 00000026795
Program Studi : Sistem Informasi
Fakultas : Teknik dan Informatika
Telah disetujui untuk diajukan pada
Sidang Ujian Skripsi Universitas Multimedia Nusantara
Tangerang, 3 Januari 2022 Pembimbing
Wira Munggana, S.Si., M.Sc.
( )
Ketua Program Studi Sistem Informasi
Ririn Ikana Desanti, S.Kom., M.Kom.
HALAMAN PENGESAHAN
Skripsi dengan judul
ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULILINDUNGI MENGGUNAKAN SUPPORT
VECTOR MACHINE, NAÏVE BAYES, DAN K – NN Oleh
Nama : Savero Ramadhan
NIM : 00000026795
Program Studi : Sistem Informasi
Fakultas : Teknik dan informatika
Telah diujikan pada hari Jumat, 14 – Januari - 2022 Pukul 15.00 s.d 16.30 dan dinyatakan
LULUS
Dengan susunan penguji sebagai berikut.
Ketua Sidang
Samuel Ady Sanjaya, S.T., M.T.
(0305049402)
Penguji
Monika Evelin Johan, S.Kom., M.M.S.I.
(0327059501/071281) Pembimbing
Wira Munggana, S.Si., M.Sc (023860)
Ketua Sistem Informasi
Ririn Inkana Desanti, S.Kom.,M.Kom
v
Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara
HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Sebagai civitas academica Universitas Multimedia Nusantara, saya yang bertanda tangan di bawah ini:
Nama : Savero Ramadhan
NIM : 00000026795
Program Studi : Sistem Informasi
Fakultas : Teknik dan Informatika
JenisKarya : *Tesis/Skripsi/Tugas Akhir (*coret salah satu)
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Multimedia Nusantara Hak Bebas Royalti Nonekslusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul.
ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA
MENGENAI APLIKASI PEDULILINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE BAYES, DAN K – NN
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Noneksklusif ini, Universitas Multimedia Nusantara berhak menyimpan, mengalihmediakan/mengalihformatkan, mengelola dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta.
Demikian pernyataan ini saya buat dengan sebenarnya.
Tangerang, 3 Januari 2021 Yang menyatakan,
(Savero Ramadhan)
KATA PENGANTAR
Puji dan syukur kepada Tuhan Yang Maha Esa atas segala rahmat-Nya sehingga skripsi yang berjudul “Analisa Sentimen Pendapat Masyarakat Indonesia Terhadap Aplikasi PeduliLindungi Menggunakan Support Vector Machine, Naïve bayes, dan K-NN” dapat diselesaikan dengan tepat waktu. Skripsi ini penulis ajukan kepada Program Strata 1, Program Studi Sistem Informasi, Fakultas Teknik dan Informatika, Universitas Multimedia Nusantara. Setelah melewati berbagai hambatan dan rintangan yang terus dihadapi, penulis sadar bahwa skripsi ini tidak dapat selesai tanpa bantuan dari berbagai pihak. Maka dari itu pada kesempatan ini penulis ingin mengucapkan rasa terima kasih sebesar-besarnya kepada :
Mengucapkan terima kasih
1. Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara.
2. Dr. Eng. Niki Prastomo, S.T., M.Sc.selaku Dekan Fakultas Teknik Informatika Universitas Multimedia Nusantara.
3. Ririn Ikana Desanti, S.Kom., M.Kom., selaku Ketua Program Studi Universitas Multimedia Nusantara.
4. Wira Munggana, S.Si., M.Sc, sebagai Pembimbing pertama yang telah memberikan bimbingan, arahan, dan motivasi atas terselesainya tugas akhir ini.
5. Keluarga kedua orang tua saya terutama Ibu saya dan sahabat yaitu, Krizia Gidion Gaghana, Flavius Ryaas, Ria, Dita Michelle, Joti dan kawan kawan yang telah memberikan bantuan dukungan material moral, sehingga penulis dapat menyelesaikan tugas akhir ini.
Semoga karya ilmiah ini dapat bermanfaat baik menjadi sumberinformasi maupun inspirasi bagi para pembaca
Tangerang, 3 Januari 2021
(Savero Ramadhan)
vii
Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara
ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE
BAYES, DAN K – NN
(Savero Ramadhan) ABSTRAK
Pada tahun 2020, masyarakat global menyaksikan kemunculan virus corona jenis baru penyebab penyakit virus corona, atau yang sekarang dikenal dengan COVID 19. Indonesia merupakan salah satu negara yang terdampak wabah yang satu ini. Pemerintah telah mengambil langkah tegas dalam memerangi penyebaran virus corona di Indonesia, salah satunya lewat teknologi informasi dengan mengembangkan sebuah aplikasi pelacakan atau contact tracing “Pedulilindungi”. Namun kepercayaan masyarakat masih sangatlah minim, dikarenakan beberapa faktor diantaranya adalah informasi yang diberikan kurang tepat dan isu isu kebocoran data pribadi yang dijual secara ilegal.
Tujuan dari penelitian ini adalah untuk mengetahui sentiment masyarakat terhadap aplikasi “Pedulilindungi” Penelitian ini menggunakan analisis sentimen menggunakan text mining. Sumber data yang digunakan adalah data tweet melalui aplikasi Twitter. Data tersebut dikategorikan menggunakan SVM, KNN, dan Naive Bayes untuk mengetahui keakuratan hasil klasifikasi prediksi terhadap sentiment masyarakat. Aplikasi yang digunakan untuk analisis dan klasifikasi sentimen adalah Rapidminer
Data dikumpulkan dengan jangka waktu tanggal 22 November 2021 hingga 27 Desember 2021 dengan jumlah 7.587.Berdasarkan hasil dari Confusion Matrix yang telah dihasilkan algoritma Support Vector Machines lebih baik digunakan dalam penelitian ini dengan hasil akurasi : 71.59% presisi: 74.39%
recall: 58.29%, dan AUC: 0.771 dibandingkan dengan algoritma K-NN dan Naïve bayes
Kata kunci: K-nn, Naïve bayes, PeduliLindungi, sentimen analisis, Support Vector Machine,
SENTIMENT ANALYSIS OF INDONESIAN PEOPLE'S OPINIONS REGARDING PEDULILINDUNGI APPLICATION USING SUPPORT VECTOR MACHINE, NAÏVE BAYES, AND K
– NN
(Savero Ramadhan) ABSTRACT (English)
In 2020, the world community witnessed the emergence of a new type of coronavirus that causes coronavirus disease or now known as COVID-19. Indonesia is one of the countries affected by this outbreak. The government has taken decisive steps in combating the spread of the coronavirus in Indonesia, one of which is through information technology by developing a tracking application or contact tracing
"PeduliLindungi". But public trust is still very minimal, because several factors include the information provided incorrectly and the issue of leaking personal data sold illegally.
The purpose of this study was to find out people's sentiment towards the application
"PeduliLindungi" This study uses sentiment analysis with text mining. The source of the data used is tweet data about the app care protection from Twitter. The data will be classified using SVM, K-NN, and Naïve Bayes to determine the accuracy of public sentiment. The application used for sentiment analysis and classification is Rapidminer.
Based on the results of the Confusion Matrix that has been generated the Support Vector Machines algorithm is better used in this study with accuracy results:
71.59% precision: 74.39% recall: 58.29%, and AUC: 0.771 compared to K-NN and Naïve bayes algorithms
Keywords: K-NN, Text mining, Rapidminer, PeduliLindungi, Sentiment Analysis, Naive Bayes, SVM.
ix
Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara
DAFTAR ISI
HALAMAN PENGESAHAN ... iv
HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... v
KATA PENGANTAR ... vi
ABSTRAK ... vii
ABSTRACT (English) ... viii
DAFTAR ISI ... ix
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiii
DAFTAR RUMUS... xiv
DAFTAR LAMPIRAN ... xv
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang... 1
1.2 Rumusan Masalah ... 5
1.3 Batasan Masalah ... 5
1.4 Tujuan dan Manfaat penelitian ... 5
1.4.1 Tujuan penelitian ... 5
1.4.2 Manfaat Penelitian ... 5
BAB II LANDASAN TEORI ... 7
2.1 Covid – 19 ... 7
2.2 PeduliLindungi ... 7
2.3 Text mining ... 8
2.4 Text processing ... 8
2.5 Analisis sentiment ... 9
2.6 Twitter ... 10
2.7 Naïve bayes ... 10
2.8 Svm ... 11
2.9 K-NN ... 12
2.10 Confusion Matrix ... 14
2.11 Rapid Miner ... 16
2.12 Penelitian terdahulu ... 16
BAB III METODOLOGI PENELITIAN... 22
3.1 Gambaran umum Objek Penelitian ... 22
3.2 Metode Penelitian ... 22
3.3 Variabel penelitian... 23
3.4 Teknik Pengumpulan data ... 24
3.4.2 Pendaftaran akses twitter ... 24
3.4.1 Penggalian data twitter... 24
3.4.1 Twitter data... 24
3.4.3 Seleksi tweet ... 24
3.5 Teknik Analisa data ... 25
3.5.1 Text preprocessing ... 25
3.5.2 Perbandingan Algoritma ... 26
3.6 Pelatihan dan pengujian ... 28
3.7 Evaluasi hasil ... 30
BAB IV ANALISIS DAN HASIL PENELITIAN ... 31
4.1 Penggalian data ... 31
4.1.1 Pendaftaran akses twitter ... 31
4.1.2 Penggalaian data twitter ... 32
4.1.3 Seleksi tweet ... 34
4.2 Text preprocessing ... 34
4.2.1 Data Cleansing ... 34
4.2.2 Data Labeling ... 38
4.2.3. Case Folding ... 40
4.2.4 Tokenize ... 41
4.2.5 Filtering stopword ... 44
4.2.6 Pembobotan Tf -Idf ... 46
4.3 Perancangan model ... 46
4.4 Training model ... 48
4.4.1 Support Vector Machines (SVM) ... 49
4.4.2 Naïve Bayes ... 52
4.4.3 K-NN ... 54
xi
Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara
4.5 Hasil ... 56
BAB V SIMPULAN DAN SARAN ... 60
5.1 Kesimpulan ... 60
5.2 Saran ... 60
DAFTAR PUSTAKA ... 62
LAMPIRAN ... 65
DAFTAR TABEL
Table 2. 1 Confusion Matrix ... 15
Table 2. 2 Penelitian terdahulu... 16
Tabel 3. 1 Perbandingan algoritma ... 27
Tabel 3. 2 Skenario Perbandingan Data Training & testing ... 29
Tabel 4. 1 Data Raw ... 33
Tabel 4. 2 Remove punctuation ... 37
Tabel 4. 3 Case Folding ... 40
Tabel 4. 4 Tokenize ... 42
Tabel 4. 5 K-Fold SVM ... 52
Tabel 4. 6 K-Fold NBC ... 54
Tabel 4. 7 K-Fold K-NN ... 56
Tabel 4. 8 Hasil akurasi Setiap Algoritma ... 57
xiii
Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara
DAFTAR GAMBAR
Gambar 1. 1 PeduliLindungi ... 2
Gambar 2. 1 Twitter ... 10
Gambar 2. 2 hyperplane ... 12
Gambar 2. 3 Confusion Matrix... 14
Gambar 2. 4 Rapidminer 16 Gambar 3. 1 Kerangka pikir penelitian. ... 23
Gambar 4. 1 Pendaftaran Akses ... 31
Gambar 4. 2 penggalian data ... 32
Gambar 4. 3 hasil Scraping data ... 33
Gambar 4. 4 Cleansing Process ... 35
Gambar 4. 5 Cleansing Data ... 35
Gambar 4. 6 Remove URL ... 36
Gambar 4. 7 Remove Punctuation ... 37
Gambar 4. 8 Data labeling ... 39
Gambar 4. 9 Case Folding ... 40
Gambar 4. 10 Tokenize ... 42
Gambar 4. 11 Main Process ... 43
Gambar 4. 12 sub process ... 44
Gambar 4. 13 Stopword ... 45
Gambar 4. 14 Pembobotan ... 46
Gambar 4. 15 Main Process ... 48
Gambar 4. 16 K-Fold ... 49
Gambar 4. 17 kerangka kerja SVM... 50
Gambar 4. 18 SVM ... 50
Gambar 4. 19 hasil SVM ... 50
Gambar 4. 20 Confusion matriks 8 Fold ... 51
Gambar 4. 21 kerangka kerja NBC ... 52
Gambar 4. 22 Hasil NBC ... 53
Gambar 4. 23 Confusion matriks 3 Fold ... 53
Gambar 4. 24 Kerangka K-NN ... 54
Gambar 4. 25 Hasil K-NN ... 55
Gambar 4. 26 Confusion Matrix 9 Fold ... 55
Gambar 4. 27 Bar chart ... 58
DAFTAR RUMUS
Rumus 2. 1 NVB ... 11 Rumus 2. 2 K-NN ... 13
xv
Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara
DAFTAR LAMPIRAN
lampiran turnitin 1 ... 65