• Tidak ada hasil yang ditemukan

ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE BAYES, DAN K - NN

N/A
N/A
Protected

Academic year: 2022

Membagikan "ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE BAYES, DAN K - NN"

Copied!
16
0
0

Teks penuh

(1)

ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI

LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE

BAYES, DAN K - NN

SKRIPSI Savero Ramadhan

00000026795

PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2022

(2)

i

Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara

ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI

LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE

BAYES, DAN K - NN

SKRIPSI

Diajukan sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sistem Informasi

Savero Ramadhan 00000026795

PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2022

(3)
(4)

iii

Judul…, Nama Penulis, Universitas Multimedia Nusantara

HALAMAN PERSETUJUAN

Skripsi dengan judul

ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULILINDUNGI MENGGUNAKAN SUPPORT

VECTOR MACHINE, NAÏVE BAYES, DAN K – NN Oleh

Nama : Savero Ramadhan

NIM : 00000026795

Program Studi : Sistem Informasi

Fakultas : Teknik dan Informatika

Telah disetujui untuk diajukan pada

Sidang Ujian Skripsi Universitas Multimedia Nusantara

Tangerang, 3 Januari 2022 Pembimbing

Wira Munggana, S.Si., M.Sc.

( )

Ketua Program Studi Sistem Informasi

Ririn Ikana Desanti, S.Kom., M.Kom.

(5)

HALAMAN PENGESAHAN

Skripsi dengan judul

ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULILINDUNGI MENGGUNAKAN SUPPORT

VECTOR MACHINE, NAÏVE BAYES, DAN K – NN Oleh

Nama : Savero Ramadhan

NIM : 00000026795

Program Studi : Sistem Informasi

Fakultas : Teknik dan informatika

Telah diujikan pada hari Jumat, 14 – Januari - 2022 Pukul 15.00 s.d 16.30 dan dinyatakan

LULUS

Dengan susunan penguji sebagai berikut.

Ketua Sidang

Samuel Ady Sanjaya, S.T., M.T.

(0305049402)

Penguji

Monika Evelin Johan, S.Kom., M.M.S.I.

(0327059501/071281) Pembimbing

Wira Munggana, S.Si., M.Sc (023860)

Ketua Sistem Informasi

Ririn Inkana Desanti, S.Kom.,M.Kom

(6)

v

Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara

HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Sebagai civitas academica Universitas Multimedia Nusantara, saya yang bertanda tangan di bawah ini:

Nama : Savero Ramadhan

NIM : 00000026795

Program Studi : Sistem Informasi

Fakultas : Teknik dan Informatika

JenisKarya : *Tesis/Skripsi/Tugas Akhir (*coret salah satu)

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Multimedia Nusantara Hak Bebas Royalti Nonekslusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul.

ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA

MENGENAI APLIKASI PEDULILINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE BAYES, DAN K – NN

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Noneksklusif ini, Universitas Multimedia Nusantara berhak menyimpan, mengalihmediakan/mengalihformatkan, mengelola dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta.

Demikian pernyataan ini saya buat dengan sebenarnya.

Tangerang, 3 Januari 2021 Yang menyatakan,

(Savero Ramadhan)

(7)

KATA PENGANTAR

Puji dan syukur kepada Tuhan Yang Maha Esa atas segala rahmat-Nya sehingga skripsi yang berjudul “Analisa Sentimen Pendapat Masyarakat Indonesia Terhadap Aplikasi PeduliLindungi Menggunakan Support Vector Machine, Naïve bayes, dan K-NN” dapat diselesaikan dengan tepat waktu. Skripsi ini penulis ajukan kepada Program Strata 1, Program Studi Sistem Informasi, Fakultas Teknik dan Informatika, Universitas Multimedia Nusantara. Setelah melewati berbagai hambatan dan rintangan yang terus dihadapi, penulis sadar bahwa skripsi ini tidak dapat selesai tanpa bantuan dari berbagai pihak. Maka dari itu pada kesempatan ini penulis ingin mengucapkan rasa terima kasih sebesar-besarnya kepada :

Mengucapkan terima kasih

1. Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara.

2. Dr. Eng. Niki Prastomo, S.T., M.Sc.selaku Dekan Fakultas Teknik Informatika Universitas Multimedia Nusantara.

3. Ririn Ikana Desanti, S.Kom., M.Kom., selaku Ketua Program Studi Universitas Multimedia Nusantara.

4. Wira Munggana, S.Si., M.Sc, sebagai Pembimbing pertama yang telah memberikan bimbingan, arahan, dan motivasi atas terselesainya tugas akhir ini.

5. Keluarga kedua orang tua saya terutama Ibu saya dan sahabat yaitu, Krizia Gidion Gaghana, Flavius Ryaas, Ria, Dita Michelle, Joti dan kawan kawan yang telah memberikan bantuan dukungan material moral, sehingga penulis dapat menyelesaikan tugas akhir ini.

Semoga karya ilmiah ini dapat bermanfaat baik menjadi sumberinformasi maupun inspirasi bagi para pembaca

Tangerang, 3 Januari 2021

(Savero Ramadhan)

(8)

vii

Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara

ANALISIS SENTIMEN PENDAPAT MASYARAKAT INDONESIA MENGENAI APLIKASI PEDULI LINDUNGI MENGGUNAKAN SUPPORT VECTOR MACHINE, NAÏVE

BAYES, DAN K – NN

(Savero Ramadhan) ABSTRAK

Pada tahun 2020, masyarakat global menyaksikan kemunculan virus corona jenis baru penyebab penyakit virus corona, atau yang sekarang dikenal dengan COVID 19. Indonesia merupakan salah satu negara yang terdampak wabah yang satu ini. Pemerintah telah mengambil langkah tegas dalam memerangi penyebaran virus corona di Indonesia, salah satunya lewat teknologi informasi dengan mengembangkan sebuah aplikasi pelacakan atau contact tracing “Pedulilindungi”. Namun kepercayaan masyarakat masih sangatlah minim, dikarenakan beberapa faktor diantaranya adalah informasi yang diberikan kurang tepat dan isu isu kebocoran data pribadi yang dijual secara ilegal.

Tujuan dari penelitian ini adalah untuk mengetahui sentiment masyarakat terhadap aplikasi “Pedulilindungi” Penelitian ini menggunakan analisis sentimen menggunakan text mining. Sumber data yang digunakan adalah data tweet melalui aplikasi Twitter. Data tersebut dikategorikan menggunakan SVM, KNN, dan Naive Bayes untuk mengetahui keakuratan hasil klasifikasi prediksi terhadap sentiment masyarakat. Aplikasi yang digunakan untuk analisis dan klasifikasi sentimen adalah Rapidminer

Data dikumpulkan dengan jangka waktu tanggal 22 November 2021 hingga 27 Desember 2021 dengan jumlah 7.587.Berdasarkan hasil dari Confusion Matrix yang telah dihasilkan algoritma Support Vector Machines lebih baik digunakan dalam penelitian ini dengan hasil akurasi : 71.59% presisi: 74.39%

recall: 58.29%, dan AUC: 0.771 dibandingkan dengan algoritma K-NN dan Naïve bayes

Kata kunci: K-nn, Naïve bayes, PeduliLindungi, sentimen analisis, Support Vector Machine,

(9)

SENTIMENT ANALYSIS OF INDONESIAN PEOPLE'S OPINIONS REGARDING PEDULILINDUNGI APPLICATION USING SUPPORT VECTOR MACHINE, NAÏVE BAYES, AND K

– NN

(Savero Ramadhan) ABSTRACT (English)

In 2020, the world community witnessed the emergence of a new type of coronavirus that causes coronavirus disease or now known as COVID-19. Indonesia is one of the countries affected by this outbreak. The government has taken decisive steps in combating the spread of the coronavirus in Indonesia, one of which is through information technology by developing a tracking application or contact tracing

"PeduliLindungi". But public trust is still very minimal, because several factors include the information provided incorrectly and the issue of leaking personal data sold illegally.

The purpose of this study was to find out people's sentiment towards the application

"PeduliLindungi" This study uses sentiment analysis with text mining. The source of the data used is tweet data about the app care protection from Twitter. The data will be classified using SVM, K-NN, and Naïve Bayes to determine the accuracy of public sentiment. The application used for sentiment analysis and classification is Rapidminer.

Based on the results of the Confusion Matrix that has been generated the Support Vector Machines algorithm is better used in this study with accuracy results:

71.59% precision: 74.39% recall: 58.29%, and AUC: 0.771 compared to K-NN and Naïve bayes algorithms

Keywords: K-NN, Text mining, Rapidminer, PeduliLindungi, Sentiment Analysis, Naive Bayes, SVM.

(10)

ix

Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara

DAFTAR ISI

HALAMAN PENGESAHAN ... iv

HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... v

KATA PENGANTAR ... vi

ABSTRAK ... vii

ABSTRACT (English) ... viii

DAFTAR ISI ... ix

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiii

DAFTAR RUMUS... xiv

DAFTAR LAMPIRAN ... xv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang... 1

1.2 Rumusan Masalah ... 5

1.3 Batasan Masalah ... 5

1.4 Tujuan dan Manfaat penelitian ... 5

1.4.1 Tujuan penelitian ... 5

1.4.2 Manfaat Penelitian ... 5

BAB II LANDASAN TEORI ... 7

2.1 Covid – 19 ... 7

2.2 PeduliLindungi ... 7

2.3 Text mining ... 8

2.4 Text processing ... 8

2.5 Analisis sentiment ... 9

2.6 Twitter ... 10

2.7 Naïve bayes ... 10

2.8 Svm ... 11

2.9 K-NN ... 12

2.10 Confusion Matrix ... 14

2.11 Rapid Miner ... 16

(11)

2.12 Penelitian terdahulu ... 16

BAB III METODOLOGI PENELITIAN... 22

3.1 Gambaran umum Objek Penelitian ... 22

3.2 Metode Penelitian ... 22

3.3 Variabel penelitian... 23

3.4 Teknik Pengumpulan data ... 24

3.4.2 Pendaftaran akses twitter ... 24

3.4.1 Penggalian data twitter... 24

3.4.1 Twitter data... 24

3.4.3 Seleksi tweet ... 24

3.5 Teknik Analisa data ... 25

3.5.1 Text preprocessing ... 25

3.5.2 Perbandingan Algoritma ... 26

3.6 Pelatihan dan pengujian ... 28

3.7 Evaluasi hasil ... 30

BAB IV ANALISIS DAN HASIL PENELITIAN ... 31

4.1 Penggalian data ... 31

4.1.1 Pendaftaran akses twitter ... 31

4.1.2 Penggalaian data twitter ... 32

4.1.3 Seleksi tweet ... 34

4.2 Text preprocessing ... 34

4.2.1 Data Cleansing ... 34

4.2.2 Data Labeling ... 38

4.2.3. Case Folding ... 40

4.2.4 Tokenize ... 41

4.2.5 Filtering stopword ... 44

4.2.6 Pembobotan Tf -Idf ... 46

4.3 Perancangan model ... 46

4.4 Training model ... 48

4.4.1 Support Vector Machines (SVM) ... 49

4.4.2 Naïve Bayes ... 52

4.4.3 K-NN ... 54

(12)

xi

Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara

4.5 Hasil ... 56

BAB V SIMPULAN DAN SARAN ... 60

5.1 Kesimpulan ... 60

5.2 Saran ... 60

DAFTAR PUSTAKA ... 62

LAMPIRAN ... 65

(13)

DAFTAR TABEL

Table 2. 1 Confusion Matrix ... 15

Table 2. 2 Penelitian terdahulu... 16

Tabel 3. 1 Perbandingan algoritma ... 27

Tabel 3. 2 Skenario Perbandingan Data Training & testing ... 29

Tabel 4. 1 Data Raw ... 33

Tabel 4. 2 Remove punctuation ... 37

Tabel 4. 3 Case Folding ... 40

Tabel 4. 4 Tokenize ... 42

Tabel 4. 5 K-Fold SVM ... 52

Tabel 4. 6 K-Fold NBC ... 54

Tabel 4. 7 K-Fold K-NN ... 56

Tabel 4. 8 Hasil akurasi Setiap Algoritma ... 57

(14)

xiii

Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara

DAFTAR GAMBAR

Gambar 1. 1 PeduliLindungi ... 2

Gambar 2. 1 Twitter ... 10

Gambar 2. 2 hyperplane ... 12

Gambar 2. 3 Confusion Matrix... 14

Gambar 2. 4 Rapidminer 16 Gambar 3. 1 Kerangka pikir penelitian. ... 23

Gambar 4. 1 Pendaftaran Akses ... 31

Gambar 4. 2 penggalian data ... 32

Gambar 4. 3 hasil Scraping data ... 33

Gambar 4. 4 Cleansing Process ... 35

Gambar 4. 5 Cleansing Data ... 35

Gambar 4. 6 Remove URL ... 36

Gambar 4. 7 Remove Punctuation ... 37

Gambar 4. 8 Data labeling ... 39

Gambar 4. 9 Case Folding ... 40

Gambar 4. 10 Tokenize ... 42

Gambar 4. 11 Main Process ... 43

Gambar 4. 12 sub process ... 44

Gambar 4. 13 Stopword ... 45

Gambar 4. 14 Pembobotan ... 46

Gambar 4. 15 Main Process ... 48

Gambar 4. 16 K-Fold ... 49

Gambar 4. 17 kerangka kerja SVM... 50

Gambar 4. 18 SVM ... 50

Gambar 4. 19 hasil SVM ... 50

Gambar 4. 20 Confusion matriks 8 Fold ... 51

Gambar 4. 21 kerangka kerja NBC ... 52

Gambar 4. 22 Hasil NBC ... 53

Gambar 4. 23 Confusion matriks 3 Fold ... 53

Gambar 4. 24 Kerangka K-NN ... 54

Gambar 4. 25 Hasil K-NN ... 55

Gambar 4. 26 Confusion Matrix 9 Fold ... 55

Gambar 4. 27 Bar chart ... 58

(15)

DAFTAR RUMUS

Rumus 2. 1 NVB ... 11 Rumus 2. 2 K-NN ... 13

(16)

xv

Analisis Sentimen Pendapat, Savero Ramadhan, Universitas Multimedia Nusantara

DAFTAR LAMPIRAN

lampiran turnitin 1 ... 65

Referensi

Dokumen terkait

Menurut Verhaar (1992:132), sinonim adalah ungkapan (biasanya sebuah kata, tetapi dapat pula berupa frase atau kalimat) yang kurang lebih sama maknanya dengan suatu ungkapan

Hal ini memungkinkan karena kita telah menerima Roh yang menjadikan kita anak-anak Allah, yang dapat berseru “Abba, Bapa!” (lihat Roma.. saja yang diminta oleh Allah dengan

Sebelum pulang, penulis mengucapkan terima kasih dan menyampaikan bahwa penulis akan kembali untuk melakukan wawancara dengan kedua guru Pendidikan Agama Islam (PAI) tersebut.

Hasil penelitian menunjukkan bahwa pemanfaatan jenis/sumber probiotik berasal dari ikan tawar maupun ikan laut ternyata mempunyai efek sama, namun terdapat potensi bahwa

Penulisan hukum yang dilakukan oleh Uliartha Febriani (040508839), mahasiswa Fakultas Hukum Universitas Atma Jaya Yogyakarta, dengan judul “Peran Lembaga

Dengan menggunakan model Jigsaw yang didukung dengan alat peraga dalam pembelajaran pecahan siswa yang telah mengetahui pecahan dalam kehidupan sehari – hari

Penelitian ini bertujuan untuk mendeskripsikan kebijakan BPJS-kesehatan yang berkaitan dengan faktor-faktor komunikasi, sumber daya disposisi, dan struktur

SMA Bertaraf Internasional perlu menjalin kerjasama ( networking ) dengan sekolah lain, baik di dalam maupun luar negeri, yang telah memiliki reputasi internasional sebagai