• Tidak ada hasil yang ditemukan

ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN ALGORITMA SVM, NAÏVE BAYES DAN K-NN

N/A
N/A
Protected

Academic year: 2022

Membagikan "ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN ALGORITMA SVM, NAÏVE BAYES DAN K-NN"

Copied!
16
0
0

Teks penuh

(1)

ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN ALGORITMA SVM, NAÏVE

BAYES DAN K-NN

SKRIPSI

Reyhan Nico Fernaldy

00000010153

PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKINIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2022

(2)

i

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN

ALGORITMA SVM, NAÏVE BAYES DAN K-NN

SKRIPSI

Diajukan sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer (S. Kom)

Reyhan Nico Fernaldy

00000010153

PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2022

(3)

ii

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

HALAMAN PERNYATAAN TIDAK PLAGIAT

Dengan ini saya,

Nama : Reyhan Nico Fernaldy

Nomor Induk Mahasiswa : 00000010153 Program studi : Sistem Informasi

Skripsi dengan judul:

Analisis Sentimen Ulasan dan Rating Pengguna Peduli Lindungi Pada Google Playstore dengan Algoritma Svm, Naive Bayes dan K-nn

merupakan hasil karya saya sendiri bukan plagiat dari karya ilmiah yang ditulis oleh orang lain, dan semua sumber, baik yang dikutip maupun dirujuk, telah saya nyatakan dengan benar serta dicantumkan di Daftar Pustaka.

Jika di kemudian hari terbukti ditemukan kecurangan/penyimpangan, baik dalam pelaksanaan skripsi maupun dalam penulisan laporan skripsi, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk Tugas Akhir yang telah saya tempuh.

Tangerang, 29 Desember 2021

*materai Rp 10.000,00

(Reyhan Nico Fernaldy)

(4)

iii

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

HALAMAN PERSETUJUAN

Skripsi dengan judul

ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN ALGORITMA SVM,

NAÏVE BAYES DAN K-NN Oleh

Nama : Reyhan Nico Fernaldy

NIM : 00000010153

Program Studi : Sistem Informasi Fakultas : Teknik dan Informatika

Telah disetujui untuk diajukan pada

Sidang Ujian Skripsi Universitas Multimedia Nusantara

Tangerang, 29 Desember 2021

Pembimbing

29/12/2021

Monika Evelin Johan, S.Kom.,M.M.S.I, 071281

Ketua Sistem Informasi

Ririn Ikana Desanti, S.Kom., M.Kom.

(5)

iv

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

HALAMAN PENGESAHAN

Skripsi dengan judul

ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN ALGORITMA SVM,

NAÏVE BAYES DAN K-NN Oleh

Nama : Reyhan Nico Fernaldy

NIM : 00000010153

Program Studi : Sistem Informasi Fakultas : Teknik dan Informatika

Telah diujikan pada hari Jumat, 14 Januari 2022 Pukul 13.00 s.d 14.30 dan dinyatakan

LULUS

Dengan susunan penguji sebagai berikut.

Ketua Sidang

Ir. Raymond Sunardi Oetama, M.C.I.S 023897

Penguji

Wira Munggana, S.Si., M.Sc.

023860 Pembimbing

Monika Evelin Johan, S.Kom.,M.M.S.I, 071281

Ketua Sistem Informasi

Ririn Ikana Desanti, S.Kom., M.Kom.

051314 31.01.2022

(6)

v

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Sebagai civitas academica Universitas Multimedia Nusantara, saya yang bertanda tangan di bawah ini:

Nama : Reyhan Nico Fernaldy

NIM : 00000010153

Program Studi : Sistem Informasi Fakultas : Teknik dan Informatika

JenisKarya : *Tesis/Skripsi/Tugas Akhir (*coret salah satu)

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Multimedia Nusantara Hak Bebas Royalti Nonekslusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul.

ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN ALGORITMA SVM, NAÏVE BAYES DAN K-NN

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Noneksklusif ini, Universitas Multimedia Nusantara berhak menyimpan, mengalihmediakan/mengalihformatkan, mengelola dalam bentuk pangkalan data (database), merawat, dan memublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta.

Demikian pernyataan ini saya buat dengan sebenarnya.

Tangerang, 29 Desember 2021 Yang menyatakan,

(Reyhan Nico Fernaldy)

(7)

vi

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

KATA PENGANTAR

Puji dan syukur kepada Allah S.W.T sehingga Laporan dari karya ilmiah dengan judul “ ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN ALGORITMA SVM, NAÏVE BAYES DAN K-NN” dapat ditempuh dalam tepat waktu. Karya ilmiah ini diajukan sebagai syarat dalam menyelesaikan masa perkuliahan dengan gelar Strata 1, Program Studi Sistem Informasi Fakultas Teknologi dan Informasi Universitas Multimedia Nusantara.

Mengucapkan terima kasih

1. Bapak Dr. Ninok Leksono, M.A, selaku Rektor Universitas Multimedia Nusantara.

2. Bapak Dr. Eng. Niki Prastomo, S.T., M.Sc, selaku Dekan Fakultas Universitas Multimedia Nusantara.

3. Ibu Ririn Ikana Desanti, S.Kom., M.Kom, selaku Ketua Program Studi Universitas Multimedia Nusantara.

4. Ibu Monika Evelin Johan, S.Kom.,M.M.S.I, sebagai Pembimbing pertama yang telah memberikan Ilmu Pengetahuan serta bimbingan, arahan, dan motivasi atas terselesainya tugas akhir ini.

5. Keluarga saya yang telah memberikan bantuan dukungan material dan moral, sehingga penulis dapat menyelesaikan tugas akhir ini.

6. Dosen – Dosen Universitas Multimedia Khususnya dalam Program Studi Sistem Informasi yang telah memberikan Ilmu dan Pengetahuan selama masa Perkuliahan yang sangat berguna untuk kedepannya.

Semoga karya ilmiah ini dapat menjadi acuan untuk kedepannya sehingga karya ilmiah ini tidak hanya berhenti disini.

Tangerang, 29 Desember 2021

(Reyhan Nico Fernaldy)

(8)

vii

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

ANALISIS SENTIMEN ULASAN DAN RATING PENGGUNA PEDULI LINDUNGI PADA GOOGLE PLAYSTORE DENGAN

ALGORITMA SVM, NAÏVE BAYES DAN K-NN

(Reyhan Nico Fernaldy) ABSTRAK

Pada 11 Maret 2020, Organisasi Kesehatan Dunia (WHO) telah resmi menyatakan wabah virus corona atau 2019 coronavirus disease (Covid-19) sebagai pandemi global. Di Indonesia sendiri Pemerintah telah memberi laporan kasus Covid-19 yang kembali meningkat dipertengahan tahun 2021. Dengan adanya kasus tersebut Pemerintah bersama pengembang aplikasi terus melakukan inovasi dalam hal untuk memonitor kasus penyebaran Covid-19. PeduliLindungi adalah aplikasi dengan mengandalkan seseorang untuk saling berbagi data lokasi saat bepergian sehingga riwayat kontak dengan pasien COVID-19 dapat terlacak.

Tujuan dari penelitian ini adalah untuk mendapatkan hasil klasifikasi terbaik dari ketiga metode perbandingan Support Vector Machine, Naïve Bayes dan K-Nearest Neighbor. Dan juga peneliti membandingkan hasil klasifikasi dari data Rating dan Review. Dengan ada analisis pengembang mendapatkan bahan evaluasi dalam hal membantu pengembangan aplikasi PeduliLindungi menggunakan proses klasifikasi data dari Rating dan Review Google Playstore menggunakan tools Rapid Miner.

Hasil yang didapat Nilai akurasi dari algoritma SVM adalah 89,39% untuk data Rating objek dan 73,07% untuk data Review, kemudian untuk algoritma Naive Bayes kedua menghasilkan akurasi sebesar 68,46% untuk data objek Rating dan 52,72% untuk data Review, terakhir algoritma K-NN yang menghasilkan akurasi sebesar 99,81% untuk objek data Rating dan 77,08% untuk data yang mengambil objek data Review. Dari hasil penelitian ini ditemukan pengguna aplikasi ini masih memberikan review negatif daripada review positif dengan perbandingan 7.684 untuk sentimen negatif dan 1.287 untuk sentimen positif.

Kata Kunci: Analisa Sentimen, K-Nearest Neighbor, Knowledge Discovery In Databases, Naive Bayes, Support Vector Machine

(9)

viii

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

SENTIMENT ANALYSIS OF USER REVIEWS AND RATINGS PEDULILINDUNGI ON GOOGLE PLAYSTORE WITH SVM,

NAÏVE BAYES AND K-NN ALGORITHM

(Reyhan Nico Fernaldy) ABSTRACT (English)

On March 11, 2020, the World Health Organization (WHO) has officially declared the coronavirus outbreak or 2019 coronavirus disease (Covid-19) a global pandemic. In Indonesia, the Government has reported that Covid-19 cases have increased again in the middle of 2021. With these cases, the Government and application developers continue to innovate in terms of monitoring cases of the spread of Covid-19. This application, called PeduliLindung, relies on community participation to share location data while traveling so that contact history with COVID-19 patients can be tracked.

The purpose of this study was to obtain the best classification results from the three comparison methods of Support Vector Machine, Naïve Bayes and K-Nearest Neighbor. And also the researchers compared the classification results from the Rating and Review data. With the analysis, developers get evaluation materials in terms of helping the development of the Cares for Protection application using the data classification process from Ratings and Reviews of Google Playstore using Rapid Miner tools.

The results obtained The accuracy value of the SVM algorithm is 89.39% for object Rating data and 73.07% for Review data, then for the second Naive Bayes algorithm it produces an accuracy of 68.46% for Rating object data and 52.72%

for data Review, the last is the K-NN algorithm which produces an accuracy of 99.81% for the Rating data object and 77.08% for the data that takes the Review data object. From the results of this study, it was found that users of this application still gave negative reviews rather than positive reviews with a comparison of 7,684 for negative sentiment and 1,287 for positive sentiment.

Keywords: K-Nearest Neighbor, Knowledge Discovery In Databases, Naive Bayes, Sentiment Analysis, Support Vector Machine

(10)

ix

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

DAFTAR ISI

HALAMAN PERNYATAAN TIDAK PLAGIAT ... ii

HALAMAN PERSETUJUAN ... iii

HALAMAN PENGESAHAN ... iv

HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... v

KATA PENGANTAR ... vi

ABSTRAK ... vii

ABSTRACT (English) ... viii

DAFTAR ISI ... ix

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiii

DAFTAR LAMPIRAN ... xv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 5

1.3 Batasan Masalah ... 5

1.4 Tujuan dan Manfaat Penelitian ... 6

1.4.1 Tujuan Penelitian ... 6

1.4.2 Manfaat Penelitian ... 6

1.5 Sistematika Penulisan ... 7

BAB II LANDASAN TEORI ... 9

PeduliLindungi ... 9

Profil Kementerian Komunikasi dan Informatika (KOMINFO) ... 9

Google Playstore ... 10

Analisa Sentimen ... 11

Text Mining ... 11

Text Preprocessing ... 11

Naïve Bayes Classifer ... 13

Support Vector Machine ... 15

K-Nearest Neighbor ... 17

(11)

x

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

Knowledge Discovery In Database ... 19

Rstudio ... 21

Bahasa R ... 22

Anaconda ... 23

Jupyter Notebook ... 23

Machine Learning ... 24

Term Frequency – Inverse Document Frequency (TF-IDF) ... 24

Lexicon – Based ... 25

Confusion Matrix ... 26

K-fold Cross Validation ... 27

Penelitian Terdahulu ... 28

BAB III METODOLOGI PENELITIAN ... 34

3.1 Objek Penelitian ... 34

3.2 Teknik Pengumpulan Data ... 35

3.3 Alur Penelitian ... 35

3.3.1 Data Selection ... 37

BAB IV ANALISIS DAN HASIL PENELITIAN ... 40

4.1 Data Selection ... 40

4.2 Data Preprocessing ... 41

4.2.1 Remove Duplicate ... 42

4.2.2 Remove Digit ... 42

4.2.3 Punctuation ... 42

4.2.4 Remove Emoticon ... 42

4.2.5 Transform Lowercase Text ... 43

4.2.6 Penyimpanan Hasil Processing ... 43

4.3 Data Transformation ... 44

4.3.1 Visualisasi ... 45

4.3.2 Data Labeling ... 46

4.4 Data Mining ... 51

4.4.1 Data Split ... 51

4.4.2 Sentiment Classification ... 52

4.5 Evaluation ... 59

(12)

xi

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

4.5.1 Rating ... 59

4.5.2 Review ... 64

BAB V SIMPULAN DAN SARAN ... 72

5.1 Simpulan ... 72

5.2 Saran ... 73

DAFTAR PUSTAKA ... 74

LAMPIRAN ... 79

(13)

xii

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

DAFTAR TABEL

Tabel 2. 1 Tabel Penelitian Terdahulu ... 28

Tabel 2. 2 Tabel Penelitian Terdahulu ... 30

Tabel 4. 1 Tabel Hasil Tahapan Processing ... 44

Tabel 4. 2 Tabel Hasil Tokenize ... 55

Tabel 4. 3 Tabel Hasil Proses Stem ... 55

Tabel 4. 4 Tabel Hasil Stemming ... 56

Tabel 4. 5 Tabel Perbandingan Algoritma data objek Rating ... 68

Tabel 4. 6 Tabel Perbandingan algoritma data objek Review ... 69

(14)

xiii

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

DAFTAR GAMBAR

Gambar 1. 1 Pekan Perkembangan Kasus Covid – 19 ... 3

Gambar 2. 1 Logo Aplikasi PeduliLindungi...9

Gambar 2. 2 Logo KOMINFO ... 10

Gambar 2. 3 Logo Aplikasi Google Playstore ... 10

Gambar 2. 4 Contoh Perhitungan Penjabaran ... 15

Gambar 2. 5 Konsep K-NN ... 18

Gambar 2. 6 Proses KDD ... 19

Gambar 2. 7 Logo Rstudio ... 22

Gambar 2. 8 Logo Bahasa R ... 22

Gambar 2. 9 Logo Anaconda ... 23

Gambar 2. 10 Logo Jupyter Notebook ... 24

Gambar 3. 1 Tahapan Proses KDD...36

Gambar 3. 2 Flowchart Proses KDD Pada Penelitian Ini ... 36

Gambar 4. 1 Data Selection... 40

Gambar 4. 2 Hasil Data Selection ... 40

Gambar 4. 3 Kendala Lisensi Rapidminer ... 41

Gambar 4. 4 Remove Duplicate ... 42

Gambar 4. 5 Remove Digit ... 42

Gambar 4. 6 Punctuation ... 42

Gambar 4. 7 Remove Emoticon ... 43

Gambar 4. 8 Transform Lower Case Text ... 43

Gambar 4. 9 Penyimpanan Hasil Processing ... 43

Gambar 4. 10 Kata Positif Paling Populer ... 45

Gambar 4. 11 Kata Negatif Paling Populer ... 46

Gambar 4. 12 Proses Labeling data Objek Rating ... 47

Gambar 4. 13 Edit Ecpression Generate Attributes ... 47

Gambar 4. 14 Proses Labeling Data dari Objek Rating ... 48

Gambar 4. 15 Proses Labeling ... 49

Gambar 4. 16 Hasil Labeling ... 49

Gambar 4. 17 Hasil Perbandingan sentimen pengguna Aplikasi PeduliLindungi 50 Gambar 4. 18 Proses Pembagian Data ... 51

Gambar 4. 19 Proses Import Data Rating ... 52

Gambar 4. 20 Proses Import Data Review ... 53

Gambar 4. 21 Proses Analisa Sentimen ... 54

Gambar 4. 22 Proses Document ... 54

Gambar 4. 23 Proses Testing ... 57

Gambar 4. 24 Proses Testing ... 57

Gambar 4. 25 Proses Klasifikasi Metode SVM ... 58

Gambar 4. 26 Proses Klasifikasi Metode Naive Bayes... 58

Gambar 4. 27 Proses Klasifikasi Metode K-NN ... 59

Gambar 4. 28 Hasil Accuracy SVM ... 59

Gambar 4. 29 Hasil Precision SVM ... 60

(15)

xiv

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

Gambar 4. 30 Hasil Recall ... 60

Gambar 4. 31 Hasil AUC SVM ... 60

Gambar 4. 32 Hasil Accuracy Naive Bayes ... 61

Gambar 4. 33 Hasil Precision Naive Bayes ... 61

Gambar 4. 34 Hasil Recall Naive Bayes ... 61

Gambar 4. 35 Hasil AUC Naive Bayes ... 62

Gambar 4. 36 Hasil Accuracy K-NN ... 62

Gambar 4. 37 Hasil Precision K-NN ... 62

Gambar 4. 38 Hasil Recall K-NN ... 63

Gambar 4. 39 Hasil AUC K-NN ... 63

Gambar 4. 40 Hasil Accuracy SVM ... 64

Gambar 4. 41 Hasil Precision SVM ... 64

Gambar 4. 42 Hasil Recall SVM... 64

Gambar 4. 43 Hasil AUC SVM ... 65

Gambar 4. 44 Hasil Accuracy Naive Bayes ... 65

Gambar 4. 45 Hasil Precision Naive Bayes ... 66

Gambar 4. 46 Hasil Recall Naive Bayes ... 66

Gambar 4. 47 Hasil AUC Naive Bayes ... 66

Gambar 4. 48 Hasil Accuracy K-NN ... 67

Gambar 4. 49 Hasil Precision K-NN ... 67

Gambar 4. 50 Hasil Recall K-NN ... 67

Gambar 4. 51 Hasil AUC K-NN ... 68

(16)

xv

Analisis Sentimen Ulasan..., Reyhan Nico Fernaldy, Universitas Multimedia Nusantara

DAFTAR LAMPIRAN

Lampiran A Turnitin ... 79

Referensi

Dokumen terkait

Klasifikasi sentimen pada aplikasi Google Play Store dilakukan dengan menggunakan metode Naive Bayes dan C4.5, Sedangkan metode Levenshtein Distance sebagai metode

Rumus perhitungannya adalah sebagai berikut Gorunescu, 2010: 𝑇𝑃 𝑅𝑎𝑡𝑒 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑁 𝐹𝑃 𝑅𝑎𝑡𝑒 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑁 HASIL DAN PEMBAHASAN Hasil dari penelitian ini melibatkan analisis sentimen

Dalam melakukan melakukan analisis terhadap sentiment ulasan pengguna aplikasi transportasi online, penulis menggunakan dataset yang didapatkan dari Google Playstore, kemudian

Beberapa penelitian terdahulu tentang analisis sentimen antara lain yaitu, Penerapan Naïve Bayes Classifier, K-Nearest Neighbor KNN dan Decision Tree untuk Menganalisis Sentimen pada

Hal ini dibuktikan dengan 14 juta ulasan pada bulan Juni 2023, dimana sebagian pengguna menuliskan beberapa komentar buruk, sehingga perlu dilakukan analisis sentimen yang bertujuan

Berdasarkan permasalahan yang telah dijelaskan, maka penelitian ini akan menerapkan algoritma Naïve Bayes Classifier untuk menganalisa sentimen pada ulasan toko online Halona Beauty