Perbandingan Algoritma Support Vector Machine dan K-
Nearest Neighbor pada Opini Masyarakat Terhadap
Aplikasi E-Wallet di Indonesia
SKRIPSI
Antonius Yoga Putranto 00000019623
PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG
2022
Perbandingan Algoritma Support Vector Machine dan K-
Nearest Neighbor pada Opini Masyarakat Terhadap
Aplikasi E-Wallet di Indonesia
Diajukan sebagai salah satu syarat untuk memperoleh Gelar Sarjana Sistem Informasi
Antonius Yoga Putranto 00000019623
PROGRAM STUDI SISTEM INFORMASI FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG
HALAMAN PERNYATAAN TIDAK PLAGIAT
HALAMAN PENGESAHAN
Skripsi dengan judul
“Perbandingan Algoritma Support Vector Machine dan K-Nearest Neighbor pada Opini Masyarakat Terhadap Aplikasi E-Wallet di Indonesia”
Oleh
Nama : Antonius Yoga Putranto
NIM : 00000019623
Program Studi : Sistem Informasi
Fakultas : Teknik dan Informatika
Telah diujikan pada hari Senin, 17 Januari 2022 Pukul 15.00 s/d 17.00 dan dinyatakan
LULUS
Dengan susunan penguji sebagai berikut.
Ketua Sidang
Samuel Ady Sanjaya, S.T., M.T.
Penguji
Ririn Ikana Desanti, S.Kom., M.Kom.
Ketua Program Studi Sistem Informasi
Ririn Ikana Desanti, S.Kom., M.Kom.
Pembimbing
Monika Evelin Johan, S.Kom., M.M.S.I. 31/01/2022
HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademik Universitas Multimedia Nusantara, saya yang bertandatangan di bawah ini:
Nama : Antonius Yoga Putranto
NIM : 00000019623
Program Studi : Sistem Informasi
Fakultas : Teknik dan Informatika
JenisKarya : *Tesis/Skripsi/Laporan Magang (*coret salah satu)
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Multimedia Nusantara Hak Bebas Royalti Nonekslusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul:
“Perbandingan Algoritma Support Vector Machine dan K-Nearest Neighbor pada Opini Masyarakat Terhadap Aplikasi E-Wallet di Indonesia”
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non eksklusif ini Universitas Multimedia Nusantara berhak menyimpan, mengalih media / format-kan, mengelola dalam bentuk pangkalan data (database), merawat, dan mempublikasikan tugas akhir saya selama tetap mencantumkan nama saya sebagai penulis / pencipta dan sebagai pemilik Hak Cipta. Demikian pernyataan ini saya buat dengan sebenarnya.
Tangerang, 3 Januari 2022 Yang menyatakan,
(Antonius Yoga Putranto)
KATA PENGANTAR
Puji syukur kepada Tuhan Yang Maha Esa atas berkat dan rahmatnya, penulis dapat menyelesaikan proposal penelitian dengan judul: “Perbandingan Algoritma Support Vector Machine dan K-Nearest Neighbor pada Opini Masyarakat Terhadap Aplikasi E-Wallet di Indonesia”. Proposal penelitian ini disusun untuk memenuhi mata kuliah Metode Riset Sistem Informasi pada jurusan Sistem Informasi, Fakultas Teknik dan Informatika, Universitas Multimedia Nusantara.
Penulis menyadari dalam penyusunan proposal ini tidak akan selesai tanpa bantuan dari berbagai pihak. Oleh karena itu penulis ingin mengucapkan terima kasih kepada:
1. Bapak Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara.
2. Ibu Dr. Friska Natalia, S.Kom., M.T., selaku Dekan Fakultas Universitas Multimedia Nusantara.
3. Ibu Ririn Ikana Desanti, S.Kom.,M.Kom., selaku Ketua Program Studi Universitas Multimedia Nusantara.
4. Ibu Monika Evelin Johan, S.Kom., M.M.S.I., sebagai Pembimbing yang telah banyak meluangkan waktu untuk memberikan bimbingan, arahan dan motivasi atas terselesainya tugas akhir ini.
5. Keluarga yang selalu mendukung dan telah memberikan bantuan dukungan material dan moral, sehingga penulis dapat menyelesaikan tugas akhir ini.
6. Teman-teman yang menemani penulis selama menyusun tugas akhir ini.
Tangerang, 8 September 2021
Antonius Yoga Putranto
Perbandingan Algoritma Support Vector Machine dan K-Nearest Neighbor pada Opini Masyarakat Terhadap
Aplikasi E-Wallet di Indonesia
(Antonius Yoga Putranto)
ABSTRAK
Pandemi virus Covid-19 ini telah ditetapkan oleh Word Health Organzation (WHO) sejak tanggal 11 Maret 2020. Dilakukanlah upaya lainnya yaitu mengurangi penggunaan uang tunai sebagai alat transaksi dan diganti menjadi transaksi non-tunai (cashless) yang salah satunya adalah e-wallet. E-wallet atau dompet elektronik dapat diartikan sebagai alat pembayaran non-tunai dengan menggunakan media elektronik. Data yang digunakaan mulai dari 11 Maret 2020 sampai 2021 dengan jumlah yang didapat adalah 10.000 data untuk masing-masing e-wallet.
Penelitian ini akan melakukan perbandingan dua algoritma yaitu Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN) pada sentimen analisis opini masyarakat terhadap aplikasi e-wallet yaitu Gopay, OVO, dan DANA.
Dataset yang dikumpulkan dari aplikasi Instagram dengan komentar berbahasa Indonesia.
Hasil penelitian ini berupa persentase yaitu hasil Akurasi dari algortima Support Vector Machine sebesar 76.77% sedangkan algoritma K-Nearest Neighbor sebesar 60.27%. Untuk hasil sentimen analisis menurut SVM aplikasi Gopay mendapatkan 3255 positif dan 1799 negatif, aplikasi OVO mendapatkan 3160 positif dan 2214 negatif, aplikasi DANA mendapatkan 3296 positif dan 1995 negatif. Kesimpulan pada penelitian ini yaitu algoritma SVM mendapatkan hasil terbaik dibandingkan KNN, lalu aplikasi yang mendapatkan hasil positif terbanyak adalah aplikasi DANA.
Kata kunci: Analisis Sentimen, E-wallet, Instagram, KNN, SVM,
Comparison of Support Vector Machine and K-Nearest Neighbor Algorithms on Public Opinion Against E-Wallet
Applications in Indonesia
(Antonius Yoga Putranto)
ABSTRACT (English)
Covid-19 virus pandemic has been determined by the World Health Organization (WHO) since March 11, 2020. Efforts have been made, namely reducing the use of cash as a transaction tool and changing it to cashless transactions, one of which is e-wallet. E-wallet or electronic wallet can be interpreted as a non-cash payment instrument using electronic media. The data used starts from March 11, 2020 to 2021 with the amount obtained is 10,000 data for each e-wallet.
This study will compare two algorithms, namely Support Vector Machine (SVM) and K-Nearest Neighbor (KNN) on sentiment analysis of public opinion on e-wallet applications, namely Gopay, OVO, and DANA. Dataset collected from Instagram application with Indonesian language comments.
The results of this study are percentages, namely the accuracy of the Support Vector Machine algorithm is 76.77% while K-Nearest Neighbor algorithm is 60.27%. For sentiment analysis, according to SVM, the Gopay application got 3255 positive and 1799 negative, the OVO application got 3160 positive and 2214 negative, the DANA application got 3296 positive and 1995 negative. The conclusion in this study is that the SVM algorithm gets the best results compared to KNN, then the application that gets the most positive results is the DANA application.
Keywords: E-wallet, Instagram, KNN, Sentiment Analysis, SVM.
DAFTAR ISI
HALAMAN PERNYATAAN TIDAK PLAGIAT ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... iv
KATA PENGANTAR ... v
ABSTRAK ... vi
ABSTRACT (English) ... vii
DAFTAR ISI ... viii
DAFTAR TABEL ... xi
DAFTAR GAMBAR ... xii
DAFTAR RUMUS ... xiv
BAB I PENDAHULUAN ... 1
1.1. Latar Belakang ... 1
1.2. Rumusan Masalah ... 6
1.3. Batasan Masalah ... 6
1.4. Tujuan dan Manfaat Penelitian ... 7
1.5. Sistematika Penelitian ... 8
BAB II LANDASAN TEORI ... 9
2.1. E-Wallet ... 9
2.2. Instagram ... 9
2.3. Text Mining ... 10
2.4. Analisis Sentimen ... 10
2.5. Data Pre-processing ... 10
2.7. K-Nearest Neighbor ... 12
2.8. K-Fold Cross Validation ... 14
2.9. Confusion Matrix ... 14
2.10. RapidMiner ... 15
2.11. Penelitian Terdahulu ... 16
BAB III METODOLOGI PENELITIAN ... 20
3.1. Objek Penelitian ... 20
3.2. Variable ... 20
3.3. Metode Penelitian ... 21
3.3.1. Kerangka Pikir ... 21
3.3.2. Pengumpulan data ... 21
3.3.3. Pre-processing ... 22
3.3.4. Klasifikasi Sentimen ... 23
3.3.5. Evaluasi ... 24
BAB IV ANALISIS DAN HASIL PENELITIAN ... 25
4.1. Metode Pengumpulan Data ... 25
4.2. Data Cleaning ... 31
4.2.1. Penggunaan Data ... 31
4.2.2. Menghapus Emoji ... 34
4.2.3. Menghapus Mention ... 35
4.2.4. Menghapus Tanda Baca ... 36
4.2.5. Menghilangkan Duplikat ... 37
4.3. Labeling Data ... 38
4.4. Pre-processing ... 41
4.4.2. Tokenizing ... 41
4.4.3. Filtering / Stopword Removing ... 42
4.4.4. Stemming ... 43
4.5. Klasifikasi Sentimen ... 43
4.5.1. Support Vector Machine ... 44
4.5.2. K-Nearest Neighbor ... 45
4.6. Evaluasi dan Analisis ... 45
4.6.1. Gopay ... 45
4.6.2. Ovo ... 49
4.6.3. Dana ... 52
4.6.4. Analisis ... 55
BAB V SIMPULAN DAN SARAN ... 59
5.1 Simpulan ... 59
5.2 Saran ... 60
DAFTAR PUSTAKA ... 61
LAMPIRAN ... 65
DAFTAR TABEL
Tabel 2. 1 Penelitian Terdahulu 1 [35] ... 16
Tabel 2. 2 Penelitian Terdahulu 2 [17] ... 16
Tabel 2. 3 Penelitian Terdahulu 3 [36] ... 17
Tabel 2. 4 Penelitian Terdahulu 4 [37] ... 17
Tabel 3. 1 Perbandingan Klasifikasi [43][44][45] ... 23
Tabel 4. 1 Tabel Case Folding ... 41
Tabel 4. 2 Tabel Tokenizing ... 41
Tabel 4. 3 Tabel Filtering / Stopword Removing ... 42
Tabel 4. 4 Tabel Stemming ... 43
Tabel 4. 5 Confusion Matrix Algoritma SVM pada Gopay ... 45
Tabel 4. 6 Confusion Matrix Algoritma KNN pada Gopay ... 46
Tabel 4. 7 Confusion Matrix Algoritma SVM pada Ovo ... 49
Tabel 4. 8 Confusion Matrix Algoritma KNN pada Ovo ... 49
Tabel 4. 9 Confusion Matrix Algoritma SVM pada Dana ... 52
Tabel 4. 10 Confusion Matrix Algoritma KNN pada Dana ... 52
Tabel 4. 11 Perbandingan E-Wallet menurut SVM ... 55
Tabel 4. 12 Perbandingan E-Wallet menurut KNN ... 56
Tabel 4. 13 Perbandingan Algoritma ... 57
Tabel 4. 14 Hasil Penelitian Terdahulu ... 58
DAFTAR GAMBAR
Gambar 1. 1 Peta Sebaran Covid19 [3]... 1
Gambar 1. 2 Aplikasi E-Wwallet teratas di Indonesia [9] ... 3
Gambar 1. 3 Pengguna Media Sosial di Indonesia [10] ... 4
Gambar 2. 1 Tahap Preprocessing [22] ... 11
Gambar 2. 2 Ilustrasi Support Vector Machine ... 12
Gambar 3. 1 Alur Penelitian [31] ... 21
Gambar 4. 1 Data Tidak Terstruktur Gopay ... 25
Gambar 4. 2 Data Tidak Terstruktur Ovo ... 26
Gambar 4. 3 Data Tidak Terstruktur Dana ... 27
Gambar 4. 4 Data Terstruktur Gopay ... 28
Gambar 4. 5 Data Terstruktur OVO ... 29
Gambar 4. 6 Data Terstruktur Dana ... 30
Gambar 4. 7 Data Gopay ... 31
Gambar 4. 8 Data Ovo ... 32
Gambar 4. 9 Data Dana ... 33
Gambar 4. 10 Menghapus Emoji ... 34
Gambar 4. 11 Menghapus Mention ... 35
Gambar 4. 12 Menghapus Tanda Baca ... 36
Gambar 4. 13 Operator Remove Duplicates ... 37
Gambar 4. 14 Hasil Data Cleaning ... 37
Gambar 4. 15 Hasil Labeling Data Gopay ... 38
Gambar 4. 16 Hasil Labeling Data Ovo ... 39
Gambar 4. 17 Hasil Labeling Data Dana ... 40
Gambar 4. 18 Pembagian Data ... 43
Gambar 4. 19 Operator K-Fold Cross Validation ... 44
Gambar 4. 20 Proses K-Fold Cross Validation pada SVM... 44
Gambar 4. 21 Proses K-Fold Cross Validation pada KNN... 45
Gambar 4. 22 Diagram Donut Gopay SVM ... 47
Gambar 4. 24 Diagram Donut Ovo SVM ... 50
Gambar 4. 25 Diagram Donut Ovo KNN ... 51
Gambar 4. 26 Diagram Donut Dana SVM ... 53
Gambar 4. 27 Diagram Donut Dana KNN ... 54
Gambar 4. 28 Urutan Data Positif Menurut SVM ... 55
Gambar 4. 29 Urutan Data Positif Menurut KNN ... 56
Gambar 4. 30 Perbandingan Algoritma ... 57
DAFTAR RUMUS
Rumus 2. 1. Rumus KNN [17] ... 13 Rumus 2. 2. Rumus Confusion Matrix [32] ... 14