S K R I P S I
ANALISIS SENTIMEN MENGENAI LAYANAN
PROVIDER INDIHOME BERDASARKAN
PENDAPAT PELANGGAN MELALUI MEDIA
SOSIAL TWITTER MENGGUNAKAN METODE
NAIVE BAYES CLASSIFIER
AFIF NOR YUSUF
NIM. 201751067
DOSEN PEMBIMBING
Endang Supriyati, S.Kom., M.Kom.
Tri Listyorini, S.Kom., M.Kom.
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MURIA KUDUS
2021
ii
HALAMAN PERSETUJUAN
ANALISIS SENTIMEN MENGENAI LAYANAN PROVIDER
INDIHOME BERDASARKAN PENDAPAT PELANGGAN
MELALUI MEDIA SOSIAL TWITTER MENGGUNAKAN
METODE NAIVE BAYES CLASSIFIER
AFIF NOR YUSUF 201751067
Kudus, 14 Desember 2020
Menyetujui, Pembimbing Utama,
Endang Supriyati, S.Kom., M.Kom. NIDN. 0629077402
Pembimbing Pendamping,
Tri Listyorini, S.Kom., M.Kom. NIDN. 0616088502
Mengetahui
Koordinator Skripsi/Tugas Akhir
Ratih Nindyasari, S.Kom., M.Kom. NIDN. 0625028501
iii
HALAMAN PENGESAHAN
ANALISIS SENTIMEN MENGENAI LAYANAN PROVIDER
INDIHOME BERDASARKAN PENDAPAT PELANGGAN
MELALUI SOSIAL MEDIA TWITTER MENGGUNAKAN
METODE NAIVE BAYES CLASSIFIER
AFIF NOR YUSUF NIM. 201751067
Kudus, 7 Oktober 2020
Menyetujui, Ketua Penguji,
Arief Susanto, S.Kom., M.Kom. NIDN. 0603047104
Anggota Penguji I,
Evanita, S.Kom., M.Kom. NIDN. 0611088901
Anggota Penguji II,
Tri Listyorini, S.Kom., M.Kom. NIDN. 0616088502
Pembimbing Utama,
Endang Supriyati, S.Kom., M.Kom. NIDN. 0629077402
Pembimbing Pendamping,
Tri Listyorini, S.Kom., M.Kom. NIDN. 0616088502
Mengetahui, Dekan Fakultas Teknik
Mohammad Dahlan, ST., MT. NIDN. 0601076901
Ketua Program Studi Teknik Informatika
Muhammad Malik Hakim, ST, MTI. NIDN. 0020068108
iv
PERNYATAAN KEASLIAN
Saya yang bertanda tangan di bawah ini:
Nama : Afif Nor Yusuf
NIM : 201751067
Tempat & Tanggal Lahir : Jepara, 17 Maret 1999
Judul Skripsi/Tugas Akhir : Analisis Sentimen Mengenai Layanan Provider Indihome Berdasarkan Pendapat Pelanggan Melalui Media Sosial Twitter Menggunakan Metode Naïve Bayes Classifier
Menyatakan dengan sebenarnya bahwa penulisan Skripsi ini berdasarkan hasil penelitian, pemikiran dan pemaparan asli dari saya sendiri, baik untuk naskah laporan maupun kegiatan lain yang tercantum sebagai bagian dari Skripsi ini. Seluruh ide, pendapat, atau materi dari sumber lain telah dikutip dalam Skripsi dengan cara penulisan referensi yang sesuai.
Demikian pernyataan ini saya buat dengan sesungguhnya dan apabila di kemudian hari terdapat penyimpangan dan kekeliruan dalam pernyataan ini, maka saya bersedia menerima sanksi akademik berupa pencabutan gelar dan sanksi lain sesuai dengan peraturan yang berlaku di Universitas Muria Kudus.
Demikian pernyataan ini saya buat dalam keadaan sadar tanpa paksaan dari pihak mana pun.
Kudus, 15 Desember 2020 Yang memberi pernyataan,
Afif Nor Yusuf NIM. 201751067
v
ANALISIS SENTIMEN MENGENAI LAYANAN PROVIDER
INDIHOME BERDASARKAN PENDAPAT PELANGGAN
MELALUI MEDIA SOSIAL TWITTER MENGGUNAKAN
METODE NAÏVE BAYES CLASSIFIER
Nama mahasiswa : Afif Nor Yusuf
NIM : 201751067
Pembimbing :
1. Endang Supriyati, S.Kom., M.Kom. 2. Tri Listyorini, S.Kom., M.Kom.
RINGKASAN
Pada masa saat ini microblogging sudah jadi layanan komunikasi yang benar-benar populer di kalangan penggiat internet. Microblogging ialah suatu wadah media sosial yang memungkinkan pengguna untuk mempublikasi pesan pendek bermacam opini tentang bermacam topik, mengulas isu, menuliskan pembahasan suatu layanan, menulis kabar dalam jumlah karakter terbatas(Yenni Tresnawati, 2017). Dengan media sosial, informasi masyarakat sangat beragam, dari informasi tersebut data dapat diolah menjadi analisis sentimen. Penelitian ini bertujuan untuk mengetahui sentimen masyarakat terhadap provider Indihome. Tahapan proses dimulai dari pengumpulan data, preprocessing, dan pelabelan. Setelah melakukan pelabelan, dilakukan penggolongan atau clustering pada tiap
tweet, salah satunya menggunakan metode Naive Bayes Classifier. Berdasarkan
hasil eksperimen, analisis sentimen yang dapat dilakukan oleh sistem dengan tingkat akurasi yang didapat ialah 77,25%.
Kata kunci: Analisis Sentimen, Twitter, Naive Bayes Classifier, Text Mining,
vi
ANALISIS SENTIMEN MENGENAI LAYANAN PROVIDER
INDIHOME BERDASARKAN PENDAPAT PELANGGAN
MELALUI MEDIA SOSIAL TWITTER MENGGUNAKAN
METODE NAÏVE BAYES CLASSIFIER
Student Name : Afif Nor Yusuf
Student Identity Number : 201751067
Supervisor :
1. Endang Supriyati, S.Kom., M.Kom. 2. Tri Listyorini, S.Kom., M.Kom.
ABSTRACT
At this time microblogging has become a communication service that is really popular among internet activists. Microblogging is a social media platform that allows users to publish short messages of various opinions on various topics, review issues, write discussions of a service, write news in a limited number of characters (Yenni Tresnawati, 2017). With social media, community information is very diverse, from this information data can be processed into sentiment analysis. This study aims to determine public sentiment towards Indihome providers. The process stages start from data collection, preprocessing, and labeling. After labeling, each tweet is classified or clustered, one of which uses the Naive Bayes Classifier method. Based on the experimental results, the sentiment analysis that can be carried out by the system with an accuracy rate obtained is 77.25%.
Keywords: Sentiment Analysis, Twitter, Naive Bayes Classifier, Text Mining, Python
vii
KATA PENGANTAR
Segala puji syukur bagi Allah Yang Maha Pengasih dan Penyayang yang telah melimpahkan rahmat dan kasih sayang-Nya, sehingga akhirnya penulis berhasil menyelesaikan penulis laporan skripsi berjudul: ”Analisis Sentimen Mengenai Layanan Provider Indihome Berdasarkan Pendapat Pelanggan Melalui Media Sosial Twitter Menggunakan Metode Naïve Bayes Classifier”. Penyusunan Laporan Skripsi ini merupakan salah satu syarat untuk menyelesaikan Program Studi Teknik Informatika pada Fakultas Teknik Universitas Muria Kudus. Dalam proses penyelesaian tidak luput dari berbagai macam bantuan, dukungan, saran, dan kritik yang telah penulis terima, oleh karena itu dalam kesempatan ini penulis ingin menyampaikan ucapan terima kasih kepada:
1. Prof. Dr. Ir. Darsono, M.Si. selaku Rektor Universitas Muria Kudus. 2. Mohammad Dahlan, ST., MT, selaku Dekan Fakultas Teknik
Universitas Muria Kudus.
3. Muhammad Malik Hakim, ST., MTI, selaku Ketua Program Studi Teknik Informatika Fakultas Teknik Universitas Muria Kudus.
4. Ratih Nindyasari, S.Kom., M.Kom., selaku Koordinator Skripsi. 5. Endang Supriyati, S.Kom., M.Kom., selaku pembimbing utama, dan
Tri Listyorini, S.Kom., M.Kom., selaku pembimbing pendamping yang telah memberikan bimbingan, ilmu, saran, motivasi, nasihat, pengarahan, dan bimbingan selama penyusunan skripsi ini.
6. Kedua orang tua penulis, Bapak Suharso dan Ibu Juanah yang selalu mendoakan dan selalu memberikan segala dukungan kepada penulis dalam menyelesaikan skripsi ini.
Akhir kata, penulis menyadari adanya kekurangan dan kesalahan dalam penulisan skripsi ini, karena itu penulis menerima dengan baik kritik, saran yang membangun dari pembaca sekalian. Akhirnya penulis berharap semoga skripsi ini bisa bermanfaat khususnya bagi penulis dan bagi para pembaca.
Kudus, 15 Desember 2020 Penulis
viii
DAFTAR ISI
HALAMAN PERSETUJUAN ... ii
HALAMAN PENGESAHAN ... iii
PERNYATAAN KEASLIAN ... iv
RINGKASAN ... v
ABSTRACT ... vi
KATA PENGANTAR ... vii
DAFTAR ISI ... viii
DAFTAR GAMBAR ... x
DAFTAR TABEL ... xi
DAFTAR LAMPIRAN ... xii
BAB I PENDAHULUAN ... 1 1.1. Latar Belakang ... 1 1.2. Perumusan Masalah ... 2 1.3. Batasan Masalah ... 2 1.4. Tujuan ... 3 1.5. Manfaat ... 3 1.6. Luaran ... 3
BAB II TINJAUAN PUSTAKA ... 4
Penelitian Terkait ... 4 Analisis Sentimen ... 4 Indihome ... 5 Twitter ... 5 Twitter API ... 5 Preprocessing ... 6 2.6.1. Cleansing ... 6 2.6.2. Case Folding ... 6 2.6.3. Tokenisasi ... 6 2.6.4. Stopword Removal ... 6 2.6.5. Stemming ... 7 Pembobotan Kata ... 7
ix
Evaluasi ... 8
Kerangka Pemikiran ... 10
BAB III METODOLOGI ... 11
Kebutuhan Sistem ... 11 Studi Literatur ... 11 3.2.1. Analisa Sistem ... 11 3.2.2. Python ... 12 3.2.3. NLTK ... 12 3.2.4. Scikit-Learn ... 12 3.2.5. Django ... 12
Metode Pengumpulan Data ... 13
Skenario Sistem ... 13
3.4.1. Gambaran Umum ... 13
BAB IV HASIL DAN PEMBAHASAN ... 28
Implementasi ... 28
4.1.1. Pengumpulan dataset ... 28
4.1.2. Proses Preprocessing ... 31
4.1.3. Vektorisasi ... 35
4.1.4. Klasifikasi Naïve Bayes ... 36
4.1.5. Evaluasi ... 37 Hasil Pembahasan ... 38 4.2.1. Hasil Scraping ... 38 4.2.2. Hasil Preprocessing ... 42 4.2.3. Hasil Labeling ... 44 4.2.4. Hasil Klasifikasi ... 46 4.2.5. Model Predic ... 48 4.2.6. Visualisasi ... 49 BAB V PENUTUP ... 51 Kesimpulan ... 51 Saran ... 51 DAFTAR PUSTAKA ... 52 LAMPIRAN ... 55 BIODATA PENULIS ... 61
x
DAFTAR GAMBAR
Gambar 2.1. Contoh tabel confusion matrix ... 8
Gambar 2.2. Kerangka Pemikiran ... 10
Gambar 3.1. Gambaran umum sistem ... 13
Gambar 3.2. Alur scraping ... 14
Gambar 3.3. Alur preprocessing ... 15
Gambar 3.4. Diagram flow klasifikasi ... 27
Gambar 4.1. Token terhubung dengan Twitter ... 28
Gambar 4.2. Fungsi scraping ... 30
Gambar 4.3. Fungsi cleansing pada tweet ... 32
Gambar 4.4. Fungsi case folding ... 33
Gambar 4.5. Fungsi tokenizing ... 33
Gambar 4.6. Fungsi stopword ... 34
Gambar 4.7. Fungsi stemming ... 35
Gambar 4.8. Program vektorisasi ... 36
Gambar 4.9. Klasifikasi naive bayes dengan library scikit-learn ... 37
Gambar 4.10. Program confusion matrix ... 38
Gambar 4.11. Halaman Scraping ... 39
Gambar 4.12. Hasil scraping ... 39
Gambar 4.13. Proses preprocessing ... 43
Gambar 4.14. Labeling manual menggunakan excel ... 45
Gambar 4.15. Hasil labeling ... 45
Gambar 4.16. Halaman klasifikasi ... 46
Gambar 4.17. Hasil klasifikasi dan evaluasi ... 48
Gambar 4.18. Model predic ... 49
Gambar 4.19. Visualisasi bar ... 49
xi
DAFTAR TABEL
Tabel 3.1. Contoh cleansing pada tweet... 15
Tabel 3.2. Contoh case folding pada tweet ... 17
Tabel 3.3. Contoh tokenzing pada tweet ... 18
Tabel 3.4. Contoh stopword pada tweet ... 20
Tabel 3.5. Contoh stopword pada tweet ... 22
Tabel 3.6. Contoh proses labeling ... 23
Tabel 3.7. Contoh input teks ... 24
Tabel 3.8. Contoh menghitung document frequency (df) ... 24
Tabel 3.9. Contoh perhitungan invers document frequency (idf) ... 25
Tabel 3.10. Contoh menghitung bobot pada masing-masing dokumen ... 25
Tabel 3.11. Contoh pembobotan kata dengan perhitungan tf idf ... 26
Tabel 4.1. Hasil scraping ... 39
xii
DAFTAR LAMPIRAN
Lampiran 1. Lembar Bimbingan ... 55 Lampiran 2. Lembar Revisi Sidang ... 58