LAPORAN S K R I P S I
ANALISIS SENTIMEN TERHADAP AKUN TWITTER SAMSUNG INDONESIA MENGGUNAKAN METODE
NAIVE BAYES
JUNDI AL’MAR’I ROSYIDIN NIM. 201751052
DOSEN PEMBIMBING Tri Listyorini, M.Kom Endang Supriyati, M.Kom
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK
UNIVERSITAS MURIA KUDUS 2021
HALAMAN PERSETUJUAN
ii
iii
HALAMAN PENGESAHAN
ANALISIS SENTIMEN TERHADAP AKUN TWITTER SAMSUNG INDONESIA MENGGUNAKAN METODE NAIVE
BAYES
JUNDI AL’MAR’I ROSYIDIN NIM. 201751052
Kudus, 31 Agustus 2021
Menyetujui, Ketua Penguji,
Rizkysari Meimaharani, M.Kom NIDN. 0620058501
Anggota Penguji I,
Evanita, M.Kom NIDN.0611088901
Anggota Penguji II,
Tri Listyorini, M.Kom NIDN. 0616088502
Pembimbing Utama,
Tri Listyorini, M.Kom NIDN. 0616088502
Pembimbing Pendamping,
Endang Supriyati, M.Kom NIDN. 0629077402 Mengetahui,
Dekan Fakultas Teknik
Mohammad Dahlan ST. MT NIDN.0601076901
Ketua Program Studi Teknik Informatika
Mukhamad Nurkamid, S.Kom, M.Cs NIDN. 0620068302
iv
PERNYATAAN KEASLIAN
Sayaoyang bertandahtangan di bawah ini:
Namae : Jundi Al’mar’i Rosyidin
NIM : 201751052
Tempat & Tanggal Lahir : Pekalongan, 5 Juli 1998
Judul Skripsi : Analisis Sentimen Terhadap Akun Twitter Samsung Indonesia Dengan Metode Naïve Bayes Sebenarnya, saya di sini untuk mengatakan bahwa penulisan risalah ini didasarkan pada hasil penelitian awal, pemikiran, dan presentasi saya baik pada draf laporan maupunlkegiatanylain yangjtercantum dalam risalah ini. Semua pendapat, pandangan, atau bahan daridsumber lainodikutip dalam risalah melalui penyusunan referensi yang sesuai.
Olehkkarenayitu, saya membuatppernyataankini dengankbenar dan dengan senang hati menerima sanksi akademik berupa pencabutan gelar saya jika di kemudian hari ada kejanggalan atau kebohongan dalam pernyataan ini.
Demikiankpernyataan yang saya buatbdalamukeadaanusadar dan tanpa paksaanhdari manapun.
lKudus, 31aAgustus 2021 Tertandaopernyataan,
Jundi Al’mar’i Rosyidin NIM. 201751040
v
ANALISIS SENTIMEN TERHADAP AKUN TWITTER SAMSUNG INDONESIA MENGGUNAKAN METODE NAIVE
BAYES
Nama mahasiswa : Jundi Al’mar’i Rosyidin
NIM : 201751052
Pembimbing :
1. Tri Listyorini, M.Kom 2. Endang Supriyati, M.Kom
RINGKASAN
Media sosial dapat memberikan gambaran secara umum opini masyarakat. Salah satu media sosial adalah Twitter dengan jumlah pengguna cukup tinggi di Indonesia. Berdasarkan hal itu Twitter dapat menjadi media untuk melakukan analisis sentimen. Penelitian ini bertujuan untuk mengetahui respon masyarakat baik opini positif, netral dan negatif.
Data yang di gunakan yaitu dari akun Twitter Samsung Indonesia yang aktif mempromosikanpproduknya melalui Twitter. Oleh karena itu perlu di buat analisis sentimen sehingga produk yang di promosikan di Twitter samsung Indonesia dapat menjadi tolak ukur untuk evaluasi produk berikutnya.
Tahapan analisis sentimen dimulai dari pengumpulan data, preprocessing, pelabelan kemudian menggunakan metode Naive Bayes yang merupakan salahosatummetode machine learningomenggunakanpprobabilitas dengan kelebihan impelementasi mudah serta menghasilkan akurasi yangjbaik.
Hasil yangddidapatkan dari metode Naive Bayes dapat memberikan hasil cukup baik terhadap sentimen positif, netral dan negatif. Tingkatrakurasi yangjdidapat adalah 71,26%
Kata kunci : AnalisiskSentimen, Samsung Indonesia, NaivebBayes.
vi
SENTIMENT ANALYSIS OF SAMSUNG INDONESIA TWITTER ACCOUNT USING NAIVE BAYES METHOD
Student Name : Jundi Al’mar’i Rosyidin
Student Identity Number : 201751052
Supervisor :
1. Tri Listyorini, M.Kom 2. Endang Supriyati, M.Kom
ABSTRACT
Social media can provide a general picture of public opinion. One of the social media is Twitter with a fairly high number of users in Indonesia. Based on this, Twitter can be a medium for conducting sentiment analysis. This study aims to determine the public's response to positive, neutral, and negative opinions. The data used is from the Samsung Indonesia Twitter account which is actively promoting its products through Twitter. Therefore, it is necessary to make a sentiment analysis so that the products promoted on Samsung Indonesia's Twitter can be a benchmark for the next product evaluation. Sentiment analysis stages start from data collection, preprocessing, labeling then use the Naïve Bayes method which is a machinellearning method using probabilityswith the advantages of easy implementation and good accuracy. The results obtained from the naive Bayes method can give good results on positive, neutral, and negative sentiments. The level of accuracy obtained is 71.26%
Keywords: SentimentaAnalysis, Samsung Indonesia, NaivegBayes
vii
KATA PENGANTAR
PujissyukurrkehadirataAllahaatasrrahmat, hidayah, dan rahmatnya sehinggappenulis dapatmmenyelesaikan risalah inigdengan sukses danllancar.
Dalam proses penyelesaian skripsiuini, banyak narasumber yang telah memberikan dukungan baik bimbingan maupun semangat. Atas banyaknya bantuan, penulis ingin menyampaikan doa dan ucapan terimakkasih tuluskkepada:
1. Allah SWTyyang telahmmemberikan segala rahmatddan Hidayahnya.
2. BapakpProf. Dr. Ir. Darsono, M.Sigselaku Rektor UniversitasmMuriaaKudus.
3. Bapak MohammaddDahlan, ST., MT selakudDekanfFakultastTeknik UniversitasmMuriakKudus.
4. Bapak Mukhamad Nurkamid, S.Kom, M.Cs sebagai KetuaoProgramsStudi TeknikkInformatika UniversitasgMuriapKudus.
5. Ibu Ratih Nindyasari, M.Komkselaku Koordinator Skripsi ProgramsStudi TeknikqInformatika UniversitaskMuriawKudus.
6. Ibu Tri Listyorini, M.Kom selakupPembimbing I telahmmemberikan pengarahan dan masukansselama penyusunankskripsi.
7. Ibu Endang Supriyati, M.KomgselakulPembimbing II yanggtelahsmemberikan pengarahan dan masukan selama penyusunangskripsi.
8. Keluarga yangmmemberikan dukungan dan semangat.
Penulis mengakui kekurangan serta kesalahan dalam penyusunan risalah ini dan sekaligus menerima kritik, saran dan kontribusi pembaca untuk perbaikan di masagyang akankdatang. Akhir kata, penulis berharapqsemogaubuku-buku dalam risalah ini dapat bermanfaatbbagirpenulis dan pembaca padakumumnya.
lKudus, 12 Agustuss2021
Penuliss
viii
DAFTAR ISI
HALAMAN PERSETUJUAN... i
HALAMAN PENGESAHAN ... iii
PERNYATAAN KEASLIAN ... iv
RINGKASAN ... v
ABSTRACT ... vi
KATA PENGANTAR ... vii
DAFTAR ISI ... viii
DAFTAR GAMBAR ... x
DAFTAR TABELl ... xi
DAFTAR PERSAMAAN... xii
DAFTAR LAMPIRAN ... xiii BAB I PENDAHULUAN ... Kesalahan! Bookmark tidak ditentukan.
1.1. Latar Belakang ... Kesalahan! Bookmark tidak ditentukan.
1.2. PerumusannMasalahh ... Kesalahan! Bookmark tidak ditentukan.
1.3. Batasan Masalah ... Kesalahan! Bookmark tidak ditentukan.
1.4. Tujuan ... Kesalahan! Bookmark tidak ditentukan.
1.5. Manfaatt ... Kesalahan! Bookmark tidak ditentukan.
BAB II TINJAUANnPUSTAKA ... Kesalahan! Bookmark tidak ditentukan.
2.1. Penelitian Terkait ... Kesalahan! Bookmark tidak ditentukan.
2.2. Samsung Indonesia ... Kesalahan! Bookmark tidak ditentukan.
2.3. Twitter ... Kesalahan! Bookmark tidak ditentukan.
2.4. Twitter API ... Kesalahan! Bookmark tidak ditentukan.
2.11. Kerangka Pemikiran ... Kesalahan! Bookmark tidak ditentukan.
BAB III METODOLOGI ... Kesalahan! Bookmark tidak ditentukan.
3.1. Gambaran Penelitian ... Kesalahan! Bookmark tidak ditentukan.
3.2. StudiiLiteraturr... Kesalahan! Bookmark tidak ditentukan.
3.3. Metode PengumpulandDataKesalahan! Bookmark tidak ditentukan.
3.4. Analisis Kebutuhan Sistem Kesalahan! Bookmark tidak ditentukan.
3.5. Skenario Sistem ... Kesalahan! Bookmark tidak ditentukan.
3.6. Tahap Evaluasi Uji PerhitunganKesalahan! Bookmark tidak ditentukan.
3.7. Tahap Evaluasi Uji Akurasi Naive BayesKesalahan! Bookmark tidak ditentukan.
ix
BAB IV HASIL DAN PEMBAHASAN.. Kesalahan! Bookmark tidak ditentukan.
4.1. Pengumpulan Dataset ... Kesalahan! Bookmark tidak ditentukan.
4.2. TahappPreprocessinggDataKesalahan! Bookmark tidak ditentukan.
4.2.1 Hasil Cleansing ... Kesalahan! Bookmark tidak ditentukan.
4.2.2 HasilfCaseeFolding ... Kesalahan! Bookmark tidak ditentukan.
4.2.3 Hasil Tokenizing ... Kesalahan! Bookmark tidak ditentukan.
4.2.4 Hasil StopwordhRemoval ... Kesalahan! Bookmark tidak ditentukan.
4.2.5 Hasil Stemming ... Kesalahan! Bookmark tidak ditentukan.
4.2.6 Hasil Keseluruhan PreprocessingKesalahan! Bookmark tidak ditentukan.
4.3. Klasifikasi Algoritma Naive BayesKesalahan! Bookmark tidak ditentukan.
4.6. Model Predic ... Kesalahan! Bookmark tidak ditentukan.
4.7. Visualisasi ... Kesalahan! Bookmark tidak ditentukan.
BAB V PENUTUPP ... Kesalahan! Bookmark tidak ditentukan.
5.1. Kesimpulan ... Kesalahan! Bookmark tidak ditentukan.
5.2. Sarann ... Kesalahan! Bookmark tidak ditentukan.
DAFTAR PUSTAKA ... Kesalahan! Bookmark tidak ditentukan.
LAMPIRAN ... Kesalahan! Bookmark tidak ditentukan.
BIODATA PENULIS ... Kesalahan! Bookmark tidak ditentukan.
x
DAFTAR GAMBAR
Gambar 2. 1 Contoh tabel confusion matrixKesalahan! Bookmark tidak ditentukan.
Gambar 2. 2 Kerangka Pemikiran ... Kesalahan! Bookmark tidak ditentukan.
Gambar 3. 1 Gambaran
Umum ...Kesalahan! Bookmark tidak ditentukan.
Gambar 3. 2 Diagrama Alir Scraping .. Kesalahan! Bookmark tidak ditentukan.
Gambar 3. 3 Diagrama Alir PreprocessingKesalahan! Bookmark tidak ditentukan.
Gambar 3. 4 Diagram Alir klasifikasii . Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 1 Api
Twitter ...Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 2 Scraping Django ... Kesalahan! Bookmark tidak ditentukan.
Gambarr4. 3 Preprocessing PadadDjangoKesalahan! Bookmark tidak ditentukan.
Gambar 4. 4 Labeling Manual ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 5 Proses Labeling ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 6 Hasil Labeling Manual .... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 7 Halaman Klasifikasi ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 8 Hasil Klasifikasi ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 9 Hasil Confusion Matrix ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 10 Menentukan Nilai PrediksiKesalahan! Bookmark tidak ditentukan.
Gambar 4. 11 Hasil Accuracy ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 12 Hasil Precision... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 13 Hasil Recall ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 14 Hasil F1 score ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 15 Hasil Support ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 16 Visualisasi Pie Chart ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 17 Visualisasi Bar... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 18 Visualisasi Pie Chart ... Kesalahan! Bookmark tidak ditentukan.
Gambar 4. 19 Visualisasi Wordcloud .. Kesalahan! Bookmark tidak ditentukan.
xi
DAFTAR TABELl
Tabel 4. 1 Data Hasil Scraping ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 2 Data Hasil Cleansing ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 3 Data Hasil CaseFolding ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 4 Data HasiloTokenizing ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 5 Data Hasil Stopword RemovalKesalahan! Bookmark tidak ditentukan.
Tabel 4. 6 Data Hasil Stemming ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 7 Data Hasil Keseluruhan PreprocessingKesalahan! Bookmark tidak ditentukan.
Tabell4. 8 Trem ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 9 Contoh Trem ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 10 Data Training ... Kesalahan! Bookmark tidak ditentukan.
Tabel 4. 11 Data Testing ... Kesalahan! Bookmark tidak ditentukan.
xii
DAFTAR PERSAMAAN
Persamaan 2. 1. Rumus TF-IDF ... Kesalahan! Bookmark tidak ditentukan.
Persamaan 2. 2. Algoritma Naive BayesKesalahan! Bookmark tidak ditentukan.
Persamaan 2. 3 Rumus Accuracy ... Kesalahan! Bookmark tidak ditentukan.
Persamaan 2. 4 Rumus Precision ... Kesalahan! Bookmark tidak ditentukan.
Persamaan 2. 5 Rumus Recall ... Kesalahan! Bookmark tidak ditentukan.
Persamaan 2. 6 Rumus F1-Score ... Kesalahan! Bookmark tidak ditentukan.
xiii
DAFTAR LAMPIRAN
Lampiran 1 Lembar konsultasi………...55 Lampiran 2 Lembar Revisi……….58