• Tidak ada hasil yang ditemukan

INSTAGRAM SENTIMENT ANALYSIS TERHADAP PEMINDAHAN IBUKOTA BARU DI INDONESIA

N/A
N/A
Protected

Academic year: 2021

Membagikan "INSTAGRAM SENTIMENT ANALYSIS TERHADAP PEMINDAHAN IBUKOTA BARU DI INDONESIA"

Copied!
13
0
0

Teks penuh

(1)

INSTAGRAM SENTIMENT ANALYSIS TERHADAP

PEMINDAHAN IBUKOTA BARU DI INDONESIA

SKRIPSI

Diajukan Guna Memenuhi Persyaratan Memperoleh Gelar Sarjana Komputer (S.Kom.)

Klivandy 00000015698

PROGRAM STUDI SISTEM INFORMASI

FAKULTAS TEKNIK DAN INFORMATIKA

UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2020

(2)

ii

PERNYATAAN

Dengan ini saya menyatakan bahwa skripsi ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah yang ditulis oleh orang lain atau lembaga lain, dan semua karya ilmiah orang lain atau lembaga lain yang dirujuk dalam skripsi ini telah disebutkan sumber kutipannya serta dicantumkan di Daftar Pustaka.

Jika di kemudian hari terbukti ditemukan kecurangan / penyimpangan, baik dalam pelaksanaan skripsi maupun dalam penulisan laporan skripsi, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah skripsi yang telah saya tempuh dan status kesarjanaan strata satu yang sudah diterima akan dicabut.

Tangerang, 30 April 2020

(3)

iii

HALAMAN PENGESAHAN

Skripsi dengan judul

“Instagram Sentiment Analysis Terhadap Pemindahan Ibukota Baru di Indonesia”

oleh Klivandy

telah diujikan pada hari Senin, 18 Mei 2020, pukul 09.00 s.d 10.30 dan dinyatakan lulus

dengan susunan penguji sebagai berikut.

Ketua Sidang Penguji

Suryasari, S.Kom., M.T. Wella, S.Kom., M.MSI. (COBIT5) Dosen Pembimbing

Friska Natalia, Ph.D. Disahkan Oleh

Ketua Program Studi Sistem Informasi – UMN

(4)

iv

INSTAGRAM SENTIMENT ANALYSIS TERHADAP PEMINDAHAN

IBUKOTA BARU DI INDONESIA

ABSTRAK

Oleh: Klivandy

Penelitian ini dilakukan dengan tujuan untuk melakukan analisis sentimen terhadap pemindahan ibukota baru di Indonesia. Penelitian ini dilakukan dikarenakan ada masyarakat yang setuju dan mendukung pemindahan ibukota ini berlangsung, tetapi di lain pihak ada juga yang tidak setuju terhadap pemindahan ibukota.

Dalam menyelesaikan masalah ini, digunakan metode text mining dengan algoritma Naïve Bayes, Support Vector Machine, dan Decision Tree C4.5 untuk melakukan pengklasifikasian terhadap sentimen masyarakat Indonesia. Sentimen tersebut dibagi menjadi tiga, yaitu: positif, negatif dan netral. Kedua algoritma tersebut digunakan untuk membandingkan algoritma apa yang mempunyai akurasi yang tinggi terhadap pengklasifikasian sentimen masyarakat Indonesia. Selain itu, digunakan juga software yang bernama R. R sendiri adalah sebuah

software yang sangat berguna dalam melakukan analisa maupun visualisasi data.

Selain R, digunakan juga software yang bernama Power BI. Power BI sendiri digunakan sebagai pembuatan visualisasi data sentimen yang telah diolah menjadi sebuah dashboard sehingga dapat dibaca maupun dipahami oleh pembaca teknis maupun non-teknis.

Sehingga dapat diperoleh hasil akhir yaitu sebuah dashboard yang berguna untuk memberikan informasi mengenai sentimen masyarakat dengan pemindahan ibukota baru di Indonesia.

Kata kunci: text mining, naïve bayes, support vector machine, decision tree c4.5,

(5)

v

INSTAGRAM SENTIMENT ANALYSIS OF THE RELOCATION OF

THE NEW CAPITAL IN INDONESIA

ABSTRACT

Oleh: Klivandy

This research was conducted with the aim of conducting sentiment analysis of the relocation of the new capital in Indonesia. This research was conducted because there are people who agree and support the relocation of the new capital, but on the other hand there are also those who disagree with the relocation of the new capital.

In solving this problem, text mining methods are used with the Naïve Bayes, Support Vector Machine, and Decision Tree C4.5 algorithm to classify the sentiments of the Indonesian people. The sentiment is divided to three: positive, negative, and neutral. The two algorithms are used to compare what algorithms have high accuracy towards the classification of Indonesian people’s sentiments. In addition, used a software called R. R is useful in analyzing and visualizing data. Besides R, a software called Power BI is also used. Power BI itself is used as a visualization of sentiment data that has been processed into a dashboard so that it can be read or understood by techinal and non-technical readers.

So the final result is dashboard that is useful to provide information regarding public sentiment with the relocation of a new capital in Indonesia.

Keywords: text mining, naïve bayes, support vector machine, decision tree c4.5,

(6)

vi

KATA PENGANTAR

Puji dan syukur kepada Tuhan Yang Maha Kuasa sehingga skripsi yang berjudul “Instagram Sentiment Analysis Terhadap Pemindahan Ibukota Baru di Indonesia” dapat selesai tepat pada waktunya. Skripsi ini penulis ajukan kepada Program Strata 1, Program Studi Sistem Informasi, Fakultas Teknologi Informasi dan Komunikasi, Universitas Multimedia Nusantara.

Dengan berakhirnya proses penulisan skripsi ini, penulis ingin mengucapkan terima kasih kepada Universitas Multimedia Nusantara yang telah memberi beasiswa kepada penulis selama menempuh pendidikan di Universitas Multimedia Nusantara sehingga dapat membantu meringankan penulis dalam membayar biaya kuliah penulis hingga selesai.

Selain itu, penulis juga ingin mengucapkan terima kasih kepada:

1. Ibu Friska Natalia, Ph.D. yang telah memberikan bimbingan dan saran-saran yang diberikan kepada penulis selama pengerjaan skripsi,

2. Orang tua dan keluarga yang telah memberikan semangat dan doa kepada penulis dalam penyelesaian skripsi ini,

3. Teman-teman yang telah memberikan semangat dan dukungan kepada penulis dalam penyelesaian skripsi ini

(7)

vii

Semoga skripsi ini dapat memberikan informasi dan inspirasi yang bermanfaat bagi para pembaca.

Tangerang, 30 April 2020

(8)

viii

DAFTAR ISI

PERNYATAAN ... ii

HALAMAN PENGESAHAN ...iii

ABSTRAK ... iv

ABSTRACT ... v

KATA PENGANTAR ... vi

DAFTAR ISI ... viii

DAFTAR TABEL ... x

DAFTAR GAMBAR ... xi

DAFTAR RUMUS ... xiii

BAB I PENDAHULUAN ... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah ... 3 1.3 Batasan Masalah ... 3 1.4 Tujuan ... 3 1.5 Manfaat ... 4

BAB II LANDASAN TEORI ... 5

2.1 Media Sosial ... 5

2.2 Data Mining ... 5

2.3 Text Mining ... 6

2.4 Analisis Sentimen ... 6

2.5 Text Preprocessing ... 7

2.6 Naïve Bayes Classifier ... 9

2.7 Support Vector Machine ... 10

2.8 Decision Tree C4.5 ... 11

2.9 R Programming ... 12

2.10 Microsoft Power BI ... 12

2.11 Penelitian Terdahulu ... 13

BAB III METODOLOGI PENELITIAN... 16

3.1 Gambaran Umum Objek Penelitian ... 16

3.2 Metode Penelitian ... 16

3.2.1 Alur Penelitian ... 16

(9)

ix

3.2.1.2 Data Cleansing ... 17

3.2.1.3 Text Preprocessing ... 18

3.2.1.4 Klasifikasi Sentimen dan Implementasi Algoritma ... 19

3.2.1.5 Analisis dan Visualisasi Data ... 19

3.2.2 Problem Solving ... 19

3.3 Variabel Penelitian... 21

3.4 Teknik Pengumpulan Data ... 21

3.5 Teknik Pengambilan Sampel ... 21

3.6 Teknik Analisis Data ... 22

BAB IV ANALISIS DAN HASIL PENELITIAN ... 23

4.1 Pengumpulan Data ... 23 4.2 Data Cleansing ... 27 4.3 Text Preprocessing ... 31 4.3.1 Case Folding ... 31 4.3.2 Stemming ... 32 4.3.3 Tokenizing ... 32 4.3.4 Filtering ... 33

4.4 Klasifikasi Sentimen dan Implementasi Algoritma ... 37

4.5 Analisis dan Visualisasi Data ... 52

BAB V KESIMPULAN DAN SARAN... 72

5.1 Kesimpulan... 72

5.2 Saran ... 73

DAFTAR PUSTAKA ... 74

(10)

x

DAFTAR TABEL

Tabel 2.1 Contoh Algoritma Naive Bayes ... 10

Tabel 2.2 Tabel Penelitian Terdahulu ... 13

Tabel 3.1 Perbandingan Algoritma ... 20

Tabel 3.2 Perbandingan R dengan Python ... 22

Tabel 4.1 Fungsi Package... 26

Tabel 4.2 Contoh Klasifikasi Sentimen Berdasarkan Kalimat ... 43

Tabel 4.3 Total Kata Klasifikasi per Sentimen ... 43

Tabel 4.4 Tabel Analisis Sebelum dan Sesudah ... 71

(11)

xi

DAFTAR GAMBAR

Gambar 2.1 Contoh Stemming ... 8

Gambar 2.2 Contoh Tokenizing ... 8

Gambar 2.3 Contoh Filtering ... 9

Gambar 3.1 Alur Penelitian ... 17

Gambar 4.1 Download instagram-scraper ... 23

Gambar 4.2 Install instagram-scraper ... 24

Gambar 4.3 Script instagram-scraper pada R ... 24

Gambar 4.4 Contoh Data Mentah .json... 25

Gambar 4.5 Input Data Mentah ke R ... 27

Gambar 4.6 Data Mentah di R ... 27

Gambar 4.7 Script Memisahkan Kolom Data ... 28

Gambar 4.8 Data yang Akan Digunakan ... 29

Gambar 4.9 Script Cleansing di R ... 30

Gambar 4.10 Data Setelah di Cleansing ... 30

Gambar 4.11 Perbandingan Data Sebelum dan Sesudah Cleansing ... 31

Gambar 4.12 Script Case Folding ... 31

Gambar 4.13 Script Stemming di R ... 32

Gambar 4.14 Script Tokenizing di R ... 32

Gambar 4.15 Download dan Install Stopword ... 33

Gambar 4.16 Script Untuk Mengubah Singkatan Kata ... 34

Gambar 4.17 Script Untuk Menghapus Kata Umum ... 34

Gambar 4.18 Hasil Penghapusan Kata Umum ... 35

Gambar 4.19 Script Penyimpanan ke file csv ... 35

Gambar 4.20 Data Microsoft Excel finalclean.csv ... 36

Gambar 4.21 Script Pengklasifikasian Analisis Sentimen ... 38

Gambar 4.22 Hasil Klasifikasi Analisis Sentimen ... 39

Gambar 4.23 Klasifikasi Sentimen Positif ... 40

Gambar 4.24 Klasifikasi Sentimen Negatif... 41

Gambar 4. 25 Klasifikasi Sentimen Netral... 42

Gambar 4.26 Penyimpanan Hasil Klasifikasi... 44

Gambar 4.27 Script Pembuatan Data Training dan Data Test ... 45

Gambar 4.28 Script Implementasi Algoritma Naïve Bayes ... 46

Gambar 4.29 Akurasi Algoritma Naïve Bayes ... 47

Gambar 4.30 Script Data Training dan Test pada Support Vector Machine... 48

Gambar 4.31 Implementasi Algoritma Support Vector Machine ... 49

Gambar 4.32 Akurasi Algoritma Support Vector Machine... 50

Gambar 4.33 Script Data Training dan Test pada Decision Tree C4.5 ... 50

Gambar 4.34 Implementasi Algoritma Decision Tree C4.5 ... 51

Gambar 4.35 Akurasi Algoritma Decision Tree C4.5 ... 51

Gambar 4.36 Input Data Excel ... 53

(12)

xii

Gambar 4.38 Wordcloud Power BI... 55

Gambar 4.39 Input Data Sentimen Positif Menjadi Visualisasi WordCloud ... 56

Gambar 4.40 Visualisasi WordCloud Sentimen Positif ... 57

Gambar 4.41 Visualisasi WordCloud Sentimen Negatif ... 58

Gambar 4.42 Visualisasi WordCloud Sentimen Netral ... 59

Gambar 4.43 Judul Dashboard ... 60

Gambar 4.44 Hasil Judul Dashboard... 61

Gambar 4.45 Grafik Total Teks ... 62

Gambar 4.46 Hasil Grafik Total Teks... 63

Gambar 4.47 Grafik Jumlah Teks Pada Masing-Masing Sentimen ... 64

Gambar 4.48 Hasil Grafik Jumlah Teks Pada Masing-Masing Sentimen ... 65

Gambar 4.49 Grafik Table Keseluruhan Teks ... 66

Gambar 4.50 Hasil Grafik Table Keseluruhan Teks... 67

Gambar 4.51 Grafik Filtering Sentimen ... 68

Gambar 4.52 Hasil Grafik Filtering Sentimen ... 69

(13)

xiii

DAFTAR RUMUS

Rumus 2.1 Persamaan Teorema Bayes ... 10

Rumus 2.2 Rumus Precision ... 11

Rumus 2.3 Rumus Recall ... 11

Referensi

Dokumen terkait

Hal ini berbeda dengan penelitian Syarifudin (2014) hasil penelitiannya menyatakan peran internal auditor tidak berpengaruh signifikan terhadap kualitas laporan

Implementasi Text Mining Pada Analisis Sentimen Pengguuna Twitter Terhadap Media Mainstream Menggunakan Naive Bayes Classifier Dan Support Vector Machine..

Kawasan Sentra Produksi Propinsi Maluku... Perhubungan Laut Trayek

Didalam suatu pertandingan dan perlombaan olahraga hanya ada dua hasil yang mungkin diterima dari hasil sebuah proses usaha yang dilakukan seorang atlet, yaitu kemenangan

Gaya belajar adalah cara yang ditempuh oleh masing-masing individu untuk memahami atau menguasai informasi melalui persepsi yang berbeda. Gaya kognitif field

Algoritma klasifikasi dalam machine learning yang pernah digunakan untuk prediksi cacat software antara lain k-Nearest Neighbor (k-NN), Naïve Bayes (NB) dan Decision Tree

Dari 2 metode algoritma yang digunakan pada tahap klasifikasi yaitu Naïve Bayes dan Support Vector Machine (SVM) didapatkan hasil bahwa nilai akurasi yang lebih

Penelitian ini menggunakan enam metode untuk klasifikasi yaitu Lexicon-based classifier, Naïve Bayes, Bayesian Network, SVM (Support Vector Machine), C4.5 (Decision