i
SKRIPSI
ANALISIS SENTIMEN PADA MEDIA SOSIAL TWITTER TERHADAP
KINERJA KABINET INDONESIA MAJU MENGGUNAKAN K-MEANS
DISUSUN OLEH :
NURUL ISLAMY ZAKIYYATUNISAH
165410111
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI MANAJEMAN INFORMATIKA DAN KOMPUTER
AKAKOM
YOGYAKARTA
HALAMAN JUDUL
SKRIPSI
ANALISIS SENTIMEN PADA MEDIA SOSIAL TWITTER TERHADAP
KINERJA KABINET INDONESIA MAJU MENGGUNAKAN K-MEANS
Diajukan Sebagai Salah Satu Syarat Menyelesaikan Studi Jenjang Strata
Satu (S1)
Program Studi Teknik Informatika
Sekolah Tinggi Manajeman Informatika Dan Komputer
Akakom
Yogyakarta
Disusun Oleh
Nurul Islamy Zakiyyatunisah
Nomor Mahasiswa : 165410111
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI MANAJEMAN INFORMATIKA DAN KOMPUTER
AKAKOM
YOGYAKARTA
HALAMAN PERSETUJUAN
Judul : ANALISIS SENTIMEN PADA MEDIA SOSIAL TWITTER
TERHADAP KINERJA KABINET INDONESIA MAJU
MENGGUNAKAN K-MEANS
Nama : Nurul Islamy Zakiyyatunisah
NIM : 165410111
Jurusan : Teknik Informatika
Jenjang : Strata Satu (S1)
Tahun : 2020
Telah diperiksa dan disetujui
Yogyakarta, ………..2020
Mengetahui Dosen Pembimbing,
HALAMAN PENGESAHAN
SKRIPSI
ANALISIS SENTIMEN PADA MEDIA SOSIAL TWITTER TERHADAP
KINERJA KABINET INDONESIA MAJU MENGGUNAKAN K-MEANS
Telah dipertahankan dan diujikan didepan Dewan Penguji Skripsi dan dinyatakan diterima sebagai syarat guna memperoleh Gelar Sarjana Komputer Sekolah Tinggi Manajeman Informatika dan Komputer AKAKOM YOGYAKARTA
Yogyakarta, ________________2020 Mengesahkan,
Dewan Penguji Tanda Tangan
1. Dini Fakta Sari, S.T., M.T. ………
2. Deborah Kurniawati, S.Kom., M.Cs. ………
Mengetahui
Ketua Program Stui Teknik Informatika
HALAMAN PERSEMBAHAN
Bismillahirahmanirahim, yang utama dari segalanya sembah sujud serta syukur kepada Allah SWT, karena telah memberikan nikmat dan kelancaran dalam menyelesaikan Skripsi ini.
Karya tulis ini penulis persembahkan kepada :
1. Bapak Prasetya Budi Utomo dan Ibu Esih Rukaesih selaku orang tua yang saya cintai yang telah membersarkan dengan kasih dan sayang, yang telah memberikan dukungan serta doanya.
2. Kakakku Mohammad Nur Islamy Taufiqy dan Widya Puji Jayanti serta adikku Mohammad Habli Islamy Sholihin yang selalu memberikan semangat dan motivasi.
3. Terimakasih kepada Bapak Cuk Subiyantoro yang telah berperan sebagai orang tua dan membimbing saya selama tinggal di Yogyakarta.
4. Keluarga besar Himpunan Mahasiswa Jurusan Teknik Informatika (HMJ TI) yang telah mengasah softskill saya dan mengajari banyak hal yang tidak diajarkan dikampus.
5. Terimakasih kepada kakak Robby yang selalu membantu dan mendukung dalam menyelesaikan Skripsi ini.
6. Terimakasih untuk temanku Nita, Dina, Fikri, Zaqie, Ulum, Widya, Ineke, Nuky, Kak johan, Mas pamungkas, Dikdik dan teman-teman lainnya yang tidak dapat disebutkan satu persatu. Terimakasih atas kebersamaan dan moment yang telah kita jalin bersama.
HALAMAN MOTTO
“Kegagalan terjadi karena terlalu banyak berencana tapi sedikit berpikir” -Unknown-
“Dan bagi tiap-tiap umat ada kiblatnya (sendiri) yang ia menghadap kepadanya. Maka berlombalombalah kamu (dalam berbuat) kebaikan. Di mana saja kamu
berada pasti Allah akan mengumpulkan kamu sekalian (pada hari kiamat). Sesungguhnya Allah Maha Kuasa atas segala sesuatu.”
INTISARI
Kabinet Indonesia maju adalah kabinet pemerintahan Indonesia pimpinan Presiden Joko Widodo dan Wakil Presiden Ma’ruf Amin. Dengan telah dilantiknya para menteri ini, masyarakat akan melihat atau mempertimbangkan serta memberikan berbagai opini ataupun komentar yang beragam dari kinerja mereka.
Opini tersebut termasuk kedalam text mining yang akan dilakukan analisis sentimen dengan melakukan training data menggunakan teknik clustering salah satunya adalah K-Means. Dimana data tweet yang digunakan terlebih dahulu melalui proses preprocessing untuk merapikan data serta dilakukan pembobotan dengan TF-IDF (Term Frequency – Inverse Document Frequency) untuk mendapatkan nilai tiap fitur atau kata yang nantinya akan dihitung menggunakan K-Means clustering untuk mendapatkan nilai dengan menggunakan rumus jarak manhattan. Dimana klaster ditentukan dari nilai minimum atau nilai terdekat ke centroid yang ada.
Dengan teknik clustering ini fitur-fitur yang mirip dikelompokan ke dalam satu klaster. Sistem yang dibuat ini dapat mengkelompokan menjadi tiga klaster yaitu positif, netral dan negatif. Dari 4728 data tweet yang diambil untuk training data yang diambil dari tanggal 23 Oktober 2019 sampai 31 Juli 2020 memiliki persentase 2.34% nilai positif dengan jumlah 115 tweet, 44.71% nilai netral dengan jumlah 2114 tweet. dan 52.86% nilai negatif dengan jumlah 2499 tweet dan berhenti pada iterasi ke-3.
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga penyusunan Skripsi yang berjudul “Analisis Sentimen Pada Media Sosial Twitter Terhadap Kinerja Kabinet Indonesia Maju Menggunakan K-Means” ini dapat diselesaikan.
Penyusunan Skripsi dari awal hingga akhir tentu tidak lepas dari bantuan berbagai pihak. Dengan adanya bantuan tersebut, penulis hendak menyampaikan terimakasih kepada beberapa pihak diantaranya sebagai berikut :
1. Bapak Ir. Totok Suprawoto, M.M., M.T., selaku Ketua Sekolah Tinggi Manajemen Informatika dan Komputer Akakom Yogyakarta.
2. Ibu Dini Fakta Sari, S.T., M.T. selaku dosen pembimbing Pra Skripsi dan Ketua Program Studi Teknik Informatika Sekolah Tinggi Manajemen Informatika dan Komputer AKAKOM Yogyakarta.
3. Kedua orang tua beserta seluruh keluarga yang telah memberikan semangat dan dukungan berupa doa dan restu sehingga Laporan Skripsi ini dapat terselesaikan.
4. Seluruh dosen dan karyawan Sekolah Tinggi Manajemen Informatika dan Komputer AKAKOM Yogyakarta.
5. Teman-teman satu angkatan yang turut membantu dan memberikan semangat dalam tersusunnya Laporan Skripsi ini.
Laporan ini penulis susun sebagai salah satu syarat untuk menyelesaikan studi jenjang Starta 1 jurusan Teknik Informatika dan untuk memperoleh gelar
viii
Sarjana Komputer pada Sekolah Tinggi Manajemen Informatika dan Komputer AKAKOM Yogyakarta.
Penulis menyadari bahwa Laporan Skripsi ini tentu terdapat banyak kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran sehingga dapat menjadi lebih baik lagi. Semoga Laporan Skripsi ini memberikan manfaat bagi penulis dan bagi pembaca.
Yogyakarta, Agustus 2020
DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERSEMBAHAN ...iv
HALAMAN MOTTO ... v
INTISARI ...vi
KATA PENGANTAR...vii
DAFTAR GAMBAR ...xii
DAFTAR TABEL ... xiv
BAB I PENDAHULUAN ... 1 1.1 Latar Belakang ... 1 1.2 Rumusan Masalah ... 2 1.3 Ruang Lingkup ... 2 1.4 Tujuan Penelitian ... 3 1.5 Manfaat Penelitian ... 3 1.6 Sistematika Penulisan ... 3
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI ... 5
2.1 Tinjauan Pustaka ... 5 2.2 Dasar Teori ... 7 2.2.1 Twitter ... 7 2.2.2 Twitter API ... 8 2.2.3 Text Mining ... 8 2.2.4 Analisis Sentimen ...10 2.2.5 Clustering ...11 2.2.6 Preprocessing ...11 2.2.7 Pembobotan TF-IDF ...12 2.2.8 K-Means ...14
BAB III METODE PENELITIAN ...17
3.1 Bahan/Data ...17
3.1.1 Kebutuhan Input ...17
x
3.2 Peralatan ...18
3.2.1 Kebutuhan Perangkat Keras ...18
3.2.2 Kebutuhan Perangkat Lunak ...18
3.3 Prosedur Pengumpulan Data ...18
3.4 Analisis Dan Rancangan Sistem ...19
3.4.1 Blok Diagram Sistem ...19
3.4.2 Use Case Diagram ...22
3.4.3 Activity Diagram ...23
3.4.4 Flowchart K-Means ...24
3.4.5 Class Diagram ...25
3.5 Rancangan Antar Muka ...26
3.5.1 Halaman Depan ...27 3.5.2 Halaman Login ...27 3.5.3 Halaman Crawling ...28 3.5.4 Halaman Preprocessing ...28 3.5.5 Halaman Training ...29 3.4.6 Halamat Visualisasi ...29
BAB IV IMPLEMENTASI DAN PEMBAHASAN SISTEM ...31
4.1 Implementasi Sistem ...31
4.1.1 Proses Pengambilan Data...31
4.1.2 Preprocessing ...33 4.1.2.1 Case Folding ...33 4.1.2.2 Filtering ...33 4.1.2.3 Stemming ...34 4.1.2.4 Tokenizing ...35 4.1.2.4 Pembobotan TF-IDF ...35 4.1.3 K-Means ...37 4.1.3.1 Normalisasi ...37 4.1.3.2 Manhattan ...37 4.1.3.3 Update Centroid ...38 4.1.3.4 SSE ...38 4.2 Pembahasan Sistem ...39 4.2.1 Halaman Utama ...39
xi 4.2.3 Halaman Crawling ...40 4.2.4 Halaman Preprocessing ...41 4.2.4 Halaman Training ...41 4.2.5 Halaman Visualisasi ...42 4.3 Hasil Pengujian...42 4.3.1 Uji Akurasi ...45 BAB V PENUTUP...46 5.1 Kesimpulan ...46 5.2 Saran ...46 DAFTAR PUSTAKA ...47 LAMPIRAN
DAFTAR GAMBAR
Gambar 2.1 Tahapan Text Mining ... 9
Gambar 2.2 Ilustrasi K-Means ... 16
Gambar 3.1 Blok Diagram Sistem ... 19
Gambar 3.2 Contoh Filtering ... 20
Gambar 3.3 Contoh Tokenizing ... 21
Gambar 3.4 Use Case Diagram ... 22
Gambar 3.5 Activity Diagram ... 23
Gambar 3.6 Flowchart K-Means ... 24
Gambar 3.7 Class Diagram ... 26
Gambar 3.8 Halaman Depan ... 27
Gambar 3.9 Halaman Login ... 27
Gambar 3.10 Halaman Crawling ... 28
Gambar 3.11 Halaman Preprocessing ... 28
Gambar 3.12 Halaman Training... 29
Gambar 3.13 Halaman Visualisasi ... 29
Gambar 3.14 Output Sentimen dalam Diagram ... 30
Gambar 4.1 Proses pengambilan tweet ... 31
Gambar 4.2 Fungsi case folding ... 33
Gambar 4.3 Fungsi remove by regex... 33
Gambar 4.4 Fungsi remove by stopword ... 34
Gambar 4.5 Fungsi stemming ... 35
Gambar 4.6 Fungsi tokenizing ... 35
Gambar 4.7 Proses perhitungan TF-IDF ... 35
Gambar 4.8 Fungsi normalisasi ... 37
Gambar 4.9 Fungsi manhattan ... 38
Gambar 4.10 Proses perhitungan centroid baru ... 38
Gambar 4.11 Proses perhitungan SSE ... 39
Gambar 4.12 Halaman Utama... 39
xiii
Gambar 4.14 Halaman Crawling ... 40
Gambar 4.15 Halaman Preprocessing ... 41
Gambar 4.16 Halaman Training... 41
Gambar 4.17 Halaman Visualisasi ... 42
Gambar 4.18 Hasil sentiment diagram pie ... 43
Gambar 4.19 Contoh hasil sentiment positif ... 45
Gambar 4.20 Contoh hasil sentiment netral ... 45
DAFTAR TABEL
Tabel 2.1 Tinjauan Pustaka ... 5 Tabel 4.1 Contoh hasil sentimen ... 44