SKRIPSI
ANALISIS SENTIMEN PENCITRAAN PERGURUAN TINGGI DI YOGYAKARTA MENGGUNAKAN METODE NAЇVE BAYES
CLASSIFIER
HENA TRIANA
Nomor Mahasiswa: 175410111
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AKAKOM
YOGYAKARTA 2021
i SKRIPSI
ANALISIS SENTIMEN PENCITRAAN PERGURUAN TINGGI DI YOGYAKARTA MENGGUNAKAN METODE NAЇVE BAYES
CLASSIFIER
Diajukan sebagai salah satu syarat menyelesaikan studi jenjang strata satu (S1) Program Studi Teknik Informatika
Sekolah Tinggi Manajemen Informatika dan Komputer Akakom
Yogyakarta
Disusun Oleh HENA TRIANA
Nomor Mahasiswa: 175410111
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AKAKOM
YOGYAKARTA 2021
ii
HALAMAN PERSETUJUAN
Judul : Analisis Sentimen Pencitraan Perguruan Tinggi di Yogyakarta Menggunakan Metode Naïve Bayes Classifier
Nama : Hena Triana
NIM : 175410111
Program Studi : Teknik Informatika Jenjang : Strata Satu (S1)
Tahun : 2021
Telah diperiksa dan disetujui
Yogyakarta, ………. 2021 Mengetahui
Dosen pembimbing
Y.Yohakim Marwanta, S.Kom., M.Cs.
iii
HALAMAN PENGESAHAN
SKRIPSI
ANALISIS SENTIMEN PENCITRAAN PERGURUAN TINGGI DI YOGYAKARTA MENGGUNAKAN METODE NAЇVE BAYES
CLASSIFIER
Telah dipertahankan di depan Dewan Penguji Skripsi dan dinyatakan diterima untuk memenuhi sebagai syarat guna memperoleh Gelar Sarjana Komputer
Sekolah Tinggi Manajamen Informatika dan Komputer Yogyakarta
Yogyakarta,
Mengesahkan
Dewan Penguji Tanda Tangan
1. Sri Redjeki, S.Si., M.Kom. ……….
2. Y. Yohakim Marwanta, S.Kom., M.Cs. ……….
Mengetahui
Ketua Program Studi Teknik Informatika
Dini Fakta Sari, S.T., M.T.
iv
HALAMAN PERSEMBAHAN
Alhamdulillah atas ridha-Nya dan dengan semangat, tekad dan doa akhirnya skripsi ini dapat penulis selesaikan. Maka dengan penuh rasa syukur dan tulus ikhlas skripsi ini penulis persembahkan kepada : Kedua orang tua atas ketulusannya mendukung dan keikhlasan dalam doa, kedua orang tua yang telah membesarkan dan mendidik penulis yaitu kakek dan nenek, kakak dan adik-adik yang telah menemani dan keluarga yang tulus selalu ada sehingga menghantarkan penulis menyelesaikan Pendidikan di Akakom Yogyakarta.
Guru dan Dosen yang telah memberikan ilmu yang bermanfaat selama proses menuntut ilmu serta doa-doa terbaiknya.
Teman dan sahabat yang telah menjadi bagian dari cerita, memberikan energi positif, semangat, dukungan dan motivasi.
Organisasi-organisasi yang telah menjadi tempat berproses, mengembangkan diri, dan mendapatkan pengalaman yang tidak didapatkan di kelas.
v
HALAMAN MOTTO
“Muliakanlah orang-orang yang telah memberikan pelajaran kepadamu”
(HR. Abu Hasan Mawardi)
“Seorang pelajar tidak akan memperoleh ilmu dan tidak pula ilmunya bermanfaat, selain jika mau mengagungkan ilmu itu sendiri, ahli ilmu, dan menghormati keagungan gurunya”
- Syekh Az-Zarnuji -
“Semangatlah dalam hal yang bermanfaat untukmu, minta tolonglah pada Allah, dan jangan malas(patah semangat)”
(HR. Muslim no 2664)
“Deciding what not to do is as important as deciding what to do”
- Steve Jobs –
vi INTISARI
Pada era perkembangan teknologi saat ini terjadi pertumbuhan data yang terus meningkat. Berbagai metode mengolah data untuk menghasilkan informasi yang berharga terus berkembang. Analisis sentimen adalah salah satu metode pengolahan data yang merupakan bagian dari opinion mining salah satu bidang Natural Language Processing (NLP) yaitu proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini.
Twitter menjadi salah satu media sosial yang memiliki banyak pengguna dan menghasilkan banyak data. Tidak sedikit pengguna twitter memanfaatkannya untuk mendapatkan infromasi, meyampaikan pendapat, membagikan informasi atau hanya sekedar membagikan kegiatan sehari-hari.
Penelitian ini memanfaatkan data dari twitter untuk melakukan analisis sentimen perguruan tinggi Yogyakarta menggunakan metode Naïve Bayes Classifier. Data yang digunakan adalah tweet berbahasa Indonesia dengan kata kunci 10 pergutuan tinggi di Yogyakarta dengan rangking teratas berdasarkan webometrics dan 4 kata kunci lainnya yang sering dicari melalui google tentang Yogyakarta yang relevan dengan obyek penelitian.
Dari penelitian yang telah dilakukan, terdapat 1710 data diambil dari twitter yang digunakan untuk klasifikasi yang terdiri dari 3 label yaitu positif, negatif dan netral. Data dibagi kedalam 70% data latih dan 30% data uji secara acak. Hasil klasifikasi sentimen analisis terhadap data uji didapatkan 82.1% netral, 14.8%
positif dan 3.1% negatif dengan nilai akurasi sebesar 73%.
Kata Kunci: Analisis Sentimen, Klasifikasi, Naïve Bayes, Twitter
vii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan rahmat, hidayah dan inayah-Nya sehingga penulis dapat menyusun dan menyelesaikan skripsi ini, untuk memenuhi salah satu syarat memperoleh gelar sarjana strata satu pada jurusan Teknik Informatika STMIK Akakom Yogyakarta.
Dalam penyusunan skripsi ini penulis mendapat bantuan, bimbingan, informasi, dan saran–saran baik secara langsung maupun tidak langsung dari berbagai pihak. Oleh karena itu, penulis mengucapkan terima kasih kepada semua pihak yang telah banyak membantu penulis dalam menyusun skripsi ini, yaitu kepada :
1. Bapak Ir. Totok Suprawoto, M.M., M.T., selaku Ketua STMIK Akakom Yogyakarta.
2. Ibu Dini Fakta Sari, S.T., M.T., selaku Ketua Program Studi Teknik Informatika STMIK Akakom Yogyakarta.
3. Bapak Luthfan Hadi Pramono, S.ST., M.T., selaku Dosen Pembimbing Akademik.
4. Bapak Y. Yohakim Marwanta, S.Kom., M.Cs., selaku Dosen Pembimbing Skripsi.
5. Ibu Sri Redjeki, S.Si., M.Kom., dan Ibu Maria Mediatrix Sebatubun, S.Kom., M.Eng., selaku Narasumber.
6. Bapak/Ibu dosen STMIK Akakom Yogyakarta yang telah memberikan banyak ilmu.
7. Orang Tua dan Keluarga yang selalu menyertakan doa dan dukungannya.
8. Teman-Teman yang sudah memberikan dorongan motivasi, semangat, dan rekan diskusi.
Penulis menyadari bahwa penyusunan skripsi ini masih jauh dari kesempurnaan. Kritik dan saran yang membangun sangat diharapkan oleh penulis demi penyempurnaan dikemudian hari. Semoga skripsi ini dapat bermanfaat.
Yogyakarta, Januari 2021
Penulis
viii DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERSEMBAHAN ... iv
HALAMAN MOTTO ... v
INTISARI ... vi
KATA PENGANTAR ... vii
DAFTAR ISI ... viii
DAFTAR GAMBAR ... x
DAFTAR TABEL ... xi
BAB 1 PENDAHULUAN ... 1
1.1 Latar Belakang Masalah ... 1
1.2 Rumusan Masalah ... 2
1.3 Ruang Lingkup ... 2
1.4 Tujuan Penelitian ... 2
1.5 Manfaat Penelitian ... 3
1.6 Sistematika Penulisan ... 3
BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI ... 5
2.1 Tinjauan Pustaka ... 5
2.2 Dasar Teori ... 6
2.2.1 Perguruan Tinggi Yogyakarta ... 6
2.2.2 Analisis Sentimen ... 7
2.2.3 Machine Learning ... 8
2.2.4 Naïve Bayes Classifier ... 8
2.2.5 Term Frequency-Inverse Document Frequency (TF-IDF) ... 9
2.2.6 Akurasi ... 10
BAB 3 METODE PENELITIAN... 11
3.1 Bahan/Data ... 11
3.1.1 Kebutuhan Input ... 11
ix
3.1.2 Kebutuhan Proses ... 11
3.1.3 Kebutuhan Output ... 11
3.2 Peralatan ... 11
3.3 Prosedur dan Pengumpulan Data ... 12
3.4 Analisis dan Percancangan Sistem ... 12
3.4.1 Alur Pengambilan Data ... 12
3.4.2 Blok Diagram Sistem ... 13
3.4.3 Perancangan Antar Muka ... 15
BAB 4 IMPLEMENTASI DAN PEMBAHASAN ... 16
4.1 Implementasi dan Uji Coba Sistem ... 16
4.1.1 Data ... 16
4.1.2 Preprocessing ... 17
4.1.3 Pembobotan TF-IDF ... 21
4.1.4 Klasifikasi ... 23
4.2 Pembahasan ... 27
4.2.1 Wordcloud ... 27
4.2.2 Analisis Sentimen ... 29
4.2.3 Akurasi ... 29
BAB 5 PENUTUP ... 31
5.1 Kesimpulan ... 31
5.2 Saran ... 31
DAFTAR PUSTAKA ... 33 LAMPIRAN
x
DAFTAR GAMBAR
Gambar 3. 1 Alur Pengambilan Data ... 13
Gambar 3. 2 Blok Diagram Sistem ... 13
Gambar 3. 3 Diagram Hasil Analisis ... 15
Gambar 4. 1 Program untuk Pengambilan Data... 16
Gambar 4. 2 Program untuk Case Folding dan Removing... 18
Gambar 4. 3 Program untuk Tokenizing ... 19
Gambar 4. 4 Program untuk Filtering ... 19
Gambar 4. 5 Program untuk Stemming ... 20
Gambar 4. 6 Program untuk Pembobotan TF-IDF... 21
Gambar 4. 7 Program untuk Split Dataset ... 23
Gambar 4. 8 Hasil Split Data ... 24
Gambar 4. 9 Program untuk Klasifikasi Naïve Bayes ... 24
Gambar 4. 10 Wordcloud tweet label Positif ... 27
Gambar 4. 11 Wordcloud tweet label Negatif ... 28
Gambar 4. 12 Wordcloud tweet label Netral ... 28
Gambar 4. 13 Diagram Hasil Klasifikasi ... 29
xi
DAFTAR TABEL
Tabel 2. 1 Tinjauan Pustaka ... 5
Tabel 3. 1 Daftar Kata Kunci Pengumpulan Data... 12
Tabel 4. 1 Contoh Data hasil Pelabelan Manual ... 17
Tabel 4. 2 Contoh Hasil Proses Case Folding dan Removing... 18
Tabel 4. 3 Contoh Hasil Proses Tokenizing ... 19
Tabel 4. 4 Contoh Hasil Proses Filtering ... 20
Tabel 4. 5 Contoh Hasil Proses Stemming ... 21
Tabel 4. 6 Contoh Hasil Perhitungan TF-IDF ... 23