• Tidak ada hasil yang ditemukan

FAKULTAS TEKNIK DAN INFORMATIKA PROGRAM STUDI SISTEM INFORMASI UNIVERSITAS MULTIMEDIA NUSANTARA 2021

N/A
N/A
Protected

Academic year: 2021

Membagikan "FAKULTAS TEKNIK DAN INFORMATIKA PROGRAM STUDI SISTEM INFORMASI UNIVERSITAS MULTIMEDIA NUSANTARA 2021"

Copied!
13
0
0

Teks penuh

(1)

PERANCANGAN DAN PENGEMBANGAN BASIS DATA

TIDAK TERSTRUKTUR UNTUK APLIKASI SENTIMENT

ANALYSIS TWITTER DAN INSTAGRAM BAHASA

INDONESIA

SKRIPSI

Diajukan Guna Memenuhi Persyaratan Menempuh Gelar Sarjana Komputer (S.Kom.)

Aria Eka Putra 00000025749

FAKULTAS TEKNIK DAN INFORMATIKA

PROGRAM STUDI SISTEM INFORMASI

UNIVERSITAS MULTIMEDIA NUSANTARA

(2)

ii

PERNYATAAN

Dengan ini saya:

Nama : Aria Eka Putra NIM : 00000025749 Program Studi : Sistem Informasi

Menyatakan bahwa skripsi ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah yang ditulis oleh orang lain atau lembaga lain, dan semua karya ilmiah atau lembaga lain yang dirujuk dalam skripsi ini telah disebutkan sumber kutipan serta dicantumkan di Daftar Pustaka.

Jika di kemudian hari terbukti ditemukan kecurangan/penyimpangan, baik dalam pelaksanaan skripsi maupun dalam penulisan laporan skripsi, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah skripsi yang telah saya tempuh.

Tangerang, 07 Juni 2021

(3)

iii

HALAMAN PENGESAHAN

Skripsi dengan judul

“Perancangan dan Pengembangan Basis Data Tidak Terstruktur untuk Aplikasi Sentiment Analysis Twitter dan Instagram Bahasa Indonesia”

oleh Aria Eka Putra

telah diujikan pada hari Senin, 14 Juni 2021, pukul 15.00 s.d. 16.30 dan dinyatakan lulus

dengan susunan penguji sebagai berikut.

Ketua Sidang Penguji

Monika Evelin Johan, S.Kom., M.M.S.I. Wella, S.Kom., M.M.S.I.

Dosen Pembimbing

Suryasari, S.Kom., M.T.

Disahkan oleh

Ketua Program Studi Sistem Informasi - UMN

Ririn Ikana Desanti, S.Kom., M.Kom.

(4)

iv

PERANCANGAN DAN PENGEMBANGAN BASIS DATA TIDAK

TERSTRUKTUR UNTUK APLIKASI SENTIMENT ANALYSIS

TWITTER DAN INSTAGRAM BAHASA INDONESIA

ABSTRAK

Oleh: Aria Eka Putra

Ribuan bahkan jutaan informasi mengalir di media sosial setiap harinya. Hal ini membuat banyak organisasi atau perusahaan yang tertarik dalam meneliti opini yang ada di media sosial khususnya Twitter dan Instagram dalam bentuk analisis sentimen. Analisis sentimen adalah salah satu produk dari Big Data yang menggunakan dokumen tidak terstruktur seperti hasil review, konten media sosial, respon dari survei, dsb. dalam jumlah besar. Dewasa ini, basis data relasional biasa dinilai kurang efektif dalam menangani karakteristik dari Big Data.

Untuk itu, penelitian kali ini akan berfokus tentang bagaimana merancang dan membangun sebuah basis data yang dapat menangani dokumen berisikan opini yang ada di media sosial. Data untuk pengujian aplikasi berupa sampel dari tweet dan komen berdasarkan kata kunci ‘mrtjkt’ dengan total 18,900 entri data yang diambil dan disatukan menjadi file CSV. Kemudian perancangan basis data akan dilakukan menggunakan pendekatan top-down development untuk nantinya diimplementasikan pada MongoDB secara fisik lalu diuji ke dalam sebuah aplikasi analisis sentimen menggunakan uji black-box. Terakhir, menilai kecepatan operasi pada grafik Opscounters yang disediakan oleh MongoDB Atlas.

Hasil penelitian menunjukkan ketika melakukan perbandingan proses analisis sentimen terhadap data dengan jumlah yang 25% lebih sedikit, besarnya data serta kompleksitasnya ketika diproses dalam aplikasi hanya mempengaruhi dua metrik operasi dalam basis data yaitu insert dan getmore. Dengan kecepatan waktu tempuh untuk operasi insert pada analisis menggunakan 18,900 entri data selama 16,800 ms dan untuk operasi getmore selama 3,000 ms. Ketika dibandingkan dengan data yang lebih sedikit, jarak kecepatan pada operasi insert mencapai 54.1% dan pada operasi getmore mencapai 40%.

Kata Kunci: Analisis Sentimen, Aplikasi ShinyR, Media Sosial, MongoDB Atlas, Rancangan Basis Data

(5)

v

DESIGN AND DEVELOPMENT OF UNSTRUCTURED DATABASE

FOR INDONESIAN LANGUAGE TWITTER AND INSTAGRAM

SENTIMENT ANALYSIS APPLICATION

ABSTRACT

By: Aria Eka Putra

Thousands and even millions of information flows on social media every day. This makes many organizations or companies interested in researching opinions on social media, especially Twitter and Instagram in the form of sentiment analysis. Sentiment analysis is a product of Big Data that uses unstructured documents such as review results, social media content, responses from surveys, etc. in large quantities. Today, ordinary relational databases are considered less effective in dealing with the characteristics of Big Data.

For this reason, this research will focus on how to design and build a database that can handle documents containing opinions on social media. The data for application testing is in the form of samples of tweets and comments based on the keyword 'mrtjkt' with a total of 18,900 data entries taken and combined into a CSV file. Then the database design will be carried out using a top-down development approach to be physically implemented in MongoDB and then tested into a sentiment analysis application using a black-box test. Lastly, assess the operating speed on the Opscounters chart provided by MongoDB Atlas.

The results show that when comparing the sentiment analysis process with 25% less data, the amount of data and its complexity when processed in the application only affects two operating metrics in the database, insert and getmore operations. With the speed of travel time for insert operations in the analysis using 18,900 data entries for 16,800 ms and for getmore operations for 3,000 ms. When compared with less data, the speed range for the insert operation reaches 54.1% and the getmore operation reaches 40%.

Keyword: Database Design, MongoDB Atlas, Sentiment Analysis, ShinyR Applications, Social Media

(6)

vi

KATA PENGANTAR

Puji dan syukur penulis kepada Tuhan Yang Maha Esa karena atas berkat dan rahmat-Nya penulis dapat menyelesaikan laporan skripsi yang berjudul “Perancangan dan Pengembangan Basis Data Tidak Terstruktur untuk Aplikasi Sentiment Analysis Twitter dan Instagram Bahasa Indonesia”. Tujuan penulisan laporan skripsi ini adalah untuk memenuhi persyaratan kelulusan Program Strata 1, Program Studi Sistem Informasi, Fakultas Teknologi Informasi dan Komunikasi, Universitas Multimedia Nusantara.

Dalam laporan skripsi, penulis ingin menyampaikan terima kasih yang sebesar-besarnya kepada pihak-pihak yang telah memberikan bantuannya baik secara moral maupun secara material, terutama kepada:

1. Bapak Dr. Ninok Leksono selaku Rektor Universitas Multimedia Nusantara.

2. Ibu Ririn Ikana Desanti, S.Kom., M.Kom. selaku Ketua Program Studi Sistem Informasi Universitas Multimedia Nusantara.

3. Ibu Suryasari, S.Kom., M.T. selaku Dosen Pembimbing Skripsi, atas masukan dari awal penyusunan laporan skripsi sampai dengan penyelesaian penulisan laporan skripsi.

Penulis berharap semoga laporan skripsi ini dapat bermanfaat, baik sebagai sumber informasi maupun sumber inspirasi, bagi para pembaca dan pihak-pihak yang membutuhkan.

Tangerang, 07 Juni 2021

(7)

vii

DAFTAR ISI

PERNYATAAN ... ii

HALAMAN PENGESAHAN ... iii

ABSTRAK ... iv

ABSTRACT ... v

KATA PENGANTAR ... vi

DAFTAR ISI ... vii

DAFTAR GAMBAR ... x

DAFTAR TABEL ... xiii

BAB I PENDAHULUAN ... 1 1.1. Latar Belakang ... 1 1.2. Rumusan Masalah ... 4 1.3. Batasan Masalah ... 4 1.4. Tujuan Penelitian ... 5 1.5. Manfaat Penelitian ... 5

BAB II LANDASAN TEORI ... 6

2.1. Media Sosial ... 6

2.1.1. Twitter (Microblog) ... 6

2.1.2. Instagram (Content Community) ... 7

2.2. Sentiment Analysis ... 10

2.2.1. Pendekatan Machine Learning ... 11

2.2.2. Pendekatan Lexicon-Based ... 11

(8)

viii

2.3.1. Relational Database ... 13

2.3.2. Non-Relational Database ... 14

2.4. Database Development Process ... 16

2.4.1. Top-down Development ... 17 2.4.2. Bottom-up Development ... 18 2.5. Notasi Pemodelan ... 19 2.6. MongoDB ... 22 2.7. ShinyR ... 24 2.8. Penelitian Terdahulu ... 26

BAB III METODOLOGI PENELITIAN... 31

3.1. Objek Penelitian ... 31

3.2. Teknik Pengumpulan dan Pengolahan Data ... 32

3.2.1. Data (Tweet) pada Twitter ... 32

3.2.2. Data (Caption) pada Instagram ... 33

3.3. Metode Penelitian ... 33

3.3.1. Metode Klasifikasi ... 34

3.3.2. Metode Pengembangan Basis Data... 36

3.4. Variabel Penelitian ... 40

3.4.1. Variabel Independen ... 40

3.4.2. Variabel Dependen ... 41

3.5. Kerangka Teori ... 41

BAB IV ANALISIS DAN PEMBAHASAN ... 46

4.1. Pengumpulan Data ... 46

4.1.1. Pengumpulan Data Twitter ... 46

(9)

ix

4.1.3. Mempersiapkan Klaster ... 50

4.2. Perancangan Sistem ... 50

4.3. Perancangan Basis Data ... 54

4.4. Perancangan Antarmuka Aplikasi ... 58

4.4.1. Tampilan Login... 58

4.4.2. Tampilan Utama ... 60

4.5. Implementasi ... 62

4.5.1. Halaman Login/Registrasi ... 66

4.5.2. Halaman Utama ... 68

4.5.3. Halaman Pembuatan Plot / Wordcloud ... 70

4.6. Testing dan Evaluasi ... 75

4.7. Hasil Analisis ... 83

BAB V KESIMPULAN DAN SARAN ... 85

5.1. Kesimpulan ... 85

5.2. Saran ... 86

DAFTAR PUSTAKA ... 88

(10)

x

DAFTAR GAMBAR

Gambar 2.1. Tampilan Timeline Twitter ... 7

Gambar 2.2. Tampilan Sebuah Feed Dalam Instagram ... 8

Gambar 2.3. Tampilan Beranda Facebook ... 10

Gambar 2.7. Contoh Diagram ER ... 14

Gambar 2.8. Contoh NoSQL Berbasis Dokumen ... 15

Gambar 2.9. Skema Top-down Design ... 17

Gambar 2.10. Skema Bottom-Up Design ... 18

Gambar 2.11. Logo MongoDB ... 23

Gambar 2.12. Arsitektur Reaktif Dari ShinyR ... 25

Gambar 3.1. Database Development Lifecycle ... 38

Gambar 3.2. Kerangka Teori Metode Penelitian ... 42

Gambar 4.1. Persiapan Environment untuk Scrape Twitter ... 46

Gambar 4.2. Tangkapan Layar Tweet ID Yang di Scrape ... 47

Gambar 4.3. Tampilan Kode Untuk Mengambil Tweet Berdasarkan ID Menggunakan Python ... 48

Gambar 4.4. Data Dari Twitter Yang Berhasil di Tarik ... 48

Gambar 4.5. Persiapan Environment Untuk Melakukan Crawling Data di Instagram ... 49

Gambar 4.6. Hasil Crawling Instagram @mrtjkt ... 49

Gambar 4.7. Use Case Diagram Aplikasi Analisis Sentimen ... 51

Gambar 4.8. Activity Diagram Aplikasi Analisis Sentimen ... 53

Gambar 4.9. Class Diagram Sebagai Desain Konseptual Aplikasi Analisis Sentimen ... 55

(11)

xi

Gambar 4.10. Document Data Model Sebagai Desain Logikal Basis Data NoSQL

Aplikasi Analisis Sentimen ... 57

Gambar 4.11. Rancangan Halaman Login ... 58

Gambar 4.12. Rancangan Halaman Registrasi ... 59

Gambar 4.13. Rancangan Halaman Utama Versi Admin ... 60

Gambar 4.14. Rancangan Halaman Utama Versi User Biasa ... 61

Gambar 4.15. Rancangan Halaman Pembuatan Plot / Grafik dan Upload Dataset ... 62

Gambar 4.16. Dashboard shinyapps.io Ketika Aplikasi Sudah di Deploy ... 65

Gambar 4.17. Tampilan Halaman Login... 66

Gambar 4.18. Tampilan Registrasi Untuk Pengguna Baru ... 67

Gambar 4.19. Tampilan Registrasi Gagal Karena Email Tidak Sesuai Format ... 67

Gambar 4.20. Tampilan Registrasi Berhasil ... 68

Gambar 4.21. Halaman Utama Versi Admin ... 68

Gambar 4.22. Halaman Utama Versi User Umum ... 69

Gambar 4.23. Popup Pesan Gagal Cari Sentimen... 70

Gambar 4.24. Popup Pesan Gagal Karena Format File Tidak Sesuai ... 71

Gambar 4.25. Tampilan Setelah Admin Berhasil Mengunggah Dokumen Dan Menentukan Kolom Berisikan Opini ... 72

Gambar 4.26. Tabel Hasil Dokumen Yang Dianalisis ... 73

Gambar 4.27. Barplot Hasil Dokumen Yang Dianalisis ... 74

Gambar 4.28. Wordcloud Hasil Dokumen Yang Dianalisis ... 75

Gambar 4.29. Tampilan Barplot Setelah Melakukan Testing Menggunakan Data Yang Besar ... 77

Gambar 4.30. Grafik OpCounters Pada Metrik MongoDB Atlas ... 79

(12)

xii

Gambar 4.32. Grafik Connection Pada Metrik MongoDB Atlas ... 81 Gambar 4.33. Grafik Logical Size Pada Metrik MongoDB Atlas ... 81

(13)

xiii

DAFTAR TABEL

Tabel 2.1. Notasi Class Diagram/Document Data Model ... 20

Tabel 2.2. Notasi Relasi ... 21

Tabel 2.3. Rincian Penelitian Terdahulu ... 26

Tabel 3.1. Komparasi Model Klasifikasi ... 34

Tabel 3.2. Komparasi Model Pengembangan Basis Data ... 36

Tabel 4.1. Library dan Package Yang Digunakan Dalam Pengembangan Aplikasi Analisis Sentimen ... 63

Tabel 4.2. Tabel Laporan Defect Dari Black-Box Testing Aplikasi Menggunakan Data Twitter & Instagram ... 76

Tabel 4.3. Tabel Waktu Tempuh Operasi Dalam Basis Data Ketika Analisis Sentimen Dilakukan ... 82

Referensi

Dokumen terkait

Karena hubungan perusahaan dengan pelanggan hanya sebatas kontrak, hal ini menyebabkan perusahaan tidak memilki strategi tersendiri dalam mempertahankan pelanggan yang

Jadi tidak perlu ada undang-undang yang memberikan intel wewenang untuk menangkap, menyadap atau membunuh, namanya juga orang yang kerjanya tidak ketahuan, mau apa saja

Inflasi di Banjarnegara terjadi karena adanya kenaikan harga yang ditunjukan oleh naiknya indeks kelompok transportasi sebesar 0,82 persen; kelompok bahan makanan sebesar

Puji dan syukur kami ucapkan pada Tuhan Yang Maha Esa atas berkat, rahmat dan penyertaan-Nyalah sehingga kami dapat menyelesaikan skripsi yang berjudul “ANALISIS DAN

Dari hasil pemeriksaan kinerja atas efektivitas kegiatan APIP pada Inspektorat Kabupaten Kepulauan Talaud TA.2013 dan semester I TA. Bulan Juni) nilai rata- rata

Kemampuan bayi BBLR dan bayi sakit untuk hidup lebih besar bila mereka dirawat pada atau mendekati suhu lingkungan yang netral.Suhu ini ditetapkan dengan mengatur suhu permukaan yang

Persentase penyertaan modal pemerintah daerah pada tahun 2010 adalah sebesar 0 sampai dengan 2,8%. Artinya ada beberapa daerah pada tahun 2010 tidak melakukan penyertaan

Tambi uma adalah salah satu kearifan lokal masyarakat suku Ende yang berada di Kabupaten Ende Propinsi Nusa Tenggara Timur. Arti Tambi uma dalam bahasa Indonesia adalah