• Tidak ada hasil yang ditemukan

SKRIPSI. IMPLEMENTASI ALGORITMA NAIVE BAYES CLASSIFIER PADA SOCIAL MEDIA (Twitter) TERHADAP UJARAN KEBENCIAN BERBAHASA INDONESIA

N/A
N/A
Protected

Academic year: 2021

Membagikan "SKRIPSI. IMPLEMENTASI ALGORITMA NAIVE BAYES CLASSIFIER PADA SOCIAL MEDIA (Twitter) TERHADAP UJARAN KEBENCIAN BERBAHASA INDONESIA"

Copied!
15
0
0

Teks penuh

(1)

i

SKRIPSI

IMPLEMENTASI ALGORITMA NAIVE BAYES CLASSIFIER PADA SOCIAL MEDIA (Twitter) TERHADAP UJARAN KEBENCIAN

BERBAHASA INDONESIA

IMPLEMENTATION OF NAIVE BAYES CLASSIFIER ALGORITHM ON SOCIAL MEDIA (Twitter) TO THE TEACHING OF INDONESIAN HATE

SPEECH

NAUFAL RIZA FATAHILLAH 135610064

PROGRAM STUDI SISTEM INFORMASI

AKAKOM YOGYAKARTA

2017

(2)

SKRIPSI

IMPLEMENTASI ALGORITMA NAIVE BAYES CLASSIFIER PADA SOCIAL MEDIA (Twitter) TERHADAP UJARAN KEBENCIAN

BERBAHASA INDONESIA

IMPLEMENTATION OF NAIVE BAYES CLASSIFIER ALGORITHM ON SOCIAL MEDIA (Twitter) TO THE TEACHING OF INDONESIAN HATE

SPEECH

Diajukan sebagai salah satu syarat untuk menyelesaikan studi jenjang Strata Satu (S1)

Program Studi Sistem Informasi

Sekolah Tinggi Manajemen Informatika dan Komputer AKAKOM

Yogyakarta

Disusun Oleh

NAUFAL RIZA FATAHILLAH 135610064

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AKAKOM

YOGYAKARTA 2017

(3)
(4)
(5)

HALAMAN PERSEMBAHAN

Yang Utama dari Segalanya

Sembah sujud serta syukur kepada Allah SWT. Taburan cinta kasih-Mu telah memberi kekuatan, membekaliku dengan ilmu. Atas karuni serta kemudahan yang Engkau berikan akhirnya skripsi ini dapat terselesaikan.

Ibu Siti Muzayyanah & Bapak Habibi

Sebagai tanda bakti, hormat, dan rasa terima kasih yang tiada terhingga kupersembahkan skripsi ini kepada Ibu dan Bapak yang telah memberikan kasih sayang, segala dukungan, dan cinta kasih yang tiada terhingga, yang tiada mungkin dapat ku balas hanya dengan selembar kertas yang bertuliskan kata cinta dan persembahan.

Sahabat Seperjuangan

Teruntuk sahabat-sahabatku Kholifah Nur Habibah, Aditya S.B., Hidayat Rohman, Dody Adi N., Heru Bagus N., Bujang P.W., Syardi B.H.J., M. Arifin, Laksono Aulia Shiddiq dan beberapa sahabat-sahabat yang tidak dapat disebutkan dikaeranakan kertasnya tidak cukup. Terimakasih untuk bantuan, nasihat, semangat & candaan kalian. Semoga keakraban kita selalu terjaga.

(6)

HALAMAN MOTTO

K

awula mung saderma.

M

obah - mosik kersaning Hyang Sukmo ”

lakukan yang kita bisa, setelahnya serahkan kepada Tuhan

B

arang siapa keluar untuk mencari ilmu

maka dia berada di jalan Allah “

~ HR.Turmudzi ~

Go find something that you haven't done before.

Don't do the same thing over and over again.

~ Mike Shinoda ~

belajar buat kita pinter

pinter buat kita sukses

sukses buat kita kaya

kaya buat kita sombong

sombong di benci oleh tuhan

MAKANYA KITA GA USAH BELAJAR!!..

(7)

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PENGESAHAN ... ii

HALAMAN PERYATAAN ... iii

HALAMAN MOTTO ... iv

HALAMAN PERSEMBAHAN ... v

ABSTRAK ... vi

ABSTRACT ... vii

KATA PENGANTAR ... viii

DAFTAR ISI ... x

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiv

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah ... 1

1.2 Rumusan Masalah ... 3

1.3 Ruang Lingkup ... 3

1.4 Tujuan Penelitian ... 3

1.5 Manfaat Penelitian ... 4

1.6 Sistematika Penulisan ... 4

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka ... 6

2.2 Dasar Teori ... 10

2.2.1 Twitter dan API Twitter ... 10

2.2.2 JavaKode Program... 10

2.2.3 Node.Js ... 11

2.2.4 MongoDB ... 12

2.2.5 NPM (Network Printer Manager) ... 13

2.2.6 Naive bayes classifier (NBC) ... 14

2.2.7 UML (Unified Modelling Language) ... 16 BAB III ANALISIS DAN PERANCANGAN SISTEM

(8)

3.1 Kebutuhan Data ... 19

3.2 Prosedur dan Pengumpulan Data .. ... 19

3.3 Analisis Perancangan Sistem ... 19

3.3.1 Analisis Kebutuhan Non Fungsional ... 19

3.3.2 Analisis Kebutuhan Fungsional ... 20

3.3.3 Perancangan Sistem ... 21

3.3.4 Use Case Diagram ... 21

3.3.5 Actifity Diagram ... 23

3.3.6 Package Architecture Klasifikasi ... 23

3.3.7 Rancangan Arsitektur Sistem ... 25

3.3.8 Flowchart Naive bayes classifier ... 26

3.3.9 Rancangan Masukan (Input) ... 30

3.3.10 Rancangan Keluaran (Output)... 31

3.3.11 Preprocessing (Stopword) ... 32

3.3.12 Rancangan Pengujian ... 33

BAB IV IMPLEMENTASI DAN PEMBAHASAN SISTEM 4.1 Implementasi Sistem ... 34

4.1.1 Implementasi Proses Kebutuhan Dependensi ... 34

4.1.2 Implementasi Koneksi Database MongoDb ... 35

4.1.3 Implementasi Class Training ... 36

4.1.4 Implementasi Pengumpulan Data Training (tweet) ... 36

4.1.5 Implementasi Training Naive bayes classifier ... 37

4.1.6 Implementasi Perhitungan Nilai Kata Positif dan Negatif ... 38

4.1.7 Implementasi Perhitungan Nilai Prior Positif dan Negatif ... 39

4.1.8 Implementasi Mendapatkan Nilai Kata Positif dan Negatif ... 39

4.1.9 Implementasi Perhitungan Nilai Likelihood Positif dan Negatif . 39 4.1.10 Implementasi Klasifikasi Naive bayes classifier ... 40

4.1.11 Implementasi Stopword ... 40

4.2 Pembahasan Sistem ... 42

4.2.1 Pembahasan Perhitungan Manual Klasifikasi ... 42

(9)

4.2.3 Tampilan Halaman Beranda User ... 45

4.2.4 Tampilan Halaman Hasil Pencarian dan Klasifikasi ... 45

4.2.5 Tampilan Halaman Beranda Admin ... 46

4.2.6 Tampilan Halaman Pencarian Data Training Admin ... 47

BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan ... 48

5.2 Saran ... 49 DAFTAR PUSTAKA

(10)

DAFTAR GAMBAR

Gambar 1.1 Grafik Pengguna Twitter ... 1

Gambar 3.1 Use Case Diagram User ... 21

Gambar 3.2 Use Case Diagram Admin ... 22

Gambar 3.3 Actifity Diagram Klasifikasi Tweet User ... 22

Gambar 3.4 Actifity Diagram Data Training Admin ... 22

Gambar 3.5 Package Architecture Klasifikasi ... 24

Gambar 3.6 Rancangan Arsitektur Sistem ... 25

Gambar 3.7 Flowchart Training Naive Bayes Classifier ... 26

Gambar 3.8 Flowchart Prosedur Cekwordindoc ... 28

Gambar 3.9 Flowchart Klasifikasi Naive Bayes Classifier ... 29

Gambar 3.10 Halaman Input Klasifikasi Tweet User... 30

Gambar 3.11 Halaman Pencarian Data Training Admin ... 31

Gambar 3.12 Halaman Hasil Klasifikasi tweet ... 32

Gambar 4.1 Kode Program Dependensi Modul package.json ... 34

Gambar 4.2 Kode Program Deklarasi Dependensi Pada app.js ... 35

Gambar 4.3 Kode Program Koneksi Database ... 36

Gambar 4.4 Kode Program Struktur Schema Training ... 36

Gambar 4.5 Kode Program proses pengumpulan data training (tweet) ... 37

Gambar 4.6 Kode Program proses training naive bayes classifier ... 37

Gambar 4.7 Kode Program perhitungan nilai kata positif dan negatif ... 38

Gambar 4.8 Kode Program perhitungan nilai prior positif dan negatif ... 39

Gambar 4.9 Kode Program mendapatkan nilai kata positif dan negatif ... 39

Gambar 4.10 Kode Program perhitungan nilai likelihood positif dan negatif ... 39

Gambar 4.11 Kode Program proses klasifikasi naive bayes classifier ... 40

Gambar 4.12 Kode Program proses stopword ... 41

Gambar 4.13 Tampilan beranda user ... 45

Gambar 4.14 Tampilan hasil pencarian tweet dan klasifikasi ... 46

Gambar 4.15 Tampilan Beranda Admin ... 46

(11)

DAFTAR TABEL

Tabel 2.1 Perbedaan Penelitian Dengan Peneliti Sebelumnya ... 7

Tabel 2.2 Rumus Naive Bayes Classifier ... 7

Tabel 2.3 Contoh Kalimat Kasus Klasifikasi ... 7

Tabel 4.1 Data Training dan Data Klasifikasi... 42

(12)

KATA PENGANTAR

Alhamdulillah, puji syukur penulis panjatkan kehadirat Allah SWT, karena atas Rahmat dan Karunia-Nya, penulis dapat menyelesaikan skripsi ini dengan baik. Sholawat serta salam selalu tercurahkan kepada pimpinan kita Nabi Muhammad SAW beserta keluarganya dan para sahabatnya, atas segala tauladan yang begitu beharga sehingga penulis dapat menyelesaikan skripsi yang berjudul “Implementasi Algoritma Naïve Bayes Classifier Pada Social Media (Twitter) Terhadap Ujaran Kebencian Berbahasa Indonesia”.

Penelitian ini disusun untuk memenuhi salah satu syarat menyelesaikan studi jenjang program sarjana. Program studi Sistem Informasi di STMIK AKAKOM Yogyakarta.

Penulis menyadari bahwa selama penulisan skripsi ini mendapatkan bantuan dari berbagai pihak, dengan penuh rasa hormat dan kerendahan hati penulis mengucapkan rasa terimakasih yang sebesar-besarnya kepada :

1. Bapak Cuk Subiyantoro, S.Kom., M.Kom., selaku ketua Sekolah Tinggi Manajemen Informatika dan Komputer AKAKOM Yogyakarta. 2. Ibu Deborah Kurniawati, S.Kom., M.Cs., selaku ketua Program Studi Sistem Informasi (S1) di Sekolah Tinggi Manajemen Informatika dan Komputer AKAKOM Yogyakarta.

3. Bapak Cosmas Haryawan, S.TP., S.Kom., M.Cs., selaku dosen pembimbing yang telah banyak memberikan pengarahan, petunjuk serta saran yang sangat besar manfaatnya dalam menyelesaikan Skripsi ini.

4. Ibu Deborah Kurniawati, S.Kom., M.Cs., selaku dosen penguji yang senantiasa memberikan saran dan masukan dalam menyelesaikan Skripsi ini.

5. Ibu Pulut Suryati, S.Kom., M.Cs., selaku dosen penguji yang senantiasa memberikan saran dan masukan dalam menyelesaikan Skripsi ini. 6. Seluruh dosen dan Staf Karyawan Sekolah Tinggi Manajemen

Informatika dan Komputer AKAKOM Yogyakarta.

7. Bapak dan Ibu serta seluruh Keluarga yang telah memberikan doa dan dukungan dalam mengerjakan Skripsi ini.

8. Teman-teman kampus saya yang telah mendukung dan menyemangati saya.

Penulis menyadari bahwa dalam penyusunan Tugas Akhir ini masih jauh dari sempurna. Oleh karena itu, mohon kritik dan saran yang membangun guna

(13)

menambah wawasan dan pengembangan ilmu kepada penulis. Akhir kata semoga skripsi ini dapat bermanfaat bagi banyak pihak dan refrensi dalam penelitian berikutnya.

Yogyakarta, 1 Agustus 2017

(14)

ABSTRAK

Twiiter merupakan sosial media yang banyak digunakan sebagai media berbagi diinternet. Terdapat tweet yang berisi kalimat yang dibagikan oleh pengguna, agar kalimat tersebut dapat dibaca oleh pengguna lainnya. Banyak informasi yang dapat didapatkan dari media social Twitter. Pengguna Twitter dapat terhubung dengan pengguna Twitter lainnya dalam sekala internasional.

Teknologi yang semakin berkembang seperti sekarang ini dapat dimanfaatkan untuk berbagai hal terutama dalam informasi yang dibagikan dimedia

social khususnya Twitter. Salah satu permasalahan yang didapatkan dari media social Twitter ini adalah terdapat tweet yang berisi ujaran positif dan ujaran negatif.

Dari permasalahan diatas diangkatlah untuk menjadi penelitian untuk mengklasifikasi tweet(kicauan) yang berisi ujaran positif dan ujaran negatif dengan menggunakan metode naive bayes classifier.

Hasil dari penelitian ini diimplementasikan ke dalam sebuah sistem yang dapat mengklasifikasi tweet pada pada Twitter. Sistem ini dibuat menggunakan teknologi Node js dan naive bayes classifier sebagai metode perhitungan klasifikasi. Berdasarkan pengujian yang dilakukan, akurasi terbaik dihasilkan oleh sistem yang menggunakan Naive bayes classifier, yakni 93%.

(15)

ABSTRACT

Twiiter is a social media that is widely used as a medium of sharing on the internet. There are tweets containing sentences shared by the user, so they can be read by other users. A lot of information can be obtained from social media Twitter. Twitter users can connect with other Twitter users in international scale.

Technology that is growing as today can be used for various things, especially in the information distributed in social media especially Twitter. One of the problems derived from social media is Twitter tweets containing speech are positive and negative utterances. From the above problems raised to be a research to classify tweets that contain positive speech and negative utterances using naive bayes classifier method.

The results of this study are implemented into a system that can classify tweets on Twitter. The system is built using js Node technology and Naive Bayes classifier as the calculation method of classification. Based on the tests performed, the best accuracy is generated by systems using the Naive Bayes Classifier, which is 93%.

Referensi

Dokumen terkait

Berdasakan latar belakang yang telah dipaparkan, mengacu pada pentingnya menjaga keamanan dan kerahasiaan rekam medis serta dampak yang dapat ditimbulkan jika

Dari kedua teori diatas dapat diartikan bahwa pendekatan pembelajaran learner centered adalah pendekatan pembelajaran dalam proses belajar mengajar yang berpusat pada

Sementara itu, persentase pengeluaran kelompok penduduk 40 persen terbawah di daerah perdesaan pada Maret 2017 adalah sebesar 20,40 persen yang berarti berada pada

Dengan demikian dapat disimpulkan bahwa secara keseluruhan peningkatan kemandirian belajar mahasiswa yang mendapatkan blended learning tidak lebih baik daripada

Memberikan arahan kepada karyawan merupakan salah satu bentuk motivasi atasan, studi awal di objek penelitian mengidentifikasi bahwa selama ini atasan terlihat kurang

Dengan perƟ mbangan hal-hal tersebut maka Sekolah Tinggi MulƟ Media melalui PPMPP menetapkan standar suasana akademik yang akan menjadi pedoman dan tolok ukur bagi Ketua

Aikakauden edustavin teos oli Tyyni Tuulion toimittama Espanjan ja Portugalin kirjallisuuden kultainen kirja , joka ilmestyi pitkien viivytysten jälkeen vuonna 1954..

Kelima prinsip-prinsip pembelajaran kooperatif diatas dapat disimpulkan bahwa prinsip-prinsip yang berkaitan dengan model pembelajaran Inside-Outside Circle adalah