• Tidak ada hasil yang ditemukan

KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE TERM FREQUENCY – INVERSE DOCUMENT FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR

N/A
N/A
Protected

Academic year: 2023

Membagikan "KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE TERM FREQUENCY – INVERSE DOCUMENT FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR"

Copied!
71
0
0

Teks penuh

(1)

KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE

TERM FREQUENCY – INVERSE DOCUMENT

FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR

TUGAS AKHIR

Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik

Pada Jurusan Teknik Informatika

Oleh :

DEKHA MULYAPUTRA 11551102847

UIN SUSKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU PEKANBARU

2023

(2)

i

LEMBAR PERSETUJUAN

KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE

TERM FREQUENCY – INVERSE DOCUMENT

FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR

TUGAS AKHIR

Oleh

DEKHA MULYAPUTRA 11551102847

Telah diperiksa dan disetujui sebagai Laporan Tugas Akhir Di Pekanbaru, pada tanggal 19 Januari 2023

Pembimbing I

(Elvia Budianita, ST, M.Cs)

NIP/NIK. 19860629 201503 2 007

(3)

ii

LEMBAR PENGESAHAN

KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE

TERM FREQUENCY – INVERSE DOCUMENT

FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR

Oleh

DEKHA MULYAPUTRA 11551102847

Telah dipertahankan di depan dewan penguji

Sebagai salah satu syarat untuk memperoleh gelar Sarjana Teknik Pada Universitas Islam Negeri Sultan Syarif Kasim Riau

Pekanbaru, 19 Januari 2023 Mengesahkan

Dekan, Ketua Jurusan,

(Dr. Hartono, M.Pd) (Iwan Iskandar, M.T)

NIP. 19640301 199203 1 003 NIP. 19821216 201503 1 003 DEWAN PENGUJI

Ketua : Dr. Alwis Nazir, M.Kom

Pembimbing I : Elvia Budianita, ST, M.Cs

Penguji I : Muhammad Fikry, ST, M.Sc

Penguji II : Iwan Iskandar, MT

(4)

iii

(5)

iv

LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL

Tugas Akhir yang tidak diterbitkan ini terdaftar dan tersedia di Perpustakaan Universitas Islam Negeri Sultan Syarif Kasim Riau adalah terbuka untuk umum dengan ketentuan bahwa hak cipta pada penulis. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau ringkasan hanya dapat dilakukan seizin penulis dan harus disertai dengan kebiasaan ilmiah untuk menyebutkan sumbernya.

Penggandaan atau penerbitan sebagian atau seluruh Tugas Akhir ini harus memperoleh

izin dari Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif

Kasim Riau. Perpustakaan yang meminjamkan Tugas Akhir ini untuk anggotanya

diharapkan untuk mengisi nama, tanda peminjaman dan tanggal pinjam.

(6)

v

LEMBAR PERNYATAAN

Dengan ini saya menyatakan bahwa dalam Tugas Akhir ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan didalam daftar pustaka.

Pekanbaru,19 Januari 2023 Yang membuat pernyataan,

DEKHA MULYAPUTRA 11551102847

(7)

vi

LEMBAR PERSEMBAHAN

Allah akan meninggikan derajat orang-orang yang beriman di antaramu dan orang-orang yang diberi ilmu pengetahuan.

Alhamdulillah…

Rasa syukur kuhaturkan kepada-Mu, Yaa Allah yang Maha Ber-Ilmu, hanya karena karuniaMu sajalah hamba-Mu akhirnya dapat menyelesaikan Tugas Akhir ini.

***

Tugas akhir ini kupersembahkan untuk Papa dan Mama. Tidak tergantikan semua jasa, pengorbanan, tetes keringat dan rasa lelah itu, hanya dengan karya kecil dari ku ini…

semoga dengan karya ini, menjadi langkah kecil untuk lebih bermanfaat bagi bangsa, Negara dan agama kedepannya.

Dan tidak lupa pula karya ini kupersembahkan juga untuk adik-adikku yang senantiasa

mendoakan abangnya agar melihat abang nya wisuda.

(8)

vii

ABSTRAK

Islamophobia adalah sebuah ketakutan yang tidak masuk akal terhadap agama Islam sehingga aktifitas yang bernuansa Islami harus dihilangkan. Stigma Islamophobia ini muncul akibat adanya aksi anarkis dan radikalisme atau biasa dikenal dengan terorisme yang mengatasnamakan Islam. Istilah Islamophobia ini populer semenjak persitiwa 11 September 2001 di New York. Di Indonesia sendiri juga terdapat serangkaian aksi terorisme yang menyebabkan stigma Islamophobia ini naik di masyarakat. Terkait islamophobia ini banyak menimbulkan sentimen dari masayarakat luas yang berupa negatif dan positif. Penelitian ini bertujuan untuk mengolah sentimen masyarakat tentang islamophobia yang berfokus pada media sosial youtube tentang islamophobia. Analisis sentimen ini dilakukan untuk menentukan seberapa banyak komentar yang bernilai positif dan negatif. Analisis sentiment menggunakan algoritma TF-IDF (Term Frequency- Inverse Document Frequency) dan algoritma MKNN (Modified K-Nearest Neighbor) dengan data komentar sebanyak 1000 komentar dan menghasilkan akurasi tertinggi 55%

dengan perbandingan data latih dengan data uji 90:10 dengan nilai K=5. Sedangkan pengujian dengan 300 komentar menghasilkan akurasi tertinggi 60% dengan perbandingan data latih 90:10 dengan nilai K=5.

Kata Kunci : Analisa Sentimen, Islamophobia, Modified K-Nearest Neighbor, Term

Frequency-Inverse Document Frequency, Youtube.

(9)

viii

ABSTRACT

Islamophobia is an irrational fear of the Islamic religion so that activities that have an Islamic nuance must be eliminated. The stigma of Islamophobia arises due to anarchist and radicalism actions or commonly known as terrorism in the name of Islam. The term Islamophobia has become popular since the events of September 11, 2001 in New York.

In Indonesia itself there have also been a series of acts of terrorism which have caused the stigma of Islamophobia to rise in society. Related to Islamophobia, this has caused a lot of negative and positive sentiments from the wider community. This study aims to process public sentiment about Islamophobia which focuses on YouTube social media about Islamophobia. Sentiment analysis is carried out to determine how many comments are positive and negative. Sentiment analysis uses the TF-IDF (Term Frequency-Inverse Document Frequency) algorithm and the MKNN (Modified K-Nearest Neighbor) algorithm with 1000 commentary data and produces the highest accuracy 55% with a comparison of training data with test data of 90:10, with a value K=5.

Key Word : Analysis Sentiment, Islamophobia, Modified K-Nearest Neighbor, Term

Frequency-Inverse Document Frequency, Youtube.

(10)

ix

KATA PENGANTAR

Assalamua’alaikum wa rohmatullahi wa barokatuh.

Alhamdulillahi robbil’alamin, Puji dan syukur kepada Allah SWT atas seluruh rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penelitian dan penulisan Laporan Tugas Akhir di jurusan Teknik Informatika dengan judul “Klasifikasi Islamophobia

Berdasarkan Komentar Youtube Menggunakan Metode Term Frequency – Inverse Document Frequency Dan Modified K-Nearest Neighbor”. Laporan Tugas Akhir ini

merupakan prasyarat untuk memperoleh gelar sarjana strata satu di jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Sultan Syarif Kasim Riau (UIN SUSKA RIAU).

Banyak sekali pihak yang telah membantu penulis dalam menyelesaikan penyusunan laporan ini, baik berupa bantuan materi ataupun berupa motivasi dan dukungan kepada penulis. Pada kesempatan ini penulis hanya dapat mengucapkan terima kasih banyak kepada :

1.

Bapak Prof. Dr. Hairunas, M.Ag selaku Rektor Universitas Islam Negeri Sultan Syarif Kasim Riau.

2.

Bapak Dr. Hartono, M.Pd selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau

3.

Bapak Iwan Iskandar, M.T. selaku Ketua Program Studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau.

4.

Bapak Muhammad Irsyad, S.T., M.T. selaku Dosen Pembimbing Akademik yang telah memberikan nasihat selama perkuliahan

5.

Ibu Elvia Budianita, S.T., M.Cs. selaku Dosen Pembimbing I Tugas Akhir yang selalu meluangkan waktu, memberikan ilmu, nasihat, saran, serta sabar membimbing penulis hingga tugas akhir ini selesai.

6.

Bapak Muhammad Fikry, S.T., M.Sc. selaku Dosen Penguji I yang telah

banyak memberikan saran demi kemajuan dan penyempurnaan dalam

pengerjaan tugas akhir.

(11)

x

7.

Bapak Iwan Iskandar, M.T. selaku Dosen Penguji II yang telah banyak memberikan saran demi kemajuan dan penyempurnaan dalam pengerjaan tugas akhir.

8.

Seluruh Dosen Teknik Informatika Universitas Islam Negeri Sultan Syarif Kasim Riau yang banyak memberikan ilmu, dan arahan selama perkuliahan.

Semoga ilmu yang bapak dan ibu berikan bermanfaat bagi penulis dan seluruh mahasiswa.

9.

Khusunya untuk Papa, Mama dan Adik-adikku tercinta yang telah memberikan doa dan seluruh kebaikan yang selalu diberikan sehingga telah sampai pada tahap ini. Semoga Allah SWT selalu memberikan kesehatan dan melimpahkan semua kebaikan kepada Papa dan Mama di dunia dan akhirat nanti.

10.

Seluruh teman-teman TIF angkatan 2015 yang selalu menemani, memberikan semangat, dan membantu selama perkuliahan. Semoga kita semua sukses di dunia dan akhirat, aamiinn.

Penulis menyadari bahwa dalam penulisan laporan ini masih banyak terdapat kesalahan dan kekurangan. Oleh karena itu kritik dan saran yang sifatnya membangun sangat penulis harapkan untuk kesempurnaan laporan ini. Akhhirnya penulis berharap semoga laporan ini dapat memberikan sesuatu yang bermanfaat bagi siapa saja yang membacanya.

Wassalamu’alaikum wa rohmatullahi wa barokatuh.

Pekanbaru, 5 Januari 2023

Dekha Mulyaputra

(12)

xi

DAFTAR ISI

LEMBAR PERSETUJUAN ... i

LEMBAR PENGESAHAN ... ii

LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL ... iv

LEMBAR PERNYATAAN ... v

LEMBAR PERSEMBAHAN ... vi

ABSTRAK ... vii

ABSTRACT ... viii

KATA PENGANTAR ... ix

DAFTAR ISI ... xi

DAFTAR GAMBAR ... xiv

DAFTAR TABEL ... xv

DAFTAR RUMUS ... xvii

DAFTAR SIMBOL ... xviii

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 3

1.3 Batasan Masalah ... 4

1.4 Tujuan Penelitian ... 4

1.5 Sistematika Penulisan ... 4

BAB 2 LANDASAN TEORI ... 6

2.1 Islamophobia ... 6

2.2 Youtube ... 6

2.3 Text Mining ... 7

2.4 Text Preprocessing ... 7

(13)

xii

2.4.1 Cleaning... 7

2.4.2 Case Folding... 7

2.4.3 Tokenizing ... 7

2.4.4 Normalisasi ... 7

2.4.5 Filtering ... 7

2.4.6 Stemming ... 7

2.4.7 Negation Handling ... 8

2.5 Analisis Sentimen ... 8

2.6 Pembobotan Kata ... 8

2.6.1 Term Frequency (TF) ... 8

2.6.2 Inverse Document Frequency (IDF) ... 8

2.6.3 Term Frequency-Inverse Document Frequency (TF-IDF) ... 8

2.7 Modified K-Nearest Neighbor (MKNN) ... 9

2.8 Penelitan Terkait ... 10

BAB 3 METODOLOGI PENELITIAN ... 17

3.1 Identifikasi Masalah ... 18

3.2 Studi Pustaka ... 18

3.3 Pengumpulan Data ... 18

3.4 Text Preprocessing ... 18

3.5 Text Transformation ... 19

3.6 Feature Selection ... 19

3.7 Pattern Discovery ... 19

3.8 Perancangan Aplikasi ... 20

3.9 Penerapan Aplikasi ... 20

3.10 Pengujian ... 20

3.11 Kesimpulan dan Saran ... 21

(14)

xiii

BAB 4 HASIL DAN PEMBAHASAN ... 22

4.1 Analisa ... 22

4.1.1 Analisa Kebutuhan Data ... 22

4.1.2 Pelabelan Data ... 22

4.1.3 Text Preprocessing ... 23

4.1.4 Text Transformation ... 31

4.1.5 Feature Selection ... 33

4.1.6 Pattern Discovery ... 33

4.2 Perancangan Aplikasi ... 39

4.2.1 Perancangan Basis Data ... 39

4.2.2 Perancangan Struktur Menu ... 44

4.2.3 Perancangan Antarmuka (Interface) ... 45

4.3 Implementasi ... 47

4.3.1 Batasan Implementasi ... 47

4.3.2 Lingkungan Implementasi ... 48

4.3.3 Implementasi Aplikasi ... 48

4.4 Pengujian ... 51

4.4.1 Confussion Matrix ... 51

4.4.2 Analisa dan Hasil Pengujian ... 53

BAB 5 PENUTUP ... 54

5.1 Kesimpulan ... 54

5.2 Saran ... 54

DAFTAR PUSTAKA ... xviii

LAMPIRAN ... xviii

DAFTAR RIWAYAT HIDUP ... xliv

(15)

xiv

DAFTAR GAMBAR

Gambar 3.1 Flowchart Metodologi Penelitian ... 17

Gambar 4.1 Flowchart Text Preprocessing ... 23

Gambar 4.2 Flowchart Tahapan Text Transformation... 31

Gambar 4.3 Flowchart Tahapan MKNN ... 33

Gambar 4.4 Perancangan Struktur Menu ... 44

Gambar 4.5 Tampilan Halaman Dashboard ... 45

Gambar 4.6 Tampilan Halaman Data Komentar ... 46

Gambar 4.7 Tampilan Halaman MKNN ... 46

Gambar 4.8 Tampilan Halaman Pengujian ... 47

Gambar 4.9 Tampilan Halaman Dashboard ... 49

Gambar 4.10 Tampilan Halaman Data Komentar ... 49

Gambar 4.11 Tampilan Halaman Menu MKNN ... 50

Gambar 4.12 Tampilan Halaman Pengujian ... 50

(16)

xv

DAFTAR TABEL

Tabel 2.1 Penelitian Terkait ... 10

Tabel 3.1 Confussion Matrix ... 21

Tabel 4.1 Pelabelan Data ... 22

Tabel 4.2 Proses Cleaning ... 23

Tabel 4.3 Proses Case Folding ... 24

Tabel 4.4 Proses Tokenizing ... 24

Tabel 4.5 Proses Normalisasi ... 26

Tabel 4.6 Proses Filtering ... 27

Tabel 4.7 Proses Stemming ... 29

Tabel 4.8 Proses Negation Handling ... 30

Tabel 4.9 Hasil TF, DF dan IDF ... 31

Tabel 4.10 Hasil TF IDF ... 32

Tabel 4.11 Contoh Data Latih ... 34

Tabel 4.12 Contoh Data Uji ... 34

Tabel 4.13Nilai Jarak Euclidean Antar Data Latih ... 35

Tabel 4.14 Nilai Validitas ... 36

Tabel 4.15 Nilai Jarak Euclidean Data Uji Dengan Data Latih ... 37

Tabel 4.16 Hasil Weight Voting ... 37

Tabel 4.17 Urutan Nilai Weight Voting Sebanyak K ... 38

Tabel 4.18 Kelas Asli Hasil Weight Voting ... 38

Tabel 4.19 Hasil Prediksi ... 39

Tabel 4.20 Struktur Tabel Komentar ... 39

Tabel 4.21 Struktur Tabel Pembagian Data ... 39

Tabel 4.22 Struktur Tabel Bobot Kata ... 40

Tabel 4.23 Struktur Tabel Cleaning ... 40

Tabel 4.24 Struktur Tabel Case Folding ... 40

Tabel 4.25Struktur Tabel Tokenizing ... 41

Tabel 4.26 Struktur Tabel Normalizing ... 41

Tabel 4.27 Struktur Tabel Filtering ... 42

(17)

xvi

Tabel 4.28 Struktur Tabel Stemming ... 42

Tabel 4.29 Struktur Tabel Negation Handling ... 42

Tabel 4.30 Struktur Tabel Jarak Euclidean ... 43

Tabel 4.31 Struktur Tabel Validitas ... 43

Tabel 4.32 Struktur Tabel Weight Voting ... 43

Tabel 4.33 Struktur Tabel Data Nilai K ... 44

Tabel 4.34 Akurasi Cofussion Matrix Pengujian 90:10 ... 51

Tabel 4.35 Akurasi Confussion Matrix Pengujian 80:20 ... 51

Tabel 4.36 Akurasi Confussion Matrix Pengujian 70:30 ... 51

Tabel 4.37 Confussion Matrix 90:10 300 data ... 52

Tabel 4.38 Confussion Matrix 80:20 300 data ... 52

Tabel 4.39 Confussion Matrix 70:30 300 data ... 53

(18)

xvii

DAFTAR RUMUS

(2.1)Inverse Document Frequency ... 8

(2.2)TF-IDF ... 9

(2.3)Jarak Euclidean ... 9

(2.4)Validitas ... 9

(2.5)Persamaan Titik S ... 10

(2.6)Weight Voting ... 10

(3.1)Akurasi ... 21

(3.2)Precission ... 21

(3.3)Recall ... 21

(19)

xviii

DAFTAR SIMBOL

Simbol Flowchart

Flow Direction : menghubungkan antar simbol satu dengan Simbol yang lain

Terminator : simbol permulaan (start)

Manual Operation : menunjukkan pengolahan yang tidak dilakukan oleh computer

Document : menyatakan input berasal dari dokumen ke dalam bentuk kertas.

Disk and on-line storage : menyatakan input berasal dari disk atau disimpan di disk.

Proses : simbol untuk melakukan suatu pemrosesan baik oleh user atau dengan computer

Verifikasi : simbol yang memutuskan apakah

vaild atau tidaknya suatu kejadian.

(20)

1

BAB 1

PENDAHULUAN 1.1 Latar Belakang

Islamophobia adalah sebuah ketakutan yang tidak masuk akal terhadap agama Islam sehingga aktifitas yang bernuansa Islami harus dihilangkan [1]. Stigma Islamophobia ini muncul akibat adanya aksi anarkis dan radikalisme atau biasa dikenal dengan terorisme yang mengatasnamakan Islam. Istilah Islamophobia ini populer semenjak persitiwa 11 September 2001 di New York. Di Indonesia sendiri juga terdapat serangkaian aksi terorisme yang menyebabkan stigma Islamophobia ini naik di masyarakat. Beberapa aksi terorisme di Indonesia diantaranya, kasus bom Bali, bom JW marriot, NII KW 9 dan lain sebagainya. Ironis nya para pelaku dari kejadian terorisme di Indonesia sering kali mengatasnamakan Islam, sehingga menjadikan ketakuran non muslim di Indonesia terhadap agama Islam semakin besar [2].

Terkait beberapa peristiwa terorisme diatas, tidak lepas pula dari peran media massa sebagai pembuat berita tentang berbagai macam aksi terorisme. Salah satunya berita tentang konflik yang terjadi antara Israel dan Palestina. Banyak warganet yang mengomentari terkait konflik ini. Sebagian besar warganet berkomentar positif dan memberikan dukungannya terhadap Palestina dan sangat sedikit yang berkomentar dukungan terhadap Israel [3].

Persitiwa – peristiwa yang menyangkut Islamophobia banyak di jumpai di

berbagai media massa dan di platform online, salah satunya Youtube. Youtube adalah

sebuah situs web video sharing yang populer dimana pengguna dapat memuat, menonton,

dan berbagi video secara gratis. Youtube didirikan pada 3 Februari 2005 oleh 3 orang

mantan pegawai PayPal, yaitu Chad Hurley, Steve Chen dan Jawed Karim. Saat ini

youtube sudah memiliki lebih dari 1 milliar pengguna di seluruh dunia. Setiap hari orang

– orang dapat menghabiskan ribuan hingga jutaan jam menonton video di youtube. Para

pengguna youtube rata berusia 18-34 tahun dan 18-49 tahun. Dikarenakan banyak nya

pengguna youtube, menandakan bahwa youtube bisa menjadi sumber dan dapat dijadikan

sebagai media analisis sentimen mengenai suatu topik. Banyaknya komentar dari para

(21)

2

pengguna youtube tersebut dapat dijadikan sebagai informasi yang dapat di analisa lagi [4].

Analisa sentimen tersebut dapat dilakukan dengan teknik text mining. Text mining bertujuan untuk menghasilkan informasi dari satu set dokumen. Text mining mampu menghasilkan informasi melalui pemrosesan, pengelompokkan dan analisis data – data tidak terstruktur dalam jumlah besar. Proses text mining dapat menghasilkan analisis sentiment secara emosional mengidentifikasi pernyataan jika positif atau negatif. Objek text mining merupakan dokumen tidak terstruktur atau semi terstruktur. Text mining secara efektif mengekstrak informasi yang diperlukan dari sejumlah dokumen [5].

Terdapat penelitian terkait analisis tentang Islamophobia, salah satunya yaitu penelitian yang dilakukan oleh [6] menggunakan algoritma Naïve Bayes dengan akurasi 73,12% dan SVM dengan akurasi 81,37%. Tujuan dilakukannya penelitian ini ada untuk menemukan korban pelecehan atau perundungan baik secara online maupun offline. Lalu memberikan masukkan dan edukasi kepada pelaku pelecehan dan perundungan serta orang – orang yang anti Islam agar tidak melakukan diskriminasi, permusuhan dan perlakuan yang tidak adil terhadap komunitas dan individu muslim.

Penelitian terkait analisis sentimen pada media sosial, salah satunya yaitu penelitian yang dilakukan oleh [7] yang menggunakan platform twitter dan menggunakan algoritma support vector machine (SVM). Kekurangan dari metode ini adalah harus berbasis dengan kamus KBBI yang lengkap untuk mendapatkan akurasi yang tinggi.

Metode yang digunakan dalam penelitian ini adalah metode Modified K-Nearest

Neighbor (MKNN). Metode ini merupakan algoritma penyempurnaan dari algoritma K-

Nearest Neighbor (KNN). Algoritma KNN merupakan suatu metode yang menggunakan

algoritma supervised learning yaitu menemukan pola baru dalam data awal dan

menghubungkan pola data yang sudah ada dengan data yang baru. Kelebihan metode

KNN adalah algoritma yang sangat sederhana karena bekerja berdasarkan jarak terpendek

dari query instance ke training sample untuk menentukan KNN nya [8]. Perbedaan nya

dengan MKNN adalah terdapat perhitungan weight voting serta perhitungan nilai validasi

pada data. Kelebihan MKNN dibandingkan dengan KNN adalah tingkat akurasi yang

lebih tinggi dimana dalam MKNN ditambahkan perhitungan nilai validity yang berguna

dalam mengatasi masalah outlier dalam perhitungan bobot pada KNN tradisional [9].

(22)

3

Dalam penelitian ini juga akan menggunaka metode pembobotan kata term frequency – relevance frequency (TF-RF). Metode TF-RF merupakan perkembangan dari metode term frequency – inverse document frequency (TF-IDF). Metode TF-IDF merupakan metode yang digunakan untuk menentukan seberapa jauh keterhubungan kata (term) terhadap dokumen dengan memberikan bobot setiap kata [10]. Kelemahan dari TF-IDF adalah tidak dapat mempresentasikan perbedaan antara dokumen positif dan negatif dan RF merupakan relevance frequency yang diharapkan dapat meningkatkan daya diskriminatif [11].

Terkait dengan judul penelitian yang akan diajukan mengenai algoritma Modified K-Nearest Neighbor, terdapat beberapa penelitian terkait diantaranya yang dilakukan oleh [12] yaitu Implementasi klasifikasi text mining sebagai model dalam kesimpulan isi Tafsir Bil Ma'tsur dan Bil Ra'yi. Pada Penelitian ini dilakukan dengan menerapkan algoritma K-Nearest Neighbor (KNN) dengan akurasi sebesar 98,12%. Namun KNN telah dibandingkan terlebih dahulu dengan algoritma Modified K-Nearest Neighbor (MKNN) dan Fuzzy K-Nearest Neighbor (FKNN), dimana kedua algoritma tersebut memiliki akurasi masing-masing 98,01% dan 88,3%. MKNN merupakan algoritma terbaik dengan akurasi tertinggi, tetapi juga memiliki nilai error yang tinggi sebesar 4,3%

yang lebih tinggi dari KNN, 1,9%. Kinerja dari algoritma Modified K-Nearest Neighbor pada umumnya

Berdasarkan latar belakang yang sudah dijelaskan diatas, maka penulis akan melakukan penelitian analisis sentimen menggunakan algoritma Modified K-Nearest Neighbor dalam klasifikasi komentar youtube tentang Islamophobia. Hasil utama dari penelitian ini adalah untuk mengetahui seberapa besar akurasi yang didapatkan oleh algoritma Modified K-Nearest Neighbor dan untuk mengetahui performa dari algoritma tersebut dalam melakukan klasifikasi sentimen.

1.2 Rumusan Masalah

Berdasarkan masalah yang telah diuraikan diatas, maka terdapatlah rumusan masalah yaitu :

1. Bagaimana penerapan algoritma Modified K-Nearest Neighbor dalam mengklasifikasi sentimen terhadap topik Islamophobia pada youtube.

2. Bagaimana pengujian nilai akurasi metode Modified K-Nearest Neighbor.

(23)

4

1.3 Batasan Masalah

Dalam melakukan suatu penelitian diperlukan batasan – batasan agar tidak menyimpang dari apa yang telah direncanakan, adapun batasan masalah dalam penulisan tugas akhir ini, yaitu :

1. Output yang dihasilkan berupa klasifikasi positif dan negatif dari komentar youtube yang mengandung Islamophobia.

2. Data diambil menggunakan youtube API.

3. Text preprocessing dengan proses cleaning, case folding, tokenizing, stopword removal dan stemming.

4. Pelabelan data positif dan negative dilakukan secara manual.

5. Dataset yang akan diambil sebanyak 1000 komentar.

1.4 Tujuan Penelitian

Adapun tujuan dari penelitian ini adalah Menerapkan algoritma Modified K- Nearest Neighbor untuk mengklasifikasi komentar di youtube mengenai Islamophobia, serta menguji tingkat akurasi dari algoritma tersebut.

1.5 Sistematika Penulisan

Agar lebih sistematis dan terarah dalam penyusunan laporan tugas akhir, penulis membagi dalam beberapa bab. Berikut ini adalah bab-bab yang disajikan :

BAB I PENDAHULUAN

Bab ini berisi tentang penjelasan mengenai latar belakang masalah, rumusan masalah, batasan masalah, tujuan dari penelitian yang dilakukan, dan sistematika penulisan laporan Tugas Akhir.

BAB II LANDASAN TEORI

Bab ini berisi tentang teori-teori terkait penelitian yang dilakukan yakni penerapan metode Modified K-Nearest Neighbor dalam mengklasifikasi komentar di youtube tentang Islamophobia. Perangkat analisa sistem beserta model pengembangan sistem juga akan dibahas.

BAB III METODOLOGI PENELITIAN

Bab ini menjelaskan rangkaian tahapan dalam pembuatan sistem yang terdiri

dari pengumpulan data, analisis data, analisa metode Modified K-Nearest

(24)

5

Neighbor, perancangan, text mining, analisa fungsional sistem, implementasi beserta pengujian sistem yang akan dibangun.

BAB IV ANALISA DAN PERANCANGAN

Bab ini menjelaskan mengenai analisa dari sistem yang akan dibangun menggunakan PHP, dengan menerapkan algoritma Modified K-Nearest Neighbor dalam mengklasifikasi komentar di youtube.

BAB V IMPLEMENTASI DAN PENGUJIAN

Bab ini menjelaskan hasil dari perancangan sistem yang telah dilakukan sebelumnya yang mana berisi tentang implementasi dari metode yang diterapkan ke dalam sistem.

BAB IV PENUTUP

Bab penutup ini berisi kesimpulan dan saran dari hasil penelitian menerapkan

algoritma Modified K-Nearest Neighbor dalam mengklasifikasi komentar di

youtube tentang Islamophobia.

(25)

6

BAB 2

LANDASAN TEORI 2.1 Islamophobia

Islamophobia adalah sebuah bentuk ketakutan berupa kecemasan yang dialami seseorang maupun kelompok sosial terhadap Islam dan orang – orang muslim yang bersumber dari pendangan yang tertutup tentang Islam serta disertai prasangka bahwa Islam sebagai agama yang “inferior” tidak pantas untuk berpengaruh terhadap nilai – nilai yang telah ada di masyarakat [13].

Istilah Islamophobia sendiri populer pasca tragedy WTC 11 September 2001 di New York serta seruan peperangan terhadap terorisme. Komunitas Islam dipandang sebagai penyebab segala permasalahan dan secara stereotip mereka menjadi sasaran tuduhan tersebut [13].

Di Indonesia sendiri kecemasan terhadap muslim menyebar pasca terjadinya peristiwa ledakan bom Bali I, 12 Oktober 2002. Sehingga terjadi rentetan penangkapan beberapa orang Islam yang dianggap terkait seperti Amrozi, Ali Imron, dan Imam Samudra [13]. Berbagai sentiment pun muncul di masyarakat, terutama sentimen positif dan negatif. Dimana sentimen positif yaitu berupa tidak mendukung nya terhadap islamophobia, dan sentimen negatif yang mendukungan adanya islamophobia.

2.2 Youtube

Youtube adalah situs media digital (video) yang dapat di download, diunggah, serta dibagikan (share) di seluruh penjuru negeri. Youtube merupakan situs sosial media yang sering dipakai serta fenomenal dikalangan masyarakat. Masyarakat menggunakan youtube baik dalam melihat berita terkini, mencari informasi, bahkan untuk mencari hiburan seperti menonton film, mendengarkan lagu atau menonton berbagai video tutorial [14].

Youtube dibentuk oleh 3 orang mantan pegawai PayPal yaitu, Chad Hurley, Steve

Chen, dan Jawed Karim. Nama youtube sendiri terinspirasi dari nama sebuah kedai pizza

dan restoran Jepang di San Mateo, California [15]

(26)

7

2.3 Text Mining

Text mining merupakan proses menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen dan bertujuan untuk mencari kata – kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antar dokumen [16]. Text mining dapat digunakan untuk melakukan klasifikasi analisis sentimen, text clustering, information extraction dan information retrieval, dimana text mining juga termasuk jenis data mining untuk menemukan pola yang menarik dalam data teks yang berjumlah besar [17].

2.4 Text Preprocessing

Merupakan tahap pembersihkan kata sebelum diolah. Adapun proses – proses dalam preprocessing sebagai berikut :

2.4.1 Cleaning

melakukan pemilihan atribut yang akan digunakan, membuang atribut noise atau data yang tidak dibutuhkan dalam proses analisis sentiment.

2.4.2 Case Folding

menggunakan transform cases untuk mengubah seluruh teks kedalam huruf kecil (lowercase).

2.4.3 Tokenizing

melakukan pemecahan kata pada kalimat dan menghilangkan beberapa karakter tertentu seperti tanda baca.

2.4.4 Normalisasi

merupakan perbaikan kata yang ejaannya tidak baku atau disingkat agar menjadi kata baku sesuai dengan kamus besar bahasa Indonesia.

2.4.5 Filtering

Proses menghilangkan kata stopword, yaitu kata – kata yang sering muncul dan tidak memiliki arti.

2.4.6 Stemming

Proses menghilangkan imbuhan pada kata agar menjadi kata dasar.

(27)

8

2.4.7 Negation Handling

Proses yang berguna untuk meningkatkan akurasi dalam klasifikasi. Dalam proses ini jika ada kata yang bersifat negasi seperti bukan, nggak dan lainnya, membuat makna kata berikutnya menjadi berlawanan dengan maksa aslinya.

2.5 Analisis Sentimen

Analisis sentimen adalah proses memahami, mengekstrak dan memproses data tekstual secara otomatis untuk mendapatkan sentimen informasi yang terkandung dalam sebuah opini. Analisis sentimen dilakukan untuk melihat kecenderungan opini atau pendapat terhadap suatu masalah atau suatu objek oleh seseorang, apakah cenderung memandang positif atau negatif [18].

2.6 Pembobotan Kata

Pembobotan kata dibutuhkan untuk implementasi terhadap klasifikasi dokumen teks. Pada penelitian ini menggunakan pembobotan kata Term Frequency-Inverse Document Frequency (TF-IDF).

2.6.1 Term Frequency (TF)

Merupakan jumlah kemunculan sebuah kata dalam suatu dokumen dan untuk menghitung nilai TF dengan menghitung jumlah kata dalam sebuah dokumen.

2.6.2 Inverse Document Frequency (IDF)

Merupakan inverse frekuensi sebuah dokumen yang mengandung banyak nya sebuah kata.

𝑰𝑫𝑭 = 𝒍𝒐𝒈 𝑫

𝑫𝑭

(2.1)

Dimana :

D = Jumlah dokumen dalam dataset

DF = jumlah dokumen yang mengandung kata

2.6.3 Term Frequency-Inverse Document Frequency (TF-IDF)

Metode TF-IDF menggabungkan dua konsep perhitungan bobot, yaitu

kemunculan sebuah kata dalam sebuah dokumen dan inverse sebuah dokumen yang

mengandung kata tersebut. Bobot hubungan antara kata dan dokumen akan tinggi jika

(28)

9

frekuensi kemunculan kata tersebut tinggi dalam sebuah dokumen. Berikut rumus untuk mendapatkan nilai TF-IDF :

𝑻𝑭 𝑰𝑫𝑭 = 𝑻𝑭 𝐱 𝑰𝑫𝑭

(2.2)

2.7 Modified K-Nearest Neighbor (MKNN)

Algoritma KNN dan turunannya merupakan algoritma klasifikasi yang berdasarkan pada kedekatan suatu objek. Perbedaan algoritma KNN dengan MKNN yaitu pada penambahan tahapan dalam proses klasifikasi MKNN berupa perhitungan nilai validitas MKNN berupa perhitungan nilai validitas dan perhitungan weighted voting [19].

Berikut tahapan – tahapan dalam melakukan proses klasifikasi menggunakan algoritma MKNN :

1.

Menghitung

jarak

Menghitung jarak antara dua titik pada data training (x) dan titik pada data testing (y) dengan rumus Euclidean pada persamaan berikut :

𝒅(𝒙, 𝒚) = √∑ (𝒙

𝒊

− 𝒚

𝒊

)

𝟐

𝒏 𝒊=𝟏

(2.3)

Dimana :

d = jarak titik data training x dan data testing y i = nilai atribut

x = data training y = data testing n = dimensi atribut

2.

Validitas

data latih

Menggunakan validitas dalam menghitung jumlah titik dalam seluruh data latih. Tetangga terdekat setiap data akan berpengaruh pada validitas data.

Persamaan yang digunakan untuk menghitung validitas dari setiap titik pada data latih adalah seperti persamaan berikut :

𝑽𝒂𝒍𝒊𝒅𝒊𝒕𝒂𝒔 = 𝟏

𝒌 ∑ 𝑺(𝒍𝒃𝒍(𝑿), 𝒍𝒃𝒍(𝑵

𝒊

(𝒙)))

𝑲 𝒊=𝟏

(2.4)

(29)

10

Dimana :

K = banyaknya titik terdekat Lbl(x) = kelas x

Ni(x) = label kelas titik terdekat x

S = menghitung titik kesamaan x dan data ke-1 dari tetangga terdekat

Persamaan titik S :

𝑺(𝒂, 𝒃) = { 𝟏

𝒂=𝒃

𝟎

𝒂≠𝒃 (2.5)

Dimana :

a = kelas a pada data latih b = kelas selain a

3. Weight voting

Menggunakan validitas dari setiap data pada data latih, lalu dikalikan dengan weight berdasarkan jarak Euclidean adalah untuk menentukan weight voting.

Berikut persamaan perhitungan weight voting tiap tetangga dalam metode MKNN :

𝑾(𝒙) = 𝑽𝒂𝒍𝒊𝒅𝒊𝒕𝒂𝒔(𝒙) ∗ 𝟏

𝒅

𝒆+𝟎,𝟓 (2.6)

Dimana :

W(x) = perhitungan weight voting Validitas (x) = nilai validitas

de = jarak euclidean

2.8 Penelitan Terkait

Berikut beberapa penelitian terkait yang menjadi acuan penulis dalam melakukan penelitian ini :

Tabel 2.1 Penelitian Terkait

No. Nama Penulis Tahun Judul Metode Hasil

1. Siti Mutrofin, Arrie

2015 Optimasi Teknik

Modifie

d K-

Berdasarkan hasil uji

menggunakan data Iris dan

(30)

11 Kurniawardhani,

Abidatul Izzah, Mukhamad Masrur

Klasifikas i Modified K-

Nearest Neighbor Menggun akan Algoritma Genetika

Nearest Neighb or dan Algorit ma Genetik a

Wine MKNN lebih unggul dari pada kNN, baik menggunakan data latih 60%, 70%, 80%, maupun 90%, dengan akurasi paling rendah adalah sebesar 93,78% dan paling tinggi 97,28%, masih lebih tinggi dibandingkan dengan kNN dengan akurasi terendah sebesar 82,92% dan paling tinggi 84,82% untuk data Iris, begitu juga ketika menggunakan data wine MKNN masih lebih unggul

dibandingkan kNN.

Sedangkan untuk GMKNN dapat menentukan nilai k

secara otomasi,

dibandingkan MKNN yang penentuan k-nya masih manual

2.

Fakihatin

Wafiyah, Nurul Hidayat, Rizal Setya Perdana

2017 Implemen tasi Algoritma Modified K-Nearest Neighbor untuk Klasifikas

Modifie

d K-

Nearest Neighb or

Hasil pengujian terhadap perubahan nilai K, perubahan jumlah data latih dan perubahan komposisi data latih didapatkan rata – rata akurasi untuk pengujian pengaruh nilai K terhadap akurasi sebesar 88,55%.

Nilai rata – rata akurasi dari

(31)

12 i Penyakit Demam

pengaruh variasi jumlah data latih adalah 92,42%.

Pengujian pengaruh komposisi data latih

terhadap akurasi

mendapatkan nilai rata – rata akurasi sebesar 87,89%.

Pengujian pengaruh komposisi data latih dan data uji terhadap akurasi mendapatkan nilai rata – rata akurasi sebesar 96,35%.

3.

Andre Rino Prasetyo,

Indriati, Putra Pandu Adikara

2018 Klasifikas i Hoax Pada Berita Kesehatan Berbahasa Indonesia Dengan Menggun akan Metode Modified K-Nearest Neighbor

Algorit ma Modifie

d K-

Nearest Neighb or

Hasil yang diperoleh berdasarkan implementasi dan pengujian menghasilkan nilai k terbaik berjumlah 4, precision sebesar 0,83 recall sebesar 0,75 f-measure sebesar 0,79 dan akurasi sebesar 75%.

4.

Felix Fridom Mailo, Lutfan Lazuardi

2019 Analisis Sentimen Data Twitter Menggun akan

Algorit ma Naïve Bayes

Berdasarkan hasil analisis

sentimen tweet didapatkan

sentimen positif sebanyak

22.246 (51,2%) tweet,

diikuti oleh sentimen negatif

sebanyak 12.015 (27,7%)

(32)

13 Metode Text Mining Tentang Masalah Obesitas di

Indonesia

tweet dan sentimen netral dengan jumlah 9.174 (21,1%) dari total 43.435 tweet. Nilai akurasi dengan algoritma Naïve Bayes didapatkan hasil nilai akurasi sebesar 94%.

Kesimpulan:

5.

Faizal Nur Rozi, Dwi Harini Sulistyawati

2019 Klasifikas i Berita Hoax Pilpres Menggun akan Metode Modified K-Nearest Neighbor Dan Pembobot an

Menggun akan Tf- Idf

Modifie

d K-

Nearest Neighb or

Hasil dari pengklasifikasian 65 dokumen uji beserta 466

dokumen latih

menggunakan Modified K- Nearest Neighbor pada setiap dokumen, muncul nilai Precission sebesar 93.75%, nilai Recall sebesar 90.90% dan nilai Accuracy sebesar 92.30%

6.

Assad Hidayat, Mustakim, Muhammad Zakiy Fauzi, Imaduddin Syukra

2019 Implemen tasi Algoritma K-Nearest Neighbor dan Probabilis tic Neural

Algorit ma K- Nearest Neighb or dan Probaili stic Neural

Data dibagi menggunakan

K-Fold Cross Validation

yang kemudian dihitung

akurasinya. Pada percobaan

menggunakan metode

pembagian data dengan 10 K

pada K-Fold Cross

Validation didapat hasil

(33)

14 Network untuk Analisis Opini Masyarak at

Terhadap Toko Online di Indonesia

Networ k

perbandingan akurasi antara KNN dan PNN terhadap data Lazada dan data Blibli, Dimana pada data Lazada akurasi KNN lebih tinggi dibandingkan PNN dengan akurasi KNN sebesar 71.57% sedangkan PNN sebesar 66.71%. Untuk data Blibli akurasi KNN juga lebih tinggi dibandingkan PNN dengan akurasi KNN sebesar 68.29% sedangkan PNN sebesar 65.29%. Jadi hasil akurasi pada data Lazada dan Blibli menggunakan algoritma KNN memiliki performa lebih baik dibanding PNN

7.

Muhammad Reza Ravi, Indriati, Sigit Adinugroho

2019 Implemen tasi Algoritma Modified K-Nearest Neighbor Untuk Mengiden tifikasi Penyakit Gigi dan Mulut

Modifie

d K-

Nearest Neighb or

Pada data latih sebanyak 70 dan data uji 30 serta nilai K

= 60, MKNN memperoleh

akurasi 86,6%

(34)

15 8.

Afrizal Nur, Mustakim, Suja’i Syarifandi, Saidul Amin

2019 Implemen tasi klasifikasi text mining sebagai model dalam kesimpula n isi Tafsir Bil

Ma'tsur dan Bil Ra'yi

K- Nearest Neighb or, Fuzzy K- Nearest Neighb or dan Modifie

d K-

Nearest Neighb or

Penelitian ini

dilakukan dengan

menerapkan algoritma K- Nearest Neighbor (KNN) dengan akurasi sebesar 98,12%. Namun KNN telah dibandingkan terlebih dahulu dengan algoritma Modified K-Nearest Neighbor (MKNN) dan Fuzzy K-Nearest Neighbor (FKNN), dimana kedua algoritma tersebut memiliki akurasi masing-masing 98,01% dan 88,3%. MKNN merupakan algoritma terbaik dengan akurasi tertinggi, tetapi juga memiliki nilai error yang tinggi sebesar 4,3% yang lebih tinggi dari KNN, 1,9%

9.

Annisa Sugesti, Moch. Abdul Mukid, Tarno

2019 Perbandin gan Kinerja Mutual K- Nearest Neighbor (Mknn) Dan K- Nearest Neighbor (Knn)

Mutual K- Nearest Neighb or dan K- Nearest Neighb or

Rata-rata nilai G-Mean yang

dihasilkan dari klasifikasi

dengan K=9 menggunakan

Mutual K-Nearest Neighbor

(MKNN) yaitu 0,702. Nilai

tersebut lebih rendah dari

rata-rata nilai G-Mean KNN

pada K=3 senilai 0,718.

(35)

16 Dalam

Analisis Klasifikas i

Kelayaka n Kredit

10.

Adella Ayu Paramitha, Indirati, Yuita Arum Sari

2020 Analisis Sentimen Terhadap Ulasan Pengguna MRT Jakarta mengguna kan Informati on Gain dan

Modified K-Nearest Neighbor

Informa tion Gain dan Modifie

d K-

Nearest Neighb or

Hasil pengujian MKNN dan seleksi fitur informarion gain, didapatkan hasil terbesar nilai akurasi 0,86769 dan f-measure sebesar 0,86265. Dengan menggunakan nilai k = 3 dan menggunakan seleksi fitur information gain dengan

menggunakan nilai

threshold sebesar 25% pada

penggunaan informarion

gain

(36)

17

BAB 3

METODOLOGI PENELITIAN

Tahapan – tahapan yang dilakukan dalam menulis penelitian ini agar tersusun secara rapid an sistematis sehingga dapat mencapai tujuan awal dari penelitian ini dapat dilihat pada gambar berikut :

Gambar 3.1 Flowchart Metodologi Penelitian

(37)

18

3.1 Identifikasi Masalah

Tahap untuk menemukan rumusan masalah yang akan penulis teliti yaitu pengimplementasian algoritma modified k-nearest neighbor dalam analisis sentimen komentar youtube tentang islamophobia.

3.2 Studi Pustaka

Tahapan yang dilakukan untuk mengumpulkan sumber – sumber informasi terkait penelitian melalui jurnal ilmiah dan buku yang berkaitan dengan permasalahan menggunakan platform youtube dengan menggunakan metode klasifikasi yang digunakan yaitu Modified K-Nearest Neighbor.

3.3 Pengumpulan Data

Tahap pengumpulan dan analisa data yang diperoleh melalui platform youtube melalui komentar – komentar sentimen dari berbagai video yang berkaitan dengan Islamophobia yang selanjutnya akan diberi pelabelan pada masing – masing komentar yang sudah didapatkan dengan positif dan negatif.

3.4 Text Preprocessing

Merupakan tahap untuk mengubah data komentar yang telah dikumpulkan yang masih data mentah untuk di sederhanakan kembali supaya data dapat diproses lebih cepat.

Adapun tahap – tahap dalam preprocessing : 1. Cleaning

melakukan pemilihan atribut yang akan digunakan, membuang atribut noise atau data yang tidak dibutuhkan dalam proses analisis sentiment.

2. Case Folding

Proses untuk mengubah semua huruf kedalam huruf kecil (lowercase) dengan fitur transform cases.

3. Tokenizing

Merupakan proses untuk memotong dokumen menjadi bagian – bagian kecil.

Proses ini juga akan menghilangkan beberapa tanda baca.

4. Normalisasi

merupakan perbaikan kata yang ejaannya tidak baku atau disingkat agar

menjadi kata baku sesuai dengan kamus besar bahasa Indonesia.

(38)

19 5. Filtering

Proses menghilangkan kata stopword, yaitu kata – kata yang sering muncul dan tidak memiliki arti.

6. Stemming

Pada tahap ini untuk menemukan kata – kata dasar dengan menghilangkan imbuhan yang terdapat dalam kata tersebut.

7. Negation Handling

Proses yang berguna untuk meningkatkan akurasi dalam klasifikasi. Dalam proses ini jika ada kata yang bersifat negasi seperti bukan, nggak dan lainnya, membuat makna kata berikutnya menjadi berlawanan dengan maksa aslinya.

3.5 Text Transformation

Setelah tahap text preprocessing, selanjutnya adalah tahap text transformation.

Dengan menggunakan algoritma Term Frequency – Inverse Document Frequency (TF- IDF). Metode pembobotan ini mengaitkan antara Term Frequency (TF) dengan Inverse Document Frequency (IDF). Metode TF-IDF menggabungkan dua konsep perhitungan bobot, yaitu kemunculan sebuah kata dalam sebuah dokumen dan inverse sebuah dokumen yang mengandung kata tersebut. Bobot hubungan antara kata dan dokumen akan tinggi jika frekuensi kemunculan kata tersebut tinggi dalam sebuah dokumen.

Berikut rumus untuk mendapatkan nilai TF-IDF.

3.6 Feature Selection

Tahapan feature selection yaitu threshold dilakukan setelah mendapatkan nilai dari TF dan IDF. Nilai yang digunakan dalam threshold ini adalah nilai TF dan IDF.

Digunakannya feature selection pada penelitian ini diharapkan untuk meningkatkan akurasi dari nilai yang akan didapatkan.

3.7 Pattern Discovery

Tahapan menggunakan metode data mining untuk mengolah data yang telah

didapat dari proses sebelumnya. Metode yang digunakan pada tahapan ini yaitu Modified

K-Nearest Neighbor (MKNN). Pada tahap ini data dibagi menjadi 2 yaitu data uji dan

data latih dengan perbandingan 70% : 30% (data latih : data uji), 80% : 20% (data latih :

data uji), 90% : 10% (data latih : data uji).

(39)

20

3.8 Perancangan Aplikasi

Pada penelitian ini menggunakan dua tahapan perancangan aplikasi yaitu : 1. Perancangan Database

Untuk merancang struktur database yang akan digunakan untuk menyimpan data hasil pemrosesan oleh sistem.

2. Perancangan aplikasi

Membangun rancangan aplikasi dengan tampilan yang dapat digunakan dengan mudah oleh penggunanya.

3.9 Penerapan Aplikasi

Proses penerapan metode Modified K-Nearest Neighbor kedalam aplikasi dengan menggunakan pemrograman PHP 7.0 dan MySQL. Proses ini memerlukan perangkat pendukung dalam bentuk perangkat keras dan perangkat lunak.

1. Perangkat Keras

Laptop : Lenovo Ideapad 110

Processor : Intel ® Core ™ i5-7200 U 2.50 GHz RAM : 4 GB

2. Perangkat Lunak

Sistem Operasi : Windows 10 Professional Bahasa Pemrograman : PHP

Web Browser : Chrome

DBMS : MySQL

3.10 Pengujian

Tahap yang dilakukan untuk melihat hasil analisa yang diperoleh aplikasi, maka pengujian dilakukan menggunakan white box dan confusion matrix.

1. Confusion Matrix

Merupakan suatu metode untuk mengetahui akurasi berdasarkan pada

prediksi suatu objek benar atau salah. Precision adalah tingkat ketepatan antar

informasi yang diminta dengan jawaban yang diberikan oleh sistem. Recall

(40)

21

merupakan tingkat keberhasilan sistem dalam menemukan kembali informasi.

Berikut tabel dari confussion matrix.

Tabel 3.1 Confussion Matrix

Kelas Terklasifikasi Positif Terklasifikasi Negatif Positif TP (True Positive) FP (False Positive) Negatif FN (False Negative) TN (True Negative)

𝑨𝒌𝒖𝒓𝒂𝒔𝒊 = (𝑻𝑷 + 𝑻𝑵)

𝑻𝑷 + 𝑻𝑵 + 𝑭𝑷 + 𝑭𝑵 × 𝟏𝟎𝟎

(3.1)

𝑷𝒓𝒆𝒄𝒊𝒔𝒊𝒐𝒏 = 𝑻𝑷

𝑻𝑷 + 𝑭𝑷 × 𝟏𝟎𝟎

(3.2)

𝑹𝒆𝒄𝒂𝒍𝒍 = 𝑻𝑷

𝑻𝑷 + 𝑭𝑵 × 𝟏𝟎𝟎

(3.3)

Dimana :

TP = true positive merupakan data yang sebenarnya bernilai positif dan hasil klasifikasi juga bernilai positif.

TN = True negative merupakan data yang sebenarnya bernilai negatif dan hasil klasifikasinya juga bernilai negatif.

FP = False positive merupakan data yang sebenarnya bernilai positif dan hasil klasifikasi nya bernilai negatif.

FN = False negative merupakan data yang sebernanya bernilai negatif dan hasil klasifikasi nya bernilai positif.

3.11 Kesimpulan dan Saran

Merupakan tahap penentuan hasil pengujian yang telah dilakukan sebelumnya.

Hal ini bertujuan untuk mengetahui apakah penerapan algoritma Modified K-Nearest

Neighbor dalam melakukan analisis sentimen tentang Islamophobia pada platform

youtube memiliki tingkat akurasi yang tinggi. Pada bagian saran berisi kemungkinan

pengembangan yang dapat dilakukan kedalam penelitian ini.

(41)

54

BAB 5 PENUTUP 5.1 Kesimpulan

Berdasarkan pengujian pada masing-masing dataset menggunakan confussion matrix menunjukkan bahwa:

1. Pengujian dengan data 1000 komentar mendapatkan akurasi tertinggi dengan perbandingan 90:10 yaitu akurasi sebesar 55% dengan nilai K=5. Sedangkan pengujian dengan data 300 komentar mendapatkan akurasi tertinggi dengan perbandingan 90:10 yaitu akurasi sebesar 60% dengan nilai K=5.

2. Dapat disimpulkan bahwa nilai akurasi yang diperoleh rendah. Hal ini bisa disebabkan karena jumlah dataset yang digunakan sedikit.

5.2 Saran

Setiap penelitian yang dilakukan tidak selalu menghasilkan yang sempurna, maka pasti ada kekurangan yang harus diperbaiki melalui saran. Berikut saran yang dapat diberikan terkait penelitian ini adalah :

1. Sistem klasifikasi ini dapat dikembangkan lagi dengan menggunakan sumber data dari sosial media lain seperti facebook, twitter, instagram dan lain-lain.

2. Pada penelitian selanjutnya dapat digunakan jumlah dataset komentar yang

lebih banyak lagi.

(42)

xviii

DAFTAR PUSTAKA

[1] I. Zulian, “Analisis Pengaruh Islamophobia Terhadap Kebijakan Luar Negeri Amerika Serikat Di Pemerintahan Donald Trump,” J. PIR Power Int. Relations, vol. 3, no. 2, p. 140, 2020, doi: 10.22303/pir.3.2.2019.140-155.

[2] A. Amalia and A. Haris, “Wacana islamophobia di media massa,” J. Ilm. Fak. Ilmu Komun. Islam Riau, vol. 7, no. 1, pp. 71–81, 2019.

[3] A. Herman and J. Nurdiansa, “Analisis Framing Pemberitaan Konflik Israel - Palestina dalam Harian Kompas dan Radar Sulteng,” J. Ilmu Komun., vol. Volume 8, no. Mei-Agustus 2010, pp. 154–169, 2010.

[4] P. N. Thanissaro and S. Kulupana, “Buddhist teen worldview: Some normative background for health professionals,” Contemp. Buddhism, vol. 16, no. 1, pp. 28–

42, 2015, doi: 10.1080/14639947.2015.1006801.

[5] Samsir, Ambiyar, U. Verawardina, F. Edi, and R. Watrianthos, “Analisis Sentimen Pembelajaran Daring Pada Twitter di Masa Pandemi COVID-19 Menggunakan Metode Naïve Bayes,” J. Media Inform. Budidarma, vol. 5, pp. 157–163, 2021, doi: 10.30865/mib.v5i1.2604.

[6] W. Gata and A. Bayhaqy, “Analysis sentiment about islamophobia when Christchurch attack on social media,” Telkomnika (Telecommunication Comput.

Electron. Control., vol. 18, no. 4, pp. 1819–1827, 2020, doi:

10.12928/TELKOMNIKA.V18I4.14179.

[7] D. Darwis, E. S. Pratiwi, and A. F. O. Pasaribu, “Penerapan Algoritma Svm Untuk Analisis Sentimen Pada Data Twitter Komisi Pemberantasan Korupsi Republik Indonesia,” Edutic - Sci. J. Informatics Educ., vol. 7, no. 1, pp. 1–11, 2020, doi:

10.21107/edutic.v7i1.8779.

[8] S. B. Imandoust and M. Bolandraftar, “Application of K-Nearest Neighbor

( KNN ) Approach for Predicting Economic Events : Theoretical Background,” Int.

(43)

xix

J. Eng. Res. Appl., vol. 3, no. 5, pp. 605–610, 2013.

[9] H. Parvin, H. Alizadeh, and B. Minaei-bidgoli, “MKNN : Modified K-Nearest Neighbor,” Proc. World Congr. Eng. Comput. Sci. WCECS, pp. 22–25, 2008.

[10] A. Deolika, K. Kusrini, and E. T. Luthfi, “Analisis Pembobotan Kata Pada Klasifikasi Text Mining,” J. Teknol. Inf., vol. 3, no. 2, p. 179, 2019, doi:

10.36294/jurti.v3i2.1077.

[11] I. Istiqlaliyyah, Y. A. Sari, and M. A. Fauzi, “Pencarian Teks pada Terjemahan Ayat Al- Qur ’ an dengan Menggunakan TF-RF dan Bray-Curtis Distance,” J.

Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 5, pp. 4357–4363, 2019.

[12] A. Nur, Mustakim, S. Syarifandi, and S. Amin, “Implementation of text mining classification as a model in the conclusion of Tafsir Bil Ma’tsur and Bil Ra’yi contents,” Int. J. Eng. Adv. Technol., vol. 9, no. 1, pp. 2789–2795, 2019, doi:

10.35940/ijeat.A9780.109119.

[13] Moordiningsih, “Islamophobia Dan Strategi Mengatasinya,” Bul. Psikol., vol. 12, no. 2, pp. 73–84, 2015, doi: 10.22146/bpsi.7470.

[14] F. T. Samosir, D. N. Pitasari, and P. E. Tjahjono, “Open access under Creative Commons Attribution-Non Commercial-Share A like 4.0 International Licence (CC-BY-SA) Record and Library Journal The Effectiveness of Youtube as a Student Learning Media (Study at the Faculty of Social and Political Sciences, Uni,” Rec. Libr. J., vol. 4, no. 2, pp. 81–91, 2018, [Online]. Available: https://e- journal.unair.ac.id/index.php/RLJ

[15] E. Chandra, “Youtube, Citra Media Informasi Interaktif Atau Media Penyampaian Aspirasi Pribadi,” J. Muara Ilmu Sos. Humaniora, dan Seni, vol. 1, no. 2, p. 406, 2018, doi: 10.24912/jmishumsen.v1i2.1035.

[16] P. Soepomo, “Penerapan Text Mining Pada Sistem Klasifikasi Email Spam Menggunakan Naive Bayes,” Penerapan Text Min. Pada Sist. Klasifikasi Email Spam Menggunakan Naive Bayes, vol. 2, no. 3, pp. 73–83, 2014, doi:

10.12928/jstie.v2i3.2877.

[17] N. L. Ratniasih, M. Sudarma, and N. Gunantara, “Penerapan Text Mining Dalam

(44)

xx

Spam Filtering Untuk Aplikasi Chat,” Maj. Ilm. Teknol. Elektro, vol. 16, no. 3, p.

13, 2017, doi: 10.24843/mite.2017.v16i03p03.

[18] A. S. Rusydiana and L. Marlina, “Journal of Economics and Business Aseanomics Journal homepage Analisis Sentimen terkait Sertifikasi Halal,” J. Econ. Bus.

Aseanomics, vol. 5, no. 1, pp. 69–85, 2020, [Online]. Available:

http://academicjournal.yarsi.ac.id/jeba

[19] A. A. Paramitha, Indriati, and Y. A. Sari, “Analisis Sentimen Terhadap Ulasan Pengguna MRT Jakarta Menggunakan Information Gain dan Modified K-Nearest Neighbor,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 4, no. 4, pp. 1125–

1132, 2020.

(45)

xviii

LAMPIRAN

Data Komentar

No. Komentar Label

1 Apapun Agamanya kita HarUs Saling Menghormati,Musuh kita Adalah yg

menghina nabi atau Agama kita. positif

2 karna dengan akhlak dan otak... manusia akan bisa memanusiakan

manusia.. positif

3

Subhanallah ... inilah toleransi yang sebenarnya. Kita tidak perlu

menyalahkan agama dari oknum yang berbuat keji berdasarkan agama yg mereka anut, tdk peduli Islam, Kristen, Hindu, Budha dll. Biarkan masing”

menjalankan agama yang mereka yakini berdasarkan hati nurani mereka, selama agama itu tidak bertentangan dengan norma/budaya yg berlaku disuatu daerah/negeri. Tidak ada paksaan dalam bergama

positif

4

Klo orang yg betul2 penganut islam. Yg betul2 mendalami islam sesungguhnya jangan kan mau membunuh sesamanya manusia membunuh hewan sekalipun dia tidak akan mau. Melainkan hewan yg dimakan. Jangankan membunuh menyakiti hati seseorang menyakiti hewan sekalipun dia tidak akan sanggup

positif

5

Sy kagum dngan Orang ini. Orang ini dia betul2 berjiwa k islaman. yg melebihi orang2 yg sememangnya islam. Banyak sekali orang2 islam yg hanya beridentitas islam namun sedikit pun tidak ada tutur keislaman dia pakai terutamanya islam yg sanggup membuat teror. Nabi muhammad sbgai junjungn besar islam ttapi tdak prnah mngajarkn dan mmbenarkn kita ntuk mnyakiti siapapun termasuk nonmuslim sklipun

positif

6 Gw yakin si trump pasti kuping nya panas soalnya si trump klo mendengar

berita kebenaran tentang islam kaya cacing kepanasan positif

7 Islam merupakan agama teroris negatif

8

Alhamdulillah... Ingatlah kita sebagai umat... Tak ada beda... Keyakinan itu urusan masing2 umat... Tak ada guna kita berbeda2... Semoga kita semua meski beda keyakinan akan di beri harapan baik dunia akhirat kelak... Amin

positif

9

teRIMA KASIH MOOM ATAS PETUNJUK DaN NASEHATNYA KPD ORG 2 KAFIR YG MMBNCI AL QUR AN DAN ROSULNYA NABI MUHAMAD YG DI PILIH OLEH ALLOH UNTUK ROHMATAN LI ALAMIN YA ALLOH SADARKAN MEREKA YG MENUDUH DAN MEMFITNAH NABI PILIHANMU

CUKUP CACIAN KEDENGKIAN MEREKA

positif

10

Dan dari semua korban WTC, tidak ada dari bangsa yahudi,,, padahal yahudi yang tinggal disana banyak,, anehh kann??? Dan islam lahh yang kena getahnya,, islam bukanlahh teroris, islam itu cinta damai dan bertoleransi, jika ada islam yang anarkis, sebenarnya itu bukan islam, dia tidak memahami ilmu agama

positif

11 Wanita yg sangat cerdas sEmoga bisa menyadarkan banyak orang tentang

kedamaian dan diberikan hidayah oleh Alloh positif

(46)

xix

12

Saya yakin pasti Allah telah sediakan surga untuknya dan pasti Allah akan menyuruh malaikat yg disurga untuk menjemput ruhnya di dihari kematian nya nanti.

positif

13 islam itu agamanya teroris wkwk negatif

14 Setiap agama pasti mengajarkan kebaikan dan kedamaian,tergantung

orang dan golonganya. positif

15

Salut sama beliau ini yang mempelajari. Kitab Suci. Dan memahami isi Al- Quran an & Injil. Yang semua mengajarkan kebaikan. Maka tidak pantas untuk merendahkan agama lain

positif

16

Subkhanallah....Ibu pendeta ini sejatiny hati dan ruhnya Muslim,semoga Allah mnjadikan muslim sejati sebelum wafat,Amiin.dan mnjadi tauladan perdamaian Ummat ber'agama.

positif

17 yg heran nya di indo banyak ustad yg mengajarkan saling membenci dan

ceramah nya tidak menyejukkan hati negatif

18

Bahagia lah kaum minoritas yang tinggal di Indonesia yg mayoritas Islam ..

coba sebaliknya minoritas Islam yg tinggal di negara mayoritas non muslim ,secara ga langsung di kucilkan rasisme

positif

19

Sejuk rasanya hati,gak cukup skali dengar khotbah Pendeta ini... Alqur'an dan Injil mengajarkan Cinta Kasih&sayang...jadi itu aja yg dibuat pedoman dlm berAgama yang kita Percaya...

Hiduplah dengan penuh Toleransi, Saling menolong dlm keBaikan.

Jgn memaksakan Agama lain... spy masuk agama yg kita imani, Menurut sy gak ada untungnya, karna Mati dan Dosa tanggung sendiri...dan ini

masalah Rohani, yg ditentukan oleh 9Hati,jadi akan sia sia.

Nabi Muhammad SAW,,Prilakunya Kasih Sayang,Santun dan

meMa'afkan..wlw diHina,diLempar batu sampai kakinya luka dan giginya rompel...diMa'afkannya,

Malahan dia berDo'a sama Allah, supaya orgnya diAmpunkan, dengan alasan belum faham...Nabi tugasnya hanya menyampaikan, diBarengi dengan menContohkan Prilaku 😊🙏

positif

20 yang radikal itu hanya orang yang tidak paham dengan agamanya sendiri. positif 21 Trimakasih Karna masih punya toleransi yg tinggi terhadap agama lain

terutama agama Islam positif

22

Saya pernah kerumah teman saya yg Nonmuslim. Ibunya melihat tingkah saya yg sangat ingin memegang anjing peliharaannya. Ujar ibunya.

Peganglah jika iya menjilat tanganmu maka nanti ibu ajarkan cara mensucikannya dan jika tidak suci biar ibu yg tangung dosanya demi

*tuhan yesus* ujarnya, ini kisah yg membuat saya nyata merasakan adanya Bhineka Tunggal Ika

positif

23 terlalu lancang menafsirkan FIRMAN2 TUHAN dengan ketajaman berfikir negatif 24 Masyallah,.pendeta ini tahu benar tentang kebenaran Islam,kitab dan

nabinya,tetap Istiqomah. positif

25 katanya pendeta tapi kenapa ngajak jemaah nya untuk membenci Islam

kan gak lucu tq negatif

(47)

xx

26

Begitulah Karakter ISLAM yg cinta damai dengan siapapun..mana pernah umat islam membakar kitabnya umat kristen...! Tp alqur'an dimana mana banyak yg membakarnya...ketahuilah..sesungguhnya yg membakar alquran itu adalah org yg berhati busuk syirik dengki terhadap islam..tp syukurlah klu umat umat kristen sudah sadar dengan perbuatannya yg membakar alquran...alquran itu tdk akan pernah sirna walaupun d bakar ber miliyar"

di bakar...tak akan ada habisnya ...semoga kita semua dan non muslim khususnya d berikan Hidaya dr allah jln yg terbaik agama yg baik buat manusia.aamiin

positif

27 Tpi yg saya tanya banyak Islam arogan. Membangun gereja gak

bisa.mebakar gereja dmn mana. Apakah itu damai. negatif 28 Islam agama terores, katanya cinta damai tapi knapa kristen di gereja di

bom negatif

29

semua agama mangajarkan kebaikan,perdamaian,tdk saling

membunuh,karena kita saling membutuhkan misal dari negara non muslim produsen dan negara muslim pembelinya,begitu juga sebaliknya,dan saya baru kali ini mendengar ceramah dari gereja yg bisa saya pahami, isinya sangat menyentuh dan saling menyayangi,tdk menyalahkan agama apapun,betul apa yg dikatakan ibu pendeta lihatlah umat islam yg hidup damai sprti umat agama lain

positif

30

Islam bukan seperti yg klian sangkakan. Islam adalah Agama yg penuh cinta damai. Islam tidak mengajarkan untuk menghujat Agama lain Islam tidak mengajarkan kekerasan. Tapi Agama lainlah yg lebih dulu menghujat Islam.

Sampai" Nabi kamipun menjadi sasaran. Didunia klian menghujat dan melecehkan Agama kami tapi kellak apabila sudah mati klian para penghujat Islam akan mendapatkan balasannya.

positif

31

Ini baru pendeta yg benar yg menyerukan perdamaian dan toleransi yg baik antar umat beragama didunia krn setiap agama sllu mengjrkn kebaikan tentunya

positif

32

Ini br pendeta yg berakal sehat n waras... tdk serta nerta mjd islamphobia hny krn beda keyakinan... !! Wahai kaum islamphobia n munafikun serta kafirun belajarlah dr beliau... !! It br Pancasilais sejati... bkn cm teriak2 AQ PANCASILA... !!

positif

33 Mudah2an agama Islam semakin di mengerti,di pahami oleh orang2non

muslim sehingga mereka tau Agama Islam adalah agama yang benar. positif 34

Pada dasarnya para pemimpin agama di dunia mengakui kebenaran Islam sebagai agama yg sempurna, namun mereka banyak yg menutupinya lantaran takut dilaknat oleh pengikutnya

negatif

35

Muslim harus membalas pendeta itu dengan berkata sopan ketika berdebat dengan non muslim. Karena mereka belum tahu sedang muslim sudah tahu.

positif

36

ADUH GARA2 DI PERANCIS BANYAK TEMAN2 KATOLIK JADI SERING SERANG KAMI UMAT ISLAM NIE.... KAMI DI BULY DAN DI PUKUL.... BGMN MENRT KAMU PEMILIK YOUTUBE INI... MEREKA MINTA PERANG AGAMA NIE...

BGMN MENURUT SAUDARA2KU ... APA KITA HARUS BERPERANG

?????????????

negatif

Referensi

Garis besar

Dokumen terkait

a. Memberikan kesempatan kepada para mahasiswa yang cakap dan giat belajar, agar dapat menyelesaikan studi dalam waktu sesingkat mungkin. Memberikan kesempatan kepada mahasiswa

Kadar Glukosa Darah Subyek Penelitian (Kelompok Perlakuan) Berdasarkan hasil penelitian pada Diagram 2 didapatkan kadar glukosa darah pada subyek penelitian (kelompok

Sistem yang akan dibangun dapat berfungsi sebagai media penyimpanan dan pengolahan data administrasi sekolah, dan data akademik lainnya sehingga pencarian data akan lebih mudah

ALOKASI DAN PERUNTUKAN ALOKASI DANA DESA TAHUN ANGGARAN 2017H. KECAMATAN/DESA DAN KETENAGAKERJAAN JAMINAN KESEHATAN

Sebagaimana diketahui bahwa pakaian bekas dari luar negeri yang termasuk barang dilarang impor sebagaimana diatur dalam Peraturan Menteri Perdagangan Nomor

Berdasarkan hasil penelitian quaisy experimental design (eksperimen berpura- pura) yang dilakukan oleh peneliti di SMA Negeri 7 Pontianak dari hasil penelitian

Lantai dari Canary cafe, DailySweet Cafe dan Stilrod Cafe menggunakan terapan gaya yang termasuk kedalam periode vintage yaitu perpaduan gaya American Beaux Arts dan

Saya juga memberitahukan Yang Mulia bahwa di tahun 1688 telah tiba di pelabuhan Sarangam sebuah kapal dengan nakhoda seorang Cina peranakan berasal dari Japara, bernama Loanko,