KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE
TERM FREQUENCY – INVERSE DOCUMENT
FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR
TUGAS AKHIR
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik
Pada Jurusan Teknik Informatika
Oleh :DEKHA MULYAPUTRA 11551102847
UIN SUSKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU PEKANBARU
2023
i
LEMBAR PERSETUJUAN
KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE
TERM FREQUENCY – INVERSE DOCUMENT
FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR
TUGAS AKHIR
Oleh
DEKHA MULYAPUTRA 11551102847
Telah diperiksa dan disetujui sebagai Laporan Tugas Akhir Di Pekanbaru, pada tanggal 19 Januari 2023
Pembimbing I
(Elvia Budianita, ST, M.Cs)
NIP/NIK. 19860629 201503 2 007
ii
LEMBAR PENGESAHAN
KLASIFIKASI ISLAMOPHOBIA BERDASARKAN KOMENTAR YOUTUBE MENGGUNAKAN METODE
TERM FREQUENCY – INVERSE DOCUMENT
FREQUENCY DAN MODIFIED K-NEAREST NEIGHBOR
Oleh
DEKHA MULYAPUTRA 11551102847
Telah dipertahankan di depan dewan penguji
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Teknik Pada Universitas Islam Negeri Sultan Syarif Kasim Riau
Pekanbaru, 19 Januari 2023 Mengesahkan
Dekan, Ketua Jurusan,
(Dr. Hartono, M.Pd) (Iwan Iskandar, M.T)
NIP. 19640301 199203 1 003 NIP. 19821216 201503 1 003 DEWAN PENGUJI
Ketua : Dr. Alwis Nazir, M.Kom
Pembimbing I : Elvia Budianita, ST, M.Cs
Penguji I : Muhammad Fikry, ST, M.Sc
Penguji II : Iwan Iskandar, MT
iii
iv
LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL
Tugas Akhir yang tidak diterbitkan ini terdaftar dan tersedia di Perpustakaan Universitas Islam Negeri Sultan Syarif Kasim Riau adalah terbuka untuk umum dengan ketentuan bahwa hak cipta pada penulis. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau ringkasan hanya dapat dilakukan seizin penulis dan harus disertai dengan kebiasaan ilmiah untuk menyebutkan sumbernya.
Penggandaan atau penerbitan sebagian atau seluruh Tugas Akhir ini harus memperoleh
izin dari Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif
Kasim Riau. Perpustakaan yang meminjamkan Tugas Akhir ini untuk anggotanya
diharapkan untuk mengisi nama, tanda peminjaman dan tanggal pinjam.
v
LEMBAR PERNYATAAN
Dengan ini saya menyatakan bahwa dalam Tugas Akhir ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan didalam daftar pustaka.
Pekanbaru,19 Januari 2023 Yang membuat pernyataan,
DEKHA MULYAPUTRA 11551102847
vi
LEMBAR PERSEMBAHAN
Allah akan meninggikan derajat orang-orang yang beriman di antaramu dan orang-orang yang diberi ilmu pengetahuan.
Alhamdulillah…
Rasa syukur kuhaturkan kepada-Mu, Yaa Allah yang Maha Ber-Ilmu, hanya karena karuniaMu sajalah hamba-Mu akhirnya dapat menyelesaikan Tugas Akhir ini.
***
Tugas akhir ini kupersembahkan untuk Papa dan Mama. Tidak tergantikan semua jasa, pengorbanan, tetes keringat dan rasa lelah itu, hanya dengan karya kecil dari ku ini…
semoga dengan karya ini, menjadi langkah kecil untuk lebih bermanfaat bagi bangsa, Negara dan agama kedepannya.
Dan tidak lupa pula karya ini kupersembahkan juga untuk adik-adikku yang senantiasa
mendoakan abangnya agar melihat abang nya wisuda.
vii
ABSTRAK
Islamophobia adalah sebuah ketakutan yang tidak masuk akal terhadap agama Islam sehingga aktifitas yang bernuansa Islami harus dihilangkan. Stigma Islamophobia ini muncul akibat adanya aksi anarkis dan radikalisme atau biasa dikenal dengan terorisme yang mengatasnamakan Islam. Istilah Islamophobia ini populer semenjak persitiwa 11 September 2001 di New York. Di Indonesia sendiri juga terdapat serangkaian aksi terorisme yang menyebabkan stigma Islamophobia ini naik di masyarakat. Terkait islamophobia ini banyak menimbulkan sentimen dari masayarakat luas yang berupa negatif dan positif. Penelitian ini bertujuan untuk mengolah sentimen masyarakat tentang islamophobia yang berfokus pada media sosial youtube tentang islamophobia. Analisis sentimen ini dilakukan untuk menentukan seberapa banyak komentar yang bernilai positif dan negatif. Analisis sentiment menggunakan algoritma TF-IDF (Term Frequency- Inverse Document Frequency) dan algoritma MKNN (Modified K-Nearest Neighbor) dengan data komentar sebanyak 1000 komentar dan menghasilkan akurasi tertinggi 55%
dengan perbandingan data latih dengan data uji 90:10 dengan nilai K=5. Sedangkan pengujian dengan 300 komentar menghasilkan akurasi tertinggi 60% dengan perbandingan data latih 90:10 dengan nilai K=5.
Kata Kunci : Analisa Sentimen, Islamophobia, Modified K-Nearest Neighbor, Term
Frequency-Inverse Document Frequency, Youtube.
viii
ABSTRACT
Islamophobia is an irrational fear of the Islamic religion so that activities that have an Islamic nuance must be eliminated. The stigma of Islamophobia arises due to anarchist and radicalism actions or commonly known as terrorism in the name of Islam. The term Islamophobia has become popular since the events of September 11, 2001 in New York.
In Indonesia itself there have also been a series of acts of terrorism which have caused the stigma of Islamophobia to rise in society. Related to Islamophobia, this has caused a lot of negative and positive sentiments from the wider community. This study aims to process public sentiment about Islamophobia which focuses on YouTube social media about Islamophobia. Sentiment analysis is carried out to determine how many comments are positive and negative. Sentiment analysis uses the TF-IDF (Term Frequency-Inverse Document Frequency) algorithm and the MKNN (Modified K-Nearest Neighbor) algorithm with 1000 commentary data and produces the highest accuracy 55% with a comparison of training data with test data of 90:10, with a value K=5.
Key Word : Analysis Sentiment, Islamophobia, Modified K-Nearest Neighbor, Term
Frequency-Inverse Document Frequency, Youtube.
ix
KATA PENGANTAR
Assalamua’alaikum wa rohmatullahi wa barokatuh.
Alhamdulillahi robbil’alamin, Puji dan syukur kepada Allah SWT atas seluruh rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penelitian dan penulisan Laporan Tugas Akhir di jurusan Teknik Informatika dengan judul “Klasifikasi Islamophobia
Berdasarkan Komentar Youtube Menggunakan Metode Term Frequency – Inverse Document Frequency Dan Modified K-Nearest Neighbor”. Laporan Tugas Akhir inimerupakan prasyarat untuk memperoleh gelar sarjana strata satu di jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Sultan Syarif Kasim Riau (UIN SUSKA RIAU).
Banyak sekali pihak yang telah membantu penulis dalam menyelesaikan penyusunan laporan ini, baik berupa bantuan materi ataupun berupa motivasi dan dukungan kepada penulis. Pada kesempatan ini penulis hanya dapat mengucapkan terima kasih banyak kepada :
1.
Bapak Prof. Dr. Hairunas, M.Ag selaku Rektor Universitas Islam Negeri Sultan Syarif Kasim Riau.
2.
Bapak Dr. Hartono, M.Pd selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau
3.
Bapak Iwan Iskandar, M.T. selaku Ketua Program Studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau.
4.
Bapak Muhammad Irsyad, S.T., M.T. selaku Dosen Pembimbing Akademik yang telah memberikan nasihat selama perkuliahan
5.
Ibu Elvia Budianita, S.T., M.Cs. selaku Dosen Pembimbing I Tugas Akhir yang selalu meluangkan waktu, memberikan ilmu, nasihat, saran, serta sabar membimbing penulis hingga tugas akhir ini selesai.
6.
Bapak Muhammad Fikry, S.T., M.Sc. selaku Dosen Penguji I yang telah
banyak memberikan saran demi kemajuan dan penyempurnaan dalam
pengerjaan tugas akhir.
x
7.
Bapak Iwan Iskandar, M.T. selaku Dosen Penguji II yang telah banyak memberikan saran demi kemajuan dan penyempurnaan dalam pengerjaan tugas akhir.
8.
Seluruh Dosen Teknik Informatika Universitas Islam Negeri Sultan Syarif Kasim Riau yang banyak memberikan ilmu, dan arahan selama perkuliahan.
Semoga ilmu yang bapak dan ibu berikan bermanfaat bagi penulis dan seluruh mahasiswa.
9.
Khusunya untuk Papa, Mama dan Adik-adikku tercinta yang telah memberikan doa dan seluruh kebaikan yang selalu diberikan sehingga telah sampai pada tahap ini. Semoga Allah SWT selalu memberikan kesehatan dan melimpahkan semua kebaikan kepada Papa dan Mama di dunia dan akhirat nanti.
10.
Seluruh teman-teman TIF angkatan 2015 yang selalu menemani, memberikan semangat, dan membantu selama perkuliahan. Semoga kita semua sukses di dunia dan akhirat, aamiinn.
Penulis menyadari bahwa dalam penulisan laporan ini masih banyak terdapat kesalahan dan kekurangan. Oleh karena itu kritik dan saran yang sifatnya membangun sangat penulis harapkan untuk kesempurnaan laporan ini. Akhhirnya penulis berharap semoga laporan ini dapat memberikan sesuatu yang bermanfaat bagi siapa saja yang membacanya.
Wassalamu’alaikum wa rohmatullahi wa barokatuh.
Pekanbaru, 5 Januari 2023
Dekha Mulyaputra
xi
DAFTAR ISI
LEMBAR PERSETUJUAN ... i
LEMBAR PENGESAHAN ... ii
LEMBAR HAK ATAS KEKAYAAN INTELEKTUAL ... iv
LEMBAR PERNYATAAN ... v
LEMBAR PERSEMBAHAN ... vi
ABSTRAK ... vii
ABSTRACT ... viii
KATA PENGANTAR ... ix
DAFTAR ISI ... xi
DAFTAR GAMBAR ... xiv
DAFTAR TABEL ... xv
DAFTAR RUMUS ... xvii
DAFTAR SIMBOL ... xviii
BAB 1 PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 3
1.3 Batasan Masalah ... 4
1.4 Tujuan Penelitian ... 4
1.5 Sistematika Penulisan ... 4
BAB 2 LANDASAN TEORI ... 6
2.1 Islamophobia ... 6
2.2 Youtube ... 6
2.3 Text Mining ... 7
2.4 Text Preprocessing ... 7
xii
2.4.1 Cleaning... 7
2.4.2 Case Folding... 7
2.4.3 Tokenizing ... 7
2.4.4 Normalisasi ... 7
2.4.5 Filtering ... 7
2.4.6 Stemming ... 7
2.4.7 Negation Handling ... 8
2.5 Analisis Sentimen ... 8
2.6 Pembobotan Kata ... 8
2.6.1 Term Frequency (TF) ... 8
2.6.2 Inverse Document Frequency (IDF) ... 8
2.6.3 Term Frequency-Inverse Document Frequency (TF-IDF) ... 8
2.7 Modified K-Nearest Neighbor (MKNN) ... 9
2.8 Penelitan Terkait ... 10
BAB 3 METODOLOGI PENELITIAN ... 17
3.1 Identifikasi Masalah ... 18
3.2 Studi Pustaka ... 18
3.3 Pengumpulan Data ... 18
3.4 Text Preprocessing ... 18
3.5 Text Transformation ... 19
3.6 Feature Selection ... 19
3.7 Pattern Discovery ... 19
3.8 Perancangan Aplikasi ... 20
3.9 Penerapan Aplikasi ... 20
3.10 Pengujian ... 20
3.11 Kesimpulan dan Saran ... 21
xiii
BAB 4 HASIL DAN PEMBAHASAN ... 22
4.1 Analisa ... 22
4.1.1 Analisa Kebutuhan Data ... 22
4.1.2 Pelabelan Data ... 22
4.1.3 Text Preprocessing ... 23
4.1.4 Text Transformation ... 31
4.1.5 Feature Selection ... 33
4.1.6 Pattern Discovery ... 33
4.2 Perancangan Aplikasi ... 39
4.2.1 Perancangan Basis Data ... 39
4.2.2 Perancangan Struktur Menu ... 44
4.2.3 Perancangan Antarmuka (Interface) ... 45
4.3 Implementasi ... 47
4.3.1 Batasan Implementasi ... 47
4.3.2 Lingkungan Implementasi ... 48
4.3.3 Implementasi Aplikasi ... 48
4.4 Pengujian ... 51
4.4.1 Confussion Matrix ... 51
4.4.2 Analisa dan Hasil Pengujian ... 53
BAB 5 PENUTUP ... 54
5.1 Kesimpulan ... 54
5.2 Saran ... 54
DAFTAR PUSTAKA ... xviii
LAMPIRAN ... xviii
DAFTAR RIWAYAT HIDUP ... xliv
xiv
DAFTAR GAMBAR
Gambar 3.1 Flowchart Metodologi Penelitian ... 17
Gambar 4.1 Flowchart Text Preprocessing ... 23
Gambar 4.2 Flowchart Tahapan Text Transformation... 31
Gambar 4.3 Flowchart Tahapan MKNN ... 33
Gambar 4.4 Perancangan Struktur Menu ... 44
Gambar 4.5 Tampilan Halaman Dashboard ... 45
Gambar 4.6 Tampilan Halaman Data Komentar ... 46
Gambar 4.7 Tampilan Halaman MKNN ... 46
Gambar 4.8 Tampilan Halaman Pengujian ... 47
Gambar 4.9 Tampilan Halaman Dashboard ... 49
Gambar 4.10 Tampilan Halaman Data Komentar ... 49
Gambar 4.11 Tampilan Halaman Menu MKNN ... 50
Gambar 4.12 Tampilan Halaman Pengujian ... 50
xv
DAFTAR TABEL
Tabel 2.1 Penelitian Terkait ... 10
Tabel 3.1 Confussion Matrix ... 21
Tabel 4.1 Pelabelan Data ... 22
Tabel 4.2 Proses Cleaning ... 23
Tabel 4.3 Proses Case Folding ... 24
Tabel 4.4 Proses Tokenizing ... 24
Tabel 4.5 Proses Normalisasi ... 26
Tabel 4.6 Proses Filtering ... 27
Tabel 4.7 Proses Stemming ... 29
Tabel 4.8 Proses Negation Handling ... 30
Tabel 4.9 Hasil TF, DF dan IDF ... 31
Tabel 4.10 Hasil TF IDF ... 32
Tabel 4.11 Contoh Data Latih ... 34
Tabel 4.12 Contoh Data Uji ... 34
Tabel 4.13Nilai Jarak Euclidean Antar Data Latih ... 35
Tabel 4.14 Nilai Validitas ... 36
Tabel 4.15 Nilai Jarak Euclidean Data Uji Dengan Data Latih ... 37
Tabel 4.16 Hasil Weight Voting ... 37
Tabel 4.17 Urutan Nilai Weight Voting Sebanyak K ... 38
Tabel 4.18 Kelas Asli Hasil Weight Voting ... 38
Tabel 4.19 Hasil Prediksi ... 39
Tabel 4.20 Struktur Tabel Komentar ... 39
Tabel 4.21 Struktur Tabel Pembagian Data ... 39
Tabel 4.22 Struktur Tabel Bobot Kata ... 40
Tabel 4.23 Struktur Tabel Cleaning ... 40
Tabel 4.24 Struktur Tabel Case Folding ... 40
Tabel 4.25Struktur Tabel Tokenizing ... 41
Tabel 4.26 Struktur Tabel Normalizing ... 41
Tabel 4.27 Struktur Tabel Filtering ... 42
xvi
Tabel 4.28 Struktur Tabel Stemming ... 42
Tabel 4.29 Struktur Tabel Negation Handling ... 42
Tabel 4.30 Struktur Tabel Jarak Euclidean ... 43
Tabel 4.31 Struktur Tabel Validitas ... 43
Tabel 4.32 Struktur Tabel Weight Voting ... 43
Tabel 4.33 Struktur Tabel Data Nilai K ... 44
Tabel 4.34 Akurasi Cofussion Matrix Pengujian 90:10 ... 51
Tabel 4.35 Akurasi Confussion Matrix Pengujian 80:20 ... 51
Tabel 4.36 Akurasi Confussion Matrix Pengujian 70:30 ... 51
Tabel 4.37 Confussion Matrix 90:10 300 data ... 52
Tabel 4.38 Confussion Matrix 80:20 300 data ... 52
Tabel 4.39 Confussion Matrix 70:30 300 data ... 53
xvii
DAFTAR RUMUS
(2.1)Inverse Document Frequency ... 8
(2.2)TF-IDF ... 9
(2.3)Jarak Euclidean ... 9
(2.4)Validitas ... 9
(2.5)Persamaan Titik S ... 10
(2.6)Weight Voting ... 10
(3.1)Akurasi ... 21
(3.2)Precission ... 21
(3.3)Recall ... 21
xviii
DAFTAR SIMBOL
Simbol Flowchart
Flow Direction : menghubungkan antar simbol satu dengan Simbol yang lain
Terminator : simbol permulaan (start)
Manual Operation : menunjukkan pengolahan yang tidak dilakukan oleh computer
Document : menyatakan input berasal dari dokumen ke dalam bentuk kertas.
Disk and on-line storage : menyatakan input berasal dari disk atau disimpan di disk.
Proses : simbol untuk melakukan suatu pemrosesan baik oleh user atau dengan computer
Verifikasi : simbol yang memutuskan apakah
vaild atau tidaknya suatu kejadian.
1
BAB 1
PENDAHULUAN 1.1 Latar Belakang
Islamophobia adalah sebuah ketakutan yang tidak masuk akal terhadap agama Islam sehingga aktifitas yang bernuansa Islami harus dihilangkan [1]. Stigma Islamophobia ini muncul akibat adanya aksi anarkis dan radikalisme atau biasa dikenal dengan terorisme yang mengatasnamakan Islam. Istilah Islamophobia ini populer semenjak persitiwa 11 September 2001 di New York. Di Indonesia sendiri juga terdapat serangkaian aksi terorisme yang menyebabkan stigma Islamophobia ini naik di masyarakat. Beberapa aksi terorisme di Indonesia diantaranya, kasus bom Bali, bom JW marriot, NII KW 9 dan lain sebagainya. Ironis nya para pelaku dari kejadian terorisme di Indonesia sering kali mengatasnamakan Islam, sehingga menjadikan ketakuran non muslim di Indonesia terhadap agama Islam semakin besar [2].
Terkait beberapa peristiwa terorisme diatas, tidak lepas pula dari peran media massa sebagai pembuat berita tentang berbagai macam aksi terorisme. Salah satunya berita tentang konflik yang terjadi antara Israel dan Palestina. Banyak warganet yang mengomentari terkait konflik ini. Sebagian besar warganet berkomentar positif dan memberikan dukungannya terhadap Palestina dan sangat sedikit yang berkomentar dukungan terhadap Israel [3].
Persitiwa – peristiwa yang menyangkut Islamophobia banyak di jumpai di
berbagai media massa dan di platform online, salah satunya Youtube. Youtube adalah
sebuah situs web video sharing yang populer dimana pengguna dapat memuat, menonton,
dan berbagi video secara gratis. Youtube didirikan pada 3 Februari 2005 oleh 3 orang
mantan pegawai PayPal, yaitu Chad Hurley, Steve Chen dan Jawed Karim. Saat ini
youtube sudah memiliki lebih dari 1 milliar pengguna di seluruh dunia. Setiap hari orang
– orang dapat menghabiskan ribuan hingga jutaan jam menonton video di youtube. Para
pengguna youtube rata berusia 18-34 tahun dan 18-49 tahun. Dikarenakan banyak nya
pengguna youtube, menandakan bahwa youtube bisa menjadi sumber dan dapat dijadikan
sebagai media analisis sentimen mengenai suatu topik. Banyaknya komentar dari para
2
pengguna youtube tersebut dapat dijadikan sebagai informasi yang dapat di analisa lagi [4].
Analisa sentimen tersebut dapat dilakukan dengan teknik text mining. Text mining bertujuan untuk menghasilkan informasi dari satu set dokumen. Text mining mampu menghasilkan informasi melalui pemrosesan, pengelompokkan dan analisis data – data tidak terstruktur dalam jumlah besar. Proses text mining dapat menghasilkan analisis sentiment secara emosional mengidentifikasi pernyataan jika positif atau negatif. Objek text mining merupakan dokumen tidak terstruktur atau semi terstruktur. Text mining secara efektif mengekstrak informasi yang diperlukan dari sejumlah dokumen [5].
Terdapat penelitian terkait analisis tentang Islamophobia, salah satunya yaitu penelitian yang dilakukan oleh [6] menggunakan algoritma Naïve Bayes dengan akurasi 73,12% dan SVM dengan akurasi 81,37%. Tujuan dilakukannya penelitian ini ada untuk menemukan korban pelecehan atau perundungan baik secara online maupun offline. Lalu memberikan masukkan dan edukasi kepada pelaku pelecehan dan perundungan serta orang – orang yang anti Islam agar tidak melakukan diskriminasi, permusuhan dan perlakuan yang tidak adil terhadap komunitas dan individu muslim.
Penelitian terkait analisis sentimen pada media sosial, salah satunya yaitu penelitian yang dilakukan oleh [7] yang menggunakan platform twitter dan menggunakan algoritma support vector machine (SVM). Kekurangan dari metode ini adalah harus berbasis dengan kamus KBBI yang lengkap untuk mendapatkan akurasi yang tinggi.
Metode yang digunakan dalam penelitian ini adalah metode Modified K-Nearest
Neighbor (MKNN). Metode ini merupakan algoritma penyempurnaan dari algoritma K-
Nearest Neighbor (KNN). Algoritma KNN merupakan suatu metode yang menggunakan
algoritma supervised learning yaitu menemukan pola baru dalam data awal dan
menghubungkan pola data yang sudah ada dengan data yang baru. Kelebihan metode
KNN adalah algoritma yang sangat sederhana karena bekerja berdasarkan jarak terpendek
dari query instance ke training sample untuk menentukan KNN nya [8]. Perbedaan nya
dengan MKNN adalah terdapat perhitungan weight voting serta perhitungan nilai validasi
pada data. Kelebihan MKNN dibandingkan dengan KNN adalah tingkat akurasi yang
lebih tinggi dimana dalam MKNN ditambahkan perhitungan nilai validity yang berguna
dalam mengatasi masalah outlier dalam perhitungan bobot pada KNN tradisional [9].
3
Dalam penelitian ini juga akan menggunaka metode pembobotan kata term frequency – relevance frequency (TF-RF). Metode TF-RF merupakan perkembangan dari metode term frequency – inverse document frequency (TF-IDF). Metode TF-IDF merupakan metode yang digunakan untuk menentukan seberapa jauh keterhubungan kata (term) terhadap dokumen dengan memberikan bobot setiap kata [10]. Kelemahan dari TF-IDF adalah tidak dapat mempresentasikan perbedaan antara dokumen positif dan negatif dan RF merupakan relevance frequency yang diharapkan dapat meningkatkan daya diskriminatif [11].
Terkait dengan judul penelitian yang akan diajukan mengenai algoritma Modified K-Nearest Neighbor, terdapat beberapa penelitian terkait diantaranya yang dilakukan oleh [12] yaitu Implementasi klasifikasi text mining sebagai model dalam kesimpulan isi Tafsir Bil Ma'tsur dan Bil Ra'yi. Pada Penelitian ini dilakukan dengan menerapkan algoritma K-Nearest Neighbor (KNN) dengan akurasi sebesar 98,12%. Namun KNN telah dibandingkan terlebih dahulu dengan algoritma Modified K-Nearest Neighbor (MKNN) dan Fuzzy K-Nearest Neighbor (FKNN), dimana kedua algoritma tersebut memiliki akurasi masing-masing 98,01% dan 88,3%. MKNN merupakan algoritma terbaik dengan akurasi tertinggi, tetapi juga memiliki nilai error yang tinggi sebesar 4,3%
yang lebih tinggi dari KNN, 1,9%. Kinerja dari algoritma Modified K-Nearest Neighbor pada umumnya
Berdasarkan latar belakang yang sudah dijelaskan diatas, maka penulis akan melakukan penelitian analisis sentimen menggunakan algoritma Modified K-Nearest Neighbor dalam klasifikasi komentar youtube tentang Islamophobia. Hasil utama dari penelitian ini adalah untuk mengetahui seberapa besar akurasi yang didapatkan oleh algoritma Modified K-Nearest Neighbor dan untuk mengetahui performa dari algoritma tersebut dalam melakukan klasifikasi sentimen.
1.2 Rumusan Masalah
Berdasarkan masalah yang telah diuraikan diatas, maka terdapatlah rumusan masalah yaitu :
1. Bagaimana penerapan algoritma Modified K-Nearest Neighbor dalam mengklasifikasi sentimen terhadap topik Islamophobia pada youtube.
2. Bagaimana pengujian nilai akurasi metode Modified K-Nearest Neighbor.
4
1.3 Batasan Masalah
Dalam melakukan suatu penelitian diperlukan batasan – batasan agar tidak menyimpang dari apa yang telah direncanakan, adapun batasan masalah dalam penulisan tugas akhir ini, yaitu :
1. Output yang dihasilkan berupa klasifikasi positif dan negatif dari komentar youtube yang mengandung Islamophobia.
2. Data diambil menggunakan youtube API.
3. Text preprocessing dengan proses cleaning, case folding, tokenizing, stopword removal dan stemming.
4. Pelabelan data positif dan negative dilakukan secara manual.
5. Dataset yang akan diambil sebanyak 1000 komentar.
1.4 Tujuan Penelitian
Adapun tujuan dari penelitian ini adalah Menerapkan algoritma Modified K- Nearest Neighbor untuk mengklasifikasi komentar di youtube mengenai Islamophobia, serta menguji tingkat akurasi dari algoritma tersebut.
1.5 Sistematika Penulisan
Agar lebih sistematis dan terarah dalam penyusunan laporan tugas akhir, penulis membagi dalam beberapa bab. Berikut ini adalah bab-bab yang disajikan :
BAB I PENDAHULUAN
Bab ini berisi tentang penjelasan mengenai latar belakang masalah, rumusan masalah, batasan masalah, tujuan dari penelitian yang dilakukan, dan sistematika penulisan laporan Tugas Akhir.
BAB II LANDASAN TEORI
Bab ini berisi tentang teori-teori terkait penelitian yang dilakukan yakni penerapan metode Modified K-Nearest Neighbor dalam mengklasifikasi komentar di youtube tentang Islamophobia. Perangkat analisa sistem beserta model pengembangan sistem juga akan dibahas.
BAB III METODOLOGI PENELITIAN
Bab ini menjelaskan rangkaian tahapan dalam pembuatan sistem yang terdiri
dari pengumpulan data, analisis data, analisa metode Modified K-Nearest
5
Neighbor, perancangan, text mining, analisa fungsional sistem, implementasi beserta pengujian sistem yang akan dibangun.
BAB IV ANALISA DAN PERANCANGAN
Bab ini menjelaskan mengenai analisa dari sistem yang akan dibangun menggunakan PHP, dengan menerapkan algoritma Modified K-Nearest Neighbor dalam mengklasifikasi komentar di youtube.
BAB V IMPLEMENTASI DAN PENGUJIAN
Bab ini menjelaskan hasil dari perancangan sistem yang telah dilakukan sebelumnya yang mana berisi tentang implementasi dari metode yang diterapkan ke dalam sistem.
BAB IV PENUTUP
Bab penutup ini berisi kesimpulan dan saran dari hasil penelitian menerapkan
algoritma Modified K-Nearest Neighbor dalam mengklasifikasi komentar di
youtube tentang Islamophobia.
6
BAB 2
LANDASAN TEORI 2.1 Islamophobia
Islamophobia adalah sebuah bentuk ketakutan berupa kecemasan yang dialami seseorang maupun kelompok sosial terhadap Islam dan orang – orang muslim yang bersumber dari pendangan yang tertutup tentang Islam serta disertai prasangka bahwa Islam sebagai agama yang “inferior” tidak pantas untuk berpengaruh terhadap nilai – nilai yang telah ada di masyarakat [13].
Istilah Islamophobia sendiri populer pasca tragedy WTC 11 September 2001 di New York serta seruan peperangan terhadap terorisme. Komunitas Islam dipandang sebagai penyebab segala permasalahan dan secara stereotip mereka menjadi sasaran tuduhan tersebut [13].
Di Indonesia sendiri kecemasan terhadap muslim menyebar pasca terjadinya peristiwa ledakan bom Bali I, 12 Oktober 2002. Sehingga terjadi rentetan penangkapan beberapa orang Islam yang dianggap terkait seperti Amrozi, Ali Imron, dan Imam Samudra [13]. Berbagai sentiment pun muncul di masyarakat, terutama sentimen positif dan negatif. Dimana sentimen positif yaitu berupa tidak mendukung nya terhadap islamophobia, dan sentimen negatif yang mendukungan adanya islamophobia.
2.2 Youtube
Youtube adalah situs media digital (video) yang dapat di download, diunggah, serta dibagikan (share) di seluruh penjuru negeri. Youtube merupakan situs sosial media yang sering dipakai serta fenomenal dikalangan masyarakat. Masyarakat menggunakan youtube baik dalam melihat berita terkini, mencari informasi, bahkan untuk mencari hiburan seperti menonton film, mendengarkan lagu atau menonton berbagai video tutorial [14].
Youtube dibentuk oleh 3 orang mantan pegawai PayPal yaitu, Chad Hurley, Steve
Chen, dan Jawed Karim. Nama youtube sendiri terinspirasi dari nama sebuah kedai pizza
dan restoran Jepang di San Mateo, California [15]
7
2.3 Text Mining
Text mining merupakan proses menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen dan bertujuan untuk mencari kata – kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antar dokumen [16]. Text mining dapat digunakan untuk melakukan klasifikasi analisis sentimen, text clustering, information extraction dan information retrieval, dimana text mining juga termasuk jenis data mining untuk menemukan pola yang menarik dalam data teks yang berjumlah besar [17].
2.4 Text Preprocessing
Merupakan tahap pembersihkan kata sebelum diolah. Adapun proses – proses dalam preprocessing sebagai berikut :
2.4.1 Cleaning
melakukan pemilihan atribut yang akan digunakan, membuang atribut noise atau data yang tidak dibutuhkan dalam proses analisis sentiment.
2.4.2 Case Folding
menggunakan transform cases untuk mengubah seluruh teks kedalam huruf kecil (lowercase).
2.4.3 Tokenizing
melakukan pemecahan kata pada kalimat dan menghilangkan beberapa karakter tertentu seperti tanda baca.
2.4.4 Normalisasi
merupakan perbaikan kata yang ejaannya tidak baku atau disingkat agar menjadi kata baku sesuai dengan kamus besar bahasa Indonesia.
2.4.5 Filtering
Proses menghilangkan kata stopword, yaitu kata – kata yang sering muncul dan tidak memiliki arti.
2.4.6 Stemming
Proses menghilangkan imbuhan pada kata agar menjadi kata dasar.
8
2.4.7 Negation HandlingProses yang berguna untuk meningkatkan akurasi dalam klasifikasi. Dalam proses ini jika ada kata yang bersifat negasi seperti bukan, nggak dan lainnya, membuat makna kata berikutnya menjadi berlawanan dengan maksa aslinya.
2.5 Analisis Sentimen
Analisis sentimen adalah proses memahami, mengekstrak dan memproses data tekstual secara otomatis untuk mendapatkan sentimen informasi yang terkandung dalam sebuah opini. Analisis sentimen dilakukan untuk melihat kecenderungan opini atau pendapat terhadap suatu masalah atau suatu objek oleh seseorang, apakah cenderung memandang positif atau negatif [18].
2.6 Pembobotan Kata
Pembobotan kata dibutuhkan untuk implementasi terhadap klasifikasi dokumen teks. Pada penelitian ini menggunakan pembobotan kata Term Frequency-Inverse Document Frequency (TF-IDF).
2.6.1 Term Frequency (TF)
Merupakan jumlah kemunculan sebuah kata dalam suatu dokumen dan untuk menghitung nilai TF dengan menghitung jumlah kata dalam sebuah dokumen.
2.6.2 Inverse Document Frequency (IDF)
Merupakan inverse frekuensi sebuah dokumen yang mengandung banyak nya sebuah kata.
𝑰𝑫𝑭 = 𝒍𝒐𝒈 𝑫
𝑫𝑭
(2.1)Dimana :
D = Jumlah dokumen dalam dataset
DF = jumlah dokumen yang mengandung kata
2.6.3 Term Frequency-Inverse Document Frequency (TF-IDF)
Metode TF-IDF menggabungkan dua konsep perhitungan bobot, yaitu
kemunculan sebuah kata dalam sebuah dokumen dan inverse sebuah dokumen yang
mengandung kata tersebut. Bobot hubungan antara kata dan dokumen akan tinggi jika
9
frekuensi kemunculan kata tersebut tinggi dalam sebuah dokumen. Berikut rumus untuk mendapatkan nilai TF-IDF :
𝑻𝑭 𝑰𝑫𝑭 = 𝑻𝑭 𝐱 𝑰𝑫𝑭
(2.2)2.7 Modified K-Nearest Neighbor (MKNN)
Algoritma KNN dan turunannya merupakan algoritma klasifikasi yang berdasarkan pada kedekatan suatu objek. Perbedaan algoritma KNN dengan MKNN yaitu pada penambahan tahapan dalam proses klasifikasi MKNN berupa perhitungan nilai validitas MKNN berupa perhitungan nilai validitas dan perhitungan weighted voting [19].
Berikut tahapan – tahapan dalam melakukan proses klasifikasi menggunakan algoritma MKNN :
1.
Menghitung
jarakMenghitung jarak antara dua titik pada data training (x) dan titik pada data testing (y) dengan rumus Euclidean pada persamaan berikut :
𝒅(𝒙, 𝒚) = √∑ (𝒙
𝒊− 𝒚
𝒊)
𝟐𝒏 𝒊=𝟏
(2.3)
Dimana :
d = jarak titik data training x dan data testing y i = nilai atribut
x = data training y = data testing n = dimensi atribut
2.
Validitas
data latihMenggunakan validitas dalam menghitung jumlah titik dalam seluruh data latih. Tetangga terdekat setiap data akan berpengaruh pada validitas data.
Persamaan yang digunakan untuk menghitung validitas dari setiap titik pada data latih adalah seperti persamaan berikut :
𝑽𝒂𝒍𝒊𝒅𝒊𝒕𝒂𝒔 = 𝟏
𝒌 ∑ 𝑺(𝒍𝒃𝒍(𝑿), 𝒍𝒃𝒍(𝑵
𝒊(𝒙)))
𝑲 𝒊=𝟏
(2.4)
10
Dimana :
K = banyaknya titik terdekat Lbl(x) = kelas x
Ni(x) = label kelas titik terdekat x
S = menghitung titik kesamaan x dan data ke-1 dari tetangga terdekat
Persamaan titik S :
𝑺(𝒂, 𝒃) = { 𝟏
𝒂=𝒃𝟎
𝒂≠𝒃 (2.5)Dimana :
a = kelas a pada data latih b = kelas selain a
3. Weight voting
Menggunakan validitas dari setiap data pada data latih, lalu dikalikan dengan weight berdasarkan jarak Euclidean adalah untuk menentukan weight voting.
Berikut persamaan perhitungan weight voting tiap tetangga dalam metode MKNN :
𝑾(𝒙) = 𝑽𝒂𝒍𝒊𝒅𝒊𝒕𝒂𝒔(𝒙) ∗ 𝟏
𝒅
𝒆+𝟎,𝟓 (2.6)Dimana :
W(x) = perhitungan weight voting Validitas (x) = nilai validitas
de = jarak euclidean
2.8 Penelitan Terkait
Berikut beberapa penelitian terkait yang menjadi acuan penulis dalam melakukan penelitian ini :
Tabel 2.1 Penelitian Terkait
No. Nama Penulis Tahun Judul Metode Hasil
1. Siti Mutrofin, Arrie
2015 Optimasi Teknik
Modifie
d K-
Berdasarkan hasil uji
menggunakan data Iris dan
11 Kurniawardhani,
Abidatul Izzah, Mukhamad Masrur
Klasifikas i Modified K-
Nearest Neighbor Menggun akan Algoritma Genetika
Nearest Neighb or dan Algorit ma Genetik a
Wine MKNN lebih unggul dari pada kNN, baik menggunakan data latih 60%, 70%, 80%, maupun 90%, dengan akurasi paling rendah adalah sebesar 93,78% dan paling tinggi 97,28%, masih lebih tinggi dibandingkan dengan kNN dengan akurasi terendah sebesar 82,92% dan paling tinggi 84,82% untuk data Iris, begitu juga ketika menggunakan data wine MKNN masih lebih unggul
dibandingkan kNN.
Sedangkan untuk GMKNN dapat menentukan nilai k
secara otomasi,
dibandingkan MKNN yang penentuan k-nya masih manual
2.
Fakihatin
Wafiyah, Nurul Hidayat, Rizal Setya Perdana
2017 Implemen tasi Algoritma Modified K-Nearest Neighbor untuk Klasifikas
Modifie
d K-
Nearest Neighb or
Hasil pengujian terhadap perubahan nilai K, perubahan jumlah data latih dan perubahan komposisi data latih didapatkan rata – rata akurasi untuk pengujian pengaruh nilai K terhadap akurasi sebesar 88,55%.
Nilai rata – rata akurasi dari
12 i Penyakit Demam
pengaruh variasi jumlah data latih adalah 92,42%.
Pengujian pengaruh komposisi data latih
terhadap akurasi
mendapatkan nilai rata – rata akurasi sebesar 87,89%.
Pengujian pengaruh komposisi data latih dan data uji terhadap akurasi mendapatkan nilai rata – rata akurasi sebesar 96,35%.
3.
Andre Rino Prasetyo,
Indriati, Putra Pandu Adikara
2018 Klasifikas i Hoax Pada Berita Kesehatan Berbahasa Indonesia Dengan Menggun akan Metode Modified K-Nearest Neighbor
Algorit ma Modifie
d K-
Nearest Neighb or
Hasil yang diperoleh berdasarkan implementasi dan pengujian menghasilkan nilai k terbaik berjumlah 4, precision sebesar 0,83 recall sebesar 0,75 f-measure sebesar 0,79 dan akurasi sebesar 75%.
4.
Felix Fridom Mailo, Lutfan Lazuardi
2019 Analisis Sentimen Data Twitter Menggun akan
Algorit ma Naïve Bayes
Berdasarkan hasil analisis
sentimen tweet didapatkan
sentimen positif sebanyak
22.246 (51,2%) tweet,
diikuti oleh sentimen negatif
sebanyak 12.015 (27,7%)
13 Metode Text Mining Tentang Masalah Obesitas di
Indonesia
tweet dan sentimen netral dengan jumlah 9.174 (21,1%) dari total 43.435 tweet. Nilai akurasi dengan algoritma Naïve Bayes didapatkan hasil nilai akurasi sebesar 94%.
Kesimpulan:
5.
Faizal Nur Rozi, Dwi Harini Sulistyawati
2019 Klasifikas i Berita Hoax Pilpres Menggun akan Metode Modified K-Nearest Neighbor Dan Pembobot an
Menggun akan Tf- Idf
Modifie
d K-
Nearest Neighb or
Hasil dari pengklasifikasian 65 dokumen uji beserta 466
dokumen latih
menggunakan Modified K- Nearest Neighbor pada setiap dokumen, muncul nilai Precission sebesar 93.75%, nilai Recall sebesar 90.90% dan nilai Accuracy sebesar 92.30%
6.
Assad Hidayat, Mustakim, Muhammad Zakiy Fauzi, Imaduddin Syukra
2019 Implemen tasi Algoritma K-Nearest Neighbor dan Probabilis tic Neural
Algorit ma K- Nearest Neighb or dan Probaili stic Neural
Data dibagi menggunakan
K-Fold Cross Validation
yang kemudian dihitung
akurasinya. Pada percobaan
menggunakan metode
pembagian data dengan 10 K
pada K-Fold Cross
Validation didapat hasil
14 Network untuk Analisis Opini Masyarak at
Terhadap Toko Online di Indonesia
Networ k
perbandingan akurasi antara KNN dan PNN terhadap data Lazada dan data Blibli, Dimana pada data Lazada akurasi KNN lebih tinggi dibandingkan PNN dengan akurasi KNN sebesar 71.57% sedangkan PNN sebesar 66.71%. Untuk data Blibli akurasi KNN juga lebih tinggi dibandingkan PNN dengan akurasi KNN sebesar 68.29% sedangkan PNN sebesar 65.29%. Jadi hasil akurasi pada data Lazada dan Blibli menggunakan algoritma KNN memiliki performa lebih baik dibanding PNN
7.
Muhammad Reza Ravi, Indriati, Sigit Adinugroho
2019 Implemen tasi Algoritma Modified K-Nearest Neighbor Untuk Mengiden tifikasi Penyakit Gigi dan Mulut
Modifie
d K-
Nearest Neighb or
Pada data latih sebanyak 70 dan data uji 30 serta nilai K
= 60, MKNN memperoleh
akurasi 86,6%
15 8.
Afrizal Nur, Mustakim, Suja’i Syarifandi, Saidul Amin
2019 Implemen tasi klasifikasi text mining sebagai model dalam kesimpula n isi Tafsir Bil
Ma'tsur dan Bil Ra'yi
K- Nearest Neighb or, Fuzzy K- Nearest Neighb or dan Modifie
d K-
Nearest Neighb or
Penelitian ini
dilakukan dengan
menerapkan algoritma K- Nearest Neighbor (KNN) dengan akurasi sebesar 98,12%. Namun KNN telah dibandingkan terlebih dahulu dengan algoritma Modified K-Nearest Neighbor (MKNN) dan Fuzzy K-Nearest Neighbor (FKNN), dimana kedua algoritma tersebut memiliki akurasi masing-masing 98,01% dan 88,3%. MKNN merupakan algoritma terbaik dengan akurasi tertinggi, tetapi juga memiliki nilai error yang tinggi sebesar 4,3% yang lebih tinggi dari KNN, 1,9%
9.
Annisa Sugesti, Moch. Abdul Mukid, Tarno
2019 Perbandin gan Kinerja Mutual K- Nearest Neighbor (Mknn) Dan K- Nearest Neighbor (Knn)
Mutual K- Nearest Neighb or dan K- Nearest Neighb or
Rata-rata nilai G-Mean yang
dihasilkan dari klasifikasi
dengan K=9 menggunakan
Mutual K-Nearest Neighbor
(MKNN) yaitu 0,702. Nilai
tersebut lebih rendah dari
rata-rata nilai G-Mean KNN
pada K=3 senilai 0,718.
16 Dalam
Analisis Klasifikas i
Kelayaka n Kredit
10.
Adella Ayu Paramitha, Indirati, Yuita Arum Sari
2020 Analisis Sentimen Terhadap Ulasan Pengguna MRT Jakarta mengguna kan Informati on Gain dan
Modified K-Nearest Neighbor
Informa tion Gain dan Modifie
d K-
Nearest Neighb or
Hasil pengujian MKNN dan seleksi fitur informarion gain, didapatkan hasil terbesar nilai akurasi 0,86769 dan f-measure sebesar 0,86265. Dengan menggunakan nilai k = 3 dan menggunakan seleksi fitur information gain dengan
menggunakan nilai
threshold sebesar 25% pada
penggunaan informarion
gain
17
BAB 3
METODOLOGI PENELITIAN
Tahapan – tahapan yang dilakukan dalam menulis penelitian ini agar tersusun secara rapid an sistematis sehingga dapat mencapai tujuan awal dari penelitian ini dapat dilihat pada gambar berikut :
Gambar 3.1 Flowchart Metodologi Penelitian
18
3.1 Identifikasi Masalah
Tahap untuk menemukan rumusan masalah yang akan penulis teliti yaitu pengimplementasian algoritma modified k-nearest neighbor dalam analisis sentimen komentar youtube tentang islamophobia.
3.2 Studi Pustaka
Tahapan yang dilakukan untuk mengumpulkan sumber – sumber informasi terkait penelitian melalui jurnal ilmiah dan buku yang berkaitan dengan permasalahan menggunakan platform youtube dengan menggunakan metode klasifikasi yang digunakan yaitu Modified K-Nearest Neighbor.
3.3 Pengumpulan Data
Tahap pengumpulan dan analisa data yang diperoleh melalui platform youtube melalui komentar – komentar sentimen dari berbagai video yang berkaitan dengan Islamophobia yang selanjutnya akan diberi pelabelan pada masing – masing komentar yang sudah didapatkan dengan positif dan negatif.
3.4 Text Preprocessing
Merupakan tahap untuk mengubah data komentar yang telah dikumpulkan yang masih data mentah untuk di sederhanakan kembali supaya data dapat diproses lebih cepat.
Adapun tahap – tahap dalam preprocessing : 1. Cleaning
melakukan pemilihan atribut yang akan digunakan, membuang atribut noise atau data yang tidak dibutuhkan dalam proses analisis sentiment.
2. Case Folding
Proses untuk mengubah semua huruf kedalam huruf kecil (lowercase) dengan fitur transform cases.
3. Tokenizing
Merupakan proses untuk memotong dokumen menjadi bagian – bagian kecil.
Proses ini juga akan menghilangkan beberapa tanda baca.
4. Normalisasi
merupakan perbaikan kata yang ejaannya tidak baku atau disingkat agar
menjadi kata baku sesuai dengan kamus besar bahasa Indonesia.
19 5. Filtering
Proses menghilangkan kata stopword, yaitu kata – kata yang sering muncul dan tidak memiliki arti.
6. Stemming
Pada tahap ini untuk menemukan kata – kata dasar dengan menghilangkan imbuhan yang terdapat dalam kata tersebut.
7. Negation Handling
Proses yang berguna untuk meningkatkan akurasi dalam klasifikasi. Dalam proses ini jika ada kata yang bersifat negasi seperti bukan, nggak dan lainnya, membuat makna kata berikutnya menjadi berlawanan dengan maksa aslinya.
3.5 Text Transformation
Setelah tahap text preprocessing, selanjutnya adalah tahap text transformation.
Dengan menggunakan algoritma Term Frequency – Inverse Document Frequency (TF- IDF). Metode pembobotan ini mengaitkan antara Term Frequency (TF) dengan Inverse Document Frequency (IDF). Metode TF-IDF menggabungkan dua konsep perhitungan bobot, yaitu kemunculan sebuah kata dalam sebuah dokumen dan inverse sebuah dokumen yang mengandung kata tersebut. Bobot hubungan antara kata dan dokumen akan tinggi jika frekuensi kemunculan kata tersebut tinggi dalam sebuah dokumen.
Berikut rumus untuk mendapatkan nilai TF-IDF.
3.6 Feature Selection
Tahapan feature selection yaitu threshold dilakukan setelah mendapatkan nilai dari TF dan IDF. Nilai yang digunakan dalam threshold ini adalah nilai TF dan IDF.
Digunakannya feature selection pada penelitian ini diharapkan untuk meningkatkan akurasi dari nilai yang akan didapatkan.
3.7 Pattern Discovery
Tahapan menggunakan metode data mining untuk mengolah data yang telah
didapat dari proses sebelumnya. Metode yang digunakan pada tahapan ini yaitu Modified
K-Nearest Neighbor (MKNN). Pada tahap ini data dibagi menjadi 2 yaitu data uji dan
data latih dengan perbandingan 70% : 30% (data latih : data uji), 80% : 20% (data latih :
data uji), 90% : 10% (data latih : data uji).
20
3.8 Perancangan Aplikasi
Pada penelitian ini menggunakan dua tahapan perancangan aplikasi yaitu : 1. Perancangan Database
Untuk merancang struktur database yang akan digunakan untuk menyimpan data hasil pemrosesan oleh sistem.
2. Perancangan aplikasi
Membangun rancangan aplikasi dengan tampilan yang dapat digunakan dengan mudah oleh penggunanya.
3.9 Penerapan Aplikasi
Proses penerapan metode Modified K-Nearest Neighbor kedalam aplikasi dengan menggunakan pemrograman PHP 7.0 dan MySQL. Proses ini memerlukan perangkat pendukung dalam bentuk perangkat keras dan perangkat lunak.
1. Perangkat Keras
Laptop : Lenovo Ideapad 110
Processor : Intel ® Core ™ i5-7200 U 2.50 GHz RAM : 4 GB
2. Perangkat Lunak
Sistem Operasi : Windows 10 Professional Bahasa Pemrograman : PHP
Web Browser : Chrome
DBMS : MySQL
3.10 Pengujian
Tahap yang dilakukan untuk melihat hasil analisa yang diperoleh aplikasi, maka pengujian dilakukan menggunakan white box dan confusion matrix.
1. Confusion Matrix
Merupakan suatu metode untuk mengetahui akurasi berdasarkan pada
prediksi suatu objek benar atau salah. Precision adalah tingkat ketepatan antar
informasi yang diminta dengan jawaban yang diberikan oleh sistem. Recall
21
merupakan tingkat keberhasilan sistem dalam menemukan kembali informasi.
Berikut tabel dari confussion matrix.
Tabel 3.1 Confussion Matrix
Kelas Terklasifikasi Positif Terklasifikasi Negatif Positif TP (True Positive) FP (False Positive) Negatif FN (False Negative) TN (True Negative)
𝑨𝒌𝒖𝒓𝒂𝒔𝒊 = (𝑻𝑷 + 𝑻𝑵)
𝑻𝑷 + 𝑻𝑵 + 𝑭𝑷 + 𝑭𝑵 × 𝟏𝟎𝟎
(3.1)𝑷𝒓𝒆𝒄𝒊𝒔𝒊𝒐𝒏 = 𝑻𝑷
𝑻𝑷 + 𝑭𝑷 × 𝟏𝟎𝟎
(3.2)𝑹𝒆𝒄𝒂𝒍𝒍 = 𝑻𝑷
𝑻𝑷 + 𝑭𝑵 × 𝟏𝟎𝟎
(3.3)Dimana :
TP = true positive merupakan data yang sebenarnya bernilai positif dan hasil klasifikasi juga bernilai positif.
TN = True negative merupakan data yang sebenarnya bernilai negatif dan hasil klasifikasinya juga bernilai negatif.
FP = False positive merupakan data yang sebenarnya bernilai positif dan hasil klasifikasi nya bernilai negatif.
FN = False negative merupakan data yang sebernanya bernilai negatif dan hasil klasifikasi nya bernilai positif.
3.11 Kesimpulan dan Saran
Merupakan tahap penentuan hasil pengujian yang telah dilakukan sebelumnya.
Hal ini bertujuan untuk mengetahui apakah penerapan algoritma Modified K-Nearest
Neighbor dalam melakukan analisis sentimen tentang Islamophobia pada platform
youtube memiliki tingkat akurasi yang tinggi. Pada bagian saran berisi kemungkinan
pengembangan yang dapat dilakukan kedalam penelitian ini.
54
BAB 5 PENUTUP 5.1 Kesimpulan
Berdasarkan pengujian pada masing-masing dataset menggunakan confussion matrix menunjukkan bahwa:
1. Pengujian dengan data 1000 komentar mendapatkan akurasi tertinggi dengan perbandingan 90:10 yaitu akurasi sebesar 55% dengan nilai K=5. Sedangkan pengujian dengan data 300 komentar mendapatkan akurasi tertinggi dengan perbandingan 90:10 yaitu akurasi sebesar 60% dengan nilai K=5.
2. Dapat disimpulkan bahwa nilai akurasi yang diperoleh rendah. Hal ini bisa disebabkan karena jumlah dataset yang digunakan sedikit.
5.2 Saran
Setiap penelitian yang dilakukan tidak selalu menghasilkan yang sempurna, maka pasti ada kekurangan yang harus diperbaiki melalui saran. Berikut saran yang dapat diberikan terkait penelitian ini adalah :
1. Sistem klasifikasi ini dapat dikembangkan lagi dengan menggunakan sumber data dari sosial media lain seperti facebook, twitter, instagram dan lain-lain.
2. Pada penelitian selanjutnya dapat digunakan jumlah dataset komentar yang
lebih banyak lagi.
xviii
DAFTAR PUSTAKA
[1] I. Zulian, “Analisis Pengaruh Islamophobia Terhadap Kebijakan Luar Negeri Amerika Serikat Di Pemerintahan Donald Trump,” J. PIR Power Int. Relations, vol. 3, no. 2, p. 140, 2020, doi: 10.22303/pir.3.2.2019.140-155.
[2] A. Amalia and A. Haris, “Wacana islamophobia di media massa,” J. Ilm. Fak. Ilmu Komun. Islam Riau, vol. 7, no. 1, pp. 71–81, 2019.
[3] A. Herman and J. Nurdiansa, “Analisis Framing Pemberitaan Konflik Israel - Palestina dalam Harian Kompas dan Radar Sulteng,” J. Ilmu Komun., vol. Volume 8, no. Mei-Agustus 2010, pp. 154–169, 2010.
[4] P. N. Thanissaro and S. Kulupana, “Buddhist teen worldview: Some normative background for health professionals,” Contemp. Buddhism, vol. 16, no. 1, pp. 28–
42, 2015, doi: 10.1080/14639947.2015.1006801.
[5] Samsir, Ambiyar, U. Verawardina, F. Edi, and R. Watrianthos, “Analisis Sentimen Pembelajaran Daring Pada Twitter di Masa Pandemi COVID-19 Menggunakan Metode Naïve Bayes,” J. Media Inform. Budidarma, vol. 5, pp. 157–163, 2021, doi: 10.30865/mib.v5i1.2604.
[6] W. Gata and A. Bayhaqy, “Analysis sentiment about islamophobia when Christchurch attack on social media,” Telkomnika (Telecommunication Comput.
Electron. Control., vol. 18, no. 4, pp. 1819–1827, 2020, doi:
10.12928/TELKOMNIKA.V18I4.14179.
[7] D. Darwis, E. S. Pratiwi, and A. F. O. Pasaribu, “Penerapan Algoritma Svm Untuk Analisis Sentimen Pada Data Twitter Komisi Pemberantasan Korupsi Republik Indonesia,” Edutic - Sci. J. Informatics Educ., vol. 7, no. 1, pp. 1–11, 2020, doi:
10.21107/edutic.v7i1.8779.
[8] S. B. Imandoust and M. Bolandraftar, “Application of K-Nearest Neighbor
( KNN ) Approach for Predicting Economic Events : Theoretical Background,” Int.
xix
J. Eng. Res. Appl., vol. 3, no. 5, pp. 605–610, 2013.
[9] H. Parvin, H. Alizadeh, and B. Minaei-bidgoli, “MKNN : Modified K-Nearest Neighbor,” Proc. World Congr. Eng. Comput. Sci. WCECS, pp. 22–25, 2008.
[10] A. Deolika, K. Kusrini, and E. T. Luthfi, “Analisis Pembobotan Kata Pada Klasifikasi Text Mining,” J. Teknol. Inf., vol. 3, no. 2, p. 179, 2019, doi:
10.36294/jurti.v3i2.1077.
[11] I. Istiqlaliyyah, Y. A. Sari, and M. A. Fauzi, “Pencarian Teks pada Terjemahan Ayat Al- Qur ’ an dengan Menggunakan TF-RF dan Bray-Curtis Distance,” J.
Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 5, pp. 4357–4363, 2019.
[12] A. Nur, Mustakim, S. Syarifandi, and S. Amin, “Implementation of text mining classification as a model in the conclusion of Tafsir Bil Ma’tsur and Bil Ra’yi contents,” Int. J. Eng. Adv. Technol., vol. 9, no. 1, pp. 2789–2795, 2019, doi:
10.35940/ijeat.A9780.109119.
[13] Moordiningsih, “Islamophobia Dan Strategi Mengatasinya,” Bul. Psikol., vol. 12, no. 2, pp. 73–84, 2015, doi: 10.22146/bpsi.7470.
[14] F. T. Samosir, D. N. Pitasari, and P. E. Tjahjono, “Open access under Creative Commons Attribution-Non Commercial-Share A like 4.0 International Licence (CC-BY-SA) Record and Library Journal The Effectiveness of Youtube as a Student Learning Media (Study at the Faculty of Social and Political Sciences, Uni,” Rec. Libr. J., vol. 4, no. 2, pp. 81–91, 2018, [Online]. Available: https://e- journal.unair.ac.id/index.php/RLJ
[15] E. Chandra, “Youtube, Citra Media Informasi Interaktif Atau Media Penyampaian Aspirasi Pribadi,” J. Muara Ilmu Sos. Humaniora, dan Seni, vol. 1, no. 2, p. 406, 2018, doi: 10.24912/jmishumsen.v1i2.1035.
[16] P. Soepomo, “Penerapan Text Mining Pada Sistem Klasifikasi Email Spam Menggunakan Naive Bayes,” Penerapan Text Min. Pada Sist. Klasifikasi Email Spam Menggunakan Naive Bayes, vol. 2, no. 3, pp. 73–83, 2014, doi:
10.12928/jstie.v2i3.2877.
[17] N. L. Ratniasih, M. Sudarma, and N. Gunantara, “Penerapan Text Mining Dalam
xx
Spam Filtering Untuk Aplikasi Chat,” Maj. Ilm. Teknol. Elektro, vol. 16, no. 3, p.
13, 2017, doi: 10.24843/mite.2017.v16i03p03.
[18] A. S. Rusydiana and L. Marlina, “Journal of Economics and Business Aseanomics Journal homepage Analisis Sentimen terkait Sertifikasi Halal,” J. Econ. Bus.
Aseanomics, vol. 5, no. 1, pp. 69–85, 2020, [Online]. Available:
http://academicjournal.yarsi.ac.id/jeba
[19] A. A. Paramitha, Indriati, and Y. A. Sari, “Analisis Sentimen Terhadap Ulasan Pengguna MRT Jakarta Menggunakan Information Gain dan Modified K-Nearest Neighbor,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 4, no. 4, pp. 1125–
1132, 2020.
xviii
LAMPIRAN
Data Komentar
No. Komentar Label
1 Apapun Agamanya kita HarUs Saling Menghormati,Musuh kita Adalah yg
menghina nabi atau Agama kita. positif
2 karna dengan akhlak dan otak... manusia akan bisa memanusiakan
manusia.. positif
3
Subhanallah ... inilah toleransi yang sebenarnya. Kita tidak perlu
menyalahkan agama dari oknum yang berbuat keji berdasarkan agama yg mereka anut, tdk peduli Islam, Kristen, Hindu, Budha dll. Biarkan masing”
menjalankan agama yang mereka yakini berdasarkan hati nurani mereka, selama agama itu tidak bertentangan dengan norma/budaya yg berlaku disuatu daerah/negeri. Tidak ada paksaan dalam bergama
positif
4
Klo orang yg betul2 penganut islam. Yg betul2 mendalami islam sesungguhnya jangan kan mau membunuh sesamanya manusia membunuh hewan sekalipun dia tidak akan mau. Melainkan hewan yg dimakan. Jangankan membunuh menyakiti hati seseorang menyakiti hewan sekalipun dia tidak akan sanggup
positif
5
Sy kagum dngan Orang ini. Orang ini dia betul2 berjiwa k islaman. yg melebihi orang2 yg sememangnya islam. Banyak sekali orang2 islam yg hanya beridentitas islam namun sedikit pun tidak ada tutur keislaman dia pakai terutamanya islam yg sanggup membuat teror. Nabi muhammad sbgai junjungn besar islam ttapi tdak prnah mngajarkn dan mmbenarkn kita ntuk mnyakiti siapapun termasuk nonmuslim sklipun
positif
6 Gw yakin si trump pasti kuping nya panas soalnya si trump klo mendengar
berita kebenaran tentang islam kaya cacing kepanasan positif
7 Islam merupakan agama teroris negatif
8
Alhamdulillah... Ingatlah kita sebagai umat... Tak ada beda... Keyakinan itu urusan masing2 umat... Tak ada guna kita berbeda2... Semoga kita semua meski beda keyakinan akan di beri harapan baik dunia akhirat kelak... Amin
positif
9
teRIMA KASIH MOOM ATAS PETUNJUK DaN NASEHATNYA KPD ORG 2 KAFIR YG MMBNCI AL QUR AN DAN ROSULNYA NABI MUHAMAD YG DI PILIH OLEH ALLOH UNTUK ROHMATAN LI ALAMIN YA ALLOH SADARKAN MEREKA YG MENUDUH DAN MEMFITNAH NABI PILIHANMU
CUKUP CACIAN KEDENGKIAN MEREKA
positif
10
Dan dari semua korban WTC, tidak ada dari bangsa yahudi,,, padahal yahudi yang tinggal disana banyak,, anehh kann??? Dan islam lahh yang kena getahnya,, islam bukanlahh teroris, islam itu cinta damai dan bertoleransi, jika ada islam yang anarkis, sebenarnya itu bukan islam, dia tidak memahami ilmu agama
positif
11 Wanita yg sangat cerdas sEmoga bisa menyadarkan banyak orang tentang
kedamaian dan diberikan hidayah oleh Alloh positif
xix
12Saya yakin pasti Allah telah sediakan surga untuknya dan pasti Allah akan menyuruh malaikat yg disurga untuk menjemput ruhnya di dihari kematian nya nanti.
positif
13 islam itu agamanya teroris wkwk negatif
14 Setiap agama pasti mengajarkan kebaikan dan kedamaian,tergantung
orang dan golonganya. positif
15
Salut sama beliau ini yang mempelajari. Kitab Suci. Dan memahami isi Al- Quran an & Injil. Yang semua mengajarkan kebaikan. Maka tidak pantas untuk merendahkan agama lain
positif
16
Subkhanallah....Ibu pendeta ini sejatiny hati dan ruhnya Muslim,semoga Allah mnjadikan muslim sejati sebelum wafat,Amiin.dan mnjadi tauladan perdamaian Ummat ber'agama.
positif
17 yg heran nya di indo banyak ustad yg mengajarkan saling membenci dan
ceramah nya tidak menyejukkan hati negatif
18
Bahagia lah kaum minoritas yang tinggal di Indonesia yg mayoritas Islam ..
coba sebaliknya minoritas Islam yg tinggal di negara mayoritas non muslim ,secara ga langsung di kucilkan rasisme
positif
19
Sejuk rasanya hati,gak cukup skali dengar khotbah Pendeta ini... Alqur'an dan Injil mengajarkan Cinta Kasih&sayang...jadi itu aja yg dibuat pedoman dlm berAgama yang kita Percaya...
Hiduplah dengan penuh Toleransi, Saling menolong dlm keBaikan.
Jgn memaksakan Agama lain... spy masuk agama yg kita imani, Menurut sy gak ada untungnya, karna Mati dan Dosa tanggung sendiri...dan ini
masalah Rohani, yg ditentukan oleh 9Hati,jadi akan sia sia.
Nabi Muhammad SAW,,Prilakunya Kasih Sayang,Santun dan
meMa'afkan..wlw diHina,diLempar batu sampai kakinya luka dan giginya rompel...diMa'afkannya,
Malahan dia berDo'a sama Allah, supaya orgnya diAmpunkan, dengan alasan belum faham...Nabi tugasnya hanya menyampaikan, diBarengi dengan menContohkan Prilaku 😊🙏
positif
20 yang radikal itu hanya orang yang tidak paham dengan agamanya sendiri. positif 21 Trimakasih Karna masih punya toleransi yg tinggi terhadap agama lain
terutama agama Islam positif
22
Saya pernah kerumah teman saya yg Nonmuslim. Ibunya melihat tingkah saya yg sangat ingin memegang anjing peliharaannya. Ujar ibunya.
Peganglah jika iya menjilat tanganmu maka nanti ibu ajarkan cara mensucikannya dan jika tidak suci biar ibu yg tangung dosanya demi
*tuhan yesus* ujarnya, ini kisah yg membuat saya nyata merasakan adanya Bhineka Tunggal Ika
positif
23 terlalu lancang menafsirkan FIRMAN2 TUHAN dengan ketajaman berfikir negatif 24 Masyallah,.pendeta ini tahu benar tentang kebenaran Islam,kitab dan
nabinya,tetap Istiqomah. positif
25 katanya pendeta tapi kenapa ngajak jemaah nya untuk membenci Islam
kan gak lucu tq negatif
xx
26Begitulah Karakter ISLAM yg cinta damai dengan siapapun..mana pernah umat islam membakar kitabnya umat kristen...! Tp alqur'an dimana mana banyak yg membakarnya...ketahuilah..sesungguhnya yg membakar alquran itu adalah org yg berhati busuk syirik dengki terhadap islam..tp syukurlah klu umat umat kristen sudah sadar dengan perbuatannya yg membakar alquran...alquran itu tdk akan pernah sirna walaupun d bakar ber miliyar"
di bakar...tak akan ada habisnya ...semoga kita semua dan non muslim khususnya d berikan Hidaya dr allah jln yg terbaik agama yg baik buat manusia.aamiin
positif
27 Tpi yg saya tanya banyak Islam arogan. Membangun gereja gak
bisa.mebakar gereja dmn mana. Apakah itu damai. negatif 28 Islam agama terores, katanya cinta damai tapi knapa kristen di gereja di
bom negatif
29
semua agama mangajarkan kebaikan,perdamaian,tdk saling
membunuh,karena kita saling membutuhkan misal dari negara non muslim produsen dan negara muslim pembelinya,begitu juga sebaliknya,dan saya baru kali ini mendengar ceramah dari gereja yg bisa saya pahami, isinya sangat menyentuh dan saling menyayangi,tdk menyalahkan agama apapun,betul apa yg dikatakan ibu pendeta lihatlah umat islam yg hidup damai sprti umat agama lain
positif
30
Islam bukan seperti yg klian sangkakan. Islam adalah Agama yg penuh cinta damai. Islam tidak mengajarkan untuk menghujat Agama lain Islam tidak mengajarkan kekerasan. Tapi Agama lainlah yg lebih dulu menghujat Islam.
Sampai" Nabi kamipun menjadi sasaran. Didunia klian menghujat dan melecehkan Agama kami tapi kellak apabila sudah mati klian para penghujat Islam akan mendapatkan balasannya.
positif
31
Ini baru pendeta yg benar yg menyerukan perdamaian dan toleransi yg baik antar umat beragama didunia krn setiap agama sllu mengjrkn kebaikan tentunya
positif
32
Ini br pendeta yg berakal sehat n waras... tdk serta nerta mjd islamphobia hny krn beda keyakinan... !! Wahai kaum islamphobia n munafikun serta kafirun belajarlah dr beliau... !! It br Pancasilais sejati... bkn cm teriak2 AQ PANCASILA... !!
positif
33 Mudah2an agama Islam semakin di mengerti,di pahami oleh orang2non
muslim sehingga mereka tau Agama Islam adalah agama yang benar. positif 34
Pada dasarnya para pemimpin agama di dunia mengakui kebenaran Islam sebagai agama yg sempurna, namun mereka banyak yg menutupinya lantaran takut dilaknat oleh pengikutnya
negatif
35
Muslim harus membalas pendeta itu dengan berkata sopan ketika berdebat dengan non muslim. Karena mereka belum tahu sedang muslim sudah tahu.
positif
36
ADUH GARA2 DI PERANCIS BANYAK TEMAN2 KATOLIK JADI SERING SERANG KAMI UMAT ISLAM NIE.... KAMI DI BULY DAN DI PUKUL.... BGMN MENRT KAMU PEMILIK YOUTUBE INI... MEREKA MINTA PERANG AGAMA NIE...
BGMN MENURUT SAUDARA2KU ... APA KITA HARUS BERPERANG
?????????????
negatif