BAB III.............................................................................................................. 20
4.5 Simulasi (Simulation)
4.5.1 Tahap Pengujian Data Uji
Pengujian yang dilakukan adalah penggunaan algoritma K-Means yaitu pada skenario 1 dan kombinasi algortima K-K-Means dan algoritma Levensthein Distance yaitu pada skenario 2 untuk menentukan sentimen positif dan negatif.
Pada tahapan ini terdapat informasi sejauh mana tingkat keberhasilan algoritma tersebut di dalam data uji ke dalam skenario yang dihitung berdasarkan tingkat akurasi akurasi.
1. Skenario 1 (Membandingkan Hasil Sentimen Algoritma K-Means dan Hasil Sentimen secara Manual)
Pada skenario 1 ini didapatkan dari hasil perbandingan sentimen algoritma K-Means dengan nilai k = 2 dan sentimen secara manual yaitu sebesar 84%. Hasil dari aplikasi bisa dilihat pada gambar 4.11.
Gambar 4. 11 Hasil Akurasi dan Aplikasi skenario 1
2. Skenario 2 (Membandingkan Hasil Sentimen Kombinasi Algoritma K-Means dan Algoritma Levensthein Distance dan sentimen secara manual yaitu sebesar 96%. Hasil dari aplikasi bias dilihat pada gambar 4.12.
Gambar 4. 12 Hasil Akurasi dan Aplikasi skenario 2
4.6 Verifikasi dan Validasi (Verification and Validation) Pembahasan untuk sub-bab ini akan dibahas pada bab 5 4.7 Eksperimen (Experimentation)
Pembahasan untuk sub-bab ini akan dibahas pada bab 5 4.8 Analisis Keluaran (Output Analysis)
Pembahasan untuk sub-bab ini akan dibahas pada bab 5
84 UIN Syarif Hidayatullah Jakarta
BAB V
HASIL DAN PEMBAHASAN
5.1 Verifikasi dan Validasi (Varification and Validation)Dalam proses verifikasi ini penulis ingin mengetahui bahwa input dan output sesuai dengan apa yang diinginkan dimulai dari tahap formulasi masalah hingga simulasi.
Dalam proses validasi tersebut penulis akan menguji keakuratan sistem dengan melakukan perbandingan hasil algoritma K-Means dan kombinasi algoritma K-Means dengan algoritma Levensthein Distance yang dihitung secara manual pada aplikasi analisis sentimen.
Pada intinya, verifikasi dan validasi bertujuan untuk menyakinkan hasil dari aplikasi sentimen ini sesuai dengan yang dikonsepkan sebelumnya.
5.2 Eksperimentasi (Experimentation)
Eksperimen yang dilakukan ialah membandingkan dari hasil skenario antara hasil sentimen data uji menggunakan algoritma K-Means dan kombinasi algoritma K-Means dengan algoritma Levensthein Distance. Parameter yang digunakan untuk nilai k pada algoritma K-Means yaitu k=2. Selanjutnya akan dilakukan analisis output yang nantinya dibahas pada tahapan Output Analysis.
5.3 Analisis Keluaran (Output Analysis)
Pada tahapan ini, dilakukan analisis berupa hasil sentimen komentar masyarakat Jakarta terhadap pembatasan sosial berskala besar (psbb) menggunakan algoritma Means dan kombinasi algoritma K-Means dan algoritma Levensthein Distance beserta hasil tingkat akurasi dari setiap skenario. Output penelitian ini didapatkan dari aplikasi yang
sudah dibangun menggunakan algoritma tersebut. Hasil sentimen dan tingkat akurasi dari setiap algoritma yang digunakan akan dijelaskan pada sub-bab 5.3.1 , sub-bab 5.3.2 , dan sub-bab 5.3.3.
5.3.1 Hasil Sentimen Algoritma K-Means dan Algoritma Levensthein Distance
Pada tahap ini penulis menguji keakuratan sistem terkait 50 komentar data uji yang bersumber dari Instagram dan pengujian 50 data uji ini dilakukan menggunakan algoritma K-Means dan kombinasi algoritma K-Means dengan algoritma Levensthein Distance. Dari hasil data uji tersebut didapatkan hasil analisis yaitu berupa positif dan negatif.
Tabel 5. 1 Hasil Sentimen dari Skenario Pada Data Uji
Data ke-n Algoritma K-Means Kombinasi Algoritma K-Means dan Algoritma Levensthein Distance
Sentimen sebenarnya
1 Positif Positif Positif
2 Negatif Negatif Negatif
3 Negatif Positif Positif
4 Negatif Positif Positif
5 Positif Positif Positif
6 Negatif Negatif Negatif
7 Positif Positif Positif
8 Negatif Negatif Negatif
9 Positif Positif Positif
10 Negatif Positif Positif
11 Negatif Negatif Negatif
12 Negatif Negatif Negatif
13 Negatif Negatif Negatif
14 Negatif Negatif Negatif
15 Positif Positif Positif
16 Negatif Negatif Negatif
17 Negatif Negatif Negatif
18 Negatif Negatif Negatif
19 Negatif Negatif Negatif
20 Negatif Negatif Negatif
21 Negatif Negatif Negatif
22 Negatif Negatif Negatif
23 Negatif Negatif Negatif
24 Positif Positif Negatif
25 Negatif Negatif Negatif
26 Positif Positif Positif
27 Negatif Negatif Negatif
28 Negatif Positif Positif
29 Negatif Negatif Negatif
30 Positif Positif Positif
31 Negatif Negatif Negatif
32 Negatif Negatif Negatif
33 Negatif Negatif Negatif
34 Negatif Positif Positif
35 Positif Positif Positif
36 Positif Positif Positif
37 Negatif Negatif Negatif
38 Negatif Negatif Negatif
39 Positif Positif Positif
40 Positif Positif Positif
41 Negatif Negatif Negatif
42 Negatif Negatif Negatif
43 Negatif Negatif Negatif
44 Negatif Negatif Negatif
45 Negatif Negatif Negatif
46 Negatif Negatif Negatif
47 Negatif Negatif Negatif
48 Negatif Negatif Negatif
49 Negatif Negatif Negatif
50 Negatif Negatif Positif
5.3.2 Analisis Hasil Akurasi Algoritma K-Means
Pada skenario 1 yaitu menganalisis sentimen pada 50 data uji menggunakan algoritma K-Means dan menghitung tingkat akurasi dari penggunaan algoritma K-Means. Hasil pengujian dari skenario 1 ini dapat dilihat pada tabel 5.2.
Tabel 5. 2 Hasil Pengujian Skenario 1
Actual Value
Prediction Value
Positive (+)
Negative (-)
Positive (+)
True positive = 11 False positive = 1
Negative (-)
False negative =6 True negative = 32
Hasil pengujian pada skenario 1 dari tabel diatas dapat diambil kesimpulan sebagai berikut:
1. Sentimen dari masyarakat terhadap kebijakan pemerintah tentang pembatasan sosial berskala besar (psbb) yaitu lebih banyak yang bersentimen negatif dibanding yang bersentimen positif.
2. Nilai akurasi dari skenario 1 yaitu perbandingan antara hasil sentimen dari algoritma K-Means tanpa menggunakan algoritma Levensthein Distance dan hasil sentimen secara manual mendapatkan tingkat akurasi yang lebih kecil dibandingkan skenario 2, perhitungan hasil bisa dilihat dibawah ini.
𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑏𝑒𝑛𝑎𝑟
𝑇𝑜𝑡𝑎𝑙 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 = (11 + 32 )
( 11 + 1 + 32 + 6 ) × 100 = 86%
5.3.3 Analisis Hasil Akurasi Algoritma K-means dan Algoritma Levensthein Distance
Pada skenario 2 yaitu menganalisis sentimen pada 50 data uji kombinasi algoritma K-Means dengan algoritma Levensthein Distance dan menghitung tingkat akurasinya. Hasil pengujian dari skenario 2 ini dapat dilihat pada tabel 5.3.
Tabel 5. 3 Hasil Pengujian Skenario 2
Actual Value
Prediction Value
Positive (+)
Negative (-)
Positive (+)
True positive = 16 False positive = 1
Negative (-)
False negative =1 True negative = 32
Hasil pengujian pada skenario 2 dari tabel diatas dapat diambil kesimpulan sebagai berikut:
1. Sentimen dari masyarakat terhadap kebijakan pemerintah tentang pembatasan sosial berskala besar (psbb) yaitu lebih banyak yang bersentimen negatif dibanding yang bersentimen positif.
2. Nilai akurasi dari skenario 2 yaitu perbandingan antara hasil sentimen dari kombinasi algoritma K-Means dengan algoritma Levensthein distance dan hasil sentimen secara manual mendapatkan tingkat akurasi lebih tinggi dibandingkan skenario 1 karena menggunakan algoritma normaliasi kata ini.
Perhitungan hasil bisa dilihat dibawah ini.
𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑏𝑒𝑛𝑎𝑟
𝑇𝑜𝑡𝑎𝑙 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 = (16 + 32 )
( 16 + 1 + 32 + 1 ) × 100 = 96%
90 UIN Syarif Hidayatullah Jakarta
BAB VI PENUTUP
6.1 KesimpulanBerdasarkan masalah yang telah dirumuskan di bab 1 pada sub-bab 1.2 dan telah dideskripsikan pada bab-bab sebelumnya, peneliti mendapatkan hasil yaitu tingkat akurasi yang didapatkan dari 2 skenario yaitu pada skenario 1 peneliti hanya menggunakan algoritma K-Means tanpa bantuan algoritma normalisasi kata didapatkan nilai akurasinya yaitu 86% dan pada skenario 2 peneliti menggunakan kombinasi algoritma K-Means dan algoritma Levensthein Distance sebagai algoritma normalisasi kata mengalami peningkatan akurasi yaitu 96%.
Kesimpulan yang bisa diambil dari hasil di atas yaitu pada penelitian analisis teks diharuskan menggunakan fitur tambahan berupa normalisasi kata yang baik. Masyarakat pada umumnya, mereka menggambarkan ekspresi ataupun pendapat mereka menggunakan kata – kata singkatan yang tidak ada di dalam KBBI (jika berbahasa Indonesia).
Dengan menggunakan fitur normalisasi kata ini, peneliti bisa mengekstrak informasi dengan lebih jelas dan akurat dari data – data yang sudah diambil melalui target sumber.
6.2 Saran
Pada penelitian saat ini peneliti menyadari bahwa masih banyak kekurangan dan keterbatasan. Oleh karena itu, ada beberapa hal yang bisa sarankan untuk penelitian selanjutnya agar hasilnya lebih memuaskan dan lebih baik, yaitu:
1. Sistem ini hanya bisa menggunakan bahasa Indonesia. Diharapkan penelitian selanjutnya bisa menggunakan selain bahasa Indonesia.
2. Menambahkan data yang akan dianalisis agar hasilnya lebih meyakinkan.
91 UIN Syarif Hidayatullah Jakarta
DAFTAR PUSTAKA
Arief, R., & Imanuel, K. (2019). ANALISIS SENTIMEN TOPIK VIRAL DESA PENARI PADA MEDIA SOSIAL TWITTER DENGAN METODE LEXICON BASED. Jurnal Ilmiah MATRIK.
Asroni, Fitri, H., & Prasetyo, E. (2018). Penerapan Metode Clustering dengan Algoritma K-Means pada Pengelompokan Data Calon Mahasiswa Baru di Universitas Muhammadiyah Yogyakarta. Semesta Teknika.
Budiaji, W. (2019). Penerapan Reproducible Reseacrh pada Rstudio dengan Bahasa R dan paket Knitr. Jurnal ilmu komputer dan Informatika.
Firdausillah, F., & Arieansyah. (2019). Implementasi Algoritma Levensthein Distance Sebagai Chatbot Agen Pariwisata Berbasis Aplikasi LINE.
Seminar Nasional APTIKOM.
Firman, A., F.Wowor, H., & Najoan, X. (2016). Sistem Informasi Perpustakaan Online Berbasis Web . E-journal Teknik Elektro dan Komputer.
Gunawan, F., Fauzi, M. A., & Adikara, P. P. (2017). ANALISIS SENTIMEN PADA ULASAN APLIKASI MOBILE MENGGUNAKAN NAIVE BAYES DAN NORMALISASI KATA BERBASIS LEVENTHEIN DISTANCE (STUDI KASUS APLIKASI BCA MOBILE). SYSTEMIC.
Gustientiedina, Adiya, M., & Desnelita, Y. (2019). Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada RSUD Pekanbaru.
Jurnal Nasional Teknologi dan Sistem Informasi.
H, A. T. (2015). PREPOCESSING TEXT UNTUK MEMINIMALISIR KATA YANG TIDAK BERARTI DALAM PROSES TEXT MINING. Jurnal Informatika UPGRIS.
Indraloka, D. S., & Santosa, B. (2017). PENERAPAN TEXT MINING UNTUK MELAKUKAN CLUSTERING DATA TWEET SHOPEE INDONESIA.
Jurnal Sains dan Seni ITS.
Maulana, G. G. (2017). PEMBELAJARAN DASAR ALGORITMA DAN PEMROGRAMAN MENGGUNAKAN EL-GORITMA BERBASIS WEB. Jurnal Teknik Mesin.
Muhyiddin. (2020). Covid-19, New Normal dan Perencanaan Pembangunan di Indonesia. The Indonesian Journal of Development Planning.
Najjichah, H., Syukur, A., & Subagyo, H. (2019). PENGARUH TEXT PREPROCESSING DAN KOMBINASINYA PADA PERINGKAS DOKUMEN OTOMATIS TEKS BERBAHASA INDONESIA. Jurnal Teknologi Informasi.
Nasruddin, R., & Haq, I. (2020). Pembatasan Sosial Berskala Besar (PSBB) Dan Masyarakat Berpenghasilan Rendah. SALAM; Jurnal Sosial & Budaya Syar-i.
Nur, F., Zarlis, P. M., & Nasution, D. B. (2017). PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAH MENENGAH KEJURUAN UNTUK CLUSTERING. InfoTekJar.
Nurjanah, M., Hamdani, & Astuti, I. F. (2013). PENERAPAN ALGORITMA TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF) UNTUK TEXT MINING. Jurnal Informatika Mulawarman.
Rahman, M., Darmawidjadja, M., & Alamsah, D. (2017). Klasifikasi Untuk Diagnosa Diabetes Menggunakan Metode Bayesian Regularization Neural Network (RBNN). Jurnal Informatika.
Saputra, T. I., & Arianty, R. (2019). IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING PADA ANALISIS SENTIMEN KELUHAN PENGGUNA INDOSAT. Jurnal Ilmiah Informatika Komputer.
Sari, F. V., & Wibowo, A. (2019). ANALISIS SENTIMEN PELANGGAN TOKO ONLINE JD.ID MENGGUNAKAN METODE NAIVE BAYES CLASSIFER BERBASIS KONVERSI IKON EMOSI. Jurnal SIMETRIS.
Septian, J. A., Fahrudin, T. M., & Nugroho, A. (2019). Analisis Sentimen Pengguna Twitter Terhadap Polemik Persepakbolaan Indonesia Menggunakan Pembobotan TF-IDF dan K-Nearest Neighbor. JOURNAL OF INTELLIGENT SYSTEM AND COMPUTATION.
Susanto, E. H. (2017). MEDIA SOSIAL SABAGAI PENDUKUNG JARINGAN KOMUNIKASI POLITIK. Jurnal ASPIKOM.
Warman, I., & Ramdaniansyah, R. (2018). Analisis Perbandingan Kinerja Query Database Management System (DBMS) Antara MySQL 5.7.16 Dan Mariadb 10.1. Jurnal TEKNOIF.
Wirayasa, I. P., Wirawan, I. m., & Pradnyana, I. m. (2019). Algoritma Bastal:
Adaptasi Algoritma Nazief & Adriani untuk Stemming Teks Bahasa Bali.
Janapati.