Tahap Pengujian Data Uji - Simulasi (Simulation)

BAB III.............................................................................................................. 20

4.5 Simulasi (Simulation)

4.5.1 Tahap Pengujian Data Uji

Pengujian yang dilakukan adalah penggunaan algoritma K-Means yaitu pada skenario 1 dan kombinasi algortima K-K-Means dan algoritma Levensthein Distance yaitu pada skenario 2 untuk menentukan sentimen positif dan negatif.

Pada tahapan ini terdapat informasi sejauh mana tingkat keberhasilan algoritma tersebut di dalam data uji ke dalam skenario yang dihitung berdasarkan tingkat akurasi akurasi.

1. Skenario 1 (Membandingkan Hasil Sentimen Algoritma K-Means dan Hasil Sentimen secara Manual)

Pada skenario 1 ini didapatkan dari hasil perbandingan sentimen algoritma K-Means dengan nilai k = 2 dan sentimen secara manual yaitu sebesar 84%. Hasil dari aplikasi bisa dilihat pada gambar 4.11.

Gambar 4. 11 Hasil Akurasi dan Aplikasi skenario 1

2. Skenario 2 (Membandingkan Hasil Sentimen Kombinasi Algoritma K-Means dan Algoritma Levensthein Distance dan sentimen secara manual yaitu sebesar 96%. Hasil dari aplikasi bias dilihat pada gambar 4.12.

Gambar 4. 12 Hasil Akurasi dan Aplikasi skenario 2

4.6 Verifikasi dan Validasi (Verification and Validation) Pembahasan untuk sub-bab ini akan dibahas pada bab 5 4.7 Eksperimen (Experimentation)

Pembahasan untuk sub-bab ini akan dibahas pada bab 5 4.8 Analisis Keluaran (Output Analysis)

Pembahasan untuk sub-bab ini akan dibahas pada bab 5

84 UIN Syarif Hidayatullah Jakarta

BAB V

HASIL DAN PEMBAHASAN

5.1 Verifikasi dan Validasi (Varification and Validation)

Dalam proses verifikasi ini penulis ingin mengetahui bahwa input dan output sesuai dengan apa yang diinginkan dimulai dari tahap formulasi masalah hingga simulasi.

Dalam proses validasi tersebut penulis akan menguji keakuratan sistem dengan melakukan perbandingan hasil algoritma K-Means dan kombinasi algoritma K-Means dengan algoritma Levensthein Distance yang dihitung secara manual pada aplikasi analisis sentimen.

Pada intinya, verifikasi dan validasi bertujuan untuk menyakinkan hasil dari aplikasi sentimen ini sesuai dengan yang dikonsepkan sebelumnya.

5.2 Eksperimentasi (Experimentation)

Eksperimen yang dilakukan ialah membandingkan dari hasil skenario antara hasil sentimen data uji menggunakan algoritma K-Means dan kombinasi algoritma K-Means dengan algoritma Levensthein Distance. Parameter yang digunakan untuk nilai k pada algoritma K-Means yaitu k=2. Selanjutnya akan dilakukan analisis output yang nantinya dibahas pada tahapan Output Analysis.

5.3 Analisis Keluaran (Output Analysis)

Pada tahapan ini, dilakukan analisis berupa hasil sentimen komentar masyarakat Jakarta terhadap pembatasan sosial berskala besar (psbb) menggunakan algoritma Means dan kombinasi algoritma K-Means dan algoritma Levensthein Distance beserta hasil tingkat akurasi dari setiap skenario. Output penelitian ini didapatkan dari aplikasi yang

sudah dibangun menggunakan algoritma tersebut. Hasil sentimen dan tingkat akurasi dari setiap algoritma yang digunakan akan dijelaskan pada sub-bab 5.3.1 , sub-bab 5.3.2 , dan sub-bab 5.3.3.

5.3.1 Hasil Sentimen Algoritma K-Means dan Algoritma Levensthein Distance

Pada tahap ini penulis menguji keakuratan sistem terkait 50 komentar data uji yang bersumber dari Instagram dan pengujian 50 data uji ini dilakukan menggunakan algoritma K-Means dan kombinasi algoritma K-Means dengan algoritma Levensthein Distance. Dari hasil data uji tersebut didapatkan hasil analisis yaitu berupa positif dan negatif.

Tabel 5. 1 Hasil Sentimen dari Skenario Pada Data Uji

Data ke-n Algoritma K-Means Kombinasi Algoritma K-Means dan Algoritma Levensthein Distance

Sentimen sebenarnya

1 Positif Positif Positif

2 Negatif Negatif Negatif

3 Negatif Positif Positif

4 Negatif Positif Positif

5 Positif Positif Positif

6 Negatif Negatif Negatif

7 Positif Positif Positif

8 Negatif Negatif Negatif

9 Positif Positif Positif

10 Negatif Positif Positif

11 Negatif Negatif Negatif

12 Negatif Negatif Negatif

13 Negatif Negatif Negatif

14 Negatif Negatif Negatif

15 Positif Positif Positif

16 Negatif Negatif Negatif

17 Negatif Negatif Negatif

18 Negatif Negatif Negatif

19 Negatif Negatif Negatif

20 Negatif Negatif Negatif

21 Negatif Negatif Negatif

22 Negatif Negatif Negatif

23 Negatif Negatif Negatif

24 Positif Positif Negatif

25 Negatif Negatif Negatif

26 Positif Positif Positif

27 Negatif Negatif Negatif

28 Negatif Positif Positif

29 Negatif Negatif Negatif

30 Positif Positif Positif

31 Negatif Negatif Negatif

32 Negatif Negatif Negatif

33 Negatif Negatif Negatif

34 Negatif Positif Positif

35 Positif Positif Positif

36 Positif Positif Positif

37 Negatif Negatif Negatif

38 Negatif Negatif Negatif

39 Positif Positif Positif

40 Positif Positif Positif

41 Negatif Negatif Negatif

42 Negatif Negatif Negatif

43 Negatif Negatif Negatif

44 Negatif Negatif Negatif

45 Negatif Negatif Negatif

46 Negatif Negatif Negatif

47 Negatif Negatif Negatif

48 Negatif Negatif Negatif

49 Negatif Negatif Negatif

50 Negatif Negatif Positif

5.3.2 Analisis Hasil Akurasi Algoritma K-Means

Pada skenario 1 yaitu menganalisis sentimen pada 50 data uji menggunakan algoritma K-Means dan menghitung tingkat akurasi dari penggunaan algoritma K-Means. Hasil pengujian dari skenario 1 ini dapat dilihat pada tabel 5.2.

Tabel 5. 2 Hasil Pengujian Skenario 1

Actual Value

Prediction Value

Positive (+)

Negative (-)

Positive (+)

True positive = 11 False positive = 1

Negative (-)

False negative =6 True negative = 32

Hasil pengujian pada skenario 1 dari tabel diatas dapat diambil kesimpulan sebagai berikut:

1. Sentimen dari masyarakat terhadap kebijakan pemerintah tentang pembatasan sosial berskala besar (psbb) yaitu lebih banyak yang bersentimen negatif dibanding yang bersentimen positif.

2. Nilai akurasi dari skenario 1 yaitu perbandingan antara hasil sentimen dari algoritma K-Means tanpa menggunakan algoritma Levensthein Distance dan hasil sentimen secara manual mendapatkan tingkat akurasi yang lebih kecil dibandingkan skenario 2, perhitungan hasil bisa dilihat dibawah ini.

𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑏𝑒𝑛𝑎𝑟

𝑇𝑜𝑡𝑎𝑙 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 = (11 + 32 )

( 11 + 1 + 32 + 6 ) × 100 = 86%

5.3.3 Analisis Hasil Akurasi Algoritma K-means dan Algoritma Levensthein Distance

Pada skenario 2 yaitu menganalisis sentimen pada 50 data uji kombinasi algoritma K-Means dengan algoritma Levensthein Distance dan menghitung tingkat akurasinya. Hasil pengujian dari skenario 2 ini dapat dilihat pada tabel 5.3.

Tabel 5. 3 Hasil Pengujian Skenario 2

Actual Value

Prediction Value

Positive (+)

Negative (-)

Positive (+)

True positive = 16 False positive = 1

Negative (-)

False negative =1 True negative = 32

Hasil pengujian pada skenario 2 dari tabel diatas dapat diambil kesimpulan sebagai berikut:

1. Sentimen dari masyarakat terhadap kebijakan pemerintah tentang pembatasan sosial berskala besar (psbb) yaitu lebih banyak yang bersentimen negatif dibanding yang bersentimen positif.

2. Nilai akurasi dari skenario 2 yaitu perbandingan antara hasil sentimen dari kombinasi algoritma K-Means dengan algoritma Levensthein distance dan hasil sentimen secara manual mendapatkan tingkat akurasi lebih tinggi dibandingkan skenario 1 karena menggunakan algoritma normaliasi kata ini.

Perhitungan hasil bisa dilihat dibawah ini.

𝐽𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑏𝑒𝑛𝑎𝑟

𝑇𝑜𝑡𝑎𝑙 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 = (16 + 32 )

( 16 + 1 + 32 + 1 ) × 100 = 96%

90 UIN Syarif Hidayatullah Jakarta

BAB VI PENUTUP

6.1 Kesimpulan

Berdasarkan masalah yang telah dirumuskan di bab 1 pada sub-bab 1.2 dan telah dideskripsikan pada bab-bab sebelumnya, peneliti mendapatkan hasil yaitu tingkat akurasi yang didapatkan dari 2 skenario yaitu pada skenario 1 peneliti hanya menggunakan algoritma K-Means tanpa bantuan algoritma normalisasi kata didapatkan nilai akurasinya yaitu 86% dan pada skenario 2 peneliti menggunakan kombinasi algoritma K-Means dan algoritma Levensthein Distance sebagai algoritma normalisasi kata mengalami peningkatan akurasi yaitu 96%.

Kesimpulan yang bisa diambil dari hasil di atas yaitu pada penelitian analisis teks diharuskan menggunakan fitur tambahan berupa normalisasi kata yang baik. Masyarakat pada umumnya, mereka menggambarkan ekspresi ataupun pendapat mereka menggunakan kata – kata singkatan yang tidak ada di dalam KBBI (jika berbahasa Indonesia).

Dengan menggunakan fitur normalisasi kata ini, peneliti bisa mengekstrak informasi dengan lebih jelas dan akurat dari data – data yang sudah diambil melalui target sumber.

6.2 Saran

Pada penelitian saat ini peneliti menyadari bahwa masih banyak kekurangan dan keterbatasan. Oleh karena itu, ada beberapa hal yang bisa sarankan untuk penelitian selanjutnya agar hasilnya lebih memuaskan dan lebih baik, yaitu:

1. Sistem ini hanya bisa menggunakan bahasa Indonesia. Diharapkan penelitian selanjutnya bisa menggunakan selain bahasa Indonesia.

2. Menambahkan data yang akan dianalisis agar hasilnya lebih meyakinkan.

91 UIN Syarif Hidayatullah Jakarta

DAFTAR PUSTAKA

Arief, R., & Imanuel, K. (2019). ANALISIS SENTIMEN TOPIK VIRAL DESA PENARI PADA MEDIA SOSIAL TWITTER DENGAN METODE LEXICON BASED. Jurnal Ilmiah MATRIK.

Asroni, Fitri, H., & Prasetyo, E. (2018). Penerapan Metode Clustering dengan Algoritma K-Means pada Pengelompokan Data Calon Mahasiswa Baru di Universitas Muhammadiyah Yogyakarta. Semesta Teknika.

Budiaji, W. (2019). Penerapan Reproducible Reseacrh pada Rstudio dengan Bahasa R dan paket Knitr. Jurnal ilmu komputer dan Informatika.

Firdausillah, F., & Arieansyah. (2019). Implementasi Algoritma Levensthein Distance Sebagai Chatbot Agen Pariwisata Berbasis Aplikasi LINE.

Seminar Nasional APTIKOM.

Firman, A., F.Wowor, H., & Najoan, X. (2016). Sistem Informasi Perpustakaan Online Berbasis Web . E-journal Teknik Elektro dan Komputer.

Gunawan, F., Fauzi, M. A., & Adikara, P. P. (2017). ANALISIS SENTIMEN PADA ULASAN APLIKASI MOBILE MENGGUNAKAN NAIVE BAYES DAN NORMALISASI KATA BERBASIS LEVENTHEIN DISTANCE (STUDI KASUS APLIKASI BCA MOBILE). SYSTEMIC.

Gustientiedina, Adiya, M., & Desnelita, Y. (2019). Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan Pada RSUD Pekanbaru.

Jurnal Nasional Teknologi dan Sistem Informasi.

H, A. T. (2015). PREPOCESSING TEXT UNTUK MEMINIMALISIR KATA YANG TIDAK BERARTI DALAM PROSES TEXT MINING. Jurnal Informatika UPGRIS.

Indraloka, D. S., & Santosa, B. (2017). PENERAPAN TEXT MINING UNTUK MELAKUKAN CLUSTERING DATA TWEET SHOPEE INDONESIA.

Jurnal Sains dan Seni ITS.

Maulana, G. G. (2017). PEMBELAJARAN DASAR ALGORITMA DAN PEMROGRAMAN MENGGUNAKAN EL-GORITMA BERBASIS WEB. Jurnal Teknik Mesin.

Muhyiddin. (2020). Covid-19, New Normal dan Perencanaan Pembangunan di Indonesia. The Indonesian Journal of Development Planning.

Najjichah, H., Syukur, A., & Subagyo, H. (2019). PENGARUH TEXT PREPROCESSING DAN KOMBINASINYA PADA PERINGKAS DOKUMEN OTOMATIS TEKS BERBAHASA INDONESIA. Jurnal Teknologi Informasi.

Nasruddin, R., & Haq, I. (2020). Pembatasan Sosial Berskala Besar (PSBB) Dan Masyarakat Berpenghasilan Rendah. SALAM; Jurnal Sosial & Budaya Syar-i.

Nur, F., Zarlis, P. M., & Nasution, D. B. (2017). PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAH MENENGAH KEJURUAN UNTUK CLUSTERING. InfoTekJar.

Nurjanah, M., Hamdani, & Astuti, I. F. (2013). PENERAPAN ALGORITMA TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF) UNTUK TEXT MINING. Jurnal Informatika Mulawarman.

Rahman, M., Darmawidjadja, M., & Alamsah, D. (2017). Klasifikasi Untuk Diagnosa Diabetes Menggunakan Metode Bayesian Regularization Neural Network (RBNN). Jurnal Informatika.

Saputra, T. I., & Arianty, R. (2019). IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING PADA ANALISIS SENTIMEN KELUHAN PENGGUNA INDOSAT. Jurnal Ilmiah Informatika Komputer.

Sari, F. V., & Wibowo, A. (2019). ANALISIS SENTIMEN PELANGGAN TOKO ONLINE JD.ID MENGGUNAKAN METODE NAIVE BAYES CLASSIFER BERBASIS KONVERSI IKON EMOSI. Jurnal SIMETRIS.

Septian, J. A., Fahrudin, T. M., & Nugroho, A. (2019). Analisis Sentimen Pengguna Twitter Terhadap Polemik Persepakbolaan Indonesia Menggunakan Pembobotan TF-IDF dan K-Nearest Neighbor. JOURNAL OF INTELLIGENT SYSTEM AND COMPUTATION.

Susanto, E. H. (2017). MEDIA SOSIAL SABAGAI PENDUKUNG JARINGAN KOMUNIKASI POLITIK. Jurnal ASPIKOM.

Warman, I., & Ramdaniansyah, R. (2018). Analisis Perbandingan Kinerja Query Database Management System (DBMS) Antara MySQL 5.7.16 Dan Mariadb 10.1. Jurnal TEKNOIF.

Wirayasa, I. P., Wirawan, I. m., & Pradnyana, I. m. (2019). Algoritma Bastal:

Adaptasi Algoritma Nazief & Adriani untuk Stemming Teks Bahasa Bali.

Janapati.

Dalam dokumen Skripsi. Oleh : Mochamad Fadli NIM : (Halaman 96-0)