Analisis Sentimen Ulasan Aplikasi Capcut Menggunakan Metode Naive Bayes

(1)

9

Analisis Sentimen Ulasan Aplikasi Capcut Menggunakan Metode Naive Bayes

VF. Anindya¹, Andri Wijaya^2*

1Sistem Informasi, Sains dan Teknologi, Universitas Katolik Musi Charitas, Palembang

2Sistem Informasi, Sains dan Teknologi, Universitas Katolik Musi Charitas, Palembang

Informasi Artikel:

Dikirim: 07-12-2023; Diterima: 11-01-2024; Diterbitkan: 15-01-2024 Doi : http://dx.doi.org/10.31602/jssi.v2i1.13372

Abstrak

Penelitian ini mengeksplorasi sentimen pengguna terhadap aplikasi pengeditan video, CapCut, menggunakan metode Naïve Bayes. Studi ini didasarkan pada pertumbuhan pesat industri pengeditan video mobile dan urgensi memahami respon pengguna. Data yang dianalisis berasal dari berbagai sumber online, diolah dengan metode Naïve Bayes untuk mengklasifikasikan sentimen menjadi positif, negatif, dan netral. Proses penelitian melibatkan pra-pemrosesan data, ekstraksi fitur, serta pelatihan model.

Hasilnya menunjukkan efektivitas metode Naïve Bayes dalam mengidentifikasi sentimen dengan tingkat akurasi yang signifikan. Klasifikasi sentimen ini memberikan pandangan berharga bagi pengembang CapCut untuk meningkatkan kualitas aplikasi. Implikasi penelitian ini tidak hanya berdampak pada pengembangan CapCut, tetapi juga pada pengembangan metode analisis sentimen dalam konteks pengeditan video mobile. Hasil penelitian ini penting dalam memberikan wawasan mendalam terhadap preferensi pengguna, mendukung pengembangan aplikasi, serta meningkatkan pengalaman pengguna secara keseluruhan.

Kata Kunci: Analisis Sentimen, Naïve Bayes, Ulasan Pengguna, Aplikasi CapCut, Pengeditan Video.

PENDAHULUAN

Dalam era digital yang terus berkembang, aplikasi pengeditan video menjadi salah satu elemen kunci dalam memenuhi kebutuhan kreatif pengguna internet. Salah satu aplikasi yang semakin populer adalah CapCut, sebuah platform pengeditan video yang menyediakan beragam fitur untuk menciptakan konten yang menarik dan berkualitas. Seiring dengan popularitasnya, pengguna CapCut aktif memberikan ulasan terhadap pengalaman mereka.

CapCut, awalnya dikenal sebagai Viamaker sebelum perubahannya pada tahun 2020. Dikembangkan oleh ByteDance, aplikasi ini memungkinkan pengguna untuk

(2)

10 dengan mudah mengedit video dengan berbagai fitur seperti pengaturan durasi, penambahan efek, filter, teks, musik, dan suara latar. CapCut menjadi salah satu aplikasi pengeditan video yang populer di seluruh dunia. Menurut situs resmi CapCut.Com (2023), aplikasi ini diperkenalkan sebagai alat pengeditan video yang mudah digunakan, memungkinkan pengguna untuk merekam, mengedit, dan berbagi momen penting dalam hitungan menit (Menurut Pahmi, 2022).

GooglePlay, diluncurkan pada Maret 2012 sebagai pengganti Android Market dan Layanan Musik Google, merupakan layanan konten digital yang mencakup toko daring untuk berbagai produk seperti musik, buku, aplikasi, permainan, dan pemutar media berbasis awan. Layanan ini dapat diakses melalui web, aplikasi Android (Wikipedia, 2015).

Penelitian ini akan menggunakan metode Naïve Bayes untuk melakukan analisis sentimen terhadap ulasan pengguna CapCut yang diambil dari Play Store. Dan salah satu metode klasifikasi teks yang populer, akan membantu untuk memahami apakah ulasan tersebut cenderung positif dan negatif.

Analisis sentimen adalah proses untuk memahami, mengekstrak, dan mengolah data tekstual, dengan tujuan mendapatkan informasi tentang sentimen dalam kalimat opini terhadap suatu entitas. Tujuannya adalah menyediakan informasi berharga dari dataset tidak terstruktur, dan dampak serta manfaatnya telah menghasilkan perkembangan dengan banyak perusahaan fokus pada layanan ini (G A. Buntoro, 2017).

Pada penelitian sebelumnya yang dilakukan oleh (Pramastuti, 2015), metode klasifikasi Naive Bayes digunakan, dengan perhitungan nilai rata-rata menggunakan Average of Probabilities. Penelitian ini juga memiliki kekurangan dalam menangani masalah ulasan singkat, yang menyebabkan penurunan tingkat akurasi.

Naïve Bayes, salah satu metode klasifikasi data umum dalam machine learning, memanfaatkan perhitungan probabilitas dan statistik berdasarkan prinsip karya ilmuwan Inggris, Thomas Bayes. Metode ini bekerja dengan memprediksi probabilitas kejadian di masa depan berdasarkan pengalaman dari kejadian sebelumnya. (A. Amolik, 2016).

METODE 2.1 Data

Dataset yang telah dikumpulkan melalui proses scraping data dengan menggunakan bahasa pemrograman python dengan data yang diambil dari Play Store.

Dataset tersebut berisi ulasan komentar berdasarkan class negatif dan class positif yang akan disimpan dengan format csv.

2.2 Text Mining

Sebagai ekstraksi dari informasi tersembunyi, dan berpotensi berguna dari data tekstual, yang mencakup sejumlah besar teks (Waegel, 2006). Bidang ini berfokus pada

(3)

11 ekstraksi informasi bermakna dari teks bahasa alami, dengan tujuan menganalisis teks untuk mendapatkan informasi yang berguna.

2.3 Analisis Sentimen

Analisis sentimen adalah evaluasi terhadap pendapat, perasaan, sikap, dan emosi. Dalam menganalisis pendapat dalam teks, umumnya dilakukan penilaian terhadap polaritasnya, yang memungkinkan klasifikasi kata atau frasa dengan class positif dan negatif (Guevara, 2018).

2.4 Metode Naïve Bayes

Metode yang populer karena kemudahan penggunaannya dan kemampuannya untuk beradaptasi di berbagai domain. Sementara itu, Support Vector Machine memiliki keunggulan dalam mengidentifikasi beragam hyperplane yang memperbesar margin antara kelas-kelas yang berbeda. Namun, metode ini juga memiliki kelemahan dalam pemilihan fitur yang tepat (Ratino,N. Hafidz,2020).

2.5 Metode Penelitian

Tahapan penelitian lebih rinci, seperti dijelaskan pada Gambar 1 : 1. Identifikasi Masalah

Tahap ini akan menjelaskan permasalahan yang ada pada aplikasi Capcutyang diketahui dari ulasan komentar yang diambil dari Play Store.

2. Pengumpulan Data

Pengumpulan data diambil menggunakan scraping dalam bahasa pemrograman python, data yang diambil sebanyak 3000 data dari ulasan Play Store aplikasi CapCut yang akan disimpan dalam format CSV.

3. Preprocessing Data

Tahapan penting dalam proses mining yang melibatkan beberapa langkah:

a. Cleaning

Menghapus karakter non-abjad seperti emoticon, angka, hashtag (#), mention (@), URL, dan link pada komentar.

b. Filtering

Menghapus kata yang tidak relevan dan stopwords dari hasil token.

c. Stemming

Merubah ke bentuk dasarnya dari yang memiliki imbuhan.

d. Tokenizing

Memisahkan dokumen menjadi potongan kata.

4. Split Data

Memisahkan data training dan data testing, dengan perbandingan 80:20, di mana data training lebih besar.

5. Analyze Results

(4)

12 Proses pemodelan menggunakan algoritma Multinomial Naïve Bayes yang diimplementasikan pada data testing. Tujuannya adalah menghasilkan prediksi dan akurasi dari proses analisis sentimen.

Gambar 1 yang merupakan alur tahapan penelitian yang akan diadopsi dalam jurnal ini:

Gambar 1. Tahap Penelitian

HASIL DAN PEMBAHASAN 3.1 Scrapping

Pengumpulan data melalui scrapping dari aplikasi CapCut. Hasil dari pengumpulan data ini terlihat pada Gambar 2.

(5)

13 Gambar 2. Scrapping

Proses pengumpulan data dari aplikasi CapCut, yang terlihat pada Gambar 2, mencakup berbagai atribut seperti reviewId, username, userImage, content, score, thumbsUpCount, reviewCreatedVersion, at, replyContent, repliedAt, dan appVersion.

Namun, dari data yang terkumpul, hanya konten (content) yang akan diolah lebih lanjut.

Gambar 3. Menunjukkan Content 3.2 Labeling Data

Pada tahap labeling data, akan dijelaskan label pada kelas positif dan kelas negatif yang diambil berdasarkan ulasan pada aplikasi CapCut. Informasi mengenai labeling data ini terdapat pada Gambar 4.

Gambar 4. Menampilkan Hasil Labeling Data

Gambar 5. Presentase Sentimen

(6)

14 Hasil dari pelabelan data terlihat pada Gambar 4. Presentase sentimen ditampilkan dalam diagram lingkaran dengan 49,7% untuk kelas positif dan 50,3% untuk kelas negatif.

3.3 Data Cleaning

Proses pembersihan data (data cleaning) menjelaskan langkah-langkah untuk membersihkan dan menyiapkan data guna analisis atau pemodelan lebih lanjut.

Tahapan ini menjadi krusial karena data yang kotor atau tidak terstruktur dapat menghasilkan analisis yang tidak akurat atau bias. Pembersihan meliputi penghapusan data duplikat, emoji, karakter spesial, angka, kata berulang, kata tiga huruf, dan spasi berlebihan. Informasi lebih lanjut mengenai data cleaning dapat ditemukan pada Gambar 6.

Gambar 6. Data Cleaning 3.4 Teks Preprocessing

Preprocessing adalah tahapan membersihkan dataset yang dipilih dengan mengubah beberapa data yang tidak teratur menjadi data yang teratur. Proses ini bertujuan untuk mempersiapkan dataset sebelum dilakukan tahapan klasifikasi (F.Septianingrum, 2021).

Terdapat beberapa tahapan dalam Text Processing ini:

a. Tokenizing

Membagi teks menjadi bagian – bagian yang lebih kecil, yang akan disebut token. Token berisi kata, frasa,Kalimat atau, elemen lainnya yang lebih kecil dari tekxt yang diolah. Proses ini bertujuan untuk mempermudah analisis text dengan mengidentifikasikan dan mengelompokan unit – unut dasar dalam text. Tahapan tokenizing terlihat pada Gambar 7.

b. Stopword Removal

Proses menghapus kata – kata umum yang dianggap tidak memiliki nilai informatif dalam analisis text. Kata tersebut biasanya terdiri dari "juga", "dan",

"yang", “atau”,”di”dan sebagainya. Informasi mengenai stopword removal terdapat pada Gambar 7.

c. Stemming

Penyeragaman kata-kata untuk mengurangi variasi pada data latih (Manning, 2008). Stemming membantu mengidentifikasi akar kata dan

(7)

15 mengabaikan variasi morfologis sehingga kata-kata dengan makna serupa dapat dianggap sama. Informasi lebih lanjut tentang stemming dapat ditemukan pada Gambar 8.

Gambar 7. Text StopWord dan Text Tokenizing

Gambar 8. Text Stemming 3.5 Visualisasi Label

Pada visualisasi label menjelaskan data yang telah diproses sebelumnya ke bentuk perbandingan sentimen dari matric accuracy, precission, pecall, dan F1 Scorce.

Hasil dari visualisasi label dapat dilihat pada Gambar 9.

Gambar 9. Visualisasi Label 3.6 Wordcloud Hasil Sentimen

Visualisasi wordcloud dapat mempermudah pengamat dalam memahami gagasan dan pendapat penulis teks, sehingga menjadi alat bantu dalam melakukan

(8)

16 analisis terhadap wacana tertulis (McNaught dan Lam,2010). Visualisasi dari teks dapat mempermudah pengamat untuk memahami gagasan dan pendapat penulis, serta menjadi alat bantu dalam menganalisis wacana tertulis dan kategori sentimennya, menunjukkan kata-kata yang sering digunakan dalam masing-masing sentimen. Ukuran font dalam wordcloud mengindikasikan frekuensi kemunculan kata, di mana ukuran font yang lebih besar menunjukkan frekuensi yang lebih tinggi (Aryahuda medium.com).Berikut adalah wordcloud yang menggambarkan ulasan aplikasi CapCut.

Gambar 10. WordCloud Sentimen Positif

Gambar 11. WordCloud Sentimen Negatif 3.1 Build Model

MultinomialNB beroperasi menghitung kemunculan kata sebagai positif atau negatif. Model MultinomialNB melatih distribusi multinomial kata dalam masing-masing kelas sentimen. Akurasi model yang dibangun menggunakan algoritma MultinomialNB dapat dilihat dalam referensi.

(9)

17 Gambar 12. Akurasi Model

3.2 Evaluasi

Confusion matrix adalah tampat menyimpan informasi untuk menilai kinerja model yang digunakan dan berfungsi sebagai acuan pada tahap evaluasi algoritma.

Tabel 1. Confusion Matrix

Predicted Values Positif (0) Negatif (1) Actual

Values

Positif (0) TP FP Negatif (1) FN TN

Nilai variabel TP (True Positive) dan variabel TN (True Negative), yang menghasilkan total prediksi benar. Nilai variabel FP (False Positive) dan variabel FN (False Negative) menunjukan total prediksi salah. Kinerja model dihitung dengan menggunakan rumus untuk accuracy, precision, recall, dan F1-Score.

Gambar 13. Perhitungan Kinerja Model

Accuracy adalah rasio prediksi yang benar terhadap keseluruhan data. Precision adalah rasio benar positif dibandingkan dengan keseluruhan hasil yang diprediksi positif.

Recall adalah menunjukan benar positif dibandingkan dengan keseluruhan data yang benar positif. Sementara F1-Score merupakan perbandingan rata-rata dari presisi dan recall yang dibobotkan.

(10)

18 KESIMPULAN

Penelitian ini menyimpulkan bahwa Analisis sentimen ulasan aplikasi CapCut menggunakan metode Naive Bayes memberikan wawasan berharga tentang persepsi pengguna. Penerapan metode ini dapat membantu pengembang dan pemilik aplikasi dalam memahami umpan balik pengguna, mengidentifikasi area peningkatan, dan proaktif meningkatkan pengalaman pengguna untuk menjaga kepuasan serta popularitas aplikasi CapCut di pasar. Dari hasil presentase data, terdapat 49,7% dari kelas positif dan 50,3% dari kelas negatif. Meskipun data yang diuji sudah cukup sesuai, masih ada ruang untuk perbaikan pada tahapan preprocessing data.

DAFTAR PUSTAKA

Dian Nurdiansyah, Putri Handayani, Fairuz Zabadi A.(2023) PENINGKATAN SKILL EDITING VIDEO KARANG TARUNA MENGGUNAKAN APLIKASI MOBILE PHONE CAPCUT DI DESA LENGKONG KULON. Communnity Development Journal, Vol.4 No.3, Hal. 5572- 5580.

Siti Nurwahyuni.(2019) ANALISIS SENTIMEN APLIKASI TRANSPORTASI ONLINE KRL ACCESS MENGGUNAKAN METODE NAIVE BAYES. JURNAL SWABUMI, Vol. 7 No.1, pp. 31~38

Nuraeni Herlinawati, Yuri Yuliani, Siti Faizah, Windu Gata, Samudi. (2020) ANALISIS SENTIMEN ZOOM CLOUD MEETINGS DI PLAY STORE MENGGUNAKAN NAÏVE BAYES DAN SUPPORT VECTOR MACHINE. CESS (Journal of Computer Engineering System and Science). Vol. 5 No. 2

Ferly Gunawan, Mochammad Ali Fauzi, Putra Pandu Adikara.(2017) Analisis Sentimen Pada Ulasan Aplikasi Mobile Menggunakan Naive Bayes dan Normalisasi Kata Berbasis Levenshtein Distance (Studi Kasus Aplikasi BCA Mobile). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer. Vol. 1, No. 10, hlm. 1082-1088

Dedi Darwis, Nery Siskawati, Zaenal Abidin. Penerapan Algoritma Naive Bayes untuk Analisis Sentimen Review Data Twitter BMKG Nasio. Jurnal TEKNO KOMPAK, Vol.

15, No. 1, P-ISSN: 1412-9663, E-ISSN : 2656-3525

Nirwana Samrin, Muhammad Nur Akbar.(2023) Analisis Sentimen Komentar Pengguna Aplikasi Threads Pada Google PlayStore Menggunakan Algoritma Multinomial Naïve Bayes, Volume3,No.2

Andreyestha.(2016) ANALISIS SENTIMEN MASYARAKAT TERHADAP FENOMENA TERORIS MELALUI TWITTER DI INDONESIA, Volume 19, No. 3

Melati Indah Petiwi, Agung Triayudi, Ira Diana Sholihati.(2022) Analisis Sentimen Gofood Berdasarkan Twitter Menggunakan Metode Naïve Bayes dan Support Vector Machine. JURNAL MEDIA INFORMATIKA BUDIDARMA, Volume 6, Nomor 1, Page 542- 550

(11)

19 Fauzan Setya Ananto, Firman Noor Hasan.(2023) Volume 6, Nomor 1, Januari 2022, Page 542-550. Jurnal ICT : Information Communication & Technology, Vol. 23, N0.1, pp. 75-80

Billy Gunawan, Helen Sasty Pratiwi, Enda Esyudha Pratama.(2018) Sistem Analisis Sentimen pada Ulasan Produk Menggunakan Metode Naive Bayes. (Jurnal Edukasi dan Penelitian Informatika), Vol. 4 No. 2

Muhamad Iqbal Qels.(2015) APLIKASI WORDCLOUD SEBAGAI ALAT BANTU ANALISIS WACANA. : https://www.researchgate.net/publication/316736417

Aryahuda medium.com “Visualisasi Word Cloud Menggunakan Python untuk Melihat Sentimen Pelanggan Terhadap Pembelian Pakaian Wanita pada Suatu E Commerce”