• Tidak ada hasil yang ditemukan

Analisis Sentimen Kendaraan Listrik Pada Media Sosial Twitter Menggunakan Algoritma Logistic Regression dan Principal Component Analysis

N/A
N/A
Protected

Academic year: 2023

Membagikan "Analisis Sentimen Kendaraan Listrik Pada Media Sosial Twitter Menggunakan Algoritma Logistic Regression dan Principal Component Analysis"

Copied!
7
0
0

Teks penuh

(1)

Analisis Sentimen Kendaraan Listrik Pada Media Sosial Twitter Menggunakan Algoritma Logistic Regression dan Principal Component

Analysis

Youga Pratama*, Danang Triantoro Murdiansyah, Kemas Muslim Lhaksmana Informatika, Informatika, Telkom University, Bandung, Indonesia

Email: 1,*yougapratama@student.telkomuniversity.ac.id, 2danangtri@telkomuniversity.ac.id,

3kemasmuslim@telkomuniversity.ac.id

Correspondent Author Email: yougapratama@student.telkomuniversity.ac.id

Abstrak−Analisis sentimen twitter merupakan cara untuk mengidentifikasi pendapat, reaksi, penilaian, evaluasi, dan emosi seseorang terhadap topik tertentu pada media sosial twitter. Pendapat atau bisa disebut opini ini dapat dikategorikan menjadi positif atau negatif. Penelitian ini dilakukan untuk mengetahui opini masyarakat terhadap kendaraan listrik pada media sosial twitter lebih mengarah ke positif atau ke negatif. Data yang diperoleh sebanyak 1874 tweets dengan data terbagi menjadi data training dan data testing pada ratio 80:20. Data diklasifikasikan menggunakan metode Logistic Regression (LR), dan Principal Component Analysis (PCA) sebagai optimasi dalam meningkatkan akurasi. Di dalam penelitian ini dapat diketahui bahwa sekitar 86,9% opini yang ada bersifat positif, dan 13,1% opini bersifat negatif terhadap topik kendaraan listrik. Hasil dari penelitian yang dilakukan dengan menggunakan algoritma Logistic Regression didapatkan akurasi terbaik sebesar 87,9%, dan setelah dioptimalkan dengan menggunakan Principal Component Analysis akurasi terbaik yang didapat meningkat menjadi 90%.

Kata Kunci: Analisis Sentiment; Kendaraan Listrik; Twitter; Logistic Regression; Principal Component Analysis

Abstract−Twitter sentiment analysis is a method for identifying a person's opinions, reactions, judgments, evaluations, and emotions towards certain topics on Twitter social media. Opinions or can be called opinions can be classified as positive or negative.

This research was conducted to find out public opinion about electric vehicles on Twitter social media, which is more positive or negative. The data obtained was 1874 tweets with data divided into training data and testing data at a ratio of 80:20. Data is classified using the Logistic Regression (LR) method, and Principal Component Analysis (PCA) as an optimization to improve accuracy. In this study it was found that around 86.9% of the opinions were positive, and 13.1% of the opinions were negative on the topic of electric vehicles. The results of research conducted using the Logistic Regression algorithm obtained the best accuracy of 87.9%, and after being optimized using Principal Component Analysis the best accuracy obtained increased to 90%.

Keywords: Sentiment Analysis; Electric Vehicle; Twitter; Logistic Regression; Principal Component Analysis

1. PENDAHULUAN

Seiring dengan semakin berkembangnya teknologi dibagian informasi yang mana kini mulai berefek pula pada kemajuan teknologi bagian kendaraan seperti kendaraan listrik, yang semula berbahan bakar minyak menjadi tenaga listrik [1]. Berkembangnya kendaraan bertenaga listrik saat ini dinilai menjadi langkah awal yang baik untuk menstabilkan pencemaran udara yang terjadi di dunia [2]. Walaupun penggunaan kendaraan listrik saat ini masih belum banyak, tapi seiring berjalannya waktu diharapkan penggunaan kendaraan listrik di dunia akan semakin meningkat.

Berdasarkan kementrian perhubungan republik Indonesia, populasi kendaraan listrik di Indonesia saat ini mencapai 28.188unit kendaraan [3]. Penggunaan kendaraan listrik dapat dikatakan efektif dikarenakan selain ramah lingkungan, tingkat kebisingan mesin dari kendaraan listrik termasuk rendah, dan juga penggunaan baterai pada kendaraan listrik dapat menghemat biaya jika dibandingkan dengan penggunaan bahan bakar minyak. Peraturan Presiden (Perpres) No 55 Tahun 2019 terkait regulasi dalam hal pemakaian kendaraan listrik menggunakan baterai merupakan langkah awal pemerintah dalam upaya untuk mengurangi pencemaran udara [4].

Teknologi informasi dan komunikasi yang saat ini semakin berkembang pesat membuat informasi-informasi yang ada saat ini dapat langsung diketahui dengan cepat melalui layanan internet. Menurut survei mengenai penetrasi pengguna internet yang disajikan Asosiasi Penyelenggara Jasa Internet Indonesia (APJII) menyatakan bahwa pengguna internet Indonesia mencapai 77.02% sebanyak 210 juta pengguna, dan lebih dari pengguna internet diindonesia menggunakan media sosial [5]. Media sosial menjadi layanan internet yang paling sering diakses di Indonesia, salah satunya Twitter. Dengan semakin banyaknya pengguna internet dalam menggunakan media sosial, maka dibangunlah sebuah sistem yang dapat menganalisis opini-opini yang ada terkait suatu topik atau bahasan yang disebut opinion mining. Opinion mining atau sentiment analisis ini merupakan pembelajaran komputasi terkait opini orang-orang, sentiment, dan emosi melalui teks [6]. Oleh karena itu media sosial menjadi media yang cukup bagus untuk dijadikan sebagai acuan sumber data yang akan dipakai pada penelitian ini.

Menurut penelitian yang dilakukan oleh Ahmad Santoso, Agung Nugroho, dan Aswan Supriyadi Sunge denagn judul “Analisis Sentimen Tentang Mobil Listrik Dengan Metode Support Vector Machine Dan Feature Selection Particle Swarm Optimization”. Menurut peneliti dalam pengecekan akurasinya, menggunakan feature selection

(2)

Particle Swarm Optimization pada metode support vector machine dapat meningkatkan nilai akurasi yang didapat.

Dimana nilai akurasi yang didapat pada awalnya sebesar 82,51% meningkat menjadi 86,07% [7]. Menurut penelitian yang dilakukan oleh Aditta Agustian, Tukino, dan Fitria Nurapriani dengan judul “Penerapan Analisis Sentimen dan Naïve Bayes Terhadap Opini Penggunaan Kendaraan Listrik di Twitter”. Pada penelitian ini peneliti mendapatkan akurasi 80% pada penelitiannya [1].

Pada penelitian yang dilakukan Francis Joseph Costello, dan Kun Chang Lee yang berjudul “Exploring the Sentiment Analysis of Electric Vehicle Social Media Data by Using Feature Selection Methods”, dimana peneliti menemukan bahwa penggunaan 3 feature selection (Chi Square, Information Gain, dan ReliefF) menunjukkan hasil yang baik ketika digunakan dengan Logistic Regression atau support vector machine sebagai algoritma klasifikasi nya dengan akurasi 70,05%/70,04%/70,03% untuk support vector machine dan 70,40%/70,39%/70,51% untuk Logistic Regression [8]. Pada penelitian yang dilakukan oleh Ayikpa Kacoutchy Jean dkk..., yang berjudul “Application based on Hybrid CNN-SVM and PCASVM Approaches for Classification of Cocoa Beans”. Pada penelitian ini, peneliti melakukan perbandingan dengan menggunakan hybrid Convolutional Neural Network dengan Support vector machine (CNN-SVM) dan Principal Component Analysis dengan Support Vector Machine (PCA-SVM) dalam klasifikasi gambar biji kakao dimana dapat dilihat akurasi dalam penggunaan hybric CNN-SVM memiliki akurasi sebesar 98,32%

dan PCA-SVM memiliki akurasi sebesar 97,65% [9].

Pada penelitian yang dilakukan oleh Bagja Nugraha yang berjudul “Metode KlasifikasiAnalisis Sentimen pada Media Sosial”. Peneliti melakukan penelitian terkait metode klasifikasi dengan menggabungkan Support Vector Machine (SVM), Principal Component Analysis dan Genetic Algorithm, dimana pada penelitian ini tingkat akurasi yang didapat menggunakan metode SVM sebesar 86,00% sedangkan untuk metode SVM dengan mengoptimalkan penggunaan Principal Component Analysis dan Genetic Algorithm memiliki tingkat akurasi lebih tinggi yaitu sebesar 97% [10].

Penelitian ini bertujuan untuk melakukan analisis sentimen terkait kebijakan pemerintah dalam mengembangkan kendaraan listrik di Indonesia. Data sentiment atau opini ini diperoleh dengan melakukan crawling pada twitter dengan kata kunci “kendaraan listrik”, “motor listrik”, dan “mobil listrik” melalui akses Application Programming Interface (API). Data opini yang ada akan dilakukan pembersihan terlebih dahulu dan akan terbagi dalam bentuk positif dan negatif sebagai sentimennya, untuk pengukuran tingkat akurasinya akan berdasarkan accuracy, precision, dan recall dalam analisisnya. Pada penelitian ini juga peneliti menggunakan metode Logistic Regression dan Principal Component Analysis (PCA) sebagai optimasi dalam meningkatkan akurasi yang didapat.

2. METODOLOGI PENELITIAN

2.1 Tahapan Penelitian

Rancangan sistem yang dibuat dari analisis sentimen terkait kendaraan listrik menggunakan algoritma logistic regression dan PCA ini ditunjukkan pada Gambar 1.

Gambar 1. Rancangan Sistem

(3)

Tahap pada penelitian ini dimulai mengumpulkan dataset, lalu dilanjutkan dengan penghapusan duplikat secara manual, pemberian label dan pembagian dataset menjadi data training dan data testing. Setelah dataset yang ada dibagi, tahap selanjutnya adalah dengan melakukan pre-processing data. Dataset yang sudah dilakukan pre- processing kemudian akan dilakukan tahap ekstraksi fitur dengan menggunakan PCA dan mengklasifikasikannya menggunakan algoritma logistic regression. Setelah tahap klasifikasi dilakukan maka tahap terakhir yang dilakukan adalah dengan mengecek akurasi yang didapat dari penelitian ini.

2.2 Text Minning

Text mining adalah proses dalam menganalisis teks atau informasi untuk yang diambil dari suatu sumber atau dokumen. Kumpulan teks atau dokumen baik secara terstruktur maupun tidak terstruktur ini yang akan dijadikan sebagai sumber data dalam teks mining untuk mendapatkan informasi yang berguna [11]. Text mining biasanya digunakan untuk hal-hal seperti klasifikasi, pengumpulan teks, analisis sentiment, peringkasan dokumen, dan pembelajaran mengenai hubungan antar entitas [12].

2.3 Analisis Sentimen

Analisis sentimen atau bisa disebut juga opinion mining merupakan bagian dari data mining yang sering digunakan untuk menganalisis teks dari opini yang mengandung polaritas yang nantinya akan menghasilkan data berupa informasi yang memiliki nilai positif dan negatif [13]. Tugas dasar analisis sentiment adalah dengan mengumpulkan data atau teks yang ada menjadi sebuah kalimat atau dokumen, yang kemudian mengkategorikan kalimat atau dokumen tadi menjadi bentuk positif atau negatif.

2.4 word2vec

Word2vec merupakan model yang digunakan untuk menghitung representasi suatu kata menjadi vektor. Model word2vec dapat menghasilkan output berupa vektor dengan input berupa korpus teks [14]. Word2vec memiliki dua tipe model arsitektur yaitu, Continuous Bag of Words (CBOW) dan Skip-Gram. Pada penelitian ini akan digunakan CBOW. CBOW memprediksi setiap kemunculan kata berdasarkan kata-kata tetangganya. Vektor yang dihasilkan nantinya akan digunakan sebagai fitur klasifikasi. Word2vec dapat membantu meningkatkan kinerja pada klasifikasi dikarenakan pada word2vec, kata yang sama memiliki vektor yang sama [15]. Ilustrasi CBOW dapat dilihat pada Gambar 2.

Gambar 2. Word2vec CBOW

Pada Gambar 2 ketika kata-kata konteks dimasukkan, komponen CBOW menyimpulkan kata targetnya.

Lapisan input menerima W(t) = {W(t-2), W(t+2),….., W(t-1), W(t+1)} sebagai argumen, dimana W(t) menunjukkan kata-kata. Lapisan projection dianggap sebagai susunan vektor multidimensi yang menyimpan jumlah dari beberapa vektor. Lapisan output merupakan lapisan yang menampilkan hasil dari vektorisasi [16].

(4)

2.5 Pre-Processing

Pre-Processing merupakan tahapan data yang diperoleh dikumpulkan menjadi satu dokumen yang kemudian akan dilakukan analisis. Pre-processing ini sendiri dibagi menjadi beberapa bagian yaitu sebagai berikut:

2.5.1 Case Folding

Case folding adalah proses dimana semua huruf yang ada diubah menjadi huruf kecil. Berikut merupakan contoh dari case folding

Tabel 1. Hasil dari Case Folding

Sebelum Sesudah

RT @barikade_98: Dukung Penuh Penggunaan Kendaraan Dinas Listrik

rt @barikade_98 dukung penuh penggunaan kendaraan dinas listrik

2.5.2 Tokenizing

Tokenizing adalah proses untuk memecah kata menjadi beberapa bagian. Hasil kata yang sudah dipecah ini yang disebut token. Tokenizing juga biasa digunakan untuk menghapus tanda baca yang tidak akan digunakan dalam Preprocessing [11]. Berikut merupakan contoh dari tokenizing

Tabel 2. Hasil dari Tokenizing

Sebelum Sesudah

dukung penuh penggunaan kendaraan dinas listrik ‘dukung’, ‘penuh’, ‘penggunaan’, ‘kendaraan’, ‘dinas’, ‘listrik’

2.5.3 Stopwords

Stopwords adalah penghapusan kata yang tidak penting atau tidak dibutuhkan berupa kata keterangan dan kata sambung [17]. Berikut merupakan contoh dari stopwords

Tabel 3. Hasil dari Stopwords

Sebelum Sesudah

dukung penuh penggunaan kendaraan dinas listrik 'dukung', 'penuh', 'kendaraan', 'listrik' 2.5.4 Stemming

Stemming adalah proses mengubah suatu kata menjadi ke bentuk aslinya atau kata dasar [11]. Berikut merupakan contoh dari stemming

Tabel 4. Hasil dari Stemming

Sebelum Sesudah

dukung penuh penggunaan kendaraan dinas listrik 'dukung', 'penuh', 'guna', 'kendara', 'dinas', 'listrik' 2.6 PCA

Principal Component Analysis (PCA) adalah metode untuk mereduksi dimensi suatu data untuk dapat mengambil informasi penting dalam data yang besar [18]. PCA mereduksi dimensi suatu data, menemukan pola pada dimensi paling tinggi, dan memvisualisasikannya. PCA juga bisa disebut sebagai cara dalam mengidentifikasi fitur yang paling relevan dari sekumpulan fitur-fitur yang bergantung secara linear. Ruang dimensi paling rendah terbaik dapat ditentukan dengan eigenvector terbaik dari matriks konvarian suatu data [19].

2.7 Logistic Regression

Logistic regression adalah metode statistik yang dapat menganalisis multivariat dan pemodelan variabel biner. Analisis multivariat dapat memperkirakan koefisien pada setiap prediktor yang termasuk kedalam model akhir dan menyesuaikannya dengan prediktor lain [20]. Logistic regression memiliki fungsi dalam menentukan beberapa fungsi linier yang dapat dinyatakan sebagai berikut:

Logit (P)=β0+ β1X1+β2X2….βkXk (1)

P = porbabilitas fitur X1,X2…Xk = nilai prediktor β1, β2… βk = intersepsi model [21]

(5)

2.8 Analisis Performansi

Setelah semua tahapan dilakukan, maka selanjutnya akan dilakukan menganalisis performansi dari sistem yang sudah dibuat. Pada penelitian ini analisis performansi akan dihitung berdasarkan hasil dari akurasi, F1-score, recall, dan precision menggunakan metode confusion matrix sebagai berikut:

Tabel 5. Confusion Matrix

Positif Negatif Positif TP FP Negatif FN TN

Akurasi = 𝑇𝑃 + 𝑇𝑁 𝑇𝑜𝑡𝑎𝑙 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑑𝑎𝑡𝑎 Precision = 𝑇𝑃

𝑇𝑃 + 𝑇𝑁

Recall = 𝑇𝑃 𝑇𝑃 + 𝐹𝑁

F1-score =2 𝑥 (𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑥 𝑟𝑒𝑐𝑎𝑙𝑙) 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑟𝑒𝑐𝑎𝑙𝑙 [4]

3. HASIL DAN PEMBAHASAN

3.1 Pengumpulan Data

Data opini atau tweet yang digunakan pada penelitian ini dikumpulkan menggunakan metode crawling dan fitur API pada twitter. Data yang akan digunakan berkaitan dengan kata kunci kendaraan listrik. Kata kunci yang digunakan dalam penelitian ini ada 3 yaitu: #kendaraanlistrik, #mobillistrik, dan #motorlistrik. Jumlah data yang telah dikumpulkan dan telah dilakukan penghapusan duplikat secara manual sebanyak 1.874 data tweets dalam bentuk file dengan format XLSX. Pelabelan data pada penelitian ini dilakukan secara manual untuk memastikan ketepatan sentimen pada data yang ada. Jumlah data berdasarkan sentimennya dapat dilihat pada Gambar 3.

Gambar 3. Jumlah data berdasarkan sentiment 3.2 Hasil Pengujian

Pada penelitian ini dilakukan dua skenario pengujian. Pada skenario pertama akan dilakukan pengklasifikasian hanya menggunakan logistic regression, lalu pengujian akan menggunakan rasio data yang berbeda untuk menentukan rasio dengan akurasi terbaik. Pada skenario kedua pengklasifikasian akan dilakukan dengan menggunakan logistic regression dan PCA digunakan sebagai ekstraksi fitur, lalu dalam pengujian ini juga akan menggunakan rasio data

(6)

yang berbeda untuk menentukan rasio dengan akurasi terbaik. Pada penelitian ini penilaian performa yang digunakan adalah nilai akurasi, F1-Score, Recall, dan Precision.Hasil dari skenario 1

Tabel 6. Hasil skenario 1

Model Rasio Akurasi (%) F1-Score (%) Recall (%) Precision (%)

70:30:00 86 87 91 86

80:20:00 87 88 93 84,4

Logistic Regression 90:10:00 87,9 89,9 92 87,9

Performansi dari klasifikasi logistic regression tanpa menggunakan kombinasi PCA ini dapat dilihat bahwa nilai terbaik didapatkan dengan akurasi sebesar 87,9%, nilai F1-score sebesar 89,9%, nilai precision sebesar 87,9% pada rasio 90:10 dan nilai recall sebesar 93% pada rasio 80:20. Hasil dari skenario 2 (Logistic Regression, dan PCA)

Tabel 7. Hasil skenario 2 dengan menggunakan PCA

Model Rasio Akurasi (%) F1-Score (%) Recall (%) Precision (%)

70:30:00 84,7 91,6 97,7 86,3

80:20:00 88 92,7 98 88

Logistic Regression + PCA 90:10:00 90 94 99 90

Pada performansi dari klasifikasi logistic regression dengan menggunakan PCA ini dapat dilihat bahwa nilai terbaik didapatkan dengan akurasi sebesar 90%, F1-score sebesar 94%, recall sebesar 99%, dan precision sebesar 90%

pada rasio 90:10. Hasil dari pengujian klasifikasi logistic regression dengan mengombinasikan dengan PCA dapat meningkatkan akurasi, F1-score, recall, dan precision pada rasio rasio 80:20 dan 90:10, sedangkan pada rasio 70:30 mengalami penurunan pada akurasinya tetapi tetap mengalami kenaikan pada nilai F1-score, recall, dan precision.

4. KESIMPULAN

Pada penelitian ini, penggabungan klasifikasi logistic regression dengan PCA sebagai optimasi klasifikasi telah diimplementasikan dalam analisis sentimen ini. Dataset yang digunakan berupa opini dalam bahasa Indonesia dengan data opini sebanyak 1.874 data tweet dengan pembahasan terkait kendaraan listrik. Penggunaan klasifikasi logistic regression dengan metode PCA mendapatkan niali akurasi, F1-score, recall, dan, precision yang lebih baik jika dibandingkan dengan logistic regression saja. Seperti yang dapat dilihat pada Tabel 7. Pertambahan nilai yang didapatkan tidak cukup signifikan pada nilai akurasi yang didapat, bahkan pada pembagian rasio 70:30 akurasi yang didapat menurun sebesar 1,3% walaupun pada nilai F1-score dan recall mendapatkan pertambahan nilai yang besar.

yang dapat dikatakan tidak cukup baik. Penggunaan dataset yang lebih banyak dapat digunakan pada penelitian selanjutnya dalam meningkatkan akurasi yang didapat. Kemudian penggunaan algoritma klasifikasi yang berbeda dapat menjadi perbandingan untuk mencari akurasi yang lebih baik.

REFERENCES

[1] A. Agustian, T. Tukiro, dan F. Nurapriani, “Analisis Sentimen, Text Mining Penerapan Analisis Sentimen Dan Naive Bayes Terhadap Opini Penggunaan Kendaraan Listrik Di Twitter”, TIKA, vol. 7, no. 3, hlm. 243-249, 2022, doi: https://doi.org/10.51179/tika.v7i3.1550

[2] V. Tulus Pangapoi Sidabutar, “Kajian pengembangan kendaraan listrik di Indonesia: prospek dan hambatannya”, jpe, vol. 15, no. 1, pp. 21-38, May 2020, doi:

https://doi.org/10.22437/paradigma.v15i1.9217

[3] Biro Komunikasi dan Informasi Publik, (2022), “Menhub Dorong Instansi Pusat dan Daerah Jadi Role Model Penggunaan Kendaraan Listrik”, [Online]. Tersedia: https://dephub.go.id/post/read/menhub- dorong-instansi-pusat-dan-daerah-jadi-role-model-penggunaan-kendaraan-listrik [Diakses 13 Januari 2023]

[4] A. Riyadi et al., "Pengukuran Sentimen Sosial Terhadap Teknologi Kendaraan Listrik: Bukti Empiris di Indonesia", EXPERT: Jurnal Manajemen Sistem Informasi dan Teknologi, Vol 11, No 2, 2021, doi:

http://dx.doi.org/10.36448/expert.v11i2.2171

[5] APJII, (2022), “Survei Penetrasi dan Perilaku Penggunaan Internet “, [Online]. Tersedia:

https://apjii.or.id/survei/surveiprofilinternetindonesia2022-21072047 [Diakses 21 Desember 2022]

(7)

[6] F. Handayani, dan M. Mustikasari, “SENTIMENT ANALYSIS OF ELECTRIC CARS USING RECURRENT NEURAL NETWORK METHOD IN INDONESIAN TWEETS”, Jurnal Ilmiah KURSOR, vol. 10, no. 04, hlm. 153-158, 2020, doi: https://doi.org/10.21107/kursor.v10i4.233

[7] A. Santoso, A. Nugroho, and A. S. Sunge, “Analisis Sentimen Tentang Mobil Listrik Dengan Metode Support Vector Machine Dan Feature Selection Particle Swarm Optimization”, jpcs, vol. 2, no. 1, pp.

24-31, Jul. 2022, doi: https://doi.org/10.37366/jpcs.v2i1.1084

[8] F. J. Costello and K. C. Lee, “Exploring the Sentiment Analysis of Electric Vehicles Social Media Data by Using Feature Selection Methods,” Journal of Digital Convergence, vol. 18, no. 2, pp. 249–259, Feb. 2020, doi: https://doi.org/10.14400/JDC.2020.18.2.249

[9] A. K. Jean et al., "Application based on Hybrid CNN-SVM and PCASVM Approaches for Classification of Cocoa Beans", International Journal of Advanced Computer Science and Applications (IJACSA), vol. 13, no. 9, 2022, doi: 10.14569/IJACSA.2022.0130927

[10] B. Nugraha, “Metode Klasifikasi Analisis Sentimen pada Media Sosial”, Syntax J. Inf., vol. 9, no. 2, pp. 119–123, Dec. 2020, doi: https://doi.org/10.35706/syji.v9i2.3593

[11] W. Yulita et al., "ANALISIS SENTIMEN TERHADAP OPINI MASYARAKAT TENTANG VAKSIN COVID-19 MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER", JDMSI, vol. 2, no. 2, hlm. 1-9, 2021, doi: https://doi.org/10.33365/jdmsi.v2i2.1344

[12] D. K. Wardy et al., "Clustering Artikel pada Portal Berita Online Menggunakan Metode K-Means", JITTER: Jurnal Ilmiah Teknologi dan Komputer, vol. 3, no. 1, pp. 985-993, mar. 2022, [Online].

Tersedia: https://ojs.unud.ac.id/index.php/jitter/article/view/84732 [Diakses 19 Januari 2023]

[13] B. Laurensz and Eko Sediyono, “Analysis of Public Sentiment on Vaccination in Efforts to Overcome the Covid-19 Pandemic”, JNTETI, vol. 10, no. 2, pp. 118-123, May 2021, doi:

https://doi.org/10.22146/jnteti.v10i2.1421

[14] A. K. Sharma et al., "Sentimental Short Sentences Classification by Using CNN Deep Learning Model with Fine Tuned Word2Vec", Procedia Computer Science, vol. 167, pp. 1139-1147, 2020, doi:

10.1016/j.procs.2020.03.416

[15] M. A. Fauzi, "Word2Vec model for sentiment analysis of product reviews in Indonesian language", IJECE, vol. 9, no. 1, pp. 525-530, Fe. 2019, doi: http://doi.org/10.11591/ijece.v9i1.pp525-530

[16] A. Fesseha, S. Xiong, E. D. Emiru, M. Diallo, and A. Dahou, “Text Classification Based on Convolutional Neural Networks and Word Embedding for Low-Resource Languages: Tigrinya,”

Information, vol. 12, no. 2, p. 52, Jan. 2021, doi: 10.3390/info12020052

[17] A. P. Giovani et al., "ANALISIS SENTIMEN APLIKASI RUANG GURU DI TWITTER MENGGUNAKAN ALGORITMA KLASIFIKASI", Jurnal TEKNOINFO, vol. 14, no. 2, pp. 116-124, 2020, doi: https://doi.org/10.33365/jti.v14i2.679

[18]A. S. Ritonga, I. Muhandhis, "TEKNIK DATA MINING UNTUK MENGKLASIFIKASIKAN DATA ULASAN DESTINASI WISATA MENGGUNAKAN REDUKSI DATA PRINCIPAL COMPONENT ANALYSIS (PCA)", Jurnal Ilmiah Edutic, vol. 7, no. 2, pp. 124-133, Mei. 2022, doi:

https://doi.org/10.21107/edutic.v7i2.9247

[19] D. K. Choubey et al., "Performance evaluation of classifcation methods with PCA and PSO for diabetes", Netw Model Anal Health Inform Bioinforma, vol. 9, no. 5, 2020, doi:

https://doi.org/10.1007/s13721-019-0210-8

[20] M. E. Shipe et al., "Developing prediction models for clinical use using logistic regression: an overview", J Thorac Dis, Mar. 2019, doi: 10.21037/jtd.2019.01.25

[21] H. M. Ahmed et al., "Sentiment Analysis of Online Food Reviews using Big Data Analytics", Elementary Education Online, vol. 20, no. 2, pp. 827-836, Apr.2021, doi:

10.17051/ilkonline.2021.02.93

Referensi

Dokumen terkait