• Tidak ada hasil yang ditemukan

View of Support Vector Machine untuk Analisis Sentimen Masyarakat Terhadap Penggunaan Antibiotik di Indonesia

N/A
N/A
Protected

Academic year: 2024

Membagikan "View of Support Vector Machine untuk Analisis Sentimen Masyarakat Terhadap Penggunaan Antibiotik di Indonesia"

Copied!
11
0
0

Teks penuh

(1)

Jln. Khatib Sulaiman Dalam, No. 1, Padang, Indonesia, Telp. (0751) 7056199, 7058325 Website: ijcs.stmikindonesia.ac.id | E-mail: [email protected]

Support Vector Machine untuk Analisis Sentimen Masyarakat Terhadap Penggunaan Antibiotik di Indonesia.

Herdianti Darwis1, Nugraha Wanaspati2, Siska Anraeni3

[email protected], [email protected], [email protected] Universitas Muslim Indonesia

Informasi Artikel Abstrak Diterima : 30 Jul 2023

Direview : 19 Ags 2023 Disetujui : 30 Ags 2023

Peningkatan penggunaan antibiotik secara global termasuk di Indonesia, seringkali irasional dan tanpa resep berpotensi menyebabkan resistensi bakteri. Analisis sentimen data Twitter menggunakan query "antibiotik" dapat membantu mengungkap opini publik. Penelitian ini bertujuan untuk menerapkan algoritma Support Vector Machine (SVM) dengan kernel linear, RBF, dan polynomial, menggabungkan berbagai metode seperti pelabelan dengan RoBERTa, pelatihan dengan 5 cross validation, dan tokenizing bigram.

Tiga skenario digunakan dalam penelitian ini dan yang menghasilkan nilai akurasi tertinggi yaitu skenario ketiga yang menggunakan slangword dari ramaprakoso dan stopword dari sastrawi sebagai referensi library untuk filtering, nilai setiap kernel: akurasi 99,88%, presisi 99,88%, recall 99,88%, dan f1 score 99,88%. Dari hasil pengujian, dapat disimpulkan bahwa SVM efektif untuk analisis sentimen. Peningkatan performa ini sangat signifikan dibandingkan dengan performa sebelum menggunakan SMOTE.

Kata Kunci

Sentimen, Antibiotik, SVM, Bigram, SMOTE.

Keywords Abstrak

Sentiment, Antibiotic, SVM, Bigram, SMOTE.

Increased use of antibiotics globally, including in Indonesia, is often irrational and without a prescription potentially causing bacterial resistance. An analysis of Twitter's sentimental data using an "antibiotic"

query can help reveal public opinion. The research aims to implement the Support Vector Machine (SVM) algorithm with linear, RBF, and polynomial kernels, combining various methods such as labelling with RoBERTa, training with 5 cross validation, and tokenizing bigram. Three scenarios were used in this study and the ones that produced the highest accuracy values were the third scenario that used the slangword of ramaprakoso and the stopword of sastrawi as the library reference for filtering, the values of each kernel: accuration of 99.88%, precision of 99,88%, recall of 98.88%, and the f1 score of 98.88%. From the test results, it can be concluded that SVM is effective for sentimental analysis. This performance increase is very significant compared to the performance before using SMOTE.

(2)

A. Pendahuluan

Antibiotik adalah obat yang mencegah dan mengobati infeksi ketika mikroba merangsang sistem pertahanan tubuh dan menyebabkan penyakit menular [1].

Mikroorganisme patogen seperti virus, jamur, bakteri, dan parasit bisa menyebabkan infeksi. Bakteri adalah organisme mikroskopis, biasanya uniseluler tanpa membran inti, memiliki dinding sel, tetapi tidak memiliki klorofil [2].

Antimikroba digunakan untuk mengobati infeksi yang disebabkan oleh bakteri yang memasuki tubuh sebagai parasit. Dampak infeksi pada kesehatan harus ditangani serius [3].

Di negara berkembang seperti Indonesia, kematian karena penyakit menular tinggi sehingga penggunaan antibiotik meningkat. Namun, penggunaan antibiotik yang tidak rasional dan tanpa resep berdampak negatif, termasuk resistensi bakteri [4]. Antimicrobial Resistance in Indonesia (AMRIN) Study, menunjukkan bahwa 43%

dari 2494 individu di Indonesia resisten terhadap berbagai jenis antibiotik, termasuk E. coli yang resisten terhadap antibiotik seperti ampicillin, kotrimoksasol, dan kloramfenikol [5]. Dengan perkembangan infeksi resisten yang cepat, diperkirakan bahwa kematian akibat resistensi antimikroba pada tahun 2050 akan melebihi kematian akibat kanker [6].

Kemajuan teknologi komputer telah membawa perkembangan signifikan dalam sistem pengenalan atau pengidentifikasian, yang telah menjadi objek penting riset dan pengembangan [7]. Dalam mengidentifikasi suatu objek ketidakseimbangan kelas dapat terjadi, salah satu strategi yang paling banyak digunakan untuk mengatasi ketidakseimbangan kelas adalah metode Synthetic Minority Oversampling Technique (SMOTE). Dengan membuat instansi baru dari kelas minoritas menggunakan metode SMOTE, sampel baru akan dihasilkan dari kelompok minoritas, menyeimbangkan dataset dan meningkatkan kinerja metode klasifikasi [8].

Twitter, sebagai salah satu media sosial yang paling populer, mengalami pertumbuhan besar dalam jumlah pengguna dari tahun ke tahun. Hal ini berdampak pada peningkatan jumlah data yang dihasilkan, fenomena yang dikenal sebagai Big Data. Statistik dari Juli 2021 menunjukkan bahwa Indonesia memiliki 15,7 juta pengguna Twitter, menempati peringkat keenam di dunia [9]. Dalam konteks ini, analisis sentimen data Twitter memungkinkan kita untuk dengan cepat memahami opini masyarakat tentang penggunaan antibiotik, mengidentifikasi sentimen positif dan negatif mereka. Twitter dipilih karena kemudahan akses dan analisis data yang disediakan oleh API Twitter, serta kebijakan data yang lebih liberal dibandingkan API lain [10].

Sebuah penelitian yang dilakukan oleh Oke Dwiraswati dan Kemal Nazaruddin Siregar merancang sebuah sistem untuk melakukan analisis sentimen terhadap penggunaan antibiotik di Indonesia menggunakan metode Naïve Bayes Classifier. Dari 200 tweet yang dianalisis, sistem ini mencapai rata-rata akurasi 84%

dengan presisi 88%, recall 81%, dan f-measure 84%. Hasil ini menunjukkan bahwa metode Naïve Bayes Classifier efektif untuk analisis sentimen penggunaan antibiotik di Indonesia [11]. Penelitian lain oleh Melati Indah Petiwi bertujuan untuk menganalisis opini masyarakat tentang kinerja Gojek (Gofood) di Indonesia.

Penelitian ini mengelompokkan opini menjadi tiga kelas (positif, negatif, dan netral) dan mengujinya menggunakan metode Naïve Bayes Classifier dan Support Vector

(3)

Machine (SVM). Hasil penelitian menunjukkan bahwa SVM memberikan akurasi yang lebih tinggi dibandingkan dengan metode Naïve Bayes Classifier [12].

Berdasarkan hasil penelitian tersebut, penelitian ini difokuskan untuk menggunakan algoritma SVM dalam melakukan analisis sentimen terhadap opini masyarakat tentang penggunaan antibiotik di Indonesia. Keputusan ini didasarkan pada performa algoritma SVM dalam penelitian sebelumnya.

B. Metode Penelitian

Gambar 1. Alur Penelitian

(4)

Penelitian ini membandingkan tiga skenario yang berbeda dengan tujuan mendapatkan performa yang terbaik. Melalui perbandingan tersebut, diharapkan dapat ditemukan skenario yang paling optimal dan efektif dalam melakukan klasifikasi. Penelitian ini melibatkan pengambilan data dari Twitter, preprocessing data termasuk cleaning, filtering, dan stemming, pelabelan sentimen, ekstraksi fitur melalui pembobotan kata, pembuatan model klasifikasi dengan Support Vector Machine (SVM), dan evaluasi model berdasarkan akurasi, presisi ,recall dan f1 score.

1. Crawling data

Pada penelitian ini dilakukan pengambilan data dari situs web Twitter menggunakan query “antibiotik” yang dibantu dengan aplikasi Rapidminer. Hasil crawling data menggunakan Rapidminer berupa dataset yang akan dilakukan klasifikasi.

2. Preprocessing

Proses ini melibatkan empat tahap, pertama, data cleaning dan case folding, yang membersihkan data dari kesalahan termasuk noise data dan mengubah semua teks menjadi huruf kecil. Kedua, filtering, yang menghapus kata-kata atau karakter yang tidak relevan dan rutin muncul, juga menghilangkan slang dan kata-kata pendek. Ketiga, stemming, yang mengambil kata dasar atau akar kata untuk membantu dalam klasifikasi teks. Keempat, tokenizing, yang mengubah kalimat menjadi makna yang lebih spesifik menggunakan konsep bigram, yaitu dua kata yang berpasangan.

3. Pelabelan sentimen

Pelabelan data dilakukan menggunakan lima library yang dipilih berdasarkan akurasi yang dihasilkan. Tujuannya tidak hanya untuk menjadi dasar validasi terhadap kebenaran atau kesalahan model dalam memprediksi, tetapi juga untuk memastikan kualitas label yang akan digunakan dalam analisis data lebih lanjut, yang tentunya akan berdampak pada hasil akhir penelitian.

Data ini kemudian secara cermat dilabeli sebagai sentimen positif atau negatif, berdasarkan kriteria dan standar yang telah ditetapkan sebelumnya.

4. Ekstraksi Fitur

Ekstraksi fitur melibatkan pembobotan kata berdasarkan frekuensi kemunculan term dalam dokumen, menggunakan metode Term Frequency Invers Document Frequency (TF-IDF). TF-IDF adalah pendekatan yang biasa digunakan untuk memastikan tingkat relevansi suatu kata (term) terhadap dokumen atau kalimat dengan memberikan bobot atau nilai untuk setiap kata tersebut. Pendekatan ini, adalah penggabungan dari konsep inverse frequency dari sebuah kata di dalam dokumen dan inverse document frequency yang termasuk kata tersebut.

Pembobotan ini mengubah teks menjadi representasi numerik untuk input dalam proses klasifikasi. Adapun persamaan TF-IDF yaitu:

𝑊!" = 𝑡𝑓!" . 𝑖𝑑𝑓 (1)

𝑊!" = 𝑡𝑓!" . log ,$%#- (2)

Keterangan

𝑊!" : bobot term (𝑡") terhadap dokumen (𝑑!).

𝑡𝑓!" : Jumlah kemunculan term(𝑡") dalam (𝑑!).

𝑛 : jumlah semua dokumen yang ada dalam database.

𝑑𝑓 : banyaknya dokumen yang mengandung term [13].

(5)

5. Klasifikasi

Model klasifikasi ini memanfaatkan teknik Support Vector Machine (SVM) untuk klasifikasi. SVM adalah metode yang digunakan dalam pembelajaran mesin, yang membantu dalam memisahkan data menjadi dua atau lebih kelompok. Metode ini mencoba mencari garis batas terbaik yang disebut hyperplane, yang bisa memisahkan data tersebut dengan jarak terjauh dari titik- titik terdekat pada setiap kelompok. Titik-titik terdekat ini dikenal sebagai support vector. Jarak antara garis batas dan support vector ini disebut margin.

Tujuan dari SVM adalah untuk mencari garis batas yang bisa memberikan margin terbesar, sehingga pengelompokan data menjadi lebih akurat [14]. SVM ini menggunakan tiga jenis kernel, yaitu linier, Radial Basis Function (RBF), dan polynomial.

Gambar 2. Hyperplane Kelas Positif dan Negatif

Dalam proses ini, data dibagi menjadi dua bagian, dengan 80% digunakan untuk pengujian dan 20% untuk pelatihan, dan metode cross validation sebanyak 5 kali diterapkan untuk mengoptimalkan hasil. Selain itu, model ini juga menggunakan metode pembobotan bernama TF-IDF dan proses pelabelan berdasarkan referensi Robustly Optimized “Bidirectional Encoder Representations from Transformers” Pretraining Approach (RoBERTa) untuk membantu dalam klasifikasi. Untuk menangani masalah ketidakseimbangan dalam data sentimen, metode Synthetic Minority Over-sampling Technique (SMOTE) diaplikasikan. Dengan menggabungkan berbagai teknik ini, keakuratan model dalam mengklasifikasikan data dapat ditingkatkan. Semua teknik ini bekerja sama untuk memastikan model melakukan klasifikasi dengan seakurat mungkin.

𝐾&!#'()2𝑥!, 𝑦"6 = 𝑥!. 𝑦" (2)

𝐾*+&,#+-!(&(𝑥!, 𝑦") = 2𝑥!. 𝑦"6$ (3)

𝐾./0(𝑥!, 𝑦") = 𝑒𝑥𝑝 2−𝛾|𝑥!. −𝑦"|16 (4)

Keterangan:

𝐾 : Fungsi kernel yang menghitung kemiripan antara dua buah vektor fitur 𝑥! dan 𝑥" dalam dataset.

𝑥! : Vektor fitur data point 𝑖 dalam dataset

𝑦" : Vektor fitur data point 𝑗 dalam dataset

𝑑 : Parameter kernel yang menentukan derajat polynomial transformasi fitur yang akan digunakan

𝛾 : Parameter kernel yang menentukan seberapa cepat nilai kernel menurun seiring dengan jarak antara kedua vektor fitur [13].

(6)

6. Evaluasi

Evaluasi adalah tahap terakhir, di mana performa diukur berdasarkan akurasi algoritma SVM. Evaluasi ini membantu memastikan keandalan algoritma dan memberikan gambaran tentang kemampuannya dalam memprediksi karakteristik data baru.

C. Hasil dan Pembahasan 1. Pengambilan data

Penelitian ini menggunakan data primer dari Twitter yang diambil melalui API Twitter dengan alat Rapidminer menggunakan query "antibiotik" dalam Bahasa Indonesia. Atribut dipilih dan hasilnya diekspor ke Excel sebagai dataset mentah, yang kemudian dibersihkan dari tweet yang tidak relevan. Gambar 3 menunjukkan proses crawling data dengan Rapidminer.

Gambar 3. crawling data dengan rapidminer 2. Preprocessing

a. Data cleaning dan case folding dilakukan dengan menghapus tanda baca, angka, karakter khusus, emoji, hyperlink, username, dan duplikasi. Semua huruf diubah menjadi huruf kecil.

b. Filtering menghapus stopword dan kata dengan 3 huruf atau kurang serta mengganti kata slang, dengan referensi dari NLTK dan pujangga serta ramaprakoso.

c. Stemming mengubah semua kata dalam dataset menjadi kata dasar, menggunakan referensi dari library sastrawi.

d. Bigram tokenizing membagi teks menjadi pasangan kata bersebelahan.

Pada Tabel dapat dilihat hasil masing-masing tahap pada preprocessing.

Tabel 1. Hasil Preprocessing

Data mentah Data Cleaning

dan case folding Filtering Stemming Tokenizing bigram pelajaran guys :

gabole sembarang beli antibiotik kalo sakit, krn antibiotik hrs diminum sampe habis, kalo ga bakterinya

pelajaran guys gabole sembarang beli antibiotik kalo sakit krn antibiotik hrs diminum sampe habis kalo ga bakterinya resisten kebal

pelajaran teman-teman gabole sembarang beli antibiotik sakit

antibiotik diminum

ajar teman gabole sembarang beli antibiotik sakit

antibiotik minum habis bakteri

ajar teman, teman gabole, gabole sembarang,

sembarang beli, beli antibiotik, antibiotik sakit, sakit

antibiotik, antibiotik minum, minum

(7)

Data mentah Data Cleaning

dan case folding Filtering Stemming Tokenizing bigram resisten (kebal

terhadap obatnya) jd nanti bakal ngulang lg dari awal *cmiiw!"

terhadap obatnya jd nanti bakal ngulang lg dari awal cmiiw

habis bakterinya resisten kebal obatnya ngulang correct wrong

resisten kebal obat ngulang correct wrong

habis, habis bakteri, bakteri resisten, resisten kebal, kebal obat, obat ngulang, ngulang correct, correct wrong

3. Pelabelan

Referensi library pelabelan sentimen dilakukan menggunakan library RoBERTa dengan akurasi sebesar 86, 95%, pemilihan library berdasarkan rata- rata hasil akurasi tiap kernel yang paling tinggi dari ketiga skenario diantara kelima referensi library pelabelan sebelum dilakukan metode penyeimbangan sentimen SMOTE. Dari 1889 tweet, pelabelan menghasilkan 1631 sentimen negatif dan 258 sentimen positif. Hasil pelabelan menjadi input untuk proses klasifikasi SVM. Gambar 4 dan Gambar 5 masing masing menunjukkan perbandingan akurasi setiap library library dan hasil label sentimen menggunakan pelabelan RoBERTa yaitu library dengan akurasi tertinggi.

Gambar 4. Perbandingan akurasi setiap library pelabelan

Gambar 5. Visualisasi label sentimen hasil pelabelan dengan RoBERTa

(8)

4. Pembobotan TF-IDF

Bagian ini menjelaskan pemberian bobot pada term. TF menghitung frekuensi kemunculan bigram dalam dokumen, sedangkan IDF mencerminkan umumnya kata dalam dataset. TF-IDF adalah hasil kali antara TF dan IDF. Tabel 2 menunjukkan nilai pembobotan. Tabel 2 menunjukkan contoh hasil TF-IDF.

Tabel 2. Pembobotan TF-IDF

Terms TF

DF n/DF IDF W

D1 D2 D3 D1 D2 D3

ajar teman 0 1 0 1 3 0,47 0,00 0,47 0,00 aneh kaya 0 0 1 1 3 0,47 0,00 0,00 0,47 antibiotik asam 0 0 1 1 3 0,47 0,00 0,00 0,47 antibiotik minum 0 1 0 1 3 0,47 0,00 0,47 0,00 antibiotik pakai 1 0 0 1 3 0,47 0,47 0,00 0,00

… … …

resisten kebal 0 1 0 1 3 0,47 0,00 0,47 0,00 sakit antibiotik 0 1 0 1 3 0,47 0,00 0,47 0,00 sembarang beli 0 1 0 1 3 0,47 0,00 0,47 0,00 sembarang pakai 1 0 0 1 3 0,47 0,47 0,00 0,00 teman gabole 0 1 0 1 3 0,47 0,00 0,47 0,00 5. Klasifikasi dan evaluasi

Hasil performa yang akan dihitung menggunakan masing-masing persamaan yaitu akurasi (5), presisi (6), recall (7), dan f1 score (8). Perbandingan setiap skenario dan pengaruh metode SMOTE dalam melakukan klasifikasi sentimen.

Akurasi yang paling tinggi dihasilkan dengan kernel polynomial pada skenario 3 dan telah melalui penyeimbangan sentimen.

a. Akurasi, mengukur seberapa baik model dalam memprediksi kelas atau label yang tepat dari suatu data.

Akurasi = 23425

23425403405 (5)

b. Presisi, mengukur seberapa banyak dari hasil prediksi positif yang sebenarnya benar.

Presisi =2340323

(6) c. Recall, mengukur seberapa banyak dari data positif yang sebenarnya

terdeteksi oleh model.

𝑅𝑒𝑐𝑎𝑙𝑙 =2340523

(7) d. F1 score, menggabungkan nilai presisi dan recall menjadi sebuah nilai tunggal yang merefleksikan kinerja keseluruhan model dalam melakukan klasifikasi.

𝐹1 𝑠𝑐𝑜𝑟𝑒 =1×*)'7!7!×)'8(&&

*)'7!7!4)'8(&& (8)

Keterangan :

𝑇𝑃 : True Positive, jumlah data yang diprediksi dengan benar sebagai positif.

𝑇𝑁: True Negative, jumlah data yang diprediksi dengan benar sebagai negatif.

𝐹𝑃 : False Positive, jumlah data yang diprediksi salah sebagai positif.

𝐹𝑁: False Negative, jumlah data yang diprediksi salah sebagai negatif.

(9)

Tabel 3. Perbandingan hasil metode SMOTE setiap skenario Kernel Akurasi Presisi Recall F1 Score

Sebelum SMOTE

Skenario 1

Linear 84.97% 20,00% 0.36% 0.70%

RBF 85.07% 40,00% 0.70% 1.38%

Poly 84.97% 0.00% 0.00% 0.00%

Skenario 2

Linear 84,97% 20,00% 0,36% 0,70%

RBF 85,07% 40,00% 0,70% 1,38%

Poly 84,97% 0,00% 0,00% 0,00%

Skenario 3

Linear 86,40% 20,00% 0,39% 0,77%

RBF 86,34% 0,00% 0,00% 0,00%

Poly 86,34% 0,00% 0,00% 0,00%

Setelah SMOTE

Skenario 1

Linear 84,98% 77,49% 99,13% 86,93%

RBF 94,92% 100,00% 89,84% 93,22%

Poly 50,28% 50,14% 100,00% 66,79%

Skenario 2

Linear 85,67% 78,44% 98,69% 87,37%

RBF 94,77% 100,00% 89,53% 92,91%

Poly 50,28% 50,14% 100,00% 66,79%

Skenario 3

Linear 99,33% 99,21% 99,45% 99,32%

RBF 96,60% 99,61% 93,50% 95,97%

Poly 99,88% 99,88% 99,88% 99,88%

6. Wordcloud

Dalam Gambar 6 ini, beberapa kata dengan frekuensi terbesar adalah 'resistensi antibiotik' dan 'konsul dokter'. Dari Gambar 6, kita dapat memperoleh informasi bahwa isu resistensi antibiotik dan pentingnya konsultasi dengan dokter menjadi perhatian utama opini masyarakat dalam data teks yang kita analisis. Hal ini menegaskan pesan penting bahwa penggunaan antibiotik seharusnya tidak dilakukan secara sembarangan dan harus selalu dilakukan setelah konsultasi dengan dokter profesional.

Gambar 6. Wordcloud

(10)

D. Simpulan

Berdasarkan hasil pembahasan dari penelitian yang telah dilakukan, ditemukan bahwa metode SMOTE memainkan peranan penting dalam meningkatkan kinerja model yang digunakan. Ini karena metode SMOTE berhasil mengatasi ketidakseimbangan kelas di dalam dataset selama proses pelatihan, dengan menghasilkan sampel sintetis dari kelas yang lebih sedikit. Selain itu, dari tiga skenario yang telah dievaluasi, skenario ketiga menonjol dengan hasil yang paling menjanjikan. Skenario ini menggabungkan teknik filtering slangword berdasarkan referensi dari ramaprakoso dengan proses filtering stopword dan stemming yang diambil dari library sastrawi. Hasil akhir dari skenario ini menunjukkan performa yang luar biasa dengan akurasi mencapai 99,88%, presisi 99,88%, recall 99,88%, dan f1 score 99,88%. Performa model meningkat secara signifikan setelah menerapkan metode SMOTE dibandingkan sebelumnya.

E. Referensi

[1] A. Emelda, D. Yuliana, A. Maulana, T. Kurniawati, and W. Y. Utamil, “Gambaran Penggunaan Antibiotik Pada Masyarakat Di Pasar Niaga Daya Makassar,”

Indones. J. Community Dedication, vol. 5, pp. 13–18, 2023.

[2] M. A. Febriza, Q. J. Adrian, and A. Sucipto, “Penerapan Ar Dalam Media Pembelajaran Klasifikasi Bakteri,” J. BIOEDUIN Progr. Stud. Pendidik. Biol., vol.

11, no. 1, pp. 10–18, 2021, [Online]. Available:

https://journal.uinsgd.ac.id/index.php/bioeduin/article/view/12076

[3] D. B. Setiyono, A. Susanto, and H. Purwantiningrum, “Analisis Persepsi Dengan Penggunaan Antibiotik Di Kabupaten Brebes Analysis Of Perceptions With Antibiotic Use In The Regency Of Brebes,” J. Heal. Sci. Gorontalo J. Heal. Sci.

Community, 2023, [Online]. Available:

https://ejurnal.ung.ac.id/index.php/gojhes/index

[4] D. Aprilia, “Profil Penggunaan Antibiotik Di Salah Satu Puskesmas Kota Bandung,” 2020.

[5] S. S. Noer, R. Yulia, F. Herawati, and A. Zamroni, “Analisis Penggunaan Antibiotik pada Pasien Bedah Saraf di Ruang ICU RSUD Dr. R Sosodoro Djatikoesoemo Bojonegoro,” J. Syntax Lit., vol. 7, no. 7, pp. 9037–9052, 2022.

[6] S. F. apt. Dian Rismawati, “Masyarakat Cerdas, Bijak Gunakan Antibiotik,”

https://yankes.kemkes.go.id/, 2023.

https://yankes.kemkes.go.id/view_artikel/2157/masyarakat-cerdas-bijak- gunakan-antibiotik (accessed May 24, 2023).

[7] M. M. Baharuddin, H. Azis, and T. Hasanuddin, “Analisis Performa Metode K- Nearest Neighbor Untuk Identifikasi Jenis Kaca,” Ilk. J. Ilm., vol. 11, no. 3, pp.

269–274, 2019, doi: 10.33096/ilkom.v11i3.489.269-274.

[8] E. M. Teresia Ardika Dewi, “Perbandingan Implementasi Metode Smote Pada Algoritma Support Vector Machine (Svm) Dalam Analisis Sentimen Opini Masyarakat Tentang Mixue,” vol. 4, no. 3, pp. 849–855, 2023.

[9] D. S. Utami and A. Erfina, “Analisis Sentimen Pinjaman Online di Twitter Menggunakan Algoritma Support Vector Machine (SVM),” SISMATIK (Seminar Nas. Sist. Inf. dan Manaj. Inform., vol. 1, no. 1, pp. 299–305, 2021.

[10] Ristie Nashaya Faidatu’ Nissa and Muhammad Ilmi Hatta, “Hubungan Self- Esteem dengan Perilaku Cyberbullying pada Remaja Pengguna Media Sosial

(11)

Twitter,” Bandung Conf. Ser. Psychol. Sci., vol. 2, no. 1, Jan. 2022, doi:

10.29313/bcsps.v2i1.886.

[11] O. Dwiraswati and K. Nazaruddin Siregar, “Analisis Sentimen Pada Twitter Terhadap Penggunaan Antibiotik Di Indonesia Dengan Naive Bayes Classifier,” Media Inf., vol. 15, no. 1, pp. 1–9, 2019, [Online]. Available:

www.search.twitter.com

[12] M. I. Petiwi, A. Triayudi, and I. D. Sholihati, “Analisis Sentimen Gofood Berdasarkan Twitter Menggunakan Metode Naïve Bayes dan Support Vector Machine,” J. Media Inform. Budidarma, vol. 6, no. 1, p. 542, 2022, doi:

10.30865/mib.v6i1.3530.

[13] N. Arifin, U. Enri, and N. Sulistiyowati, “Penerapan Algoritma Support Vector Machine (SVM) dengan TF-IDF N-Gram untuk Text Classification,” STRING (Satuan Tulisan Ris. dan Inov. Teknol., vol. 6, no. 2, p. 129, 2021, doi:

10.30998/string.v6i2.10133.

[14] E. I. Elsen Ronando, Muhammad Yasa, “Sistem Prediksi Kepribadian Manusia Berdasarkan Status Media Sosial Menggunakan Support Vector Machine,” J.

Phys. A Math. Theor., vol. 44, no. 8, pp. 1–13, 2021, doi: 10.1088/1751- 8113/44/8/085201.

Referensi

Dokumen terkait

Teknik yang dapat digunakan untuk penelitian ini adalah analisis sentimen, metode klasifikasi yang akan digunakan untuk analisis sentimen ini adalah support

Analisis sentimen terhadap data Twitter mengenai penggunaan transportasi umum darat dalam kota dapat dilakukan dengan metode Support Vector Machine,

Pada Tabel 3 hasil akurasi query pada kata ―operator selluler‖ penjumlahan kelas positif yang dikelompokkan dengan benar berjumlah 56, kelas negatif yang dikelompokkan

mengimplementasikan algoritma SVM dalam melakukan analisis sentimen pada data tweet pengguna Twitter mengenai topik vaksin Covid-19 dan menerapkan grid search yang

Analisis yang dilakukan bertujuan untuk mengklasifikasi sentimen para pelanggan terhadap layanan uang elektronik OVO melalui teknik text mining dengan data yang

Kalimat tersebut akan dilakukan proses text mining dengan menggunakan algoritma Support Vector machine untuk menghasilkan klasifikasi dari sentimen suatu kalimat ke dalam sentiment

METODOLOGI PENELITIAN Pada gambar tahapan pada penelitian ini dimulai dari pengidentifikasian masalah, studi kepustakaan, mengumpulkan data dengan teknik crawling, pelabelan manual

Metode Support Vector Machine SVM digunakan dalam penelitian ini untuk menganalisis sentimen masyarakat terkait pembatalan Piala Dunia U20 di Indonesia.. Data yang digunakan dalam