60 Jurnal Teknik Informatika dan Sistem Informasi ISSN 2407-4322 Vol. 10, No. 2, Juni 2023, Hal. 60-70 E-ISSN 2503-2933
Analisis Sentimen Pendapat Masyarakat Terhadap PPKM DKI Jakarta Dengan Metode Naïve Bayes
Hikari Ardhiansya*1,Auliya Burhanuddin2, Shintia Dwi Alika3
1,2,3
Jurusan Teknik Informatika, Fakultas Informatika, Institut Teknologi Telkom Purwokerto, Purwokerto
e-mail: *1[email protected] , 2[email protected], 3shintia@ittelkom- pwt.ac.id
Abstrak
Sebuah virus yang disebut virus corona, juga disebut sebagai Covid-19 dapat membuat orang sakit dan bahkan membunuhnya. Beberapa negara telah terkena virus tersebut, termasuk Indonesia yang memiliki virus Covid-19. Pemerintah Indonesia telah meluncurkan sejumlah strategi atau upaya untuk mencegah penyebaran jangka panjang Covid-19 di tanah air sejak wabah Covid-19 di Indonesia, seperti memberlakukan Pembatasan Kegiatan Masyarakat (PPKM). Salah satu daerah yang melakukan (PPKM) yaitu provinsi DKI Jakarta yang memiliki sebaran covid terbesar di Indonesia. Selama ini dengan adanya Pembatasan Kegiatan Masyarakat pada DKI Jakarta, masyarakat merasakan kesulitan dalam melakukan aktivitasnya. Oleh karena itu diharapkan sebuah analisis sentimen untuk melihat pendapat rakyat mengenai PPKM di DKI Jakarta yang saat ini telah mulai mereda. Metode yang akan dipergunakan yaitu Naïve Bayes. Teknik klasifikasi yang disebut Naive Bayes memanfaatkan teknik probabilistik dan statistik. Hasil dari analisis sentiment ini mendapatkan 87,2% netral, 4,3% positif dan 8,4% negative dan klasifikasi dengan Naïve Bayes 2 kelas mendapatkan akurasi 90% dan untuk 3 kelas mendapatkan akurasi 81%. Dataset yang digunakan berdasarkan komentar yang berada pada youtube di konten berita yang membahas PPKM DKI Jakarta. Analisis sentimen dihasilkan menggunakan alur: cleaning, labeling, TF- IDF, split, klasifikasi dan evaluasi. Dengan menggunakan metode klasifikasi Naïve Bayes, peneliti mendapatkan hasil kategori Excellent classification.
Kata kunci— Covid-19, DKI Jakarta, Youtube, PPKM, Naïve Bayes
Abstract
A virus called coronavirus, also known as COVID-19, can make people sick and even kill them. Several countries have been affected by the virus, including Indonesia, which has the COVID-19 virus. The Indonesian government has launched a number of strategies or efforts to prevent the long-term spread of COVID-19 in the country since the COVID-19 outbreak in Indonesia, such as imposing restrictions on community activities (PPKM). One of the areas conducting (PPKM), namely DKI Jakarta Province, which has the highest COVID distribution in Indonesia, So far, with the existence of restrictions on community activities in DKI Jakarta, the community has experienced difficulties carrying out their activities. Therefore, it is hoped that a sentiment analysis will look at people's opinions regarding PPKM in DKI Jakarta, which is currently starting to subside. The method to be used is Nave Bayes. A classification technique called Naive Bayes utilizes probabilistic and statistical techniques. The results of this sentiment analysis are 87.2% neutral, 4.3% positive, and 8.4% negative, and classification with Nave Bayes gives 2 classes 90% accuracy and 3 classes 81% accuracy. The dataset used is based on comments on YouTube in news content discussing PPKM DKI Jakarta. Sentiment analysis is
Jatisi ISSN 2407-4322
Vol. 10, No. 2, Juni 2023, Hal. 60-70 E- ISSN 2503-2933 61
generated using the following flow: cleaning, labeling, TF-IDF, splitting, classification, and evaluation. By using the Nave Bayes classification method, the researcher got the results for the Excellent classification category.
Keywords— Covid-19, DKI Jakarta, Youtube, PPKM, Naïve Bayes
1. PENDAHULUAN
irus Corona atau dikenal juga dengan Covid-19 adalah virus yang dapat membuat orang sakit dan berpotensi membunuhnya. Akhir tahun 2019 terlihat penemuan virus ini di Wuhan, China.[1]. Seseorang yang terinfeksi virus akan mengalami gangguan pada pernafasan ringan maupun berat bagi seseorang yang memiki penyakit pengorbit seperti kardiovaskular, diabetes, pernapasan kronis, dan kanker. Selain itu corona virus sangat cepat penyebarannya di seluruh dunia.
World Health Organization (WHO) menyatakan status darurat bagi seluruh negara.
Dengan dinyatakannya status darurat oleh WHO, banyak negara yang melakukan lockdown untuk melindungi warga negaranya [2]. Pemerintah Indonesia telah menerapkan sejumlah strategi atau inisiatif untuk mencegah penyebaran jangka panjang Covid-19 di Indonesia sejak awal pandemi[3]. Selama ini pesatnya pertumbuhan jumlah perkara secara dunia sudah menyebabkan kepanikan, ketakutan, dan kecemasan di kalangan rakyat[4].
Pemerintah Indonesia telah melakukan pembatasan kegiatan masyarakat (PPKM) di sejumlah daerah, mulai dari level 1, 2, dan 3. Pemerintah memberlakukan Pembatasan Kegiatan Masyarakat (PPKM) untuk menghentikan penyebaran Covid-19, dan PPKM adalah penerapan dari pembatasan tersebut. DKI Jakarta adalah ibu kota Indonesia yang terletak pada pulau jawa bagian barat dan merupakan daerah yang melakukan kebijakan PPKM. Berdasarkan laman berita www.health.detik.com, pada 6 juli 2022 DKI Jakarta menjadi provinsi yang menyumbangkan kasus positif tertinggi dengan 1.516 kasus covid-19[5]. Karena sebelumnya data telah menunjukan adanya penaikan angka terkonfirmasi positif Covid-19, pemerintah DKI Jakarta memberlakukan PPKM level 2 pada tanggal 5 juli 2022 [6]. Namun pada tanggal 6 juli 2022 DKI Jakarta kembali menurunkan PPKM ke level 1 karena menurut Dinas Kesehatan DKI Jakarta Dwi Oktavia, Positivity Rate DKI Jakarta kembali memenuhi kriteria organisasi WHO[7]. Dengan sempat berlangsung kembalinya PPKM level 2 di DKI Jakarta pada tanggal 5-6 Juli 2022, tentu akan membuat fenomena-fenomena data.
Analisis sentimen adalah salah satu komponen kunci dari penambangan data, memungkinkan ekstraksi informasi penting tergantung pada sentimen dari data yang diperoleh, apakah itu positif atau negatif. Analisis sentimen, biasa disebut Opinion Mining, adalah teknik mengidentifikasi dan mengekstraksi informasi subyektif dari bahan sumber dengan menggunakan komputasi linguistik, analisis teks, dan pemrosesan bahasa alami[13]. Analisis sentimen dapat memainkan peran penting dalam pembuatan kebijakan untuk melawan COVID- 19. Media sosial dan berita online adalah sumber data tidak terstruktur.
Teknik klasifikasi yang disebut Naive Bayes memanfaatkan teknik probabilistik dan statistik. Metode ini merupakan algoritma supervised learning yang sangat sederhana. Untuk mengetahui kinerja metode klasifikasi Naïve Bayes bisa dilihat melalui akurasi. Akurasi adalah hasil yang paling sederhana dan digunakan saat mengevaluasi kinerja model. Akurasi dapat diartikan sebagai proporsi perdeksi yang benar dari banyaknya sampel [8]. Metode klasifikasi Naïve Bayes telah dibuktikan lebih baik dari Logistic Regression dalam melakukan klasifikasi kalimat yang pendek seperti komentar dengan akurasi 91%, sedangkan Logistic Regression hanya mendapatkan akurasi 71% [9].
V
62 Jatisi ISSN 2407-4322 Vol. 10, No. 2, Juni 2023, Hal. 60-70 E-ISSN 2503-2933
Di antara beberapa platform sosial media yang terkenal, Youtube merupakan salah satu media yang menerima perhatian khusus karena pengguna bisa dengan simpel menyiarkan berita.
Youtube dapat dianggap sebagai platform penting untuk menyebarluaskan informasi kesehatan yang relevan[10]. Selain itu berdasarkan www.suara.com [11]. Pada tahun 2022, pengguna YouTube di Indonesia telah mencapai 139 juta atau setara dengan 50% dari total populasi.
Youtube adalah media sosial yang menampilkan video. Salah satu video yang di tampilkan yaitu berita yang membahas PPKM di DKI Jakarta. Youtube memiliki jumlah yang signifikan dari video COVID-19 yang informatif dan menggabungkan karakteristik tertentu dapat meningkatkan popularitas video youtube [10].
Penelitian ini akan membahas mengenai pendapat masyarakat mengenai peraturan PPKM di DKI Jakarta yang saat ini sudah mulai meningkat. Data yang akan digunakan berdasarkan komentar di konten berita di Youtube yang membahas PPKM di DKI Jakarta pada tanggal 5-6 juli 2022. Berdasarkan data itu akan di proses dengan data mining dan dinilai memakai metode klasifikasi Naïve Bayes. Naïve Bayes sangat cocok untuk pengklasifikasi tweet yang pendek [9]. Oleh karena itu menurut peneliti metode ini lebih cocok untuk penelitian ini.
2. METODE PENELITIAN
Penelitian ini bertujuan untuk menganalisis komentar masyarakat mengenai PPKM yang sempat terjadi pada tanggal 5-6 juli 2022 pada sosial media youtube dan melakukan klasifikasi komentar dengan 2 kelas dan 3 kelas menggunakan Naïve Bayes. Hasil dari penelitian ini dapat digunakan untuk sarana untuk evaluasi PPKM oleh pemerintah DKI Jakarta dan bagi masyarakat dapat dijadikan sarana untuk menyampaikan tanggapan mengenai PPKM di DKI Jakarta ke pemerintah. Untuk Menjalankan penelitian ini peneliti menggunakan Jupiter Notebook. Tahapan penelitian ini yaitu:
Gambar 1. Alur Penelitian
Jatisi ISSN 2407-4322
Vol. 10, No. 2, Juni 2023, Hal. 60-70 E- ISSN 2503-2933 63
Tahapan penelitian yang terlihat di gambar 1, dapat diuraikan seperti berikut:
1. Pengumpulan Data, yaitu mengumpulkan konten pada youtube, melakukan crawling data dengan API v3, menggubah menjadi CSV.
2. Data Cleansing, yaitu melakukan data cleansing yang meliputi penghapusan missing value, pembersihan element yang tidak digunakan, stemming menggunakan sastrawi, melakukan stopwords dan tokenisasi.
3. Labeling, yaitu pemberian label kepada setiap data menggunakan sentiwordnet untuk memberikan 3 kategori(Positive, Negative dan Neutral)
4. TF-IDF, yaitu melakukan diekstraksi feature dengan menggunakan TF-IDF. Data yang di lakukan TF-IDF yaitu data yang di bersihkan dari nilai netral.
5. Clustering, yaitu prosek clustering pada data yang akan di klasifikasi dengan naive bayes.
Tahap ini ditujukan untuk menaikan akurasi.
6. Naïve Bayes, yaitu melakukan pemodelan klasifikasi dengan algoritma Complementary Naive Bayes.
7. Evaluasi, yaitu melihat akurasi dari sistem yang telah di buat sebelumnya.
3. HASIL DAN PEMBAHASAN
Analisis sentimen adalah salah satu komponen kunci dari penambangan data, memungkinkan ekstraksi informasi penting tergantung pada sentimen dari data yang diperoleh, apakah itu positif atau negatif. Teknik klasifikasi yang disebut Naive Bayes memanfaatkan teknik probabilistik dan statistik. Metode ini merupakan algoritma supervised learning yang sangat sederhana. Untuk mengetahui kinerja metode klasifikasi Naïve Bayes bisa dilihat melalui akurasi. Untuk mendapatkan informasi terkait akurasi, peneliti mengunakan library confusion_matrix. Untuk mengetahui hasil dari analisis sentimen dan akurasi dilakukan tahapan berikut :
A.Analisis Sentiment
Tahap pertama yang dilakukan peneliti yaitu melakukan pengumpulan data komentar pada konten berita yang ada di youtube. Konten yang dipilih merupakan berita di sosial media youtube yang membicarakan tentang naiknya PPKM di DKI Jakarta pada tanggal 5-6 juli 2022.
Pada tahap ini peneliti mendapatkan 18 konten, seperti dari konten dari metrotv, cnn Indonesia, tvone, berita satu dan lain-lain. Sehingga total komentar yang didapat dari youtube sebanyak 385. Alasan utama peneliti tidak mengambil hanya satu channel pada youtube, yaitu agar data menjadi lebih berwarna. Untuk melakukan crawling data v3 pada apps script. Setelah semua data telah diambil, file-file excel akan digabungkan menjadi satu file CSV. Hal ini ditujukan agar lebih rapih dan saat menginputkan data tersebut ke Jupiter notebook mejadi lebih mudah.
Sehingga hasilnya seperti pada gambar 2 sebagai berikut:
Gambar 2. Data
64 Jatisi ISSN 2407-4322 Vol. 10, No. 2, Juni 2023, Hal. 60-70 E-ISSN 2503-2933
Tahap kedua peneliti melakukan ngambilan 2 kolom, yaitu kolom name dan komentar.
Setelah itu data tersebut dilakukan penghapusan missing value. Untuk menghapus missing value mengunakan dropna(). Dropna() merupakan method dari python untuk menghapus data NULL.
Sehingga hasilnya seperti pada gambar 3 sebagai berikut :
Gambar 3. Hasil Cleansing
Tahap ketiga ini, sebelum memberi label kepada data peneliti melakukan stemming menggunakan sastrawi serta melakukan stopwords. Kedua Langkah ini ditujukan agar data menjadi lebih mudah di mengerti saat proses labeling. Proses ini akan mengambil kata-kata dasar pada suatu kalimat serta menghapus emoticon dan kata-kata yang tidak memiliki arti seperti “dan”, “atau”, “tapi” dan lainnya. Setelah bersih peneliti baru memberikan label menggunakan sentiwordnet. Pengkategorian ini mengunakan library sentiwordnet. Algoritma ini akan memberi label ke data jika nilai >0 maka Positive, nilai == 0 maka Neutral, dan nilai <0 maka Negative. Sehingga hasilnya seperti pada gambar 4 sebagai berikut:
Gambar 4. Hasil Labeling
Untuk mengetahui hasil dari analisis sentimen ini, peneliti membuat diagram plot dari hasil labeling yang terdiri dari 3 kategori yaitu Negative, Positive dan Neutral. Untuk membuat diagram ini, peneliti menggunakan metode matplotlib dari python untuk melakukan visualisasi data.
Berdasarkan hasil visualisasi data 3 kelas terlihat 87.2% komentar yang bersifat Neutral, 8.4% komentar yang bersifat Negative dan 4.3% komentar yang bersifat Positive. Hasil labeling ini menghasilkan Neutral sebanyak 321, Negative sebanyak 31,
Jatisi ISSN 2407-4322
Vol. 10, No. 2, Juni 2023, Hal. 60-70 E- ISSN 2503-2933 65
Positive sebanyak 16 data. Komentar terlihat komentar netral lebih banyak, sedangkan yang paling sedikit merupakan komentar positive. Berdasarkan hasil tersebut, peneliti dapat mengambil kesimpulan bahwa komentar pada masyarakat di youtube adalah bersifat Neutral.
Sehingga hasilnya seperti pada gambar 5 sebagai berikut :
Gambar 5. Diagram Hasil Analisis Sentimen
Sedangkan untuk hasil visualisasi data 2 kelas terlihat 66.0% komentar yang bersifat Negative dan 34.0% komentar yang bersifat Positive. Komentar terlihat komentar Negative lebih banyak, sedangkan yang paling sedikit merupakan komentar Positive. Berdasarkan hasil tersebut, peneliti dapat mengambil kesimpulan bahwa komentar pada masyarakat di youtube adalah bersifat Negative. Sehingga hasilnya seperti pada gambar 6 sebagai berikut:
Gambar 6. Diagram Hasil Analisis Sentimen 2 Kelas
66 Jatisi ISSN 2407-4322 Vol. 10, No. 2, Juni 2023, Hal. 60-70 E-ISSN 2503-2933
B. Naïve Bayes
Metode yang paling sering digunakan untuk menentukan bobot setiap kata disebut TF- IDF (Term Frequency - Inverse Document Frequency). Pendekatan ini terkenal karena lebih efektif, berguna, dan menghasilkan hasil yang tepat. Tahap ini merupakan perhitungan atau pemberian bobot term pada setiap dokumen. Untuk melakukan pembobotan ini, peneliti menggunakan library TfidfVectorizer yang dimana didalamnya terdapat CountVectorizer dan TfidfTransformer. Pada tahap ini peneliti membuat 2 percobaan, percobaan pertama dengan data yang dibobotkan adalah data Positive dan Negative serta percobaan kedua menggunakan data yang dibobotkan adalah Positive, Neutral, dan Negative. Sehingga hasilnya seperti pada gambar 7 sebagai berikut :
Gambar 7. Hasil TF-IDF
Clustering merupakan tahapan untuk membuat atau melakukan pengelompokan pada data. Algoritma yang digunakan oleh peneliti yaitu k-means dengan 2 kelas (Positive, dan Negative) dan 3 kelas (Positive, Neutral, dan Negative). K-means adalah algoritma pembelajaran mesin populer yang digunakan untuk pengelompokan data di mana jumlah cluster (K) diketahui, sebelum dijumlahkan atau ditunjukkan sebelumnya. K-Means dapat digunakan untuk mengidentifikasi pusat cluster sedemikian rupa sehingga jarak pengamatan ke pusat cluster terdekat mereka diminimalkan. Tahap clustering ini dilakukan untuk mempermudah proses klasifikasi, sehingga dapat menaikan akurasi pada model naïve bayes. Sehingga hasilnya jika di ukur dengan silhouette score seperti pada gambar 8 sebagai berikut :
Gambar 8. Hasil Clustering
Metode naïve bayes merupakan metode yang yang bersifat naif. Metode ini dipilih oleh peneliti karena mampu mengklasifikasi komentar yang pendek dengan baik. Peneliti menggunakan ComplementNB, Complement Naïve Bayes yaitu algoritma yang mengadopsi Multinomial Naïve Bayes serta didesain buat data yang tidak seimbang. Sistem di Complement Naïve Bayes dengan menghitung probabilitas kata yang timbul dari luar kelas. lalu menghitung probabilitas setiap kelas dan dipilih nilai terendah. pada penelitian ini peneliti mencoba dengan 2 model naïve bayes. Yaitu dengan naïve bayes complement untuk klasifikasi 2 kelas dan klasifikasi 3 kelas. Sehingga hasilnya seperti pada gambar 9 sebagai berikut:
Jatisi ISSN 2407-4322
Vol. 10, No. 2, Juni 2023, Hal. 60-70 E- ISSN 2503-2933 67
Gambar 9. Code Naïve Bayes
Untuk melakukan evaluasi ini, model Naive Bayes akan diberikan data test yang telah disiapkan untuk melakukan memprediksi data. Untuk melakukan evaluasi ini, peneliti mengunakan library confusion_matrix. Confusion_matrix adalah sebuah tabel untuk mengukur akurasi dari model. Confusion_matrix digunakan oleh peneliti karena lebih sering digunakan untuk mengukur hasil dari model klasifikasi di mesin learning. Selanjutnya akan dilihat akurasi, precision, recall dan f1-score.
Akurasi adalah persentase yang diperoleh dari total sentimen yang diidentifikasi dengan benar[10]. Akurasi dihitung dengan membagi jumlah data sentimen yang benar dengan total dan data uji, sebagai berikut:
X 100% (1)
Precision adalah proporsi data relevan yang ditemukan terhadap data total. [10]. Untuk menghitung Precision sebagai berikut:
Precision !"#
!"#$% !"# (2)
Recall adalah perbandingan kuantitas material relevan yang ditemukan dengan kuantitas material relevan [10]. Untuk menghitung Recal sebagai berikut:
Recall !"#
!"#$% )# (3)
F-measure adalah parameter tunggal untuk mengukur keberhasilan pengambilan, menggabungkan daya ingat dan presisi[10]. Untuk menghitung F-measure sebagai berikut:
F + measure 2 ∗01"∗1
01"$1 (4)
Pada penelitaian ini peneliti medapatkan hasil classification report dari naïve bayes dengan 2 kelas (Poistive dan Negative) dan 3 kelas (Poistive, Negative, dan Neutral).
Berdasarkan hasil 2 kelas (Poistive dan Negative), terlihat untuk label positive mendapatkan nilai 1.00 untuk precision, 0.83 untuk recall, dan 0.91 untuk f1-score. Sedangkan untuk label negative mendaptkan nilai 0.80 untuk precision, 1.00 untuk recall, dan 0.89 untuk f1-score.
68 Jatisi ISSN 2407-4322 Vol. 10, No. 2, Juni 2023, Hal. 60-70 E-ISSN 2503-2933
Sehingga bisa disimpulkan nilai dari model naïve bayes 2 kelas yaitu 0.90 untuk hasil akurasi, 0.90 untuk hasil precision, 0.92 untuk hasil recall, dan 0.90 untuk hasil f1-score. Oleh karena itu, model ini mendapatkan disimpulkan Excellent classification dengan akurasi 90%. Sehingga hasilnya seperti pada gambar 10 sebagai berikut:
Gambar 10. Hasil Naïve Bayes 2 Kelas
Berdasarkan hasil model 3 kelas (Poistive, Negative, dan Neutral), terlihat untuk label positive mendapatkan nilai 0.50 untuk precision, 0.67 untuk recall, dan 0.57 untuk f1-score.
Sedangkan untuk label negative mendaptkan nilai 0.29 untuk precision, 0.67 untuk recall, dan 0.40 untuk f1-score. Sedangkan untuk label netral mendapatkan nilai 0.95 untuk precision, 0.84 untuk recall, dan 0.89 untuk f1-score. Sehingga bisa disimpulkan nilai dari model naïve bayes 3 kelas yaitu 0.81 untuk hasil akurasi, 0.58 untuk hasil precision, 0.72 untuk hasil recall, dan 0.62 untuk hasil f1-score. Oleh karena itu, model ini mendapatkan disimpulkan Good classification dengan akurasi 81%. Sehingga hasilnya seperti pada gambar 11 sebagai berikut:
Gambar 11. Hasil Naïve Bayes 3 Kelas
4. KESIMPULAN
Berdasarkan hasil labeling terlihat 87.2% komentar yang bersifat Neutral, 8.4%
komentar yang bersifat Negative dan 4.3% komentar yang bersifat Positive. Komentar terlihat komentar netral lebih banyak, sedangkan yang paling sedikit merupakan komentar positive.
Berdasarkan hasil tersebut, peneliti dapat mengambil kesimpulan bahwa komentar pada masyarakat di youtube adalah bersifat Neutral.
Hasil akurasi yang didapat dari naïve bayes dengan 2 kelas yaitu 90% dengan nilai precision, recall, dan f1-score yaitu 0.90, 0.92, dan 0.90. Sementara naïve bayes dengan 3 kelas yaitu 81% dengan nilai precision, recall, dan f1-score dari model naïve bayes 3 kelas yaitu 0.58,
Jatisi ISSN 2407-4322
Vol. 10, No. 2, Juni 2023, Hal. 60-70 E- ISSN 2503-2933 69
0.72, dan 0.62. Sehingga dapat disimpulkan model terbaik adalah dengan 2 kelas. Hal ini menunjukan naïve bayes complementNB lebih untuk melakukan klasifikasi terhadap dua kelas karena dapat menghasilkan akurasi 90% atau bisa disebut Excellent classification.
5. SARAN
Berdasarkan hasil penelitian yang sudah dilakukan peneliti, terdapat beberapa saran untuk peneliti selanjutnya. Saran tersebut yaitu:
1. Pembuatan labeling dengan algoritma yang terbaru seperti textblob.
2. Pengkombinasian metode optimasi klasifikasi dengan algoritma yang digunakan.
3. Membuat model klasifikasi lainya seperti algoritma Decision Tree, Random Forest Classifier, LSTM, dan lain-lain.
UCAPAN TERIMA KASIH
Terimakasih penulis juga haturkan untuk semua pihak yang telah membantu peneliti dalam menyelesaikan skripsi ini yang tidak dapat peneliti sebutkan satu persatu. Akhir kata penulis menyadari bahwa tidak ada yang sempurna, penulis masih melakukan kesalahan dalam penyusunan jurnal ini. Oleh karena itu, penulis meminta maaf yang sedalam-dalamnya atas kesalahan yang dilakukan penulis.
DAFTAR PUSTAKA
[1] D. D. Darmansah and N. W. Wardani, “Analisis Pesebaran Penularan Virus Corona di Provinsi Jawa Tengah Menggunakan Metode K-Means Clustering,” JATISI (Jurnal Tek.
Inform. dan Sist. Informasi), Vol. 8, No. 1, pp. 105–117, 2021, doi:
10.35957/jatisi.v8i1.590.
[2] R. Ordila, R. Wahyuni, Y. Irawan, and M. Yulia Sari, “Penerapan Data Mining Untuk Pengelompokan Data Rekam Medis Pasien Berdasarkan Jenis Penyakit Dengan Algoritma Clustering (Studi Kasus : Poli Klinik PT.Inecda),” J. Ilmu Komput., Vol. 9, No. 2, pp. 148–153, 2020, doi: 10.33060/jik/2020/vol9.iss2.181.
[3 ]K. D. R. Sianipar, S. W. Siahaan, M. Siregar, and P. P. P. A. N. W. F. I. R. H. Zer,
“Penerapan Algoritma K-Means Dalam Menentukan Tingkat Kepuasan Mahasiswa Terhadap Pembelajaran Online,” Infomatek, Vol. 22, No. 1, pp. 23–30, 2020, doi:
10.23969/infomatek.v22i1.2748.
[4 ]K. Chakraborty, S. Bhatia, S. Bhattacharyya, J. Platos, R. Bag, and A. E. Hassanien,
“Sentiment Analysis of COVID-19 tweets by Deep Learning Classifiers—A study to Show How Popularity is Affecting Accuracy in Social Media,” Appl. Soft Comput. J., Vol. 97, 2020, doi: 10.1016/j.asoc.2020.106754.
[5] S. O. Alam, “DKI Jakarta Terbanyak, Ini Sebaran 2.743 Kasus Baru COVID-19 RI 6 Juli.,” detikHealth, 2022.
70 Jatisi ISSN 2407-4322 Vol. 10, No. 2, Juni 2023, Hal. 60-70 E-ISSN 2503-2933
[6] M. Ali, “PPKM Jawa Bali Diperpanjang, DKI Jakarta Naik Level 2,” Liputan 6, p. 1, 2022.
[7] P. Hestin Untari, “PPKM Level 1, Kasus Harian Covid-19 Jakarta Nyaris 2000,”
Bisnis.com, p. 1, 2022.
[8] J. W. G. Putra, Pengenalan Konsep Pembelajaran Mesin dan Deep Learning, 1.4. 17 Agustus 2020, 2020.
[9] J. Samuel, “COVID-19 Public Sentiment Insights and Machine Learning For Tweets Classification,” Inf., Vol. 11, No. 6, 2020, doi: 10.3390/info11060314.
[10] A. Shukla, “COVID-19 Pandemic: An Analysis of Popular YouTube Videos As An Alternative Health Information Platform,” Health Informatics J., Vol. 27, No. 2, 2021, doi: 10.1177/1460458221994878.
[11] L. Jemadu, “Jumlah Pengguna Media Sosial Indonesia Capai 191,4 Juta per 2022,”
Suara.com, 2022.
[12] F. Ratnawati, “Implementasi Algoritma Naive Bayes Terhadap Analisis Sentimen Opini Film pada Twitter,” INOVTEK Polbeng - Seri Inform., Vol. 3, No. 1, p. 50, 2018, doi:
10.35314/isi.v3i1.335.
[13] L. Dey, S. Chakraborty, A. Biswas, B. Bose, and S. Tiwari, “Sentiment Analysis of Review Datasets Using Naïve Bayes‘ and K-NN Classifier,” Int. J. Inf. Eng. Electron.
Bus., Vol. 8, No. 4, pp. 54–62, 2016, doi: 10.5815/ijieeb.2016.04.07.