• Tidak ada hasil yang ditemukan

PROPOSAL ANALISIS SENTIMEN UPAYA PEMERINTAH INDONESIA TERKAIT PENANGANAN KASUS COVID-19 MENGGUNAKAN ALGORITMA

N/A
N/A
Protected

Academic year: 2022

Membagikan "PROPOSAL ANALISIS SENTIMEN UPAYA PEMERINTAH INDONESIA TERKAIT PENANGANAN KASUS COVID-19 MENGGUNAKAN ALGORITMA"

Copied!
35
0
0

Teks penuh

(1)

PROPOSAL

ANALISIS SENTIMEN UPAYA PEMERINTAH INDONESIA TERKAIT PENANGANAN KASUS COVID-19 MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER DENGAN MEMANFAATKAN MEDIA

SOSIAL TWITTER

kan Sebagai Salah Satu Syarat Untuk Memperoleh Kekasih Hati dan Belahan Jiwa Pada Program Studi Teknik Informersitas Negeri Mana

Oleh

SHANIA GABRIELA KAPARANG 17 210 127

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK

UNIVERSITAS NEGERI MANADO 2020

(2)

i DAFTAR ISI

DAFTAR ISI ...i

DAFTAR TABEL ... iii

DAFTAR GAMBAR ... iv

BAB I ...1

PENDAHULUAN ...1

A. Latar Belakang Masalah ...1

B. Identifikasi Masalah ...5

C. Rumusan Masalah...5

D. Ruang Lingkup dan Batasan Masalah ...5

1. Ruang Lingkup ...5

2. Batasan Masalah ...6

E. Tujuan Penelitian ...6

F. Manfaat Penelitian ...6

BAB II ...8

LANDASAN TEORI ...8

A. Kajian Pustaka ...8

1. Text Mining ...8

2. Analisis Sentimen ...9

3. Media Sosial ... 10

4. Twitter... 11

5. Covid-19 ... 12

6. Naive Bayes Classifier... 14

B. Penelitian Yang Relevan ... 16

BAB III ... 21

METODOLOGI PENELITIAN ... 21

A. Teknik Pengumpulan Data... 21

B. Preprocessing... 22

C. Pembobotan Kata... 23

D. Metode Naïve Bayes Classifier ... 24

(3)

ii

E. Perhitungan Performa Sistem... 24 DAFTAR PUSTAKA ... 25

(4)

iii

DAFTAR TABEL

Tabel 2. 1 Penelitian yang Relevan... 16

(5)

iv

DAFTAR GAMBAR

Gambar 1 Grafik Perkembangan Kasus Covid-19 di Indonesia per 29 April 2020 ...2 Gambar 2 Flowchart Metodologi Penelitian ... 21

(6)

v

DAFTAR PERSAMAAN

Persamaan 1 Probabilitas Term ... 15 Persamaan 2 Vmap ... 15

(7)

1 BAB I PENDAHULUAN A. Latar Belakang Masalah

Dunia saat ini digemparkan dengan keberadaan virus yang menyerang organ pernafasan manusia. Organisasi Kesehatan Dunia atau World Health Organization (WHO) mengatakan bahwa virus corona berasal dari kelelawar di Cina pada akhir tahun 2019 dan itu bukan merupakan hasil manipulasi manusia atau laboratorium. WHO juga menetapkan Covid-19 sebagai global pandemic. Penetapan status pandemi menunjukkan bahwa corona adalah penyakit yang bisa menyerang siapa saja dan negara mana saja di dunia.

Tercatat lebih dari 114 negara telah terinfeksi dan menimbulkan korban meninggal yang cukup besar.(CNN, 2020) Pandemi corona ini masih berlangsung di berbagai negara di dunia, termasuk Indonesia. Jika sebelumnya Indonesia belum terdeteksi kasus virus corona hingga akhir Februari, kini Indonesia menjadi salah satu negara yang terkena virus ini. Pada 2 Maret 2020, Presiden Jokowi akhirnya mengumumkan kasus Covid-19 pertama di Indonesia.(CNN, 2020)

Dalam kurun waktu kurang dari 2 bulan, Indonesia tercatat memiliki kurang dari 10.000 kasus virus corona per tanggal 29 April 2020 yang dapat dilihat

(8)

2

pada grafik berikut.(Badan Nasional Penanggulangan Bencana, 2020)(Rohman, 2019).

Gambar 1 Grafik Perkembangan Kasus Covid-19 di Indonesia per 29 April 2020

Hal ini membuat Indonesia harus mengambil langkah cepat untuk menekan lajunya penyebaran virus corona. Dan langkah yang diambil adalah dengan mewajibkan para masyarakat untuk menerapkan social distancing dengan harapan meminimalisir penyebaran virus corona. Banyak yang beranggapan bahwa langkah ini tidak begitu efektif jika masyarakat tidak melakukannya dengan disiplin. Pemerintah dalam hal ini presiden sudah mengeluarkan Instruksi Presiden (Inpres) Nomor 4 Tahun 2020 Tentang Refocussing Kegiatan, Realokasi Anggaran serta Pengadaan Barang dan Jasa dalam rangka Percepatan Penanganan Corona Virus Disease 2019 (COVID-19), Salah satunya adalah realokasi anggaran kementerian dan lembaga hingga Rp 62,3 triliun.(Presiden dkk., 2020) Pemerintah juga melakukan langkah-langkah seperti rapid-test dan tes massal, mengadakan rumah sakit darurat Covid-19,

(9)

3

memesan obat-obatan untuk pengobatan pasien Covid-19, karantina wilayah, PSBB (Pembatasan Sosial Berskala Besar) yang dilakukan beberapa wilayah di Indonesia, larangan mudik lebaran dan lain-lain. Dengan bertambahnya kasus virus corona di Indonesia serta dampaknya dalam berbagai sektor seperti ekonomi, sosial, pariwisata dan sebagainya, pemerintah harus melakukan strategi yang tepat dan cepat untuk menanggulangi hal ini.

Namun permasalahannya, segala kebijakan dan strategi yang dilakukan oleh pemerintah tidak luput dari berbagai respon dan persepsi yang diberikan masyarakat juga pejabat tinggi negara. Ada persepsi masyarakat yang mengatakan bahwa pemerintah kurang cepat dan kurang efektif dalam menangani penyebaran, namun ada juga yang menganggap pemerintah cukup mampu dalam penanganan ini. Hal ini dapat kita lihat lewat survey yang ada atau lewat berbagai media sosial contohnya Twitter. Saya merupakan salah satu pengguna akun media sosial Twitter dan saya melakukan pengamatan tweet- tweet masyarakat, publik figur bahkan pejabat dalam menanggapi bagaimana upaya pemerintah dalam menangani pandemi ini. Lewat Twitter, segala bentuk pendapat-pendapat, pengalaman pengguna bahkan berbagai hal yang menarik perhatian atau yang bisa menjadi trending topic, dipublikasikan lewat teks, foto maupun video. Berikut adalah salah satu contoh tweet opini masyarakat (29 April 2020): Bun Tari @tari_bun Replying to @medcom_id “Iya benar, harus transparan dan merata, soalnya, banyak yg GK dpt, justru di komplek," elit dpt, orang miskin GK dpt”(Twitter, 2020). Dalam media sosial Twitter, kutipan yang ditulis diatas disebut tweet. Dengan berkembangnya teknologi sekarang,

(10)

4

tweet-tweet yang diunggah oleh para pengguna Twitter sudah bisa dianalisis apakah opini yang diberikan bersifat positif atau negatif (Hadna,dkk , 2016).

Analisis konten dan sentimen yang diungkapkan di Twitter pada tahap-tahap awal penyakit corona virus 2019 (Covid-19) akan sejajar dengan penyebaran penyakit dan dapat membantu memahami efek wabah pada perasaan, keyakinan, dan pikiran masyarakat umum. Pemahaman demikian akan memungkinkan kesempatan berskala besar untuk pendidikan dan penyebaran informasi yang tepat mengenai rekomendasi kesehatan masyarakat(Medford, dkk, 2020). Negara-negara lain seperti Arab Saudi dan Filipina sudah melakukan penelitian menggunakan analisis sentimen terkait respon masyarakatnya dalam media sosial Twitter. Dalam penelitian yang dilakukan Mohammed Alhajji, dkk yaitu “Sentiment analysis of tweets in Saudi Arabia regarding governmental preventive measures to contain COVID-19” terdapat 24,595 tweets yang dikumpulkan, 20,041 dinyatakan netral, 3,017 tweets (66.25%) merupakan tweets dengan sentimen positif dan 1,537 tweets (33.75%) adalah sentimen negatif, dimana sentiment positif lebih besar daripada sentiment negatif.(Alhajji, dkk, 2020)

Di dalam penelitian ini, peneliti menggunakan text-mining pengklasifikasian opini berupa analisis teks sentimen pada Twitter untuk melihat kinerja pemerintah dalam upaya penanganan kasus Covid-19 di Indonesia yang akan menghasilkan data analisis opini publik (positif maupun negatif) untuk membantu pemerintah dalam mengambil keputusan sebagai

(11)

5

bahan dalam mengeluarkan kebijakan publik terkait penanganan pandemi Covid-19 .

B. Identifikasi Masalah

Berdasarkan latar belakang, dapat diidentifikasi masalah sebagai berikut.

1. Banyaknya opini publik (baik positif maupun negatif) terkait upaya pemerintah dalam penanganan pandemi Covid-19 di Indonesia.

2. Belum adanya analisis sentimen publik terkait upaya pemerintah dalam penanganan pandemi Covid-19 di Indonesia.

C. Rumusan Masalah

Rumusan masalah dalam penelitian ini adalah bagaimana membuat analisis sentimen publik terhadap upaya pemerintah terkait penanganan kasus Covid- 19 di Indonesia melalui media Twitter?

D. Ruang Lingkup dan Batasan Masalah 1. Ruang Lingkup

Ruang lingkup penelitian ini adalah:

a. Penelitian ini menghasilkan analisis sentimen (sentimen positif maupun sentimen negatif) mengenai upaya pemerintah dalam penanganan kasus Covid-19 di Indonesia yang nantinya dapat digunakan dalam evaluasi penanganan kasus pandemi Covid-19 atau pengambilan keputusan dan kebijakan pemerintah.

b. Dalam penelitian ini juga akan diuji keakuratan dari pengklasifikasian tweet-tweet pengguna Twitter di Indonesia mengenai tanggapan

(12)

6

terhadap upaya pemerintah Indonesia dalam penanganan kasus Covid- 19 menggunakan algoritma Naïve Bayes.

2. Batasan Masalah

Penelitian ini memiliki batasan-batasan masalah, yakni:

a. Tidak melakukan perbandingan keakuratan algoritma, algoritma yang digunakan hanya Naïve Bayes.

b. Media sosial yang digunakan adalah Twitter

c. Data yang akan digunakan hanya berasal dari semua pengguna akun media sosial Twitter di Indonesia yang membuat atau mengirim tweets dalam jangka waktu 1 bulan yang sudah ditentukan peneliti.

d. Output dari penelitian ini berupa grafik dan penjelasan yang menampilkan nilai positif, nilai negatif maupun netral.

E. Tujuan Penelitian

Tujuan penelitian ini adalah untuk membuat pemodelan analisis sentimen mengenai upaya pemerintah dalam penanganan kasus Covid-19 di Indonesia yang dapat digunakan dalam evaluasi penanganan kasus pandemi Covid-19 atau pengambilan keputusan dan kebijakan pemerintah.

F. Manfaat Penelitian

Manfaat Penelitian ini adalah:

1. Bagi Penulis dalam penelitian ini dapat menambah pengetahuan mengenai text mining, analisis sentimen, bagaimana respon masyarakat terkait perkembangan kasus pandemic Covid-19 di Indonesia dan upaya pemerintah dalam penanganan kasus Covid-19 di Indonesia.

(13)

7

2. Bagi pemerintah yang berwenang juga dapat menjadi sumber data untuk mempertimbangkan atau mengambil keputusan dalam upaya penanganan kasus Covid-19 di Indonesia.

(14)

8 BAB II

LANDASAN TEORI A. Kajian Pustaka

1. Text Mining

Text mining merupakan salah satu teknik klasifikasi yang dapat digunakan dalam menggali informasi dari suatu rangkaian teks yang terdapat dalam sebuah dokumen.

Text mining merupakan variasi dari data mining yang berusaha menemukan pola yang menarik dari sekumpulan d ata tekstual yang berjumlah besar. Text mining dapat diartikan sebagai penemuan informasi yang baru dan tidak diketahui sebelumnya oleh komputer, secara otomatis mengekstrak informasi dari Sumber-sumber yang berbeda. Kunci dari proses ini adalah menggabungkan informasi yang berhasil diekstraksi dari berbagai sumber.(Ransi, dkk, 2017)

Text mining mengacu pada proses mengambil informasi berkualitas tinggi dari teks. Informasi berkualitas tinggi biasanya diperoleh melalui peramalan pola dan kecenderungan melalui sarana seperti pembelajaran pola statistik. Text mining biasanya melibatkan proses penataan teks input (biasanya parsing, bersama dengan penambahan beberapa fitur linguistik turunan dan penghilangan beberapa diantaranya, dan penyisipan subsequent ke dalam database), menentukan pola dalam data terstruktur, dan akhirnya mengevaluasi dan menginterpretasi output. Berkualitas

(15)

9

tinggi di bidang text mining biasanya mengacu ke beberapa kombinasi relevansi, kebaruan, dan interestingness.(Irene, 2014)

Jadi text mining dapat didefinisikan sebagai data dalam bentuk teks yang biasanya didapatkan dari suatu dokumen, yang bertujuan mencari teks atau kata yang menggambarkan maksud dari dokumen tersebut yang selanjutnya dilakukanlah analisa keterkaitan antar dokumen.

2. Analisis Sentimen

Menurut Nasukawa dan Yi, analisis sentimen adalah cara yang digunakan untuk mengidentifikasi sentiment berupa teks dan mengkategorikan sentiment tersebut sebagai sentimen positif maupun sentimen negatif.(W Riski, dkk, 2019)

Analisis sentimen dapat memberikan informasi kritis tentang persepsi risiko masyarakat. Pendekatan perhitungan menganalisis data tekstual untuk menafsirkan dan mengklasifikasikan emosi publik terhadap masalah apapun yang diberikan (misalnya. produk, peraturan, ukuran, dll)(Pang & Lee, 2008)

Di era media sosial, analisis sentimen dapat secara efisien menganalisis data yang jumlahnya berlebihan, yang sebagian besar bersifat pribadi, dapat diakses dan dianalisis dengan bebas. Faktanya, Twitter telah digunakan secara luas untuk pengawasan kesehatan masyarakat, dari pemantauan dan prediksi untuk mengukur respon publik(Jordan, dkk, 2019)

(16)

10

Jadi dapat diartikan analisis sentimen adalah sebuah proses klasifikasi kata/teks untuk mengkategorikan pendapat atau opini orang apakah termasuk dalam kategori positif atau negatif.

3. Media Sosial

Media sosial merupakan media online atau daring dengan memanfaatkan jaringan internet, para pengguna media sosial bisa dengan mudah saling berbagi dan berkomunikasi secara real time. Media sosial sudah tidak asing lagi pada era sekarang, hampir semua orang memiliki media sosial bahkan 1 orang bisa memiliki 2-3 akun media sosial. Media sosial dapat mendekatkan yang jauh dengan mudah dan cepat.

Berikut ini dapat dilihat ciri-ciri media sosial. Pertama, pesan yang disampaikan tidak hanya untuk satu orang tetapi lebih luas jangkauannya.

Contohnya pesan melalui SMS ataupun internet. Kedua, pesan yang disampaikan bebas atau tanpa harus melalui suatu Gatekeeper. Ketiga, pesan yang disampaikan cenderung lebih cepat dibanding media lainnya.

Keempat, penerima pesan yang menentukan waktu interaksi.(Gamble&

Terry, 2005)

Definisi lain dari sosial media juga di jelaskan oleh Van Dijk media sosial adalah platform media yang memfokuskan pada eksistensi pengguna yang memfasilitasi mereka dalam beraktivitas maupun berkolaborasi. Karena itu, media sosial dapat dilihat sebagai fasilitator online yang menguatkan hubungan antar pengguna sekaligus sebagai sebuah ikatan sosial.(Nasrullah, 2017)

(17)

11 4. Twitter

Twitter merupakan salah satu media sosial yang sering digunakan untuk berbagi pesan teks, foto, video, berita, informasi dll. Dari artikel yang diterbitkan Kominfo, pengguna Twitter, berdasarkan data PT Bakrie Telecom, memiliki 19,5 juta pengguna di Indonesia dari total 500 juta pengguna global. Twitter menjadi salah satu jejaring sosial paling besar di dunia sehingga mampu meraup keuntungan mencapai USD 145 juta.

Kebanyakan pengguna Twitter di Indonesia adalah konsumen, yaitu yang tidak memiliki Blog atau tidak pernah mengupload video di Youtube namun sering update status di Twitter dan Facebook. (Kementrian Komunikasi dan Informatika, 2020)

Twitter merupakan wadah untuk saling berbagi antar pengguna berupa teks, foto maupun video yang dapat diunggah kapanpun dan dimanapun sehingga para penggunanya dapat selalu terhubung. Dengan adanya Twitter, para penggunanya dengan mudah mengakses informasi- informasi dengan cepat dari berbagai negara. Bagi pengguna yang mengikuti (follow) suatu akun di Twitter, maka tweet dari akun tersebut akan muncul secara otomatis di beranda Twitter pengguna kecuali tweet tersebut bersifat private.

Beberapa istilah yang sering digunakan dalam Twitter:

1. Mention adalah suatu cara untuk membuat link terhadap akun Twitter atau menyebut akun pengguna lain. Mention memiliki simbol ‘@’ lalu disertai nama akun Twitter yang dipanggil. Biasanya mention

(18)

12

digunakan untuk membalas tweet atau ingin menandai ke akun pengguna lain.

2. Hashtag memiliki symbol “#” yang digunakan untuk mengindeks sebuah topik atau isu pembicaraan di Twitter agar pengguna dapat menemukan topik yang mereka inginkan dengan mudah. Hashtag juga bisa digunakan agar orang lain dapat dengan cepat menemukan tweet dari pengguna tersebut.

3. Emoticon, dahulu penggunaan emoticon di Twitter hanya berupa kombinasi huruf, angka atau tanda baca, namun emoticon sekarang sudah diperbaiki dan dalam bentuk gambar. Biasanya penggunaan emoticon untuk mengekspresikan perasaan dari pengguna.

4. Trending topic adalah tagar yang ramai dibahas dalam satu waktu di Twitter. Dimana kita bisa melihat isu yang ramai dibicarakan atau dibahas pada saat itu(Hadna, dkk, 2016)

Jadi dapat diartikan Twitter menjadi tempat atau media bagi para penggunanya untuk menyalurkan dan mengekspresikan apa yang mereka rasakan, alami, dan juga bisa membentuk sebuah percakapan dengan pengguna lain serta memberikan respon terhadap apa yang dunia sedang dialami melalui suatu peristiwa ataupun fenomena yang sementara terjadi.

5. Covid-19

Berdasarkan Groot,dkk dalam “Ninth Report of the International Committee on Taxonomy of Viruses” penyakit Coronavirus 2019 (COVID- 19) adalah penyakit menular yang disebabkan oleh sindroma pernafasan

(19)

13

akut yaitu Coronavirus 2 (SARS-CoV-2). SARS-CoV-2 dikenal sebagai subfamily Orthocoronavirinae, family Coronaviridae, order Nidovirales, dan realm Riboviria. Corona virus adalah sekelompok virus terkait yang menyebabkan penyakit pada mamalia dan burung. Pada manusia, corona virus menyebabkan infeksi saluran pernapasan yang dapat berkisar dari ringan sampai mematikan. Penyakit ringan mencakup beberapa kasus selesma, sedangkan varietas yang lebih mematikan dapat menyebabkan SARS, MERS, dan COVID-19. Belum ada vaksin atau obat anti virus untuk mencegah atau mengobati infeksi corona virus manusia.(Setiawan, 2020) Masih sama dengan penjelasan diatas, menurut situs WHO, Gejala COVID-19 yang ditunjukkan oleh pasien umumnya adalah demam, lemah akibat kelelahan, dan batuk kering. Ada juga beberapa pasien yang mengalami sakit dan nyeri di sekujur tubuh, pilek dan hidung tersumbat, merasakan sakit di tenggorokan atau gangguan pencernaan. Setelah virus mengalami inkubasi di dalam tubuh, pasien akan mengalami gejala dengan bertahap dari hari ke hari, dari yang bersifat ringan sampai berat tergantung kekebalan atau sistem imun tubuh. Tapi ada juga mereka yang terinfeksi virus corona tapi tidak mengalami gejala apa-apa, mereka disebut Orang Tanpa Gejala (OTG). Sekitaran 80% orang bisa sembuh dari penyakit ini tanpa perlu penanganan khusus, tetapi diwajibkan untuk karantina atau isolasi diri agar tidak menular ke orang lain disekitar mereka. 1 orang dari 6 orang yang terjangkit virus ini mengalami sesak nafas dan memerlukan penanganan khusus. Mereka yang mempunyai penyakit bawaan atau

(20)

14

riwayat medis akan lebih mudah terjangkit dan mengalami gejala yang serius. Orang dengan demam, batuk dan kesulitan bernapas harus mendapat perhatian medis. Menurut WHO, virus corona COVID-19 menyebar orang ke orang melalui tetesan kecil dari hidung atau mulut yang menyebar ketika seseorang batuk atau menghembuskan nafas. Tetesan ini kemudian jatuh ke benda yang disentuh oleh orang lain. Orang tersebut kemudian menyentuh mata, hidung, atau mulut. Berdasarkan studi yang ada saat ini belum ditemukan penyebaran COVID-19 melalui udara bebas.(Budiansyah, 2020)

6. Naive Bayes Classifier

Naive Bayes Classifier adalah salah satu algoritma yang populer digunakan untuk keperluan data mining karena kemudahan penggunaannya serta waktu pemrosesan yang cepat, mudah diimplementasikan dengan strukturnya yang cukup sederhana dan tingkat efektifitas yang tinggi.(Taheri, dkk, 2013)

Dengan bahasa yang lebih sederhana, Naive Bayes Classifier mengasumsikan bahwa keberadaan maupun ketidakberadaan sebuah fitur dalam sebuah kelas tidak memiliki keterkaitan dengan keberadaan maupun ketidakberadaan fitur lainnya. Sebagai contoh, sesuatu yang berwarna merah, bulat dan memiliki diameter sekitar 10 cm bisa dikategorikan sebagai buah apel. Walaupun fitur ini bergantung antara satu dengan yang lainnya, Naive Bayes Classifier akan tetap menganggap bahwa fitur-fitur

(21)

15

tersebut independen dan tidak memiliki pengaruh satu sama lainnya.(Rocha, 2006)

Berikut adalah algoritma dari metode Naïve Bayes Classifier:

Dalam proses membangun sistem pengklasifikasi menggunakan NB terdapat 2 tahapan yang dilakukan. Tahap pertama adalah proses pelatihan (training) dan tahap yang kedua adalah proses pengujian (testing).(Artanti, dkk, 2018)

1. Tahap Training (Pelatihan)

Langkah tahap training menggunakan NB adalah:

1) Menentukan probabilitas kategori dari data latih 2) Menghitung probabilitas kata (TFIDF) dari data latih 3) Menghitung probabilitas untuk setiap kelas data latih

𝑃(𝑤𝑘) = 𝑝𝑘 + 1 𝑛 + |𝑣𝑜𝑐𝑎𝑏|

Persamaan 1 Probabilitas Term

Dimana:

P(wk) : Probabilitas term

Pk+1 : Query + 1 agar hasil tidak nol

n : jumlah kata yang muncul di outcome dok |vocab| : total kata keseluruhan

2. Tahap Testing (Pengujian)

Langkah tahap testing menggunakan NB adalah:

1) Menemukan Vmap untuk setiap data uji 𝑉𝑚𝑎𝑝 = 𝑃(𝑤𝑘|𝑐). 𝑃(𝑐)

Persamaan 2 Vmap 2) Menentukan Vmap maksimum

3) Diketahui model klasifikasinya 4) Diperoleh kelas prediksi

(22)

16 B. Penelitian Yang Relevan

Text Mining dan Analisis Sentimen merupakan subjek/bidang penelitian yang sudah banyak peminatnya, hal ini karena semakin maraknya penggunaan media sosial seperti Facebook, Twitter, Instagram dan media sosial lainnya, sehingga sudah terkumpul data yang sangat besar untuk dijadikan penelitian. Salah satu pemanfaatan data ini adalah untuk mengetahui opini atau sentimen pengguna jejaring sosial terhadap suatu topik. Karena dari hasil analisa sentimen tersebut bisa didapatkan suatu pengetahuan yang baru yang dapat digunakan untuk membuat suatu keputusan.(Wardhani, 2017) Berikut contoh penelitian-penelitian yang relevan:

Tabel 2. 1 Penelitian yang Relevan

No Judul Peneliti Tahun Deskripsi

1 Sentiment analysis of tweets in Saudi Arabia regarding governmental preventive

measures to contain COVID-19

Mohammed Alhajji, PhD, MPH.

Abdullah Al Khalifah, MBBS, MAS.

Mohammed Jawad Aljubran

2020 Hasil penelitian ini adalah terdapat 24,595

tweets yang

dikumpulkan, 20,041 dinyatakan netral, 3,017 tweets (66.25%) merupakan tweets dengan sentimen positif dan 1,537 tweets (33.75%) adalah

(23)

17 MSc.

Mohammed Alkhalifah, MD, FACEP

sentimen negatif, dimana sentiment positif lebih besar daripada sentiment negatif

2 Analisis Text Mining dari Cuitan Twitter Mengenai Infrastruktur di Indonesia dengan Metode Klasifikasi Naïve Bayes

Bimananda Wa, Insan Riskia, Karina Dwia, Rani Nooraenia, Theresa Siahaana, Yosherina Dheaa

2019 Diperoleh hasil bahwa proporsi sentimen negatif lebih besar dibandingkan dengan sentimen positif. Selain

itu, hasil

pengklasifikasian

dengan menggunakan metode Naïve Bayes diperoleh model yang paling baik pada model bandara dengan akurasi sebesar 82%, presisi sebesar 0,84 dan recall sebesar 0,48.

3 Analisis Sentimen Tentang Opini Pilkada Dki 2017

Agnes Rossi Trisna

2017 Dari hasil pengujian akurasi, diperoleh 68,52%

untuk kondisi pembobotan

(24)

18 Pada Dokumen

Twitter Berbahasa Indonesia

Menggunakan Näive Bayes dan Pembobotan Emoji.

Lestari, Rizal Setya Perdana, M.

Ali Fauzi

tekstual, 75,93% untuk pembobotan non-tesktual, dan 74,81% untuk kondisi penggabungan dengan nilai konstanta 0,5 untuk tekstual dan 0,5 untuk non-tekstual. Dari hasil

pengujian pengaruh

pembobotan non-tesktual

disimpulkan bahwa

pembobotan non-tekstual berpengaruh terhadap

akurasi dan

pengklasifikasian, dengan komposisi konstanta pengali terbaik ketika α=0,4 dan β=0,6 sampai

dengan α=0,1 dan

β=0,9.(Rossi, dkk, 2017)

4 PERANCANGAN

SISTEM ANALISIS SENTIMEN KOMENTAR

Evasaria M.

Sipayung, Herastia Maharani,

2016 Hasil dari penelitian yang dilakukan mendapatkan enam kategori yang ditinjau dengan 55 keyword kata benda, terdapat 120 keyword

(25)

19 PELANGGAN

MENGGUNAKAN METODE NAIVE BAYES

CLASSIFIER

Ivan Zefanya

sentimen dengan 66 kata sentimen positif dan 54 kata sentimen negatif.

Hasil pengolahan

terhadap175 data latih disimpulkan bahwa hasil klasifikasi sentimen yang didapat adalah sentimen positif sebanyak 155 komentar dan sentimen negatif sebanyak 20

komentar. Kategori

sentimen positif terbesar adalah kategori kamar sebesar 73 komentar dan kategori dengan sentimen negatif terbesar adalah kategori kamar sebesar 17 komentar. Tingkat akurasi dalam penentuan kategori adalah sebesar 77.14% dan 75.42% dalam penentuan sentimen memiliki tingkat precision 99.12% dan recall 72.9%

(26)

20

Meskipun penelitian belum dilakukan dan belum memiliki output, dengan adanya penelitian yang relevan maka diprediksi output yang akan dihasilkan berupa sentiment positif dan negatif terkait upaya pemerintah dalam penanganan. Dimana hasil penelitian ini bisa menjadi evaluasi bagi pemerintah dalam penanganan kasus Covid-19 di Indonesia. Karena perlu dipahami bahwa kebijakan yang diambil pemerintah bukan sekedar pemikiran logika saja tetapi berdasarkan kenyataan yang dialami oleh masyarakat. Dengan adanya penelitian ini maka dapat menjawab opini-opini masyarakat terkait penanganan kasus ini, dimana pemerintah bisa memiliki bahan pertimbangan untuk mengambil kebijakan demi kepentingan masyarakat serta bangsa dan negara.

Perbedaannya dengan penelitian relevan yang terdapat pada table diatas yaitu objek penelitiannya, dalam penelitian ini objeknya adalah opini masyarakat dalam bentuk tweet-tweet yang membahas tentang upaya pemerintah dalam penanganan kasus Covid-19 sedangkan penelitian relevan lain memiliki objek penelitian yang berbeda. Ada juga penelitian relevan yang hampir sama namun cakupan wilayah dan kasus Covid-19 yang berbeda.

(27)

21 BAB III

METODOLOGI PENELITIAN Berikut adalah alur diagram metodologi penelitian:

Gambar 2 Flowchart Metodologi Penelitian

A. Teknik Pengumpulan Data

Tahap pertama yang dilakukan dalam analisis sentimen adalah pengumpulan data. Data di ambil dari media sosial Twitter. Twitter mempermudah para pengembang dengan menyediakan API (Application Programming Interface) dalam pengambilan data.

Setelah data berhasil dikumpulkan menjadi sebuah dataset, tahap selanjutnya adalah pelabelan. Pelabelan di sini ditujukan untuk membagi data ke dalam beberapa kelas sentimen yang akan digunakan dalam penelitian.

Jumlah kelas sentimen yang banyak digunakan adalah dua dan tiga kelas, yaitu negatif, netral dan positif. Tujuan dari proses pelabelan ini adalah membagi dataset menjadi 2 bagian, yaitu menjadi training data dan testing data.

Training data adalah data yang digunakan untuk melatih sistem agar mampu mengenali pola yang sedang dicari, sedangkan testing data adalah data yang digunakan untuk menguji hasil pelatihan yang sudah dilakukan. Untuk

(28)

22

melakukan pembagian, salah satu metode yang bisa digunakan adalah n-fold cross validation yang akan dijelaskan pada poin selanjutnya.

B. Preprocessing

Setelah dilakukan pelabelan data, tahap selanjutnya yang harus dilalui adalah preprocessing. Tahap ini adalah tahapan di mana data disiapkan agar menjadi data yang siap untuk dianalisis. Ada beberapa tahap dalam preprocessing ini, antara lain tokenization, cleansing dan filtering. Berikut ini adalah penjelasan secara rinci tentang tahap preprocessing.

- Tokenisasi adalah sebuah proses yang dilakukan untuk memotong atau memecah kalimat menjadi beberapa bagian atau kata. Hasil dari pemotongan ini disebut dengan token. Pada beberapa kasus, proses tokenisasi juga dilakukan dengan membuang tanda baca yang tidak diperlukan. Ada beberapa model tokenization yang bisa digunakan, yaitu unigram, bigram, trigram dan ngram. (Manning, dkk, 2009)

- Cleansing adalah suatu tahap di mana karakter maupun tanda baca yang tidak diperlukan dibuang dari teks. Contoh karakter yang dibuang adalah tanda seru, tanda tanya, koma dan titik.

- Filtering adalah tahap menghilangkan katakata yang muncul dalam jumlah besar, namun dianggap tidak memiliki makna (stopwords). Pada dasarnya, stop words list adalah sekumpulan katakata yang banyak digunakan dalam berbagai bahasa. Alasan penghapusan stop words dalam banyak program aplikasi yang berkaitan dengan text mining adalah karena penggunaannya

(29)

23

yang terlalu umum, sehingga pengguna dapat berfokus pada kata-kata lain yang jauh lebih penting.(Ganesan, 2015)

C. Pembobotan Kata

Pembobotan kata adalah suatu mekanisme untuk memberikan skor terhadap frekuensi kemunculan sebuah kata dalam dokumen teks. Salah satu metode populer untuk melakukan pembobotan kata adalah TF-IDF (Term Frequency-Inverse Document Frequency). Term Frequency–Inverse Document Frequency adalah sebuah metode pembobotan yang menggabungkan dua konsep, yaitu Term Frequency dan Document Frequency (Adji, dkk, 2015). Term Frequency adalah konsep pembobotan dengan mencari seberapa sering (frekuensi) munculnya sebuah term dalam satu dokumen(Huang & Wu, 2013). Dikarenakan setiap dokumen memiliki panjang yang berbeda-beda, bisa saja terjadi sebuah kata muncul lebih banyak di dokumen yang panjang dibandingkan dengan dokumen-dokumen yang pendek. Dengan demikian, term frequency sering dibagi dengan panjangnya dokumen (total kata yang ada di dokumen tersebut). Sedangkan Document Frequency adalah banyaknya jumlah dokumen di mana sebuah term itu muncul. Semakin kecil frekuensi kemunculannya, maka semakin kecil pula nilai bobotnya. Ketika proses perhitungan term frequency, semua kata di dalamnya dianggap sama pentingnya. Namun, terdapat kata yang sebenarnya kurang penting dan tidak perlu diperhitungkan seperti “di-”,

“ke-”, “dan” dan lain sebagainya. Oleh sebab itu, kata-kata yang kurang

(30)

24

penting tersebut perlu dikurangi bobotnya dan menambah bobot kata penting lainnya. Inilah ide dasar mengapa diperlukan stopword.

D. Metode Naïve Bayes Classifier

Proses selanjutnya yaitu klasifikasi dengan menggunakan metode Naïve Bayes. Dalam tahap ini dilakukan untuk membentuk model klasifikasi yang nantinya akan digunakan untuk mengklasifikasikan data uji X agar mendapat label Y

Secara umum proses yang dilakukan dalam klasifikasi naïve bayes adalah:

1. Mencari nilai peluang dari setiap kategori dokumen

2. Mencari nilai peluang kemunculan dari masing-masing kata pada masing-masing kategori dokumen

3. Menentukan kategori dokumen uji berdasarkan perhitungan dari proses pertama dan kedua.

E. Perhitungan Performa Sistem

Setelah data uji selesai diklasifikasikan, maka dilakukan perhitungan performa sistem yang terdiri dari akurasi, presisi, recall dan f- measure dengan confusion matrix.(Hakimi, 2018)

(31)

25

DAFTAR PUSTAKA

Adib Rifqi Setiawan. (2020). Scientific Literacy Worksheets for Distance Learning in the Topic of Coronavirus 2019 (COVID-19. 2019(February 2019), 1–13.

Alhajji, Mohammed, Abdullah , Mohammed, M. . (2020). Sentiment analysis of tweets in Saudi Arabia regarding governmental preventive measures to contain COVID-19. Preprints, (April), 16.

https://doi.org/10.20944/preprints202004.0031.v1

Artanti, D. P., Syukur, A., Prihandono, A., & Setiadi, D. R. I. M. (2018). Analisa Sentimen Untuk Penilaian Pelayanan Situs Belanja Online Menggunakan Algoritma Naïve Bayes. 8–9.

B, G. A., Adji, B. T. B., , S.T., M.T., M.Eng, P. ., & Adhistya Erna Permanasari., S.T., M.T., P. . (2015). ANALISIS SENTIMEN CALON PRESIDEN INDONESIA 2014 DENGAN LIMA CLASS ATTRIBUTE (Universitas Gadjah Mada). Diambil dari

http://etd.repository.ugm.ac.id/home/detail_pencarian/80122

Badan Nasional Penanggulangan Bencana. (2020). Situasi Virus Corona – Covid19. 2020.

Budiansyah, A. (2020). Apa Itu Virus Corona dan Cirinya Menurut Situs WHO.

CNBC Indonesia. Diambil dari

https://www.cnbcindonesia.com/tech/20200316135138-37-145175/apa-itu- virus-corona-dan-cirinya-menurut-situs-who

CNN. (2020a). Jokowi Umumkan Dua WNI Positif Corona di Indonesia.

(32)

26 Www.Cnnindonesia.Com. Diambil dari

https://www.cnnindonesia.com/nasional/20200302111534-20- 479660/jokowi-umumkan-dua-wni-positif-corona-di-indonesia

CNN. (2020b). Status Pandemi WHO, Pemerintah Naikkan Kewaspadaan.

Darwis Dzikril Hakimi, F. (2018). Sistem Analisis Sentimen Publik Tentang Opini Pemilihan Kepala Daerah Jawa Timur 2018 Pada Dokumen Twitter Menggunakan Naive Bayes Classifier. Universitas Islam Negeri Sunan Ampel Surabaya.

Gamble, Terry, M. (2005). Communication Works.

Ganesan, K. (2015). A Brief Note on Stop Words for Text Mining and Retrieval.

Diambil dari http://www.text-analytics101.com/2014/10/allabout-stop- words-for-text-mining.html.

Hadna, M. S., Santosa, P. I., & Winarno, W. W. (2016). Studi Literatur Tentang Perbandingan Metode Untuk Proses Analisis Sentimen Di Twitter. Seminar Nasional Teknologi Informasi dan Komunikasi, 2016(Sentika), 57–64.

Diambil dari https://fti.uajy.ac.id/sentika/publikasi/makalah/2016/95.pdf Huang, X., & Wu, Q. (2013). Micro-blog commercial word extraction based on

improved TF-IDF algorithm. 2013 IEEE International Conference of IEEE Region 10 (TENCON 2013), 1–5.

https://doi.org/10.1109/TENCON.2013.6718884

Irene, W. (2014). Penerapan Algoritma C5.0 Dalam Pengklasifikaian Data Mahasiswa Universitas Negeri Gorontalo. Universitas Negeri Gorontalo.

Jordan, S. E., Hovet, S. E., Fung, I. C. H., Liang, H., Fu, K. W., & Tse, Z. T. H.

(33)

27

(2019). Using Twitter for public health surveillance from monitoring and prediction to public response. 4(1), 6.

Kementrian Komunikasi dan Informatika. (2020). Pengguna Internet di Indonesia 63 Juta Orang. Diambil dari

https://kominfo.go.id/index.php/content/detail/3415/Kominfo+%3A+Penggu na+Intern et+di+Indonesia+63+Juta+Orang/0/berita_satker

Manning, C. ., Raghavan, P., & Schutze, H. (2009). An Introduction to Information Retrieval.

Medford, R. J., Saleh, S. N., Sumarsono, A., Perl, T. M., & Lehmann, C. U.

(2020). An “Infodemic”: Leveraging High-Volume Twitter Data to Understand Public Sentiment for the COVID-19 Outbreak. medRxiv, 2020.04.03.20052936. https://doi.org/10.1101/2020.04.03.20052936

Pang, P., & Lee, L. (2008). Opinion Mining and Sentiment Analysis, Foundations and Trends in Information Retrieval. Vol. 2(No. 1-2), 1–135.

Presiden, I., Indonesia, R., Ang, T., Pengadaan, S., Dan, B., Dalam, J., …

Indonesia, P. R. (2020). Instruksi presiden republik indonesia nomor 4 tahun 2020 tent ang. (022698), 22698–22701.

R, R. A. de. (2006). Naive Bayes Classifier Teaching Material. In Material (hal.

1–9). Diambil dari http://www.ic.unicamp.br/~rocha/teaching/201 1s2/mc906/aulas/naive-bayes-classifier.pdf

Ransi, N., & Nangi, J. (2017). Text mining. 3(2), 187–194.

Rossi, A., Lestari, T., Setya Perdana, R., & Fauzi, M. A. (2017). Analisis Sentimen Tentang Opini Pilkada DKI 2017 Pada Dokumen Twitter

(34)

28

Berbahasa Indonesia Menggunakan Näive Bayes dan Pembobotan Emoji.

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 1(12), 1718–1724. Diambil dari http://j-ptiik.ub.ac.id

Rulli Nasrullah. (2017). Media Sosial : Perspektif Komunikasi, Budaya, dan Sosioteknologi. Bandung: Remaja Rosdakarya.

Taheri, Sona and Mammadov, M. (2013). Learning the naive Bayes classifier with optimization models. International Journal of Applied Mathematics and Computer Science, 23(4), 787–795.

Taufiq Rohman, S.Pd.I, M. P. (2019). Kasus Perkembangan Covid -19 Di Indonesia per 29 April 2020. In Psikologi Perkembangan.

https://doi.org/10.1017/CBO9781107415324.004

Twitter. MedcomID on Twitter_ _Pemprov DKI Diminta Lebih Transparan dalam Penyaluran Bansos https___t. , (2020).

W, B., Riski, I., Dwi, K., Nooraeni, R., Siahaan, T., & Dhea, Y. (2019). Analisis Text Mining dari Cuitan Twitter Mengenai Infrastruktur di Indonesia dengan Metode Klasifikasi Naïve Bayes. Eigen Mathematics Journal, 1(2), 92.

https://doi.org/10.29303/emj.v1i2.36

Wardhani, P. A. (2017). IMPLEMENTASI APLIKASI TEXT MINING TERHADAP PENDAPAT NETIZEN DI SOCIAL MEDIA

MENGGUNAKAN ALGORITMA NAIVE BAYES DENGAN

PARAMETER DINAMIS. Efikasi Diri dan Pemahaman Konsep IPA dengan Hasil Belajar Ilmu Pengetahuan Alam Siswa Sekolah Dasar Negeri Kota Bengkulu, 6, 4–24. https://doi.org/10.1017/CBO9781107415324.004

(35)

29

Referensi

Dokumen terkait

Selain itu, tweet dengan bahasa asing akan dihapus, karena data yang digunakan dalam penelitian ini adalah data Twitter Bahasa Indonesia, menghilangkan link URL

Puji syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga penyusunan skripsi yang berjudul “Analisis Sentimen Tindakan

Hal yang dilakukan dalam penelitian ini adalah melakukan text mining pada postingan mengenai sistem e-Tilang pada media sosial Twitter menggunakan algoritma

Tujuan dari penelitian ini yaitu untuk melihat kecenderungan pendapat atau opini seseorang terhadap sebuah topik dengan menerapkan metode word embedding dan algoritma Long Short-Term

iii HALAMAN PENGESAHAN Judul :Implementasi Text Mining untuk Analisis Sentimen Protokol Kesehatan di Indonesia Menggunakan Algoritma K-Nearest Neighbor Nama : Fidya Farasalsabila

Dalam dunia pemerintahan, opinion mining dapat digunakan untuk menganalisis secara otomatis bagaimana opini masyarakat terhadap kebijakan atau sistem pemerintah yang sedang berjalan..

Untuk melakukan penanganan data tidak seimbang dengan metode kombinasi SMOTE dan Tomek Links maka dalam kasus ini, data sentimen yang berupa teks, terlebih dahulu diubah menjadi

Dengan menggunakan teks berbahasa Indonesia dari platform media sosial Twitter, penelitian ini memanfaatkan opini masyarakat dalam tweet tersebut untuk analisis sentimen masyarakat