ANALISIS SENTIMEN MASYARAKAT MENGENAI
“KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19” DENGAN MENGGUNAKAN
MOTODE NAÏVE BAYES PADA MEDIA SOSIAL FACEBOOK DAN TWITTER
S K R I P S I
REZA HARJADINATA F1E116008
PROGRAM STUDI SISTEM INFORMASI
FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS JAMBI
2022
ii
SURAT PERNYATAAN
Dengan ini saya menyatakan bahwa skripsi ini benar – benar karya sendiri. Sepanjang pengetahuan saya tidak terdapat karya atau pendapat yang ditulis atau diterbitkan orang lain kecuali sebagai acuan atau kutipan dengan mengikuti tata penulisan karya ilniah yang telah lazim.
Tanda tangan yang tertera dalam halaman pengesahan ini adalah asli. Jika tidak asli, saya siap menerima sanksi sesuai dengan peraturan yang berlaku.
Jambi, 2022 Yang menyatakan
Reza Harjadinata
F1E116008
iii
MENANGGAPI COVID-19” DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOSIAL
FACEBOOK DAN TWITTER
S K R I P S I
Diajukan sebagai salah satu syarat dalam melakukan penelitian dalam rangka penulisan Skripsi pada Program Studi Sistem Informasi
REZA HARJADINATA F1E116008
PROGRAM STUDI SISTEM INFORMASI
FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS JAMBI
2022
iv PENGESAHAN
Skripsi dengan judul ANALISIS SENTIMEN MASYARAKAT MENGENAI “KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19” DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOSIAL FACEBOOK DAN TWITTER yang disuun oleh REZA HARJADINATA, NIM:
F1E116008 telah dipertahankan di depan tim penguji
Susunan tim penguji Ketua ………: Dedy Setiawan, S.Kom., M.IT.
Sekretaris …: Ulfa Khaira, S.Komp., M.Kom Anggota ……: 1. Tri Suratno, S.Kom., M.Kom
.2. Daniel Arsa, S.Kom., M.S.I
.3. Rizqa Raaiqa Bintana, S.T., M.Kom
Disetujui:
Pembimbing Utama Pembimbing Pendamping
Tri Suratno, S.Kom., M.Kom Daniel Arsa, S.Kom., M.S.I NIP. 198310302006041002 NIP. 1989062920190310075
1996000000Diketahui:
Dekan
Fakultas sains dan teknologi
Drs. Jefri Marzal, M.Sc., D.I.T.
NIP. 196806021993031004
Ketua Jurusan Teknik elektro dan
Nehru, S.Si., M.T.
NIP. 197602082001121002
v RIWAYAT HIDUP
REZA HARJADINATA lahir di Sungai Tutung, kecamatan air hangat timur, kabupaten kerinci jambi pada tanggal 04 januari 1999. Penulis merupakan anak kedua dari dua bersaudara dari pasangan Rijal Adli dan Erni Yenti.
Jalur pendidikan formal yang ditempuh penulis adalah sebagai berikut :
1. SDN 269/III Sungai tutung, 2004-2010 2. MTsN Model Kota sungai penuh, 2010-2013 3. SMAN 1 Kota Sungai Penuh, 2013-2016
Universitas Jambi, Saat ini menempuh semester 13 di program studi
Sistem informasi, fakultas sains dan teknologi. Selama menempuh pendidikan
jenjang S1, penulis cukup aktif dalam bidang akademik. Penulis mengikuti
kegiatan magang di PT. PERTAMINA EP Asset 1 Field Jambi.
vi PRAKATA
Puji dan syukur penulis panjatkan atas berkat dan rahmat Allah SWT yang telah memberikan rahmat dan karunia-Nya, sehingga terselesaikannya skripsi yang berjudul “ANALISIS SENTIMEN MASYARAKAT MENGENAI
‘KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19’
DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOCIAL FACEBOOK DAN TWITTER”
Penulis menyadari sangatlah sulit bagi penulis untuk menyelesaikan laporan ini tanpa bantuan dan bimbingan dari berbagai pihak, terlebih kepada kedua pembimbing saya, yaitu bapak Tri Suratno, S.Kom., M.Kom. selaku pembimbing utama dan bapak Daniel Arsa, S.Kom., M.S.I. selaku pembimbing pendamping saya juga kepada Edi Saputra, S.T., M.Sc. selaku pembimbing akademik saya. Tidak lupa pula dengan segala rasa hormat penulis ucapkan terimakasih kepada:
1. Orang tua beserta keluarga besar saya atas kasih sayang, dukungan dan doanya sehingga dapat menyelesaikan Tugas Akhir ini dengan baik.
2. Seluruh dosen pengajar Program Studi Sistem Informasi Fakultas Sains dan Teknologi.
3. Keluarga besar HIMASI Unja (Himpunan Mahasiswa Sistem Informasi Unja), sebagai wadah yang membawahi mahasiswa Sistem Informasi Fakultas Sains dan Teknologi, terimakasih atas kebersamaan,
kekeluargaan, kekompakan, keceriaan dan pelajaran berharga lainnya selama 6 tahun ini.
4. Teman-teman Sistem Informasi UNJA Angkatan 2016 yang bersama-sama menjadi pejuang gelar S.Kom dan Toga UNJA, terimakasih semangatnya.
5. Serta semua pihak lainya yang tidak bisa dituliskan penulis satu per satu yang telah membantu selama pembuatan Tugas Akhir ini.
Demikian Tugas Akhir ini, penulis mengucapkan terima kasih kepada
semua pihak yang telah memberikan bantuan baik moril maupun materil
sehingga tugas akhir ini dapat diselesaikan. Penulis menyadari bahwa tugas
akhir ini masih jauh dari kata sempurna dan masih banyak kekurangan. Hal
tersebut dikarenakan keterbatasan ilmu dan pengetahuan yang dimiliki penulis
semata. Oleh karena itu penulis mengharapkan kritik dan saran dari pembaca
vii yang membutuhkan. Akhir kata, semoga Allah SWT senantiasa melimpahkan rahmat serta hidayah-Nya kepada kita semua, Amin amin ya robbal ‘alamiin.
Jambi, Januari 2023
Reza Harjadinata
F1E116008
viii DAFTAR ISI
DAFTAR ISI ... viii
DAFTAR GAMBAR ... x
BAB I PENDAHULUAN ... 1
1.1. LATAR BELAKANG ... 1
1.2. RUMUSAN MASALAH ... 4
1.3. BATASAN MASALAHA... 5
1.4. TUJUAN PENELITIAN ... 5
1.5. MANFAAT PENELITIAN ... 5
BAB II TINJAUAN PUSTAKA ... 6
2.1. Data minning ... 6
2.2. Text mining ... 6
2.3. Text processing ... 7
2.4. Analisis sentiment ... 9
2.5. Naïve Bayes Classifer ... 10
2.6. Confusion matrix ... 11
2.7. Media sosial ... 12
2.8. Facebook & Twitter ... 13
2.9. Pemerintah dan Kebijakan Pemerintah ... 13
2.10. Covid – 19 ... 18
2.11. Penelitian terdahulu ... 18
BAB III METODOLOGI PENELITIAN ... 21
3. 1. Tempat dan Waktu penelitian ... 21
3. 2. Bahan dan Alat penelitian ... 21
3. 3. Kerangka kerja penelitian ... 21
3. 4. Metode analisis data ... 22
BAB IV HASIL DAN PEMBAHASAN ... 26
4.1. Pengumpulan Data ... 26
4.2. Praprocess Data ... 30
4.3. Pengolahan data ... 32
4.4. Pembobotan TF-IDF ... 34
4.5. PEMBAHASAN ... 35
4.6. Perhitungan Akurasi... 35
BAB V KESIMPULAN DAN SARAN ... 42
ix
DAFTAR PUSTAKA ... 43
Lampiran ... 45
x DAFTAR GAMBAR
Gambar Halaman
1. Contoh Tokenization ……….……….….. 11
2. Contoh Steamming ………...………..…….. 11
3. Flow Chart Analisis Data .………...…... 12
4. Pencarian pada twitter.com………...…... 13
5. Pencarian pada facebook.com………...…... 14
6. Tampilan pluggin data miner ………...…... 14
7. Proses selector pada halaman web ………...…... 15
8. Proses scraping pada halaman web………...…... 15
9. Proses pengunduhan data ……….………...…... 16
10. Data dalam format Microsoft office excel ………...…... 16
11. Menu Remove duplicates pada Microsoft office excel………...…... 17
12. Column-c sebagai acuan………...…... 18
13. Konversi format dengan bantuan beautifultool.com ………...…... 18
14. Data dalam format JSON………...…... 19
15. Pengahpusan Punctation ………...…... 19
16. Stopward removal……...………...…... 20
17. Hasil Stemming………...………...…... 21
18. Hasil pembobotan TF-IDF………...…... 21
19. Hasil analisis sentiment .………...…... 22
BAB I PENDAHULUAN 1.1. LATAR BELAKANG
Perkembangan teknologi informasi dan komunikasi yang sangat cepat ditandai dengan salah satunya oleh perkembagan alat – alat teknologi komunikasi dan informasi, cepatnya perkembagan teknologi komunikasi ini dapat dilihat melalui internet yang sudah tersebar seluruh Indonesia maupun diseluruh dunia.
Internet di Indonesia cukup pesat, hal ini dibuktikan dengan semakin mudahnya akses internet dengan semakin banyaknya akses wireless yang beredar, perkembangan teknologi smartphone, dan teknologi jaringan membuat masyarakat lebih mudah dan cepat mengakses informasi melalui internet.
Kemudahan akses internet ini mengubah kebiasaan masyarakat yang biasanya mengakses informasi melalui media cetak menjadi melalui internet. Dengan berkembang pesatnya teknologi di Indonesia, memiliki banyak dampak yang mempengaruhi budaya dan kebiasaan masyarakat Indonesia salah satunya yaitu bersosialisasi. Dengan lahirnya media sosial interaksi sosial antar individu dapat dilakukan tanpa perlu terjadinya kontak fisik. Dalam penggunaannya, media sosial selain sebagai alat komunikasi juga digunakan sebagai tempat menyampaikan opini, pendapat, komentar, tanggapan ataupun tulisan lain sebagainya. Terdapat berbagai macam platform yang memungkinakan penggunanya mem-publish tulisan mereka, contoh media sosial yang sering digunkan yaitu facebook, Instagram, dan twitter.
Jejaring sosial yang sedang populer dikalangan pengguna internet saat ini adalah Twitter. Perkembangan penggunaan Twitter sangat cepat. Hal ini berdasarkan hasil survey PeerReach yang dilansir situs Kompas.com pada 9 Febuari 2019 yaitu terdapat lebih dari 126 juta pengguna aktif setiap hari nya diseluruh dunia bersama-sama mengirimkan 250 juta tweet setiap hari.
Pengguna Twitter berasal dari Indonesia, Indonesia menjadi yang terbanyak
ketiga didunia. Kesederhanaan dan kemudahan dalam penggunaan merupakan
beberapa alasan mengapa Twitter lebih digemari masyarakat Indonesia dalam
berkomunikasi. Setiap pengguna Twitter bebas mem-post tweet dengan batasan
140 karakter sehingga mampu menyampaikan maksud dan tujuan dengan
singkat, padat dan jelas. Indonesia menduduki posisi ketiga sebagai Negara
dengan pengguna Twitter terbanyak. Menurut CEO Twitter Dick Costlo, pada
pertengahan tahun 2015 mencapai lima puluh juta (Pratomo, 2019). Tweet bisa
digunakan penggunanya untuk memberitahu tentang apa yang sedang dilakukan
atau dirasakan, percakapan, berbagi informasi, dan pelaporan berita. Pada
umumnya tweet digunakan untuk mem-post hal tentang diri pengguna dan
2
berbagi informasi. Isi tweet juga dapat mengekspresikan perasaan atau mood pengguna, misalkan “Aku sangat suka dengan pribadi beliau”, hal ini bersifat penilaian subjektif atau opini. Opini melalui tweet inilah yang dapat dimanfaatkan untuk melihat bagaimana sentimen yang dimunculkan salah satunya adalah mengenai opini seseorang terhadap kebijakan-kebijakan yang di keluarkan oleh pemerintah.
Di negara-negara eropa terdapat asas-asas umum yang menjadi faktor penilaian baik atau buruknya suatu pemerintahan, Seperti di Belanda yang asas umum tersebut tercantum kedalam Yurisprudensi AROB (Administrative
Rechtspraak Overheidsbeschikkingen). Diantara asas-asas tersebut yakni asaspertimbangan, kecermatan, kepastian hukum, persamaan, keseimbangan, kewenangan, larangan, dan juga kepercayaan masyarakat. Salah satu produk hasil kerja dari pemerintah menurut pandangan ahli Thomas R. Dye (1981) adalah suatu bentuk kebijakan publik. Kebijakan publik itu sendiri adalah apapun yang dipilih oleh pemerintah untuk melakukan ataupun tidak melakukan sesuatu hal dalam artian membolehkan ataupun melarang suatu hal. Pada masa- masa pandemi saat ini pemerintah telah banyak mengeluarkan kebijakan publik diantaranya penetapan PSBB (pembatasan sosial berskala besar), pembentukan komite penanganan covid-19, penerapan PPKM (pemberlakuan pembatasan masyarakat) dan masih banyak yang lainnya. Merujuk ke Yurisprudensi AROB pada asa kepercayaan masyarakat tentulah pemerintah harus mengetahui opini masyarakat terhadap kebijakan kebijakan publik yang telah dikeluarkan oleh pemerintah.
Analisa mengenai pesan dari para pengguna media sosial disebut sebagai analisa opini atau sentimen (opinion analysis atau sentimen analysis). Analisis sentimen dapat digunakan untuk memberikan nilai positif, dan negatif pendapat seseorang tentang topik yang berbeda yang ada dalam tweet (Suni & Widyantoro, 2012). Analisis sentimen dapat disebut juga opinion mining yang bertujuan untuk menganalisis, memahami, mengolah dan mengestrak data tekstual yang berupa opini terhadap entitas tentang topik tertentu agar mendapatkan suatu informasi (Liu, 2010). Selain itu juga biasanya digunakan ketika suatu pihak ingin mendapatkan sentimen publik yang baik, seperti dalam pemilihan calon gubernur, tokoh politik atau lingkungan universitas tertentu (Suni & Widyantoro, 2012). Dengan manual, analisa sentimen bisa dilakukan, Misalnya memonitor berita-berita di media massa. Akan tetapi untuk data twitter, cara manual tidak mudah dilakukan karena jumlah datanya yang sangat besar dan terus mengalir.
Oleh karena itu, diajukan penerapan metode pembelajaran mesin untuk
mengklasifikasi polaritas opini dari sumber data yang sangat banyak tersebut.
Untuk melakukan hal itu, bisa menggunakan salah satu fungsi dari text mining, yaitu klasifikasi dokumen. Ada beragam teknik klasifikasi dokumen, diantaranya adalah Naïve Bayes classifier, Decision Trees, dan Support Vector Machines. Salah satu metode yang paling populer digunakan dalam pengklasifikasian dokumen saat ini adalah metode Naïve Bayes classifier. (Baeza R. & Neto, 2006).
Algoritma Naive Bayes merupakan sebuah metoda klasifikasi menggunakan metode probabilitas dan statistik yg dikemukakan oleh ilmuwan Inggris Thomas Bayes. Algoritma Naive Bayes memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. Naive Bayes Classifier bekerja sangat baik dibanding dengan model classifier lainnya. Hal ini dibuktikan pada jurnal Xhemali, Daniela, Chris J. Hinde, and Roger G. Stone. “Naive Bayes vs. decision trees vs. neural networks
in the classification of training web pages.” (2009), mengatakan bahwa “Naïve Bayes Classifier memiliki tingkat akurasi yg lebih baik disbanding model classifierlainnya”. (Xhemali, & Roger, 2009). Metode Naïve Bayes classifier mempunyai kecepatan dan akurasi yang tinggi ketika diaplikasikan dalam basis data yang besar dan data yang beragam. Hal serupa juga diungkapkan oleh (McCue, 2009) dalam penelitiannya, yaitu metode Naïve Bayes classifier memiliki beberapa kelebihan antara lain, sederhana, cepat dan berakurasi tinggi. Penelitian mengenai analisis sentimen telah banyak dilakukan sebelumnya. Diantaranya melakukan klasifikasi sentimen terhadap review film dengan menggunakan berbagai teknik pembelajaran mesin. Teknik pembelajaran mesin yang digunakan yaitu Naïve Bayes, Maximum Entropy, dan Support Vector Machines (SVM).
Penelitian tetang analisis sentimen yang menggunakan dataset dari jejaring sosial Twitter dilakukan oleh mereka yang melakukan analisis. Keuntungan penggunaan Naive Bayes Classifier adalah metode ini hanya membutuhkan jumlah data pelatihan training data yang kecil untuk menentukan estimasi parameter yang diperlukan dalam proses pengklasifikasian.
Penelitian tentang analisis sentiment telah banyak dilakukan oleh para
peneliti terdahulu salah satunya yaitu penelitian yang dilakukan oleh Hidayat
ditahun 2015 mengenai analisis sentimen terhadap wacana politik pada media
masa online Manfaat analisis sentimen dalam dunia politik antara lain untuk
membantu dalam menganalisis kebijakan publik pemerintah serta memberikan
efisiensi waktu dan efisiensi kerja bagi para penyedia berita dalam
mengklasifikasikan berita dan membantu para pencari berita untuk
mendapatkan wacana berita politik harian yang mereka inginkan. Penelitian
analisis sentimen pernah dilakukan oleh Ghulam Asrofi Buntoro 2017 yang
mengunakan model analysis sentimen calon gubernur DKI Jakarta pada tahun
4
2017 ditwitter. Metode yang digunakan dalam penelitian ini, untuk preprocessing data menggunakan tokenisasi, cleansing dan filtering, untuk menentukan class sentimen dengan metode Lexicon Based. Untuk proses klasifikasinya menggunakan metode Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM). Data yang digunakan adalah tweet dalam bahasa Indonesia dengan kata kunci AHY, Ahok, Anies, dengan jumlah dataset sebanyak 300 tweet. Hasil dari penelitian ini adalah analisis sentimen terhadap calon gubernur DKI Jakarta 2017. Akurasi tertinggi didapat saat menggunakan metode klasifikasi Naïve
Bayes Classifier (NBC), dengan nilai rata-rata akurasi mencapai 95%, nilai presisi95%, nilai recall 95% nilai TP rate 96,8% dan nilai TN rate 84,6%.
Berdasarkan pada latar belakang tersebut penilitian ini mengikuti penelitian dari Ghulam Asrofi Buntoro ditahun 2017 dengan mengganti topik menjadi kebijakan pemerintah Indonesia di masa pandemic COVID-19 dan menambahkan facebook sebagai media sosial yang akan di lakukan analisi sentimen bersamaan dengan twitter juga. Oleh karena itu judul dari penelitian ini ialah ANALISIS SENTIMEN MASYARAKAT MENGENAI “KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19” DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOSIAL FACEBOOK DAN TWITTER.
1.2. RUMUSAN MASALAH
Berdasarkan latar belakang yang telah dikembangkan diatas, maka permasalahan yang akan dibahas pada penelitian ini adalah sebagai berikut : 1. Bagaimana hasil dari analisis sentiment masyarakat mengenai kebijakan
pemerintah Indonesia dalam menanggapi covid-19 dengan metode naïve bayes ?
2. Bagaimana tingkat akurasi yang didapatkan dari analisis sentiment
masyarakat mengenai kebijakan pemerintah Indonesia dalam menanggapi
covid-19 dengan metode naïve bayes ?
1.3. BATASAN MASALAHA
Agar penelitian tugas akhir ini tidak keluar dari pokok permasalahan maka ruang lingkup pembahasan penelitian ini dibatasi dengan masalah sebagai berikut :
1. Sumber opini yang digunakan berbahasa Indonesia dan berasal dari sosial media Twiter dan Facebook.
2. Sumber opini yang digunakan pada wilayah Indonesia.
3. Analisis sentiment yang dilakukan menggunakan dan Naïve Bayes menggunakan bahasa pemrograman Python dan google colaboration sebagai IDE.
4. Analisis sentiment ini mencakup kelas positif, negatif dan netral.
5. Data yang diambil pada penelitian ini hanya seputar kebijakan pemerintah pusat Indonesia pada masa PPKM.
6. Penelitian ini tidak bertujuan untuk menetukan bagaimana hasil dari kebijakan pemerintah
1.4. TUJUAN PENELITIAN
Dari rumusan masalah diatas, tujuan dari penelitian ini adalah sebagai berikut :
1. Mengetahui hasil dari analisis sentiment masyarakat mengenai kebijakan pemerintah Indonesia dalam menanggapi covid-19 dengan metode naïve bayes
1.5. MANFAAT PENELITIAN
Adapun manfaat yang penulis harapkan dari penelitian ini antara lain adalah sebagai berikut:
1. Memberikan informasi sentiment masyarakat tentang kebijakan pemerintah Indonesia dalam menanggapi covid-19 berupa sentiment positif, sentiment negative dan sentiment netral.
2. Menjadi referensi bagi penelitian-penelitian berikutnya yang relevan dangan
kasus analisis sentiment.
6 BAB II
TINJAUAN PUSTAKA
2.1. Data minning
Seiring dengan berkembagannya penggunaan teknologi pada masa kini, tentunya data yang ditampung dalam databasepun semakin banyak dan semkin besar. Data yang semakin besar ini secara tidak langgsung harus dapat dimanfaatkan dengan baik oleh suatu organisasi ataupun suatu kelompok agar dapat memberikan suatu keunggulan kompetitif maupum informasi yang akan berguna bagi pengambilan keputusan. Proses penggalian informasi dari daya yang disimpan membutuh kan cara dan Teknik yang lebih cangih untuk dapat menghasilkan informasi yang lebih bernilai. Beragam metoe baru untuk mengali informasi dari kumpulan data pun semakin berkembang, banyak metode-metode yang memungkinkan untuk mendapatkan informasi dari sekumpulan data seperti gambaran maupun peramalan. Salah satunya yang berkembang adalah data mining
Data Mining merupakan proses yang memanfaatkan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Data Mining merupakan proses iterative dan interaktif untuk mengemukakan pola atau model baru sahih (sempurna), bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar (massive databse). Menurut Witten dkk, (2011) data mining digambarkan sebagai ekstraksi dari suatu data yang bersifat implisit, sebelumnya tidak diketahui, dan berpotensi memiliki informasi yang berguna. Data mining merupakan metode pengolahan data berskala besar untuk menemukan pola yang tersembunyi dari data tersebut. Hasil dari pengolahan data dengan metode data mining dapat digunakan untuk mengambil keputusan di masa depan
Data Mining berisi pencarian tren atau pola yang diinginkan dalam database besar untuk membantu pengambilan keputusan di waktu yang akan datang. Pola – pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja mengguankan perangkat pendukung keputusan yang lainnya (Hermawati, 2013)
2.2. Text mining
Text mining juga dikenal sebagai data mining text atau penemuan
pengetahuan dari database tekstual. Sesuai dengan buku The Text Mining
Handbook, text mining dapat didefinisikan sebagai suatu proses menggali
informasi dimana seorang user berinteraksi dengan sekumpulan dokumen
menggunakan tools analisis yang merupakan komponen – komponendalam data mining. Text mining adalah proses menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen dan tujuannya adalah mencari kata – kata yang dapat mewakili isi dokumen sehingga dapat dilakukan analisis keterhubungan antar dokumen tersebut. (Aditya B. R., 2015). Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan dalam textmining adalah sekumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu pengkategorisasian teks dan pengelompokkan teks. (Nurhuda, Sihwi, & Doewes, 2013).
Text mining akan memerlukan jutaan kata-kata yang disimpan dalam bentuk file elektronik yang bisa berbentuk beberapa dokumen yang akan diproses, namun tentu saja dokumen-dokumen ini masih dalam bentuk yang tidak terstruktur. Butuh tahapan untuk menambang teks-teks yang ada dalam koleksi dokumen sehingga didapatkan informasi-informasi yang lebih bernilai dan terstruktur.
2.3. Text processing
Preprocessing merupakan proses untuk mempersiapkan data mentah sebelum dilakukan proses lain. Pada umumnya, preprocessing data dilakukan dengan cara mengeliminasi data yang tidak sesuai atau mengubah data menjadi bentuk yang lebih mudah yang diproses oleh sistem. Preprocessing sangat penting dalam pembuatan analisis sentimen, terutama untuk media sosial yang sebagian besar berisi kata – kata atau kalimat yang tidak formal dan tidak terstruktur serta memiliki noise yang besar. Di bidang Text Mining, data preprocessing digunakan untuk mengekstraksi pengetahuan yang menarik dan penting serta dari data teks yang tidak terstruktur. Berdasarkan ketidakteraturan struktur data teks, maka proses sistem temu kembali informasi ataupun text mining memerlukan beberapa tahap awal yang pada intinya adalah mempersiapkan agar teks dapat diubah menjadi lebih terstruktur. Tahap Text Preprocessing adalah tahapan dimana aplikasi melakukan seleksi data yang akan diproses pada setiap dokumen. Proses preprocessing ini meliputi case folding, tokenizing, filtering, dan stemming (Hermawan dan Ismiati, 2020).
Namun demikian, tidak ada aturan pasti tentang setiap tahapan dalam text preprocessing.
a. Case Folding
8
Case Folding adalah proses mengubah ukuran semua karakter dalam dokumen menjadi sama. Karena data yang kita miliki tidak selalu terstruktur dan konsisten dalam penggunaan huruf kapital, maka peran case folding sangat dibutuhkan untuk mengubah bentuk keseluruhan teks dalam dokumen menjadi suatu bentuk standar.
Kebijakan Pemerintah dalam
menangani COVID-19 → Kebijakan pemerintah dalam menangani covid-19
b. Tokenizing
Data tweet bisa terdiri dari banyak kalimat. Untuk mempermudah proses analisis data, perlu dilakukan pemotongan kalimat-kalimat tersebut menjadi kata yang disebut dengan Tokenizing. Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya (Triawati, 2009). Pada proses ini juga dilakukan penghilangan angka, tanda baca, dan karakter selain huruf alfabet.
Kebijakan Pemerintah dalam
menangani COVID-19 →
Kebijakan pemerintah dalam menangani covid-19
c. Filtering
Tahap Filtering adalah tahap mengambil kata-kata penting dari hasil token. Kata umum yang biasanya muncul dan tidak memiliki makna disebut stopword. Cios, et.al., (2007) mendefinisikan Stopword sebagai kata-kata yang tidak relevan sehubungan dengan subjek utama dari basis data, meskipun kata-kata tersebut mungkin sering muncul dalam dokumen. Apabila dalam suatu kalimat terdapat satu atau lebih kata yang masuk ke dalam daftar stopword, maka kata tersebut harus dihilangkan dari kalimat itu. Kata-kata tersebut dapat dibuang karena dianggap kurang penting (contohnya kata ganti orang, kata sambung, dan masih banyak lagi) karena hasil akhir tahapan text pre-processing hanya akan menghasilkan kata-kata yang penting saja (Hermawan dan Ismiati, 2020).
Contoh stopword adalah “yang”, “dan”, “di”, “dari”, dan seterusnya.
Kebijakan pemerintah dalam menangani covid-19
→
Kebijakan pemerintah menangani covid-19
d. Stemming
Tahap Stemming adalah tahap kemudian yang diperlukan untuk memperkecil jumlah indeks yang berbeda dari satu data sehingga sebuah kata yang memiliki akhiran maupun awalan akan kembali ke bentuk dasarnya. Selain itu juga digunakan untuk mengelompokkan kata-kata lain yang memiliki kata dasar dan arti yang serupa namun memiliki bentuk yang berbeda karena telah mendapatkan imbuhan yang berbeda pula.
dikenal ditemukan
penyakit menyebar
→ kenal temu sakit
sebar
2.4. Analisis sentiment
Analisis Sentimen atau opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentiment dilakukan untuk melihat pendapat atau kecenderungan opini terhadap sebuah masalah atau objek oleh seseorang, apakah cenderung beropini negatif atau positif. (Rozi, Pranomo, & Dahlan, 2012). Menurut Medhat et al (2014, 1093) analisis sentimen adalah suatu bidang yang berlangsung dalam penelitian berbasiskan teks. Analisis sentimen atau opinion mining adalah kajian tentang cara untuk memecahkan masalah dari opini masyarakat, sikap dan emosi suatu entitas, dimana entitas tersebut dapat mewakili individu. (Wati, 2016). Analisis sentimen adalah bidang studi yang menganalisi pendapat, sentimen, evaluasi, penilaian, sikap, dan emosi seseorang terhadap sebuah produk, organisasi, individu, masalah, peristiwa atau topik Analisis sentimen dilakukan untuk melihat pendapat terhadap sebuah masalah, atau dapat juga digunakan untuk identifikasi kecenderungan hal yang sedang menjadi topik pembicaran.
(Liu,2012).
10
Dengan bantuan analisis sentimen, informasi yang tadinya tidak terstruktur dapat diubah menjadi data yang lebih terstruktur. Data tersebut dapat menjelaskan opini masyarakat mengenai produk, merek, layanan, politik, atau topik lainnya. Guna menghasilkan opini yang dibutuhkan, sentiment analysis tidak hanya harus bisa mengenali opini dari teks. Proses yang juga disebut sebagai opini mining ini juga perlu bekerja dengan mengenali tiga aspek berikut:
1. Subjek: topik apa yang sedang dibicarakan;
2. Polaritas: apakah opini yang diberikan bersifat positif atau negatif; dan 3. Pemegang opini: seseorang yang mengeluarkan opini tersebut.
2.5. Naïve Bayes Classifer
Naïve Bayes Classifier adalah salah satu metode yang popular digunakan
untuk keperluan data mining karena kemudahan penggunaannya serta waktu pemrosesannya yang cepat, mudah diimplementasikan dengan strukturnya yang cukup sederhana dan tingkat efektifitas yang tinggi. Naïve Bayes Classifer adalah teknik klasifikasi berdasarkan Teorema Bayes dengan asumsi independensi di antara para prediktor. Dalam istilah sederhana, classifier Naive Bayes mengasumsikan bahwa keberdaan fitur tertentu di kelas tidak terkait dengan keberadaan fitur lainnya. Bahkan jika fitur-fitur ini bergantung satu sama lain atau pada keberadaan fitur-fitur lainnya, semua properti ini berkontribusi secara independen terhadap probabilitasnya dan itulah sebabnya dikenal sebagai 'Naive'.
Sebagai contoh, sesuatu yang berwarna merah, bulat, dan memiliki diameter sekitar 10 cm bisa dikategorikan sebagai buah apel.
Walaupun fitur ini bergantung antara satu fitur dengan fitur yang lainnya. Naïve
Bayes Classifier akan tetap menganggap bahwa fitur – fitur tersebut independendan tidak memiliki pengaruh satu sama lainnya. Bergantung pada model
probabilitasnya, Naïve Bayes Classifier dapat dilatih untuk melakukan supervised learning dengan sangat efektif. Dalam berbagai macam penerapannya, estimasiparameter untuk model Naïve Bayes menggunakan metode maximum likehood, yang artinya pengguna dapat menggunakan model Naïve Bayes tanpa perlu mempercayai probabilitas Bayesian atau tanpa menggunakan metode Bayesian (Hadna, Santosa, & Winarno, 2016).
Teorema Bayes merupakan torema yang mengacu pada konsep
probabilitas bersyarat. Secara umum teorema Bayes dapat dinotasikan padapersmaan berikut:
𝑃(𝐶|𝑋) = 𝑃(𝑥|𝑐)𝑃(𝑐)
𝑃(𝑥) ……….(1)
Dengan X adalah data kelas yang belum diketahui, C adalah hipotesis kata yang merupakan suatu kelas yang spesifik, P(C|X) merupakan probabilitas dari hipotesis yang berdasarkan kondisi, P(C) adalah probabilitas hipotesis, P(X|C) adalah probabilitas berdasarkan kondisi pada hipotesis dan P(X) adalah probabilitas dari C.
2.6. Confusion matrix
Pengukuran terhadap kinerja suatu sistem klasifikasi merupakan hal yang penting. Kinerja sistem klasifikasi menggambarkan seberapa baik sistem dalam mengklasifikasikan data. Confusion matrix merupakan salah satu metode yang dapat digunakan untuk mengukur kinerja suatu metode klasifikasi. Pada dasarnya confusion matrix mengandung informasi yang membandingkan hasil klasifikasi yang dilakukan oleh sistem dengan hasil klasifikasi yang seharusnya.
Berdasarkan jumlah keluaran kelasnya, sistem klasifikasi dapat dibagi menjadi 4 (empat) jenis yaitu klasifikasi binary, multi-class, multi-label dan hierarchical Pada klasifikasi binary, data masukan dikelompokkan ke dalam salah satu dari dua kelas. Jenis klasifikasi ini merupakan bentuk klasifikasi yang paling sederhana dan banyak digunakan. Contoh penggunaannya antara lain dalam sistem yang melakukan deteksi orang atau bukan, sistem deteksi kendaraan atau bukan, dan sistem deteksi pergerakan atau bukan.
Sementara itu, pada bentuk klasifikasi multi-class, data masukan diklasifikasikan menjadi beberapa kelas. Sebagai contoh sistem yang dapat mengklasifikasikan jenis kendaraan seperti sepeda, sepeda motor, mobil, bus, truk, dan sebagainya. Bentuk klasifikasi multi-label pada dasarnya sama dengan multi-class dimana data dikelompokkan menjadi beberapa kelas, namun pada klasifikasi multi-label, data dapat dimasukkan dalam beberapa kelas sekaligus.
Bentuk klasifikasi yang terakhir adalah hierarchical. Data masukan
dikelompokkan menjadi beberapa kelas, namun kelas tersebut dapat
dikelompokkan kembali menjadi kelas-kelas yang lebih sederhana secara
hirarkis. Contohnya dalam penelitian ini, arah pergerakan dikelompokkan
menjadi 12 arah pergerakan yang tentunya dapat disederhanakan menjadi 4
arah. Pada pengukuran kinerja menggunakan confusion matrix, terdapat 4
(empat) istilah sebagai representasi hasil proses klasifikasi. Keempat istilah
tersebut adalah True Positive (TP), True Negative (TN), False Positive (FP) dan False
Negative (FN). Nilai True Negative (TN) merupakan jumlah data negatif yang
12
terdeteksi dengan benar, sedangkan False Positive (FP) merupakan data negatif namun terdeteksi sebagai data positif. Sementara itu, True Positive (TP) merupakan data positif yang terdeteksi benar. False Negative (FN) merupakan kebalikan dari True Positive, sehingga data posifit, namun terdeteksi sebagai data negatif. Berdasarkan nilai True Negative (TN), False Positive (FP), False Negative (FN), dan True Positive (TP) dapat diperoleh nilai akurasi, presisi dan recall. Nilai akurasi menggambarkan seberapa akurat sistem dapat mengklasifikasikan data secara benar. Dengan kata lain, nilai akurasi merupakan perbandingan antara data yang terklasifikasi benar dengan keseluruhan data. Nilai akurasi dapat diperoleh dengan Persamaan
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
𝑇𝑃+𝑇𝑁𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁
𝑥 100 %.
dimana:
TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan benar oleh sistem.
TN adalah True Negative, yaitu jumlah data negatif yang terklasifikasi dengan benar oleh sistem.
FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah oleh sistem.
FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi salah oleh sistem
2.7. Media sosial
Pada dasarnya media sosial merupakan perkembangan mutakhir dari
teknologi – teknologi web baru berbasis internet, yang memudahkan semua orang
untuk dapat berkomunikasi, berpartisipasi, saling berbagi dan membentuk
sebuah jaringan secara online, sehingga dapat menyebarluaskan konten mereka
sendiri. Seperti post di blog, tweet, atau video youtube dapat direproduksi dan
dapat dilihat secara langsung oleh jutaan orang secara gratis. Media sosial
mempunyai banyak bentuk, diantaranya yang paling popular yaitu microblogging
(twitter), facebook, dan blog. Twitter adalah suatu situs web yang merupakan
layanan dari microblog, yaitu suatu bentuk blog yang membatasi ukuran setiap
posnya, yang memberikan fasilitas bagi pengguna untuk dapat menuliskan pesan
dalam twtiiter update hanya berisi 140 karakter. Twitter merupakan salah satu
jejaring sosial yang paling mudah digunakan, karena hanya memerlukan waktu
yang singkat tetapi informasi yang disampaikan dapat langsung menyebar secara
luas. (Setyani, 2013)
2.8. Facebook & Twitter
Twitter adalah suatu jejaring sosial dan microblog daring atau suatu blog yang memungkinkan pengunanya dapat menulis text pembeharuan singkat yang biasa nyakurang dari 200 (dua ratus) karakter dan dapat mempublikasikan nya baik dilihat secara umum atau kelompok terbatas yang dipilih oleh pemilik akun tersebut. Twitter memungkin nya penggunanya untuk mengirim dan membaca pesan berbasis text hingga 140 karakter akan tetapi pada tanggal 07 November 2017 bertambah menjadi 280 karakter yang dikenal dengan sebutan kicauan (tweet). Twitter didirikan pada bulan maret ditahun 2006 oleh Jack Dorsey, dan situs jejaring sosial nya diluncurkan pada bulan juli, sejak diluncurkan nya, Twiiter telah menjadi salah satu sari sepuluh situs yang paling sering digunakan didalam internet, dan dijuluki dengan pesan singkat internet.
(Leslie, 2009)
Twitter mengalami pertumbuhan yang pesat dan dengan cepat meraih popularitas diseluruh dunia. Hingga bulan Januari 2013, terdapat lebih dari 500 juta pengguna terdaftar diTwitter, 200 juta diantaranya adalah pengguna aktif.
Lonjakan penggunaan Twitter umumnya berlangsung saat terjadinya peristiwa- peristiwa populer. Pada awal 2013, pengguna Twitter mengirimkan lebih dari 500 juta kicauan per hari, dan Twitter menangani lebih dari 1,6 miliar permintaan pencarian per hari. Hal ini menyebabkan posisi Twitter naik ke peringkat kedua sebagai situs jejaring sosial yang paling sering dikunjungi didunia, dari yang sebelumnya menempati peringkat dua puluh dua.
2.9. Pemerintah dan Kebijakan Pemerintah
Kebijakan pemerintah pada hakikatnya merupakan kebijakan yang ditujukan untuk publik dalam pengertian yang seluas-luasnya (negara, masyarakat dalam berbagai status serta untuk kepentingan umum), baik itu dilakukan secara langsung maupun tidak secara langsung yang tercermin pada berbagai dimensi kehidupan publik. Oleh karena itu, kebijakan publik sering disebut sebagai kebijakan publik.
Kebijakan dalam pengertian pilihan untuk melakukan atau untuk tidak
melakukan mengandung makna adanya kehendak untuk melakukan atau tidak
melakukan, kehendak mana dinyatakan berdasarkan otoritas yang dimiliki
untuk melakukan pengaturan dan jika perlu dilakukan pemaksaan. Pernyataan
kehendak oleh otoritas dikaitkan dengan konsep pemerintah yang memberikan
pengertian atas kebijakan yang dialkukan oleh pemerintah yang disebut sebagai
kebijakan pemerintah. Kebijakan pemerintah dapat berkonotasi sebagai
kebijakan negara ketika pemerintah yang melakukan adalah diarahkan pada
14
pemerintah negara. Kalau kebijakan pemerintah dipahami dari saran yang akan dicapai (diatur) di mana sasarannya adalah publik tidak saja dalam pengertian negara akan tetapi dalam pengertian masyarakat dan kepentingan umum maka kebijakan pemerintah dapat dikategorikan sebagai kebijakan publik. (Refika Aditama, 2012). Tentu dengan adanya atau tidaknya kebijakan dari pemerintah menuai reaksi yang beragam dari masyarakat, dengan mengetahui tingkat sentimental masyarakat akan suatu kebijakan tentu dapat menjadi tolak ukur bagi pemerintah
Dilansir dari website kemlu.go.id Pada 31 Maret 2020, Presiden RI menerbitkan Peraturan Pemerintah Pengganti UU No 1 Tahun 2020 (PERPPU 01/2020) tentang Kebijakan Keuangan Negara dan Stabilitas Sistem Keuangan Untuk Penanganan Pandemi Corona Virus Disease 2019 (Covid-19) dan/atau dalam Rangka Menghadapi Ancaman yang Membahayakan Perekonomian Nasional dan/atau Stabilitas Sistem Keuangan. Total anggaran untuk ini adalah sebesar Rp 405,1 triliun. Pada 3 April 2020, Presiden menerbitkan Peraturan Presiden (Perpres) No. 54 Tahun 2020 tentang Perubahan Postur Rincian dan APBN Tahun 2020. Perpres ini merupakan tindak lanjut dari Perppu No. 1 Tahun 2020. Anggaran dari beberapa kementerian dipotong sebesar Rp 97,42 triliun.
Namun, beberapa Kementerian mengalami peningkatan anggaran, seperti Kementerian Pendidikan dan Kebudayaan sebesar dari Rp 36 triliun menjadi Rp 70 triliun; dan Kementerian Kesehatan dari Rp 57 triliun menjadi 76 triliun dengan Initial Reponses
Pembentukan Tim Gerak Cepat (TGC) di wilayah otoritas pintu masuk negara di bandara/pelabuhan/pos lintas batas darat negara (PLBDN).
Pada 18 Januari 2020, Indonesia melakukan pemeriksaan kesehatan di 135 titik bandar udara, darat, dan pelabuhan menggunakan alat pemindai suhu.
Kementerian Kesehatan (Kemkes) menunjuk sedikitnya 100 Rumah Sakit rujukan yang sebelumnya dipakai pada kasus flu burung.
Kemkes mengembangkan pedoman kesiapsiagaan mengacu pada pedoman sementara World Health Organization (WHO).
Kemkes membuka kontak layanan yang dapat diakses umum. Layanan ini digunakan untuk mengomunikasikan hal-hal terkait Covid-19.
Pada 2 Februari 2020, Pemri mengumumkan penundaan penerbangan dari dan ke RRT daratan yang berlaku mulai 5 Februari 2020 pukul 00.00 WIB.
Pada 4 Februari 2020, Pemri menghentikan sementara impor hewan hidup
dari RRT daratan.
Pada 2 Februari 2020, memulangkan WNI dari Provinsi Hubei, RRT.
Langkah-langkah sebelumnya yang ditempuh antara lain:
Ketersediaan akses logistik di Wuhan. Bantuan dana setara Rp 133 juta kepada WNI yang sebagian besar merupakan mahasiswa.
BNPB melalui Kemlu dan KBRI Beijing mengirimkan masker N-95 untuk WNi di RRT.
Penerbitan Keputusan Presiden (Keppres) No. 7 Tahun 2020 tentang Gugus Tugas Percepatan Penanganan Corona Virus Disease 2019 (Covid-19) pada 13 Maret 2020; dan Keppres No. 9 Tahun 2020 tentang Perubahan atas Keppres No. 7 Tahun 2020 pada 20 Maret 2020.
Bidang Kesehatan (senilai Rp 75 triliun)
Perlindungan tenaga kesehatan, terutama pembelian APD
Pembelian alat-alat kesehatan yang dibutuhkan, seperti: test kit, reagen, ventilator, hand sanitizer dan lain-lain sesuai standar yang ditetapkan Kementerian Kesehatan.
Upgrade 132 rumah sakit rujukan bagi penanganan pasien Covid-19, termasuk Wisma Atlet.
Insentif dokter (spesialis Rp.15 juta/bulan), dokter umum (Rp.10 juta), perawat Rp.7.5 juta dan tenaga kesehatan lainnya Rp.5 juta.
Santunan kematian tenaga medis Rp. 300 juta
Dukungan tenaga medis, serta penanganan kesehatan lainnya.
Bidang Sosial (senilai Rp 110 triliun)
Dukungan logistik sembako dan kebutuhan pokok 25 Triliun.
PKH 10 juta KPM, dibayarkan bulanan mulai April (sehingga bantuan setahun naik 25%)
Kartu sembako dinaikkan dari 15,2 juta menjadi 20 juta penerima, dengan manfaat naik dari Rp.150.000 menjadi Rp. 200.000,- selama 9 bulan (naik 33 persen)
Kartu Prakerja dinaikkan dari 10 T menjadi 20 triliun untuk bisa mengcover sekitar 5,6 juta pekerja informal, pelaku usaha mikro dan kecil. Penerima manfaat mendapat insentif pasca pelatihan Rp 600 ribu, dengan biaya pelatihan 1 juta.
Pembebasan biaya listrik 3 bulan untuk 24 juta pelanggan listrik 450VA,
dan diskon 50% untuk 7 juta pelanggan 900VA bersubsidi.
16
Tambahan insentif perumahan bagi pembangunan perumahan masyarakat berpenghasilan rendah (MBR) hingga 175 ribu.
Kebijakan Fiskal dan Insentif Pajak (senilai Rp 70,1 triliun)
Relaksasi batas maksimal defisit APBN (sebelumnya sebesar 3%) diberlakukan pada tahun 2020, 2021 dan 2022. Diprediksi defisit APBN tahun ini adalah sebesar 5,07%.
PPH 21 pekerja sektor industri pengolahan dengan penghasilan maksimal 200 juta setahun ditanggung pemerintah 100%.
Pembebasan PPH Impor untuk 19 sektor tertentu, Wajib Pajak Kemudahan Impor Tujuan Ekspor (KITE) dan wajib Pajak KITE Industri Kecil Menengah
Pengurangan PPH 25 sebesar 30% untuk sektor tertentu Kemudahan Impor Tujuan Ekspor (KITE) dan wajib Pajak KITE Industri Kecil Menengah
Restitusi PPN dipercepat bagi 19 sektor tertentu untuk menjaga likuiditas pelaku usaha.
Penundaan pembayaran pokok dan bunga untuk semua skema Kredit Usaha Rakyat (KUR) yang terdampak COVID-19 selama 6 bulan.
Penurunan tarif PPh Badan menjadi 22% untuk tahun 2020 dan 2021 serta menjadi 20% mulai tahun 2022.
Dukungan lainnya dari pembiayaan anggaran untuk mendukung pemulihan ekonomi.
Kebijakan Perdagangan Ekspor-Impor
Penyederhanaan larangan terbatas (lartas) ekspor
Penyederhanaan larangan terbatas (lartas impor)
Percepatan layanan proses ekspor-impor melalui national logistic ecosystem.
Usaha Mikro, Kecil, dan Menengah (UMKM) senilai Rp 150 triliun
Memberikan stimulus untuk debitur melalui penilaian kualitas kredit sampai 10 Milyar berdasarkan ketepatan membayar
Restrukturisasi untuk seluruh kredit tanpa melihat plafon kredit.
Restrukturisasi kredit UMKM dengan kualitas yang dapat langsung
menjadi lancar.
Pembatasan Sosial Berskala Besar (PSBB)
Peraturan Pemerintah Nomor 21 tahun 2020 tentang Pembatasan Sosial Berskala Besar dalam rangka Percepatan Penanganan Corona Virus Disease 2019 (Covid-19) ditetapkan pada 31 Maret 2020. Pemerintah Daerah (Pemda) dapat melakukan Pembatasan Sosial Berskala Besar (PSBB) untuk satu provinsi atau kabupaten/kota tertentu. PSBB dilakukan dengan pengusulan oleh gubernur/bupati/walikota kepada Menteri Kesehatan.
Peraturan Menteri Kesehatan No. 9 Tahun 2020 tentang Pedoman PSBB dalam rangka Percepatan Penanganan Covid-19 ditetapkan pada 3 April 2020. Kebijakan PSBB antara lain: 1) Peliburan sekolah dan tempat kerja;
2) Pembatasan kegiatan keagamaan; 3) Pembatasan kegiatan di tempat/fasilitas umum; 4) Pembatasan kegiatan sosial budaya; 5) Pembatasan moda transportasi; dan 6) Pembatasan kegiatan lainnya terkait aspek pertahanan dan keamanan.
Pada 7 April 2020, Menkes menyetujui PSBB untuk diterapkan di DKI Jakarta. PSBB dilakukan selama 14 hari. Ojek online dilarang membawa penumpang. Jadwal KRL dievaluasi ulang dan dikurangi. Di wilayah Jabodetabok, akan dibagikan sembako senilai Rp 200 ribu per keluarga.
Nantinya penerima bantuan akan mendapakan Rp 600 ribu per keluarga yang diberikan selama kurun waktu 3 bulan.
Bidang Hukum
Kementerian Hukum dan HAM (Kemenkumham) telah membebaskan 22.158 orang narapidana dan anak. Sebanyak 15.477 orang di antaranya keluar penjara melalui program asimilasi. Sementara 6.681 orang lainnya menghirup udara bebas melalui program hak integrasi, baik berupa pembebasan bersyarat, cuti bersyarat, maupun cuti menjelang bebas.
Ss
Kebijakan/Fasilitas Lainnya
Pemri membangun fasilitas observasi, penampungan, dan karantina untuk mengendalikan infeksi Covid-19 di Pulau Galang. Kapasitas ini terdiri dari 1.000 tempat tidur. Fasilitas ini siap pada 6 April 2020.
Pada 23 Maret 2020, Wisma Atlet Kemayoran diresmikan menjadi rumah
sakit darurat Covid-19. Fasilitas ini dilengkapi dengan laboratorium,
farmasi, dan peralatan medis portable. Fasilitas ini mampu menampung
sampai dengan 3.000 tempat tidur.
18
2.10. Covid – 19
Pada 9 Januari 2020, CDC China melaporkan coronavirus baru sebagai agen penyebab wabah, yang masih satu jenis dengan SARS-CoV, disebut sebagai penyakit coronavirus baru 2019 (COVID-19). Pada 11 Maret 2020, 118.598 kasus COVID-19 dilaporkan di seluruh dunia oleh lebih dari 100 negara. Belum di temukan vaksin, mayoritas kasus (80%) adalah infeksi saluran pernapasan dan pneumonia (ECDC, 2020). Tindakan preventif kesehatan masyarakat untuk mengurangi dampak pandemi salah satunya menjalankan aturan social distancing. Kecerdasan teknologi media social dimanfaatkan untuk meningkatkan untuk menjalani social distancing dengan media social berkaitan dengan situasi epidemic dapat digunakan sebagai sumber informasi untuk melakukan mobilisasi masyarakat mengikuti prosedur karantina, dengan mengurangi situasi panik dan ketakutan (Martin, 2020)
2.11. Penelitian terdahulu
Dalam menunjang kegiatan penelitian ini dan menghindari dari suatu duplikasi dalam penelitian yang akan dilakukan, maka dibutuhkan beberapa acuan dari penelitian terdahulu, sehingga dengan menambahkan acuan akan memudahkan peneliti dalam mengetahui hubungan antara penelitian yang akan dilakukan dengan penelitian terdahulu.
Analisis sentimen merupakan suatu jenis penelitian berkesinambungan yang berada berbagai bidang seperti Data Mining, dan Machine Learning yang berfokur pada klasifikasi sentimen dalam sebuah kalimat berdasarkan isinya.
Penelitian dari pendapat pengguna sosial media, sentimen dan emosi melalui atribut yang dimiliki serta dituangkan dalam bentuk teks banyak dilakukan karena topik ini sangat menarik untuk diulas. Pengklasifikasian sentimen analisis menjadi alternatif dan bahan evaluasi yang baik bagi pihak terkait. Hal ini dibuktikan dengan banyaknya penelitian atau riset dibidang tersebut. Berikut merupakan penelitian yang berkaitan atau serupa dengan penelitian yang akan dilakukan oleh peneliti
NO Penelitian
/Tahun Topik Keterangan
1 (Ghulam,2017)
Analisis
Sentimen Calon Gubernur DKI
menganalisa tanggapan pengguna
twitter terhadap calon gubernur DKI
jakarta pada tahun 2017 melalui
Jakarta 2017 Di Twitter
media sosial twitter, pada penelitian ini peneliti mengklasifikasikan konten menjadi 3 kategori yaitu sentiment positif, sentiment
negative dan sentiment netral, pada penelitian ini metode yang
digunakan untuk tahapan
preprocessing data menggunakan tokenisasi, cleansing dan filtering, untuk menentukan class sentiment dengan metode LexiconBased,Untuk proses klasifikasinya menggunakan metode Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM).
Data yang digunakan adalah tweet dalam Bahasa Indonesia dengan kata kunci AHY, Ahok, Anies, dengan jumlah dataset sebanyak 300 tweet. Hasil dari penelitian ini adalah analisis sentimen terhadap calon gubernur DKI Jakarta 2017.
Akurasi tertinggi didapat saat menggunakan metode klasifikasi Naïve Bayes Classifier (NBC), dengan nilai rata-rata akurasi mencapai 95%, nilai presisi 95%, nilai recall 95% nilai TP rate 96,8%
dan nilai TN rate 84,6%.
2 (Hidayat,2015) Analisis Sentimen Calon
Gubernur DKI Jakarta 2017 Di
Menganalisa sentimen terhadap wacana politik pada Media masa online menggunakan algoritma Support vector machine dan naive bayes.hasil penelitian ini
menunjukkan bahwa penggunaan
Metode algoritma svm Dapat
mengimplementasikan hasil dari
pengujian data berita wacana politik
20
dan dari penggunaan Naive bayes dapat di Hasilkan perbedaan dengan algoritma svm Pada masing - masing data yang telah di Analisis dan dari hasil pengukuran
menggunakan teknik pengukuran precision, recall dan di dapati tingkat akurasik lasifikasi berita politik masing - masing. Sehingga pada hasil analisa tersebut dapat Di ambil kesimpulan bahwa penerapan algoritma Svm menunjukkan
akurasi lebihbesar 90,50%
Sedangkan naïve bayes di uji data sebanyak 700 Data 59,98% Dalam hasil klasifikasi opini wacana politik serta dengana danya hasil analisis tersebut dapat memperoleh
klasifikasi opini yang baik
21 BAB III
METODOLOGI PENELITIAN
3. 1. Tempat dan Waktu penelitian
Pada penelitian ini akan bertempat di lingkungan Universitas Jambi, karena mengingat data yang di butuhkan dapat di peroleh secara online dan tidak memerlukan studi lapangan.
3. 2. Bahan dan Alat penelitian
Perangkat keras yang digunakan dalam penelitian ini adalah komputer personal dengan spesifikasi sebagai berikut:
• Prosesor : Intel Core i5-1035G1 @ 1.00Ghz
• RAM : 8 GB
• Memori : 1 TB
Perangkat lunak yang digunakan dalam penelitian ini adalah sebagai berikut:
• Sistem operasi Windows 10 (64-bit)
• Bahasa pemrograman Python 3.8.8
• google collaboration sebagai IDE
• data miner (ektensi google chrome)
• Library simplejson, sastrawi, Unicode,collection, NLTK, pandas, numpy,
textblob, spacy, sklearn, matplotlib.pyplot, wordcloud,3. 3. Kerangka kerja penelitian
Adapun kerangka kerja pada penelitian kali ini dapat digambarkan dalam
bentuk diagram alir sebagai berikut ini :
22
Berdasarkan kerangka kerja diatas maka berikut merupakan penjelasan mengenai tahapan penelitian yang akan dilakukan yaitu :
1. Pengambilan data pada media sosial twitter dan facebook dengan metode yang digunakan adalah web scrapping yang akan menghasilkan data mentah.
2. Preprocesing data atau tahapan penyiapan data sebelum data diolah yang akan terbagi menjadi empat tahap yaitu :
Case folding yaitu tahapan mengubah semua huruf capital menjadi huruf biasa.
Punctuation yaitu tahapan penghapusan tanda baca.
Stopward removal yaitu pembuangan term yang tidak memiliki arti atau tidak mempengaruhi suatu kalimat.
Stemming yaitu pemotongan imbuhan pada kata yang berimbuhan sehingga kata tersebut menjadi kata dasarnya.
3. Perhitungan TF-IDF untuk menentukan kata atau term yang sering muncul
4. Pengkalisfikasian data yang telah bersih dan siap diolah dengan metode naïve bayes.
5. Pengukuran tingakat keakuratan dari hasil pengklasifikasian data.
3. 4. Metode analisis data
Metode penelitian ini akan menggunakan metode Naïve Bayes Classifier
metode ini memiliki dua tahapan proses yaitu training dan testing. Berikut adalah
tahapan pada penelitian ini :
a. Pengumpulan data
Data yang akan digunakan diperoleh dari facebook.com dan twitter.com.
dan dikumpulkan pada tanggal 1 sampai 7 september 2021. Pengumpulan data menggunbakan metode scrapping langsung pada website dari media social yang akan digunakan yaitu facebook dan twitter sehinnga tidak memerlukan API. Proses scrapping dilakukkan dengan menggunakan tools ekstensi dari google chrome yaitu data miner.
b. Pengolahan data
Terdapat empat proses pada tahapan pengolahan data yaitu case folding,
tokenization, stopward removal, serta stemming.a. Case Folding
Case Folding adalah proses mengubah ukuran semua karakter dalam dokumen menjadi sama. Karena data yang kita miliki tidak selalu terstruktur dan konsisten dalam penggunaan huruf kapital, maka peran case folding sangat dibutuhkan untuk mengubah bentuk keseluruhan teks dalam dokumen menjadi suatu bentuk standar.
Kebijakan Pemerintah dalam
menangani COVID-19 → Kebijakan pemerintah dalam menangani covid-19
b. Tokenizing
Data tweet bisa terdiri dari banyak kalimat. Untuk mempermudah proses analisis data, perlu dilakukan pemotongan kalimat-kalimat tersebut menjadi kata yang disebut dengan Tokenizing. Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya (Triawati, 2009). Pada proses ini juga dilakukan penghilangan angka, tanda baca, dan karakter selain huruf alfabet.
Kebijakan Pemerintah dalam
menangani COVID-19 →
Kebijakan pemerintah dalam menangani covid-19
c. Filtering
Tahap Filtering adalah tahap mengambil kata-kata penting dari
hasil token. Kata umum yang biasanya muncul dan tidak memiliki makna
disebut stopword. Cios, et.al., (2007) mendefinisikan Stopword sebagai
kata-kata yang tidak relevan sehubungan dengan subjek utama dari basis
24
data, meskipun kata-kata tersebut mungkin sering muncul dalam dokumen. Apabila dalam suatu kalimat terdapat satu atau lebih kata yang masuk ke dalam daftar stopword, maka kata tersebut harus dihilangkan dari kalimat itu. Kata-kata tersebut dapat dibuang karena dianggap kurang penting (contohnya kata ganti orang, kata sambung, dan masih banyak lagi) karena hasil akhir tahapan text pre-processing hanya akan menghasilkan kata-kata yang penting saja (Hermawan dan Ismiati, 2020).
Contoh stopword adalah “yang”, “dan”, “di”, “dari”, dan seterusnya.
Kebijakan pemerintah dalam menangani covid-19
→
Kebijakan pemerintah menangani covid-19
d. Stemming
Tahap Stemming adalah tahap kemudian yang diperlukan untuk memperkecil jumlah indeks yang berbeda dari satu data sehingga sebuah kata yang memiliki akhiran maupun awalan akan kembali ke bentuk dasarnya. Selain itu juga digunakan untuk mengelompokkan kata-kata lain yang memiliki kata dasar dan arti yang serupa namun memiliki bentuk yang berbeda karena telah mendapatkan imbuhan yang berbeda pula.
dikenal ditemukan
penyakit menyebar
→ kenal temu sakit
sebar
c. Penentuan Class Attribute & Penentuan Class Attribute
Setelah dilakukan tokenisasi dan ditentukan class attribute, langkah selanjutnya adalah load dictonary. Banyak jenis kamus yang dapat digunakan, contohnya: Kamus Sentimen. Kamus sentimen berisi kumpulan kata yang telah diberi bobot dengan kekuatan sentimen 1 (tidak memiliki sentimen positif) s.d. 5 (memiliki sentimen positif yang sangat kuat), dan -1 (tidak memiliki sentimen negatif) s.d. -5 (memiliki sentiment negatif yang sangat kuat). Kamus sentimen didapatkan dari penelitian Haryalesmana pada tahun 2016.
d. Experiment dan pengujian
Pada tahapan ini data sudah dikelompokan kedalam class ulasan negatif dan positif untuk dilakukan eksperimen pengujian. Data yang sudah dikelompokan akan dilakukan pengujian menggunakan metode naïve bayes dengan persamaan :
𝑃(𝐶|𝑋) =
𝑃(𝑥
|𝑐
)𝑃(𝑐) 𝑃(𝑥)Keterangan :
x : Data dengan kelas yang belum di ketahui c : Hipotesis data merupakan suatu kelas spesifik P(C|X) : Probabilitas hipotesis berdasarkan kondisi (Posteriory
probability)
P(c) : Probabilitas hipotesis (Prior probability)
P(X|C) : Probabilitas berdasarkan kondisi pada hipotesis P(x) : Probabilitas C
e. Pengukuran akurasi
Pada tahapan ini hasil klasifikasi yang telah di lakukan, akan diukur tingkat keakuratannya dengan menggunakan metode confusion matrix dengan persamaan :
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =
𝑇𝑃+𝑇𝑁𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁
𝑥 100 %.
Dimana :
TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan benar oleh sistem.
TN adalah True Negative, yaitu jumlah data negatif yang terklasifikasi dengan benar oleh sistem.
FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah oleh sistem.
FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi
salah oleh sistem
26 BAB IV
HASIL DAN PEMBAHASAN
Dalam bab ini akan dijelaskan proses dari penelitian ini, dimulai dari tahap pengumpulan data, pembersihan data, hingga proses yang terdapat dalam metode Naïve Bayes yang terdiri dari beberapa tahapan yaitu dimulai dari tahapan pengumpulan data, praproses data, parsing json, filtering tokenisasi, stemming dan terakhir klasifikasi Naïve Bayes. Data yang diambil pada penelitian kali ini menggunakan teknik scrapping dengan bantuan Data miner dan menggunakan Python 3.9.
4.1. Pengumpulan Data
Pada penelitian ini proses pengumpulan data dilakukan dengan menggunakan teknik scrapping atau meng-copy data dari suatu halaman web dengan bantuan pluggin data miner. Hal pertama yang harus dilakukan pada proses scrapping ialah membuka halaman web yang berisikan data yang ingin diambil.
Gambar 4 pencarian pada twitter.com
Gambar diatas merupakan halaman pencarian pada situs twitter.com yang sedang menampilkan hasil pencarian dari kata kunci
𝑃𝑒𝑚𝑒𝑟𝑖𝑛𝑡𝑎ℎ 𝐴𝑁𝐷 (𝑘𝑜𝑟𝑜𝑛𝑎 𝑂𝑅 𝑐𝑜𝑣𝑖𝑑) 𝐴𝑁𝐷 𝑃𝑃𝐾𝑀
Gambar 5 pencarian pada facebook.com
Gambar diatas merupakan halaman pencarian pada situs facebook.com yang sedang menampilkan hasil pencarian dari kata kunci
𝑃𝑒𝑚𝑒𝑟𝑖𝑛𝑡𝑎ℎ 𝐴𝑁𝐷 (𝑘𝑜𝑟𝑜𝑛𝑎 𝑂𝑅 𝑐𝑜𝑣𝑖𝑑) 𝐴𝑁𝐷 𝑃𝑃𝐾𝑀
Setelah menentukan halaman yang akan di ambil datanya melalui teknik scrapping, selanjutnya diperlukan untuk menentukan selector pada pluggin data
miner untuk menentukan bagian atau tag mana pada halaman web yang akan dilakukan proses scrapping oleh data miner melalui tool New Recipe yang terdapat di dalam pluggin data miner
Gambar 6. Tampilan pluggin data miner
28
Gambar 7. Proses selector pada halaman web
Setelah menentukan selector pada halaman web, selanjutnya proses scrapping bias dilakukan dengan cara menekan tombol Scrape page pada pluggin data miner.
Gambar 8. Proses scraping pada halaman web
Setelah melakukan proses scraping dan data yang terkumpul telah mencukupi,
selanjutnya data tinngal diexpor dari pluggin data miner dengan cara menekan
tombol download pada menu scrape and download pada pluggin data miner.
Gambar 9. Proses pengunduhan data
Data yang diperoleh pada tahap ini masih dalam format Microsoft office excel dengan setiap data memiliki beberap atribut yaitu
Who Post (Siapa yang memposting)
Date (tanggal)
Content (conten)
Comment (komentar dalam bentuk jumlah)
Likes (penyuka dalam bentuk jumlah)