ANALISIS SENTIMEN MASYARAKAT MENGENAI “KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19” DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOSIAL FACEBOOK DAN TWITTER

(1)

ANALISIS SENTIMEN MASYARAKAT MENGENAI

“KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19” DENGAN MENGGUNAKAN

MOTODE NAÏVE BAYES PADA MEDIA SOSIAL FACEBOOK DAN TWITTER

S K R I P S I

REZA HARJADINATA F1E116008

PROGRAM STUDI SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS JAMBI

2022

(2)

ii

SURAT PERNYATAAN

Dengan ini saya menyatakan bahwa skripsi ini benar – benar karya sendiri. Sepanjang pengetahuan saya tidak terdapat karya atau pendapat yang ditulis atau diterbitkan orang lain kecuali sebagai acuan atau kutipan dengan mengikuti tata penulisan karya ilniah yang telah lazim.

Tanda tangan yang tertera dalam halaman pengesahan ini adalah asli. Jika tidak asli, saya siap menerima sanksi sesuai dengan peraturan yang berlaku.

Jambi, 2022 Yang menyatakan

Reza Harjadinata

F1E116008

(3)

iii

MENANGGAPI COVID-19” DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOSIAL

FACEBOOK DAN TWITTER

S K R I P S I

Diajukan sebagai salah satu syarat dalam melakukan penelitian dalam rangka penulisan Skripsi pada Program Studi Sistem Informasi

REZA HARJADINATA F1E116008

PROGRAM STUDI SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS JAMBI

2022

(4)

iv PENGESAHAN

Skripsi dengan judul ANALISIS SENTIMEN MASYARAKAT MENGENAI “KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19” DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOSIAL FACEBOOK DAN TWITTER yang disuun oleh REZA HARJADINATA, NIM:

F1E116008 telah dipertahankan di depan tim penguji

Susunan tim penguji Ketua ………: Dedy Setiawan, S.Kom., M.IT.

Sekretaris …: Ulfa Khaira, S.Komp., M.Kom Anggota ……: 1. Tri Suratno, S.Kom., M.Kom

.2. Daniel Arsa, S.Kom., M.S.I

.3. Rizqa Raaiqa Bintana, S.T., M.Kom

Disetujui:

Pembimbing Utama Pembimbing Pendamping

Tri Suratno, S.Kom., M.Kom Daniel Arsa, S.Kom., M.S.I NIP. 198310302006041002 NIP. 1989062920190310075

1996000000

Diketahui:

Dekan

Fakultas sains dan teknologi

Drs. Jefri Marzal, M.Sc., D.I.T.

NIP. 196806021993031004

Ketua Jurusan Teknik elektro dan

Nehru, S.Si., M.T.

NIP. 197602082001121002

(5)

v RIWAYAT HIDUP

REZA HARJADINATA lahir di Sungai Tutung, kecamatan air hangat timur, kabupaten kerinci jambi pada tanggal 04 januari 1999. Penulis merupakan anak kedua dari dua bersaudara dari pasangan Rijal Adli dan Erni Yenti.

Jalur pendidikan formal yang ditempuh penulis adalah sebagai berikut :

1. SDN 269/III Sungai tutung, 2004-2010 2. MTsN Model Kota sungai penuh, 2010-2013 3. SMAN 1 Kota Sungai Penuh, 2013-2016

Universitas Jambi, Saat ini menempuh semester 13 di program studi

Sistem informasi, fakultas sains dan teknologi. Selama menempuh pendidikan

jenjang S1, penulis cukup aktif dalam bidang akademik. Penulis mengikuti

kegiatan magang di PT. PERTAMINA EP Asset 1 Field Jambi.

(6)

vi PRAKATA

Puji dan syukur penulis panjatkan atas berkat dan rahmat Allah SWT yang telah memberikan rahmat dan karunia-Nya, sehingga terselesaikannya skripsi yang berjudul “ANALISIS SENTIMEN MASYARAKAT MENGENAI

‘KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19’

DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOCIAL FACEBOOK DAN TWITTER”

Penulis menyadari sangatlah sulit bagi penulis untuk menyelesaikan laporan ini tanpa bantuan dan bimbingan dari berbagai pihak, terlebih kepada kedua pembimbing saya, yaitu bapak Tri Suratno, S.Kom., M.Kom. selaku pembimbing utama dan bapak Daniel Arsa, S.Kom., M.S.I. selaku pembimbing pendamping saya juga kepada Edi Saputra, S.T., M.Sc. selaku pembimbing akademik saya. Tidak lupa pula dengan segala rasa hormat penulis ucapkan terimakasih kepada:

1. Orang tua beserta keluarga besar saya atas kasih sayang, dukungan dan doanya sehingga dapat menyelesaikan Tugas Akhir ini dengan baik.

2. Seluruh dosen pengajar Program Studi Sistem Informasi Fakultas Sains dan Teknologi.

3. Keluarga besar HIMASI Unja (Himpunan Mahasiswa Sistem Informasi Unja), sebagai wadah yang membawahi mahasiswa Sistem Informasi Fakultas Sains dan Teknologi, terimakasih atas kebersamaan,

kekeluargaan, kekompakan, keceriaan dan pelajaran berharga lainnya selama 6 tahun ini.

4. Teman-teman Sistem Informasi UNJA Angkatan 2016 yang bersama-sama menjadi pejuang gelar S.Kom dan Toga UNJA, terimakasih semangatnya.

5. Serta semua pihak lainya yang tidak bisa dituliskan penulis satu per satu yang telah membantu selama pembuatan Tugas Akhir ini.

Demikian Tugas Akhir ini, penulis mengucapkan terima kasih kepada

semua pihak yang telah memberikan bantuan baik moril maupun materil

sehingga tugas akhir ini dapat diselesaikan. Penulis menyadari bahwa tugas

akhir ini masih jauh dari kata sempurna dan masih banyak kekurangan. Hal

tersebut dikarenakan keterbatasan ilmu dan pengetahuan yang dimiliki penulis

semata. Oleh karena itu penulis mengharapkan kritik dan saran dari pembaca

(7)

vii yang membutuhkan. Akhir kata, semoga Allah SWT senantiasa melimpahkan rahmat serta hidayah-Nya kepada kita semua, Amin amin ya robbal ‘alamiin.

Jambi, Januari 2023

Reza Harjadinata

F1E116008

(8)

viii DAFTAR ISI

DAFTAR ISI ... viii

DAFTAR GAMBAR ... x

BAB I PENDAHULUAN ... 1

1.1. LATAR BELAKANG ... 1

1.2. RUMUSAN MASALAH ... 4

1.3. BATASAN MASALAHA... 5

1.4. TUJUAN PENELITIAN ... 5

1.5. MANFAAT PENELITIAN ... 5

BAB II TINJAUAN PUSTAKA ... 6

2.1. Data minning ... 6

2.2. Text mining ... 6

2.3. Text processing ... 7

2.4. Analisis sentiment ... 9

2.5. Naïve Bayes Classifer ... 10

2.6. Confusion matrix ... 11

2.7. Media sosial ... 12

2.8. Facebook & Twitter ... 13

2.9. Pemerintah dan Kebijakan Pemerintah ... 13

2.10. Covid – 19 ... 18

2.11. Penelitian terdahulu ... 18

BAB III METODOLOGI PENELITIAN ... 21

3. 1. Tempat dan Waktu penelitian ... 21

3. 2. Bahan dan Alat penelitian ... 21

3. 3. Kerangka kerja penelitian ... 21

3. 4. Metode analisis data ... 22

BAB IV HASIL DAN PEMBAHASAN ... 26

4.1. Pengumpulan Data ... 26

4.2. Praprocess Data ... 30

4.3. Pengolahan data ... 32

4.4. Pembobotan TF-IDF ... 34

4.5. PEMBAHASAN ... 35

4.6. Perhitungan Akurasi... 35

BAB V KESIMPULAN DAN SARAN ... 42

(9)

ix

DAFTAR PUSTAKA ... 43

Lampiran ... 45

(10)

x DAFTAR GAMBAR

Gambar Halaman

1. Contoh Tokenization ……….……….….. 11

2. Contoh Steamming ………...………..…….. 11

3. Flow Chart Analisis Data .………...…... 12

4. Pencarian pada twitter.com………...…... 13

5. Pencarian pada facebook.com………...…... 14

6. Tampilan pluggin data miner ………...…... 14

7. Proses selector pada halaman web ………...…... 15

8. Proses scraping pada halaman web………...…... 15

9. Proses pengunduhan data ……….………...…... 16

10. Data dalam format Microsoft office excel ………...…... 16

11. Menu Remove duplicates pada Microsoft office excel………...…... 17

12. Column-c sebagai acuan………...…... 18

13. Konversi format dengan bantuan beautifultool.com ………...…... 18

14. Data dalam format JSON………...…... 19

15. Pengahpusan Punctation ………...…... 19

16. Stopward removal……...………...…... 20

17. Hasil Stemming………...………...…... 21

18. Hasil pembobotan TF-IDF………...…... 21

19. Hasil analisis sentiment .………...…... 22

(11)

BAB I PENDAHULUAN 1.1. LATAR BELAKANG

Perkembangan teknologi informasi dan komunikasi yang sangat cepat ditandai dengan salah satunya oleh perkembagan alat – alat teknologi komunikasi dan informasi, cepatnya perkembagan teknologi komunikasi ini dapat dilihat melalui internet yang sudah tersebar seluruh Indonesia maupun diseluruh dunia.

Internet di Indonesia cukup pesat, hal ini dibuktikan dengan semakin mudahnya akses internet dengan semakin banyaknya akses wireless yang beredar, perkembangan teknologi smartphone, dan teknologi jaringan membuat masyarakat lebih mudah dan cepat mengakses informasi melalui internet.

Kemudahan akses internet ini mengubah kebiasaan masyarakat yang biasanya mengakses informasi melalui media cetak menjadi melalui internet. Dengan berkembang pesatnya teknologi di Indonesia, memiliki banyak dampak yang mempengaruhi budaya dan kebiasaan masyarakat Indonesia salah satunya yaitu bersosialisasi. Dengan lahirnya media sosial interaksi sosial antar individu dapat dilakukan tanpa perlu terjadinya kontak fisik. Dalam penggunaannya, media sosial selain sebagai alat komunikasi juga digunakan sebagai tempat menyampaikan opini, pendapat, komentar, tanggapan ataupun tulisan lain sebagainya. Terdapat berbagai macam platform yang memungkinakan penggunanya mem-publish tulisan mereka, contoh media sosial yang sering digunkan yaitu facebook, Instagram, dan twitter.

Jejaring sosial yang sedang populer dikalangan pengguna internet saat ini adalah Twitter. Perkembangan penggunaan Twitter sangat cepat. Hal ini berdasarkan hasil survey PeerReach yang dilansir situs Kompas.com pada 9 Febuari 2019 yaitu terdapat lebih dari 126 juta pengguna aktif setiap hari nya diseluruh dunia bersama-sama mengirimkan 250 juta tweet setiap hari.

Pengguna Twitter berasal dari Indonesia, Indonesia menjadi yang terbanyak

ketiga didunia. Kesederhanaan dan kemudahan dalam penggunaan merupakan

beberapa alasan mengapa Twitter lebih digemari masyarakat Indonesia dalam

berkomunikasi. Setiap pengguna Twitter bebas mem-post tweet dengan batasan

140 karakter sehingga mampu menyampaikan maksud dan tujuan dengan

singkat, padat dan jelas. Indonesia menduduki posisi ketiga sebagai Negara

dengan pengguna Twitter terbanyak. Menurut CEO Twitter Dick Costlo, pada

pertengahan tahun 2015 mencapai lima puluh juta (Pratomo, 2019). Tweet bisa

digunakan penggunanya untuk memberitahu tentang apa yang sedang dilakukan

atau dirasakan, percakapan, berbagi informasi, dan pelaporan berita. Pada

umumnya tweet digunakan untuk mem-post hal tentang diri pengguna dan

(12)

2 berbagi informasi. Isi tweet juga dapat mengekspresikan perasaan atau mood pengguna, misalkan “Aku sangat suka dengan pribadi beliau”, hal ini bersifat penilaian subjektif atau opini. Opini melalui tweet inilah yang dapat dimanfaatkan untuk melihat bagaimana sentimen yang dimunculkan salah satunya adalah mengenai opini seseorang terhadap kebijakan-kebijakan yang di keluarkan oleh pemerintah.

Di negara-negara eropa terdapat asas-asas umum yang menjadi faktor penilaian baik atau buruknya suatu pemerintahan, Seperti di Belanda yang asas umum tersebut tercantum kedalam Yurisprudensi AROB (Administrative

Rechtspraak Overheidsbeschikkingen). Diantara asas-asas tersebut yakni asas

pertimbangan, kecermatan, kepastian hukum, persamaan, keseimbangan, kewenangan, larangan, dan juga kepercayaan masyarakat. Salah satu produk hasil kerja dari pemerintah menurut pandangan ahli Thomas R. Dye (1981) adalah suatu bentuk kebijakan publik. Kebijakan publik itu sendiri adalah apapun yang dipilih oleh pemerintah untuk melakukan ataupun tidak melakukan sesuatu hal dalam artian membolehkan ataupun melarang suatu hal. Pada masa- masa pandemi saat ini pemerintah telah banyak mengeluarkan kebijakan publik diantaranya penetapan PSBB (pembatasan sosial berskala besar), pembentukan komite penanganan covid-19, penerapan PPKM (pemberlakuan pembatasan masyarakat) dan masih banyak yang lainnya. Merujuk ke Yurisprudensi AROB pada asa kepercayaan masyarakat tentulah pemerintah harus mengetahui opini masyarakat terhadap kebijakan kebijakan publik yang telah dikeluarkan oleh pemerintah.

Analisa mengenai pesan dari para pengguna media sosial disebut sebagai analisa opini atau sentimen (opinion analysis atau sentimen analysis). Analisis sentimen dapat digunakan untuk memberikan nilai positif, dan negatif pendapat seseorang tentang topik yang berbeda yang ada dalam tweet (Suni & Widyantoro, 2012). Analisis sentimen dapat disebut juga opinion mining yang bertujuan untuk menganalisis, memahami, mengolah dan mengestrak data tekstual yang berupa opini terhadap entitas tentang topik tertentu agar mendapatkan suatu informasi (Liu, 2010). Selain itu juga biasanya digunakan ketika suatu pihak ingin mendapatkan sentimen publik yang baik, seperti dalam pemilihan calon gubernur, tokoh politik atau lingkungan universitas tertentu (Suni & Widyantoro, 2012). Dengan manual, analisa sentimen bisa dilakukan, Misalnya memonitor berita-berita di media massa. Akan tetapi untuk data twitter, cara manual tidak mudah dilakukan karena jumlah datanya yang sangat besar dan terus mengalir.

Oleh karena itu, diajukan penerapan metode pembelajaran mesin untuk

mengklasifikasi polaritas opini dari sumber data yang sangat banyak tersebut.

(13)

Untuk melakukan hal itu, bisa menggunakan salah satu fungsi dari text mining, yaitu klasifikasi dokumen. Ada beragam teknik klasifikasi dokumen, diantaranya adalah Naïve Bayes classifier, Decision Trees, dan Support Vector Machines. Salah satu metode yang paling populer digunakan dalam pengklasifikasian dokumen saat ini adalah metode Naïve Bayes classifier. (Baeza R. & Neto, 2006).

Algoritma Naive Bayes merupakan sebuah metoda klasifikasi menggunakan metode probabilitas dan statistik yg dikemukakan oleh ilmuwan Inggris Thomas Bayes. Algoritma Naive Bayes memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. Naive Bayes Classifier bekerja sangat baik dibanding dengan model classifier lainnya. Hal ini dibuktikan pada jurnal Xhemali, Daniela, Chris J. Hinde, and Roger G. Stone. “Naive Bayes vs. decision trees vs. neural networks

in the classification of training web pages.” (2009), mengatakan bahwa “Naïve Bayes Classifier memiliki tingkat akurasi yg lebih baik disbanding model classifier

lainnya”. (Xhemali, & Roger, 2009). Metode Naïve Bayes classifier mempunyai kecepatan dan akurasi yang tinggi ketika diaplikasikan dalam basis data yang besar dan data yang beragam. Hal serupa juga diungkapkan oleh (McCue, 2009) dalam penelitiannya, yaitu metode Naïve Bayes classifier memiliki beberapa kelebihan antara lain, sederhana, cepat dan berakurasi tinggi. Penelitian mengenai analisis sentimen telah banyak dilakukan sebelumnya. Diantaranya melakukan klasifikasi sentimen terhadap review film dengan menggunakan berbagai teknik pembelajaran mesin. Teknik pembelajaran mesin yang digunakan yaitu Naïve Bayes, Maximum Entropy, dan Support Vector Machines (SVM).

Penelitian tetang analisis sentimen yang menggunakan dataset dari jejaring sosial Twitter dilakukan oleh mereka yang melakukan analisis. Keuntungan penggunaan Naive Bayes Classifier adalah metode ini hanya membutuhkan jumlah data pelatihan training data yang kecil untuk menentukan estimasi parameter yang diperlukan dalam proses pengklasifikasian.

Penelitian tentang analisis sentiment telah banyak dilakukan oleh para

peneliti terdahulu salah satunya yaitu penelitian yang dilakukan oleh Hidayat

ditahun 2015 mengenai analisis sentimen terhadap wacana politik pada media

masa online Manfaat analisis sentimen dalam dunia politik antara lain untuk

membantu dalam menganalisis kebijakan publik pemerintah serta memberikan

efisiensi waktu dan efisiensi kerja bagi para penyedia berita dalam

mengklasifikasikan berita dan membantu para pencari berita untuk

mendapatkan wacana berita politik harian yang mereka inginkan. Penelitian

analisis sentimen pernah dilakukan oleh Ghulam Asrofi Buntoro 2017 yang

mengunakan model analysis sentimen calon gubernur DKI Jakarta pada tahun

(14)

4 2017 ditwitter. Metode yang digunakan dalam penelitian ini, untuk preprocessing data menggunakan tokenisasi, cleansing dan filtering, untuk menentukan class sentimen dengan metode Lexicon Based. Untuk proses klasifikasinya menggunakan metode Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM). Data yang digunakan adalah tweet dalam bahasa Indonesia dengan kata kunci AHY, Ahok, Anies, dengan jumlah dataset sebanyak 300 tweet. Hasil dari penelitian ini adalah analisis sentimen terhadap calon gubernur DKI Jakarta 2017. Akurasi tertinggi didapat saat menggunakan metode klasifikasi Naïve

Bayes Classifier (NBC), dengan nilai rata-rata akurasi mencapai 95%, nilai presisi

95%, nilai recall 95% nilai TP rate 96,8% dan nilai TN rate 84,6%.

Berdasarkan pada latar belakang tersebut penilitian ini mengikuti penelitian dari Ghulam Asrofi Buntoro ditahun 2017 dengan mengganti topik menjadi kebijakan pemerintah Indonesia di masa pandemic COVID-19 dan menambahkan facebook sebagai media sosial yang akan di lakukan analisi sentimen bersamaan dengan twitter juga. Oleh karena itu judul dari penelitian ini ialah ANALISIS SENTIMEN MASYARAKAT MENGENAI “KEBIJAKAN PEMERINTAH INDONESIA DALAM MENANGGAPI COVID-19” DENGAN MENGGUNAKAN MOTODE NAÏVE BAYES PADA MEDIA SOSIAL FACEBOOK DAN TWITTER.

1.2. RUMUSAN MASALAH

Berdasarkan latar belakang yang telah dikembangkan diatas, maka permasalahan yang akan dibahas pada penelitian ini adalah sebagai berikut : 1. Bagaimana hasil dari analisis sentiment masyarakat mengenai kebijakan

pemerintah Indonesia dalam menanggapi covid-19 dengan metode naïve bayes ?

2. Bagaimana tingkat akurasi yang didapatkan dari analisis sentiment

masyarakat mengenai kebijakan pemerintah Indonesia dalam menanggapi

covid-19 dengan metode naïve bayes ?

(15)

1.3. BATASAN MASALAHA

Agar penelitian tugas akhir ini tidak keluar dari pokok permasalahan maka ruang lingkup pembahasan penelitian ini dibatasi dengan masalah sebagai berikut :

1. Sumber opini yang digunakan berbahasa Indonesia dan berasal dari sosial media Twiter dan Facebook.

2. Sumber opini yang digunakan pada wilayah Indonesia.

3. Analisis sentiment yang dilakukan menggunakan dan Naïve Bayes menggunakan bahasa pemrograman Python dan google colaboration sebagai IDE.

4. Analisis sentiment ini mencakup kelas positif, negatif dan netral.

5. Data yang diambil pada penelitian ini hanya seputar kebijakan pemerintah pusat Indonesia pada masa PPKM.

6. Penelitian ini tidak bertujuan untuk menetukan bagaimana hasil dari kebijakan pemerintah

1.4. TUJUAN PENELITIAN

Dari rumusan masalah diatas, tujuan dari penelitian ini adalah sebagai berikut :

1. Mengetahui hasil dari analisis sentiment masyarakat mengenai kebijakan pemerintah Indonesia dalam menanggapi covid-19 dengan metode naïve bayes

1.5. MANFAAT PENELITIAN

Adapun manfaat yang penulis harapkan dari penelitian ini antara lain adalah sebagai berikut:

1. Memberikan informasi sentiment masyarakat tentang kebijakan pemerintah Indonesia dalam menanggapi covid-19 berupa sentiment positif, sentiment negative dan sentiment netral.

2. Menjadi referensi bagi penelitian-penelitian berikutnya yang relevan dangan

kasus analisis sentiment.

(16)

6 BAB II

TINJAUAN PUSTAKA

2.1. Data minning

Seiring dengan berkembagannya penggunaan teknologi pada masa kini, tentunya data yang ditampung dalam databasepun semakin banyak dan semkin besar. Data yang semakin besar ini secara tidak langgsung harus dapat dimanfaatkan dengan baik oleh suatu organisasi ataupun suatu kelompok agar dapat memberikan suatu keunggulan kompetitif maupum informasi yang akan berguna bagi pengambilan keputusan. Proses penggalian informasi dari daya yang disimpan membutuh kan cara dan Teknik yang lebih cangih untuk dapat menghasilkan informasi yang lebih bernilai. Beragam metoe baru untuk mengali informasi dari kumpulan data pun semakin berkembang, banyak metode-metode yang memungkinkan untuk mendapatkan informasi dari sekumpulan data seperti gambaran maupun peramalan. Salah satunya yang berkembang adalah data mining

Data Mining merupakan proses yang memanfaatkan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis. Data Mining merupakan proses iterative dan interaktif untuk mengemukakan pola atau model baru sahih (sempurna), bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar (massive databse). Menurut Witten dkk, (2011) data mining digambarkan sebagai ekstraksi dari suatu data yang bersifat implisit, sebelumnya tidak diketahui, dan berpotensi memiliki informasi yang berguna. Data mining merupakan metode pengolahan data berskala besar untuk menemukan pola yang tersembunyi dari data tersebut. Hasil dari pengolahan data dengan metode data mining dapat digunakan untuk mengambil keputusan di masa depan

Data Mining berisi pencarian tren atau pola yang diinginkan dalam database besar untuk membantu pengambilan keputusan di waktu yang akan datang. Pola – pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja mengguankan perangkat pendukung keputusan yang lainnya (Hermawati, 2013)

2.2. Text mining

Text mining juga dikenal sebagai data mining text atau penemuan

pengetahuan dari database tekstual. Sesuai dengan buku The Text Mining

Handbook, text mining dapat didefinisikan sebagai suatu proses menggali

informasi dimana seorang user berinteraksi dengan sekumpulan dokumen

(17)

menggunakan tools analisis yang merupakan komponen – komponendalam data mining. Text mining adalah proses menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen dan tujuannya adalah mencari kata – kata yang dapat mewakili isi dokumen sehingga dapat dilakukan analisis keterhubungan antar dokumen tersebut. (Aditya B. R., 2015). Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan dalam textmining adalah sekumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu pengkategorisasian teks dan pengelompokkan teks. (Nurhuda, Sihwi, & Doewes, 2013).

Text mining akan memerlukan jutaan kata-kata yang disimpan dalam bentuk file elektronik yang bisa berbentuk beberapa dokumen yang akan diproses, namun tentu saja dokumen-dokumen ini masih dalam bentuk yang tidak terstruktur. Butuh tahapan untuk menambang teks-teks yang ada dalam koleksi dokumen sehingga didapatkan informasi-informasi yang lebih bernilai dan terstruktur.

2.3. Text processing

Preprocessing merupakan proses untuk mempersiapkan data mentah sebelum dilakukan proses lain. Pada umumnya, preprocessing data dilakukan dengan cara mengeliminasi data yang tidak sesuai atau mengubah data menjadi bentuk yang lebih mudah yang diproses oleh sistem. Preprocessing sangat penting dalam pembuatan analisis sentimen, terutama untuk media sosial yang sebagian besar berisi kata – kata atau kalimat yang tidak formal dan tidak terstruktur serta memiliki noise yang besar. Di bidang Text Mining, data preprocessing digunakan untuk mengekstraksi pengetahuan yang menarik dan penting serta dari data teks yang tidak terstruktur. Berdasarkan ketidakteraturan struktur data teks, maka proses sistem temu kembali informasi ataupun text mining memerlukan beberapa tahap awal yang pada intinya adalah mempersiapkan agar teks dapat diubah menjadi lebih terstruktur. Tahap Text Preprocessing adalah tahapan dimana aplikasi melakukan seleksi data yang akan diproses pada setiap dokumen. Proses preprocessing ini meliputi case folding, tokenizing, filtering, dan stemming (Hermawan dan Ismiati, 2020).

Namun demikian, tidak ada aturan pasti tentang setiap tahapan dalam text preprocessing.

a. Case Folding

(18)

8 Case Folding adalah proses mengubah ukuran semua karakter dalam dokumen menjadi sama. Karena data yang kita miliki tidak selalu terstruktur dan konsisten dalam penggunaan huruf kapital, maka peran case folding sangat dibutuhkan untuk mengubah bentuk keseluruhan teks dalam dokumen menjadi suatu bentuk standar.

Kebijakan Pemerintah dalam

menangani COVID-19 → Kebijakan pemerintah dalam menangani covid-19

b. Tokenizing

Data tweet bisa terdiri dari banyak kalimat. Untuk mempermudah proses analisis data, perlu dilakukan pemotongan kalimat-kalimat tersebut menjadi kata yang disebut dengan Tokenizing. Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya (Triawati, 2009). Pada proses ini juga dilakukan penghilangan angka, tanda baca, dan karakter selain huruf alfabet.

Kebijakan Pemerintah dalam

menangani COVID-19 →

Kebijakan pemerintah dalam menangani covid-19

c. Filtering

Tahap Filtering adalah tahap mengambil kata-kata penting dari hasil token. Kata umum yang biasanya muncul dan tidak memiliki makna disebut stopword. Cios, et.al., (2007) mendefinisikan Stopword sebagai kata-kata yang tidak relevan sehubungan dengan subjek utama dari basis data, meskipun kata-kata tersebut mungkin sering muncul dalam dokumen. Apabila dalam suatu kalimat terdapat satu atau lebih kata yang masuk ke dalam daftar stopword, maka kata tersebut harus dihilangkan dari kalimat itu. Kata-kata tersebut dapat dibuang karena dianggap kurang penting (contohnya kata ganti orang, kata sambung, dan masih banyak lagi) karena hasil akhir tahapan text pre-processing hanya akan menghasilkan kata-kata yang penting saja (Hermawan dan Ismiati, 2020).

Contoh stopword adalah “yang”, “dan”, “di”, “dari”, dan seterusnya.

(19)

Kebijakan pemerintah dalam menangani covid-19

→

Kebijakan pemerintah menangani covid-19

d. Stemming

Tahap Stemming adalah tahap kemudian yang diperlukan untuk memperkecil jumlah indeks yang berbeda dari satu data sehingga sebuah kata yang memiliki akhiran maupun awalan akan kembali ke bentuk dasarnya. Selain itu juga digunakan untuk mengelompokkan kata-kata lain yang memiliki kata dasar dan arti yang serupa namun memiliki bentuk yang berbeda karena telah mendapatkan imbuhan yang berbeda pula.

dikenal ditemukan

penyakit menyebar

→ ^kenal ^temu _sakit

sebar

2.4. Analisis sentiment

Analisis Sentimen atau opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini. Analisis sentiment dilakukan untuk melihat pendapat atau kecenderungan opini terhadap sebuah masalah atau objek oleh seseorang, apakah cenderung beropini negatif atau positif. (Rozi, Pranomo, & Dahlan, 2012). Menurut Medhat et al (2014, 1093) analisis sentimen adalah suatu bidang yang berlangsung dalam penelitian berbasiskan teks. Analisis sentimen atau opinion mining adalah kajian tentang cara untuk memecahkan masalah dari opini masyarakat, sikap dan emosi suatu entitas, dimana entitas tersebut dapat mewakili individu. (Wati, 2016). Analisis sentimen adalah bidang studi yang menganalisi pendapat, sentimen, evaluasi, penilaian, sikap, dan emosi seseorang terhadap sebuah produk, organisasi, individu, masalah, peristiwa atau topik Analisis sentimen dilakukan untuk melihat pendapat terhadap sebuah masalah, atau dapat juga digunakan untuk identifikasi kecenderungan hal yang sedang menjadi topik pembicaran.

(Liu,2012).

(20)

10 Dengan bantuan analisis sentimen, informasi yang tadinya tidak terstruktur dapat diubah menjadi data yang lebih terstruktur. Data tersebut dapat menjelaskan opini masyarakat mengenai produk, merek, layanan, politik, atau topik lainnya. Guna menghasilkan opini yang dibutuhkan, sentiment analysis tidak hanya harus bisa mengenali opini dari teks. Proses yang juga disebut sebagai opini mining ini juga perlu bekerja dengan mengenali tiga aspek berikut:

1. Subjek: topik apa yang sedang dibicarakan;

2. Polaritas: apakah opini yang diberikan bersifat positif atau negatif; dan 3. Pemegang opini: seseorang yang mengeluarkan opini tersebut.

2.5. Naïve Bayes Classifer

Naïve Bayes Classifier adalah salah satu metode yang popular digunakan

untuk keperluan data mining karena kemudahan penggunaannya serta waktu pemrosesannya yang cepat, mudah diimplementasikan dengan strukturnya yang cukup sederhana dan tingkat efektifitas yang tinggi. Naïve Bayes Classifer adalah teknik klasifikasi berdasarkan Teorema Bayes dengan asumsi independensi di antara para prediktor. Dalam istilah sederhana, classifier Naive Bayes mengasumsikan bahwa keberdaan fitur tertentu di kelas tidak terkait dengan keberadaan fitur lainnya. Bahkan jika fitur-fitur ini bergantung satu sama lain atau pada keberadaan fitur-fitur lainnya, semua properti ini berkontribusi secara independen terhadap probabilitasnya dan itulah sebabnya dikenal sebagai 'Naive'.

Sebagai contoh, sesuatu yang berwarna merah, bulat, dan memiliki diameter sekitar 10 cm bisa dikategorikan sebagai buah apel.

Walaupun fitur ini bergantung antara satu fitur dengan fitur yang lainnya. Naïve

Bayes Classifier akan tetap menganggap bahwa fitur – fitur tersebut independen

dan tidak memiliki pengaruh satu sama lainnya. Bergantung pada model

probabilitasnya, Naïve Bayes Classifier dapat dilatih untuk melakukan supervised learning dengan sangat efektif. Dalam berbagai macam penerapannya, estimasi

parameter untuk model Naïve Bayes menggunakan metode maximum likehood, yang artinya pengguna dapat menggunakan model Naïve Bayes tanpa perlu mempercayai probabilitas Bayesian atau tanpa menggunakan metode Bayesian (Hadna, Santosa, & Winarno, 2016).

Teorema Bayes merupakan torema yang mengacu pada konsep

probabilitas bersyarat. Secara umum teorema Bayes dapat dinotasikan pada

persmaan berikut:

(21)

𝑃(𝐶|𝑋) = 𝑃(𝑥|𝑐)𝑃(𝑐)

𝑃(𝑥) ……….(1)

Dengan X adalah data kelas yang belum diketahui, C adalah hipotesis kata yang merupakan suatu kelas yang spesifik, P(C|X) merupakan probabilitas dari hipotesis yang berdasarkan kondisi, P(C) adalah probabilitas hipotesis, P(X|C) adalah probabilitas berdasarkan kondisi pada hipotesis dan P(X) adalah probabilitas dari C.

2.6. Confusion matrix

Pengukuran terhadap kinerja suatu sistem klasifikasi merupakan hal yang penting. Kinerja sistem klasifikasi menggambarkan seberapa baik sistem dalam mengklasifikasikan data. Confusion matrix merupakan salah satu metode yang dapat digunakan untuk mengukur kinerja suatu metode klasifikasi. Pada dasarnya confusion matrix mengandung informasi yang membandingkan hasil klasifikasi yang dilakukan oleh sistem dengan hasil klasifikasi yang seharusnya.

Berdasarkan jumlah keluaran kelasnya, sistem klasifikasi dapat dibagi menjadi 4 (empat) jenis yaitu klasifikasi binary, multi-class, multi-label dan hierarchical Pada klasifikasi binary, data masukan dikelompokkan ke dalam salah satu dari dua kelas. Jenis klasifikasi ini merupakan bentuk klasifikasi yang paling sederhana dan banyak digunakan. Contoh penggunaannya antara lain dalam sistem yang melakukan deteksi orang atau bukan, sistem deteksi kendaraan atau bukan, dan sistem deteksi pergerakan atau bukan.

Sementara itu, pada bentuk klasifikasi multi-class, data masukan diklasifikasikan menjadi beberapa kelas. Sebagai contoh sistem yang dapat mengklasifikasikan jenis kendaraan seperti sepeda, sepeda motor, mobil, bus, truk, dan sebagainya. Bentuk klasifikasi multi-label pada dasarnya sama dengan multi-class dimana data dikelompokkan menjadi beberapa kelas, namun pada klasifikasi multi-label, data dapat dimasukkan dalam beberapa kelas sekaligus.

Bentuk klasifikasi yang terakhir adalah hierarchical. Data masukan

dikelompokkan menjadi beberapa kelas, namun kelas tersebut dapat

dikelompokkan kembali menjadi kelas-kelas yang lebih sederhana secara

hirarkis. Contohnya dalam penelitian ini, arah pergerakan dikelompokkan

menjadi 12 arah pergerakan yang tentunya dapat disederhanakan menjadi 4

arah. Pada pengukuran kinerja menggunakan confusion matrix, terdapat 4

(empat) istilah sebagai representasi hasil proses klasifikasi. Keempat istilah

tersebut adalah True Positive (TP), True Negative (TN), False Positive (FP) dan False

Negative (FN). Nilai True Negative (TN) merupakan jumlah data negatif yang

(22)

12 terdeteksi dengan benar, sedangkan False Positive (FP) merupakan data negatif namun terdeteksi sebagai data positif. Sementara itu, True Positive (TP) merupakan data positif yang terdeteksi benar. False Negative (FN) merupakan kebalikan dari True Positive, sehingga data posifit, namun terdeteksi sebagai data negatif. Berdasarkan nilai True Negative (TN), False Positive (FP), False Negative (FN), dan True Positive (TP) dapat diperoleh nilai akurasi, presisi dan recall. Nilai akurasi menggambarkan seberapa akurat sistem dapat mengklasifikasikan data secara benar. Dengan kata lain, nilai akurasi merupakan perbandingan antara data yang terklasifikasi benar dengan keseluruhan data. Nilai akurasi dapat diperoleh dengan Persamaan

𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =

^{𝑇𝑃+𝑇𝑁}

𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁

𝑥 100 %.

dimana:



TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan benar oleh sistem.



TN adalah True Negative, yaitu jumlah data negatif yang terklasifikasi dengan benar oleh sistem.



FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah oleh sistem.



FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi salah oleh sistem

2.7. Media sosial

Pada dasarnya media sosial merupakan perkembangan mutakhir dari

teknologi – teknologi web baru berbasis internet, yang memudahkan semua orang

untuk dapat berkomunikasi, berpartisipasi, saling berbagi dan membentuk

sebuah jaringan secara online, sehingga dapat menyebarluaskan konten mereka

sendiri. Seperti post di blog, tweet, atau video youtube dapat direproduksi dan

dapat dilihat secara langsung oleh jutaan orang secara gratis. Media sosial

mempunyai banyak bentuk, diantaranya yang paling popular yaitu microblogging

(twitter), facebook, dan blog. Twitter adalah suatu situs web yang merupakan

layanan dari microblog, yaitu suatu bentuk blog yang membatasi ukuran setiap

posnya, yang memberikan fasilitas bagi pengguna untuk dapat menuliskan pesan

dalam twtiiter update hanya berisi 140 karakter. Twitter merupakan salah satu

jejaring sosial yang paling mudah digunakan, karena hanya memerlukan waktu

yang singkat tetapi informasi yang disampaikan dapat langsung menyebar secara

luas. (Setyani, 2013)

(23)

2.8. Facebook & Twitter

Twitter adalah suatu jejaring sosial dan microblog daring atau suatu blog yang memungkinkan pengunanya dapat menulis text pembeharuan singkat yang biasa nyakurang dari 200 (dua ratus) karakter dan dapat mempublikasikan nya baik dilihat secara umum atau kelompok terbatas yang dipilih oleh pemilik akun tersebut. Twitter memungkin nya penggunanya untuk mengirim dan membaca pesan berbasis text hingga 140 karakter akan tetapi pada tanggal 07 November 2017 bertambah menjadi 280 karakter yang dikenal dengan sebutan kicauan (tweet). Twitter didirikan pada bulan maret ditahun 2006 oleh Jack Dorsey, dan situs jejaring sosial nya diluncurkan pada bulan juli, sejak diluncurkan nya, Twiiter telah menjadi salah satu sari sepuluh situs yang paling sering digunakan didalam internet, dan dijuluki dengan pesan singkat internet.

(Leslie, 2009)

Twitter mengalami pertumbuhan yang pesat dan dengan cepat meraih popularitas diseluruh dunia. Hingga bulan Januari 2013, terdapat lebih dari 500 juta pengguna terdaftar diTwitter, 200 juta diantaranya adalah pengguna aktif.

Lonjakan penggunaan Twitter umumnya berlangsung saat terjadinya peristiwa- peristiwa populer. Pada awal 2013, pengguna Twitter mengirimkan lebih dari 500 juta kicauan per hari, dan Twitter menangani lebih dari 1,6 miliar permintaan pencarian per hari. Hal ini menyebabkan posisi Twitter naik ke peringkat kedua sebagai situs jejaring sosial yang paling sering dikunjungi didunia, dari yang sebelumnya menempati peringkat dua puluh dua.

2.9. Pemerintah dan Kebijakan Pemerintah

Kebijakan pemerintah pada hakikatnya merupakan kebijakan yang ditujukan untuk publik dalam pengertian yang seluas-luasnya (negara, masyarakat dalam berbagai status serta untuk kepentingan umum), baik itu dilakukan secara langsung maupun tidak secara langsung yang tercermin pada berbagai dimensi kehidupan publik. Oleh karena itu, kebijakan publik sering disebut sebagai kebijakan publik.

Kebijakan dalam pengertian pilihan untuk melakukan atau untuk tidak

melakukan mengandung makna adanya kehendak untuk melakukan atau tidak

melakukan, kehendak mana dinyatakan berdasarkan otoritas yang dimiliki

untuk melakukan pengaturan dan jika perlu dilakukan pemaksaan. Pernyataan

kehendak oleh otoritas dikaitkan dengan konsep pemerintah yang memberikan

pengertian atas kebijakan yang dialkukan oleh pemerintah yang disebut sebagai

kebijakan pemerintah. Kebijakan pemerintah dapat berkonotasi sebagai

kebijakan negara ketika pemerintah yang melakukan adalah diarahkan pada

(24)

14 pemerintah negara. Kalau kebijakan pemerintah dipahami dari saran yang akan dicapai (diatur) di mana sasarannya adalah publik tidak saja dalam pengertian negara akan tetapi dalam pengertian masyarakat dan kepentingan umum maka kebijakan pemerintah dapat dikategorikan sebagai kebijakan publik. (Refika Aditama, 2012). Tentu dengan adanya atau tidaknya kebijakan dari pemerintah menuai reaksi yang beragam dari masyarakat, dengan mengetahui tingkat sentimental masyarakat akan suatu kebijakan tentu dapat menjadi tolak ukur bagi pemerintah

Dilansir dari website kemlu.go.id Pada 31 Maret 2020, Presiden RI menerbitkan Peraturan Pemerintah Pengganti UU No 1 Tahun 2020 (PERPPU 01/2020) tentang Kebijakan Keuangan Negara dan Stabilitas Sistem Keuangan Untuk Penanganan Pandemi Corona Virus Disease 2019 (Covid-19) dan/atau dalam Rangka Menghadapi Ancaman yang Membahayakan Perekonomian Nasional dan/atau Stabilitas Sistem Keuangan. Total anggaran untuk ini adalah sebesar Rp 405,1 triliun. Pada 3 April 2020, Presiden menerbitkan Peraturan Presiden (Perpres) No. 54 Tahun 2020 tentang Perubahan Postur Rincian dan APBN Tahun 2020. Perpres ini merupakan tindak lanjut dari Perppu No. 1 Tahun 2020. Anggaran dari beberapa kementerian dipotong sebesar Rp 97,42 triliun.

Namun, beberapa Kementerian mengalami peningkatan anggaran, seperti Kementerian Pendidikan dan Kebudayaan sebesar dari Rp 36 triliun menjadi Rp 70 triliun; dan Kementerian Kesehatan dari Rp 57 triliun menjadi 76 triliun dengan Initial Reponses



Pembentukan Tim Gerak Cepat (TGC) di wilayah otoritas pintu masuk negara di bandara/pelabuhan/pos lintas batas darat negara (PLBDN).



Pada 18 Januari 2020, Indonesia melakukan pemeriksaan kesehatan di 135 titik bandar udara, darat, dan pelabuhan menggunakan alat pemindai suhu.



Kementerian Kesehatan (Kemkes) menunjuk sedikitnya 100 Rumah Sakit rujukan yang sebelumnya dipakai pada kasus flu burung.



Kemkes mengembangkan pedoman kesiapsiagaan mengacu pada pedoman sementara World Health Organization (WHO).



Kemkes membuka kontak layanan yang dapat diakses umum. Layanan ini digunakan untuk mengomunikasikan hal-hal terkait Covid-19.



Pada 2 Februari 2020, Pemri mengumumkan penundaan penerbangan dari dan ke RRT daratan yang berlaku mulai 5 Februari 2020 pukul 00.00 WIB.

Pada 4 Februari 2020, Pemri menghentikan sementara impor hewan hidup

dari RRT daratan.

(25)



Pada 2 Februari 2020, memulangkan WNI dari Provinsi Hubei, RRT.

Langkah-langkah sebelumnya yang ditempuh antara lain:



Ketersediaan akses logistik di Wuhan. Bantuan dana setara Rp 133 juta kepada WNI yang sebagian besar merupakan mahasiswa.



BNPB melalui Kemlu dan KBRI Beijing mengirimkan masker N-95 untuk WNi di RRT.



Penerbitan Keputusan Presiden (Keppres) No. 7 Tahun 2020 tentang Gugus Tugas Percepatan Penanganan Corona Virus Disease 2019 (Covid-19) pada 13 Maret 2020; dan Keppres No. 9 Tahun 2020 tentang Perubahan atas Keppres No. 7 Tahun 2020 pada 20 Maret 2020.

Bidang Kesehatan (senilai Rp 75 triliun)



Perlindungan tenaga kesehatan, terutama pembelian APD



Pembelian alat-alat kesehatan yang dibutuhkan, seperti: test kit, reagen, ventilator, hand sanitizer dan lain-lain sesuai standar yang ditetapkan Kementerian Kesehatan.



Upgrade 132 rumah sakit rujukan bagi penanganan pasien Covid-19, termasuk Wisma Atlet.



Insentif dokter (spesialis Rp.15 juta/bulan), dokter umum (Rp.10 juta), perawat Rp.7.5 juta dan tenaga kesehatan lainnya Rp.5 juta.



Santunan kematian tenaga medis Rp. 300 juta



Dukungan tenaga medis, serta penanganan kesehatan lainnya.

Bidang Sosial (senilai Rp 110 triliun)



Dukungan logistik sembako dan kebutuhan pokok 25 Triliun.



PKH 10 juta KPM, dibayarkan bulanan mulai April (sehingga bantuan setahun naik 25%)



Kartu sembako dinaikkan dari 15,2 juta menjadi 20 juta penerima, dengan manfaat naik dari Rp.150.000 menjadi Rp. 200.000,- selama 9 bulan (naik 33 persen)



Kartu Prakerja dinaikkan dari 10 T menjadi 20 triliun untuk bisa mengcover sekitar 5,6 juta pekerja informal, pelaku usaha mikro dan kecil. Penerima manfaat mendapat insentif pasca pelatihan Rp 600 ribu, dengan biaya pelatihan 1 juta.



Pembebasan biaya listrik 3 bulan untuk 24 juta pelanggan listrik 450VA,

dan diskon 50% untuk 7 juta pelanggan 900VA bersubsidi.

(26)

16



Tambahan insentif perumahan bagi pembangunan perumahan masyarakat berpenghasilan rendah (MBR) hingga 175 ribu.

Kebijakan Fiskal dan Insentif Pajak (senilai Rp 70,1 triliun)



Relaksasi batas maksimal defisit APBN (sebelumnya sebesar 3%) diberlakukan pada tahun 2020, 2021 dan 2022. Diprediksi defisit APBN tahun ini adalah sebesar 5,07%.



PPH 21 pekerja sektor industri pengolahan dengan penghasilan maksimal 200 juta setahun ditanggung pemerintah 100%.



Pembebasan PPH Impor untuk 19 sektor tertentu, Wajib Pajak Kemudahan Impor Tujuan Ekspor (KITE) dan wajib Pajak KITE Industri Kecil Menengah



Pengurangan PPH 25 sebesar 30% untuk sektor tertentu Kemudahan Impor Tujuan Ekspor (KITE) dan wajib Pajak KITE Industri Kecil Menengah



Restitusi PPN dipercepat bagi 19 sektor tertentu untuk menjaga likuiditas pelaku usaha.



Penundaan pembayaran pokok dan bunga untuk semua skema Kredit Usaha Rakyat (KUR) yang terdampak COVID-19 selama 6 bulan.



Penurunan tarif PPh Badan menjadi 22% untuk tahun 2020 dan 2021 serta menjadi 20% mulai tahun 2022.



Dukungan lainnya dari pembiayaan anggaran untuk mendukung pemulihan ekonomi.

Kebijakan Perdagangan Ekspor-Impor



Penyederhanaan larangan terbatas (lartas) ekspor



Penyederhanaan larangan terbatas (lartas impor)



Percepatan layanan proses ekspor-impor melalui national logistic ecosystem.

Usaha Mikro, Kecil, dan Menengah (UMKM) senilai Rp 150 triliun



Memberikan stimulus untuk debitur melalui penilaian kualitas kredit sampai 10 Milyar berdasarkan ketepatan membayar



Restrukturisasi untuk seluruh kredit tanpa melihat plafon kredit.



Restrukturisasi kredit UMKM dengan kualitas yang dapat langsung

menjadi lancar.

(27)

Pembatasan Sosial Berskala Besar (PSBB)



Peraturan Pemerintah Nomor 21 tahun 2020 tentang Pembatasan Sosial Berskala Besar dalam rangka Percepatan Penanganan Corona Virus Disease 2019 (Covid-19) ditetapkan pada 31 Maret 2020. Pemerintah Daerah (Pemda) dapat melakukan Pembatasan Sosial Berskala Besar (PSBB) untuk satu provinsi atau kabupaten/kota tertentu. PSBB dilakukan dengan pengusulan oleh gubernur/bupati/walikota kepada Menteri Kesehatan.



Peraturan Menteri Kesehatan No. 9 Tahun 2020 tentang Pedoman PSBB dalam rangka Percepatan Penanganan Covid-19 ditetapkan pada 3 April 2020. Kebijakan PSBB antara lain: 1) Peliburan sekolah dan tempat kerja;

2) Pembatasan kegiatan keagamaan; 3) Pembatasan kegiatan di tempat/fasilitas umum; 4) Pembatasan kegiatan sosial budaya; 5) Pembatasan moda transportasi; dan 6) Pembatasan kegiatan lainnya terkait aspek pertahanan dan keamanan.



Pada 7 April 2020, Menkes menyetujui PSBB untuk diterapkan di DKI Jakarta. PSBB dilakukan selama 14 hari. Ojek online dilarang membawa penumpang. Jadwal KRL dievaluasi ulang dan dikurangi. Di wilayah Jabodetabok, akan dibagikan sembako senilai Rp 200 ribu per keluarga.

Nantinya penerima bantuan akan mendapakan Rp 600 ribu per keluarga yang diberikan selama kurun waktu 3 bulan.

Bidang Hukum

Kementerian Hukum dan HAM (Kemenkumham) telah membebaskan 22.158 orang narapidana dan anak. Sebanyak 15.477 orang di antaranya keluar penjara melalui program asimilasi. Sementara 6.681 orang lainnya menghirup udara bebas melalui program hak integrasi, baik berupa pembebasan bersyarat, cuti bersyarat, maupun cuti menjelang bebas.

Ss

Kebijakan/Fasilitas Lainnya



Pemri membangun fasilitas observasi, penampungan, dan karantina untuk mengendalikan infeksi Covid-19 di Pulau Galang. Kapasitas ini terdiri dari 1.000 tempat tidur. Fasilitas ini siap pada 6 April 2020.



Pada 23 Maret 2020, Wisma Atlet Kemayoran diresmikan menjadi rumah

sakit darurat Covid-19. Fasilitas ini dilengkapi dengan laboratorium,

farmasi, dan peralatan medis portable. Fasilitas ini mampu menampung

sampai dengan 3.000 tempat tidur.

(28)

18 2.10. Covid – 19

Pada 9 Januari 2020, CDC China melaporkan coronavirus baru sebagai agen penyebab wabah, yang masih satu jenis dengan SARS-CoV, disebut sebagai penyakit coronavirus baru 2019 (COVID-19). Pada 11 Maret 2020, 118.598 kasus COVID-19 dilaporkan di seluruh dunia oleh lebih dari 100 negara. Belum di temukan vaksin, mayoritas kasus (80%) adalah infeksi saluran pernapasan dan pneumonia (ECDC, 2020). Tindakan preventif kesehatan masyarakat untuk mengurangi dampak pandemi salah satunya menjalankan aturan social distancing. Kecerdasan teknologi media social dimanfaatkan untuk meningkatkan untuk menjalani social distancing dengan media social berkaitan dengan situasi epidemic dapat digunakan sebagai sumber informasi untuk melakukan mobilisasi masyarakat mengikuti prosedur karantina, dengan mengurangi situasi panik dan ketakutan (Martin, 2020)

2.11. Penelitian terdahulu

Dalam menunjang kegiatan penelitian ini dan menghindari dari suatu duplikasi dalam penelitian yang akan dilakukan, maka dibutuhkan beberapa acuan dari penelitian terdahulu, sehingga dengan menambahkan acuan akan memudahkan peneliti dalam mengetahui hubungan antara penelitian yang akan dilakukan dengan penelitian terdahulu.

Analisis sentimen merupakan suatu jenis penelitian berkesinambungan yang berada berbagai bidang seperti Data Mining, dan Machine Learning yang berfokur pada klasifikasi sentimen dalam sebuah kalimat berdasarkan isinya.

Penelitian dari pendapat pengguna sosial media, sentimen dan emosi melalui atribut yang dimiliki serta dituangkan dalam bentuk teks banyak dilakukan karena topik ini sangat menarik untuk diulas. Pengklasifikasian sentimen analisis menjadi alternatif dan bahan evaluasi yang baik bagi pihak terkait. Hal ini dibuktikan dengan banyaknya penelitian atau riset dibidang tersebut. Berikut merupakan penelitian yang berkaitan atau serupa dengan penelitian yang akan dilakukan oleh peneliti

NO Penelitian

/Tahun Topik Keterangan

1 (Ghulam,2017)

Analisis

Sentimen Calon Gubernur DKI

menganalisa tanggapan pengguna

twitter terhadap calon gubernur DKI

jakarta pada tahun 2017 melalui

(29)

Jakarta 2017 Di Twitter

media sosial twitter, pada penelitian ini peneliti mengklasifikasikan konten menjadi 3 kategori yaitu sentiment positif, sentiment

negative dan sentiment netral, pada penelitian ini metode yang

digunakan untuk tahapan

preprocessing data menggunakan tokenisasi, cleansing dan filtering, untuk menentukan class sentiment dengan metode LexiconBased,Untuk proses klasifikasinya menggunakan metode Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM).

Data yang digunakan adalah tweet dalam Bahasa Indonesia dengan kata kunci AHY, Ahok, Anies, dengan jumlah dataset sebanyak 300 tweet. Hasil dari penelitian ini adalah analisis sentimen terhadap calon gubernur DKI Jakarta 2017.

Akurasi tertinggi didapat saat menggunakan metode klasifikasi Naïve Bayes Classifier (NBC), dengan nilai rata-rata akurasi mencapai 95%, nilai presisi 95%, nilai recall 95% nilai TP rate 96,8%

dan nilai TN rate 84,6%.

2 (Hidayat,2015) Analisis Sentimen Calon

Gubernur DKI Jakarta 2017 Di

Twitter

Menganalisa sentimen terhadap wacana politik pada Media masa online menggunakan algoritma Support vector machine dan naive bayes.hasil penelitian ini

menunjukkan bahwa penggunaan

Metode algoritma svm Dapat

mengimplementasikan hasil dari

pengujian data berita wacana politik

(30)

20 dan dari penggunaan Naive bayes dapat di Hasilkan perbedaan dengan algoritma svm Pada masing - masing data yang telah di Analisis dan dari hasil pengukuran

menggunakan teknik pengukuran precision, recall dan di dapati tingkat akurasik lasifikasi berita politik masing - masing. Sehingga pada hasil analisa tersebut dapat Di ambil kesimpulan bahwa penerapan algoritma Svm menunjukkan

akurasi lebihbesar 90,50%

Sedangkan naïve bayes di uji data sebanyak 700 Data 59,98% Dalam hasil klasifikasi opini wacana politik serta dengana danya hasil analisis tersebut dapat memperoleh

klasifikasi opini yang baik

(31)

21 BAB III

METODOLOGI PENELITIAN

3. 1. Tempat dan Waktu penelitian

Pada penelitian ini akan bertempat di lingkungan Universitas Jambi, karena mengingat data yang di butuhkan dapat di peroleh secara online dan tidak memerlukan studi lapangan.

3. 2. Bahan dan Alat penelitian

Perangkat keras yang digunakan dalam penelitian ini adalah komputer personal dengan spesifikasi sebagai berikut:

• Prosesor : Intel Core i5-1035G1 @ 1.00Ghz

• RAM : 8 GB

• Memori : 1 TB

Perangkat lunak yang digunakan dalam penelitian ini adalah sebagai berikut:

• Sistem operasi Windows 10 (64-bit)

• Bahasa pemrograman Python 3.8.8

• google collaboration sebagai IDE

• data miner (ektensi google chrome)

• Library simplejson, sastrawi, Unicode,collection, NLTK, pandas, numpy,

textblob, spacy, sklearn, matplotlib.pyplot, wordcloud,

3. 3. Kerangka kerja penelitian

Adapun kerangka kerja pada penelitian kali ini dapat digambarkan dalam

bentuk diagram alir sebagai berikut ini :

(32)

22 Berdasarkan kerangka kerja diatas maka berikut merupakan penjelasan mengenai tahapan penelitian yang akan dilakukan yaitu :

1. Pengambilan data pada media sosial twitter dan facebook dengan metode yang digunakan adalah web scrapping yang akan menghasilkan data mentah.

2. Preprocesing data atau tahapan penyiapan data sebelum data diolah yang akan terbagi menjadi empat tahap yaitu :



Case folding yaitu tahapan mengubah semua huruf capital menjadi huruf biasa.



Punctuation yaitu tahapan penghapusan tanda baca.



Stopward removal yaitu pembuangan term yang tidak memiliki arti atau tidak mempengaruhi suatu kalimat.



Stemming yaitu pemotongan imbuhan pada kata yang berimbuhan sehingga kata tersebut menjadi kata dasarnya.

3. Perhitungan TF-IDF untuk menentukan kata atau term yang sering muncul

4. Pengkalisfikasian data yang telah bersih dan siap diolah dengan metode naïve bayes.

5. Pengukuran tingakat keakuratan dari hasil pengklasifikasian data.

3. 4. Metode analisis data

Metode penelitian ini akan menggunakan metode Naïve Bayes Classifier

metode ini memiliki dua tahapan proses yaitu training dan testing. Berikut adalah

tahapan pada penelitian ini :

(33)

a. Pengumpulan data

Data yang akan digunakan diperoleh dari facebook.com dan twitter.com.

dan dikumpulkan pada tanggal 1 sampai 7 september 2021. Pengumpulan data menggunbakan metode scrapping langsung pada website dari media social yang akan digunakan yaitu facebook dan twitter sehinnga tidak memerlukan API. Proses scrapping dilakukkan dengan menggunakan tools ekstensi dari google chrome yaitu data miner.

b. Pengolahan data

Terdapat empat proses pada tahapan pengolahan data yaitu case folding,

tokenization, stopward removal, serta stemming.

a. Case Folding

Case Folding adalah proses mengubah ukuran semua karakter dalam dokumen menjadi sama. Karena data yang kita miliki tidak selalu terstruktur dan konsisten dalam penggunaan huruf kapital, maka peran case folding sangat dibutuhkan untuk mengubah bentuk keseluruhan teks dalam dokumen menjadi suatu bentuk standar.

Kebijakan Pemerintah dalam

menangani COVID-19 → Kebijakan pemerintah dalam menangani covid-19

b. Tokenizing

Data tweet bisa terdiri dari banyak kalimat. Untuk mempermudah proses analisis data, perlu dilakukan pemotongan kalimat-kalimat tersebut menjadi kata yang disebut dengan Tokenizing. Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya (Triawati, 2009). Pada proses ini juga dilakukan penghilangan angka, tanda baca, dan karakter selain huruf alfabet.

Kebijakan Pemerintah dalam

menangani COVID-19 →

Kebijakan pemerintah dalam menangani covid-19

c. Filtering

Tahap Filtering adalah tahap mengambil kata-kata penting dari

hasil token. Kata umum yang biasanya muncul dan tidak memiliki makna

disebut stopword. Cios, et.al., (2007) mendefinisikan Stopword sebagai

kata-kata yang tidak relevan sehubungan dengan subjek utama dari basis

(34)

24 data, meskipun kata-kata tersebut mungkin sering muncul dalam dokumen. Apabila dalam suatu kalimat terdapat satu atau lebih kata yang masuk ke dalam daftar stopword, maka kata tersebut harus dihilangkan dari kalimat itu. Kata-kata tersebut dapat dibuang karena dianggap kurang penting (contohnya kata ganti orang, kata sambung, dan masih banyak lagi) karena hasil akhir tahapan text pre-processing hanya akan menghasilkan kata-kata yang penting saja (Hermawan dan Ismiati, 2020).

Contoh stopword adalah “yang”, “dan”, “di”, “dari”, dan seterusnya.

Kebijakan pemerintah dalam menangani covid-19

→

Kebijakan pemerintah menangani covid-19

d. Stemming

Tahap Stemming adalah tahap kemudian yang diperlukan untuk memperkecil jumlah indeks yang berbeda dari satu data sehingga sebuah kata yang memiliki akhiran maupun awalan akan kembali ke bentuk dasarnya. Selain itu juga digunakan untuk mengelompokkan kata-kata lain yang memiliki kata dasar dan arti yang serupa namun memiliki bentuk yang berbeda karena telah mendapatkan imbuhan yang berbeda pula.

dikenal ditemukan

penyakit menyebar

→ ^kenal ^temu _sakit

sebar

c. Penentuan Class Attribute & Penentuan Class Attribute

Setelah dilakukan tokenisasi dan ditentukan class attribute, langkah selanjutnya adalah load dictonary. Banyak jenis kamus yang dapat digunakan, contohnya: Kamus Sentimen. Kamus sentimen berisi kumpulan kata yang telah diberi bobot dengan kekuatan sentimen 1 (tidak memiliki sentimen positif) s.d. 5 (memiliki sentimen positif yang sangat kuat), dan -1 (tidak memiliki sentimen negatif) s.d. -5 (memiliki sentiment negatif yang sangat kuat). Kamus sentimen didapatkan dari penelitian Haryalesmana pada tahun 2016.

d. Experiment dan pengujian

(35)

Pada tahapan ini data sudah dikelompokan kedalam class ulasan negatif dan positif untuk dilakukan eksperimen pengujian. Data yang sudah dikelompokan akan dilakukan pengujian menggunakan metode naïve bayes dengan persamaan :

𝑃(𝐶|𝑋) =

^𝑃(

𝑥

|

𝑐

)𝑃(𝑐) 𝑃(𝑥)

Keterangan :

x : Data dengan kelas yang belum di ketahui c : Hipotesis data merupakan suatu kelas spesifik P(C|X) : Probabilitas hipotesis berdasarkan kondisi (Posteriory

probability)

P(c) : Probabilitas hipotesis (Prior probability)

P(X|C) : Probabilitas berdasarkan kondisi pada hipotesis P(x) : Probabilitas C

e. Pengukuran akurasi

Pada tahapan ini hasil klasifikasi yang telah di lakukan, akan diukur tingkat keakuratannya dengan menggunakan metode confusion matrix dengan persamaan :

𝑎𝑘𝑢𝑟𝑎𝑠𝑖 =

^{𝑇𝑃+𝑇𝑁}

𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁

𝑥 100 %.

Dimana :



TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan benar oleh sistem.



TN adalah True Negative, yaitu jumlah data negatif yang terklasifikasi dengan benar oleh sistem.



FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah oleh sistem.



FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi

salah oleh sistem

(36)

26 BAB IV

HASIL DAN PEMBAHASAN

Dalam bab ini akan dijelaskan proses dari penelitian ini, dimulai dari tahap pengumpulan data, pembersihan data, hingga proses yang terdapat dalam metode Naïve Bayes yang terdiri dari beberapa tahapan yaitu dimulai dari tahapan pengumpulan data, praproses data, parsing json, filtering tokenisasi, stemming dan terakhir klasifikasi Naïve Bayes. Data yang diambil pada penelitian kali ini menggunakan teknik scrapping dengan bantuan Data miner dan menggunakan Python 3.9.

4.1. Pengumpulan Data

Pada penelitian ini proses pengumpulan data dilakukan dengan menggunakan teknik scrapping atau meng-copy data dari suatu halaman web dengan bantuan pluggin data miner. Hal pertama yang harus dilakukan pada proses scrapping ialah membuka halaman web yang berisikan data yang ingin diambil.

Gambar 4 pencarian pada twitter.com

Gambar diatas merupakan halaman pencarian pada situs twitter.com yang sedang menampilkan hasil pencarian dari kata kunci

𝑃𝑒𝑚𝑒𝑟𝑖𝑛𝑡𝑎ℎ 𝐴𝑁𝐷 (𝑘𝑜𝑟𝑜𝑛𝑎 𝑂𝑅 𝑐𝑜𝑣𝑖𝑑) 𝐴𝑁𝐷 𝑃𝑃𝐾𝑀

(37)

Gambar 5 pencarian pada facebook.com

Gambar diatas merupakan halaman pencarian pada situs facebook.com yang sedang menampilkan hasil pencarian dari kata kunci

𝑃𝑒𝑚𝑒𝑟𝑖𝑛𝑡𝑎ℎ 𝐴𝑁𝐷 (𝑘𝑜𝑟𝑜𝑛𝑎 𝑂𝑅 𝑐𝑜𝑣𝑖𝑑) 𝐴𝑁𝐷 𝑃𝑃𝐾𝑀

Setelah menentukan halaman yang akan di ambil datanya melalui teknik scrapping, selanjutnya diperlukan untuk menentukan selector pada pluggin data

miner untuk menentukan bagian atau tag mana pada halaman web yang akan di

lakukan proses scrapping oleh data miner melalui tool New Recipe yang terdapat di dalam pluggin data miner

Gambar 6. Tampilan pluggin data miner

(38)

28 Gambar 7. Proses selector pada halaman web

Setelah menentukan selector pada halaman web, selanjutnya proses scrapping bias dilakukan dengan cara menekan tombol Scrape page pada pluggin data miner.

Gambar 8. Proses scraping pada halaman web

Setelah melakukan proses scraping dan data yang terkumpul telah mencukupi,

selanjutnya data tinngal diexpor dari pluggin data miner dengan cara menekan

tombol download pada menu scrape and download pada pluggin data miner.

(39)

Gambar 9. Proses pengunduhan data

Data yang diperoleh pada tahap ini masih dalam format Microsoft office excel dengan setiap data memiliki beberap atribut yaitu



Who Post (Siapa yang memposting)



Date (tanggal)



Content (conten)



Comment (komentar dalam bentuk jumlah)



Likes (penyuka dalam bentuk jumlah)



Images (gambar dalam bentuk boolean)

Tetapi atribut yang akan digunakan pada penelitian ini hanya berfokus pada atribut content. Karena pada atribut itulah berisi postingan pengguna yang akan dilakukan analisa sentimennya

Gambar 10. Data dalam format Microsoft office excel

(40)

30 4.2. Praprocess Data

pada tahapan ini akan dilakukan proses penyiapan data awal yang masih memiliki format Microsoft office excel menjadi data yang sudah siap di olah dengan format JSON (JavaScript Object Notation). Hal pertama yang di lakukan ialah memastikan tidak ada data yang memiliki duplikat, sehinnga tiap tiap data menjadi unik, berbeda satu antara yang lain. Untuk melakukan hal tersebut bias dengan cara memanfaatkan fitur remove-duplicate yang telah di sediakan oleh Microsoft excel itu sendiri pada data.

Gambar 11. Menu Remove duplicates pada Microsoft office excel

Setelah memilih fungsi remove-duplicate, Microsoft office excel akan meminta

keterangan berupa kolom mana yang akan menjadi acuan sebagai pembanding

tiap data pada kolom yang dipilih tersebut, dan menghapus data dyang ternyata

memiliki duplikat. Dikarenakan data utama pada penelitian ini adalah konten

yang berisikan postingan dari masing masing pengguna maka yang menjadi

acuan ialah column-c yang berisikan data konten tersebut. Maka dipilih lah

column-c sebagai pembanding.

(41)

Gambar 12. Column-c sebagai acuan

Setelah dilaksanakannya fungsi remove-duplicate pada Microsoft office excel tersebut maka diperolehlah data yang sudah dipastikan unik dan tidak memiliki duplikat. Selanjutnya mengubah format data yang masih berformat Microsoft office excel menjadi JSON. Konversi format data ini dapat dilakukan dengan bantuan beautifultool yang dapat diakses pada situs beautifultool.com

Gambar 13. Konversi format dengan bantuan beautifultool.com

Setelah dikonversi kedalam format json data bisa diunduh dan telah dapat

digunakan untuk proses selanjutnya. Data yang telah siap akan memiliki atribut

(42)

32 yang sama dengan atribut pada data yang masih berformat Microsoft excel. Total data yang telah terkumpul memiliki total 1139 data

Gambar 14. Data dalam format JSON 4.3. Pengolahan data

Pengolahan data pada penelitian ini menggunakan pyton 3.9 dengan bantuan google collaboration sebagai IDE untuk memproses data. Tahapan pertama dalam pengolahan dataialah punctuation atau penghapusan tanda baca ataupun symbol symbol lain ( ! @ # $ % ^ & * ? , . dsb ). Hasil dari penghapusan

punctation ini adalah sebagai berikut.

Gambar 15. Pengahpusan Punctation

Tahapan selanjutnya stopword removal atau pembuangan term yang tidak

memiliki arti atau tidak mempengaruhi suatu kalimat (contoh : ada, adalah,