MySQL merupakan software database open source yang paling populer di dunia. MySQL menjadi pilihan utama bagi banyak pengembang software dan aplikasi hal ini dikarenakan kelebihan MySQL diantaranya sintaksnya yang mudah dipahami, didukung program-program umum seperti C, C++, Java, PHP, Pyton. Pengguna MySQL tidak hanya sebatas pengguna perseorangan maupun perusahaan kecil, namun perusahaan seperti Yahoo!, Google, Nokia, Youtube, Wordpress juga menggunakan DBMS MySQL. (Warman & Ramdaniansyah, 2018) 2.14 R-Programming
Software R dan paket Knitr menawarkan kemudahan untuk RR karena data dan kode dapat tersedia dengan mudah. Langkah pembuatan RR adalah pembuatan file .rmd, penyesuaian meta data, penulisan (chunk), dan rendering. Penerapan teks-kode, teks-tabel, dan teks-gambar pada sebuah contoh kasus artikel dengan RStudio, software R dan paket Knitr memberikan keuntungan yaitu penyesuaian hasil dan pengecekan yang lebih menghemat waktu jika terjadi perubahan data, cross reference yang mudah memanfaatkan data dan kode yang telah tersedia.
Pengadopsian reproducible research (data dank ode tersedia) menjadi penting bagi seorang peneliti agar kontribusi terhadap keilmuan lebih efektif. (Budiaji, 2019)
Tabel 2. 1 Studi Literatur Sejenis
Penulis & Tahun Taufik dkk (2018) Atika Rahmawati dkk (2017)
Arrofi Reza Satria dkk (2020)
A Sidang Amirul Haj dkk (2019)
Peneliti Penulis
Judul Analisis Sentimen
Terhadap Tokoh Publik Menggunakan Algoritma Support Vector Machine (SVM)
Analisis Sentimen publik pada media sosial Twitter terhadap pelaksanaan pilkada serentak menggunakan Algoritma Support Vector Machine
Analisis Sentimen Ulasan
Aplikasi Mobile
menggunakan Algoritma Gabungan Naïve Bayes dan C4.5 berbasis Normalisasi Kata Levenshtein Distance
Analisis Sentimen Kinerja KPU Pemilu 2019 Menggunakan Algoritma
K-Means Dengan
Algoritma Confix Stripping Stemmer
Analisis komentar masyarakat Jakarta terhadap kebijakan pembatasan sosial
berskala besar
menggunakan Algoritma K-Means dan Algoritma Levenshtein Distance
Data yang di ambil Dari twitter dengan
kata kunci
@temanAhok dan
“Ahok”
Twitter dengan
mendaftarkan akun untuk mengakses API Twitter
Data kometar aplikasi di playstore di ambil dengan Appbot
Komentar facebook Komentar Instagram
Algoritma Support Vector
Machine (SVM)
Support Vector Machine dan K-Means
Naïve Bayes, C4.5 dan Levensthein Distance
K-Means,Levesnthein, SVM,Confix Stripping
K-Means,Levensthein, Nazief dan Andriani
Stemmer, Naïve Bayes Nilai k k = 2 (Positif &
Negatif)
k = 2 (Positif & Negatif) k = 3 (Positif, Negatif &
Mixed)
k = 2 (Positif & Negatif) k = 2 (Positif & Negatif)
Data yang di gunakan
Data tweet sebanyak 630 data
3000 data 1300 data 200 data 150 data latih dan 50 data
uji
Stemming - - - Confix Stipping Stemer Algoritma Nazief dan
Andriani
Pembobotan kata TF-IDF - - TF-IDF TF-IDF
Normalisasi kata - - Levensthein Distance Levensthein Distane Levensthein Distance
Tools / Aplikasi - Pemrograma Java - PHP & MySQL R Programing,PHP &
MySQL Tahap pengujian dilakukan 1 kali. Pengujian dilakukan
sebanyak 2 kali.
Pengujian di lakukan sebanyak 4x .
Pengujian Dilakukan sebanyak 2 kali.
Pengujian Dilakukan sebanyak 2 kali.
BAB III
METODOLOGI PENELITIAN
3.1 Metode Pengumpulan DataPada penelitian ini penulis mengumpulkan data dan informasi yang dapat menunjang proses dalam penelitian dimana proses pengumpulan datanya sebagai berikut.
3.1.1 Studi Pustaka
Pada tahap pengumpulan data dengan studi pustaka ini penulis melakukan pengumpulan teori-teori yang berkaitan dengan penulisan skripsi sebagai bahan untuk melengkapi penelitian ini. Sumber teori berasal dari buku referensi, hasil penelitian (jurnal dan skripsi) dan artikel-artikel yang berkaitan dengan penelitian. Selain itu juga penulis juga mengunjungi beberapa situs-situs terkait aplikasi Clustering, text mining, preprocessing, algoritma k-means clustering, algoritma levenstein distance, algoritma nazief dan andriani, algoritma TF-IDF.
3.1.2 Studi Lapangan
Observasi mengambil data melalui Media Sosial secara manual yaitu komentar masyarakat Jakarta terhadap Pembatasan Sosial Berskala Besar (PSBB).
3.2 Metode Simulasi
Metode Simulasi ini digunakan untuk melihat hasil sentimen masyarakat dari objek yang diteliti yaitu komentar masyarakat Jakarta terhadap Pembatasan Sosial Berskala Besar (PSBB) dengan menggunakan algoritma k-means clustering dan algoritma levensthein distance sebagai normalisasi kata. Pada metode simulasi ini meliputi beberapa langkah atau tahap yang akan dilakukan yaitu:
3.2.1 Formulasi Masalah (Problem Formulation)
Tahap formulasi masalah merupakan langkah awal dalam perancangan pada model merode simulasi. Formulasi masalah merupakan suatu kegiatan untuk melakukan identifikasi masalah berdasarkan hasil penelitian sebelumnya. Dalam tahap formulasi masalah ini peneliti merumuskan sebuah masalah yaitu mengimplementasikan kombinasi algoritma k-means clustering dan algoritma levensthein distance dalam menganalisis sentimen komentar masyarakat Jakarta terhadap Pembatasan Sosial Berskala Besar (PSBB).
3.2.2 Model Pengkonsepan (Conceptual Model)
Pada tahapan ini peneliti membuat model konsep yang akan dilakukan yaitu membahasa keseluruhan penelitian ini. Konsep pertama membuat kosep pada proses text mining yang ingin digunakan. Kedua, dengan mengidentifikasikan input pada penelitian ini, yaitu komentar masyarakat Jakarta terhadap Pembatasan Sosial Berskala Besar (PSBB) dari akun instagram
@jktinfo dan @aniesbaswedan, kemudian komentar yang telah dikumpulkan kemudian diolah dan diproses secara manual untuk pelabelan terhadap data latih. Ketiga, membuat konsep untuk tahap uji pada skenario 1 yaitu dengan melihat hasil sentimen dan tingkat akurasi menggunakan algoritma k-means saja. Keempat, tahap uji pada skenario 2 yaitu melihat hasil sentimen dan tingkat akurasi menggunakan kombinasi algoritma K-Means dan dibantu algoritma Levensthein Distance sebagai normalisasi kata pada tahap pre-processing.
3.2.3 Data Masukan/Keluaran (Input/Output Data)
Data masukan seperti kamus kata dasar, kamus stopword, kamus untuk levensthein, dan data komentar yang didapat dari Instagram dijadikan input pada penelitian ini dalam aplikasi
berbasis PHP. Data yang diambil sebanyak 200 komentar. Data terdiri dari 150 komentar dijadikan data latih dan 50 komentar dijadikan data uji. Data pada aplikasi ini diolah menggunakan algoritma K-Means dan algoritma Levensthein Distance untuk menghasilkan output berupa hasil sentimen akhir dan tingkat akurasi dari skenario 1 dan skenario 2.
3.2.4 Pemodelan (Modelling)
Pada tahapan ini peneliti menentukan model skenario yang akan digunakan. Pada tahap ini penulis melakukan pemodelan dalam membuat rancangan sistem yang akan dibuat secara manual.
Pemodelan atau skenario yang dibuat yaitu skenario kombinasi antara algoritma K-Means dan algoritma Levensthein Distance dan skenario tanpa menggunakan algoritma Levensthein Distance (hanya menggunakan algoritma K-Means saja).
3.2.5 Simulasi
Pada tahapan ini, sistem akan dijalankan untuk mensimulasikan kinerja masing-masing algoritma suseai dengan konsep dan skenario yang telah ditentukan sebelumnya. Simulasi yang akan dilakukan adalah dengan melakukan input dataset latih dan uji. Melakukan pelabelan terhadap data latih secara manual untuk dikelompokkan sentimennya, melakukan pelatihan terhadap data latih dan melakukan clustering data uji. Hasil simulasi berupa perbandingan akurasi dari algoritma yang dijadikan,penelitian, kemudian akan dicatat dan kemudian dilakukan tahap verifikasi.
3.2.6 Verifikasi dan Validasi (Verification and Validation)
Pada tahapan ini peneliti mealukan verifikasi dan validasi dari tahapan sebelumnya. Pada tahap verifikasi dilakukan untuk memastikan adanya kesalahan atau tidak yang terjadi dalam beberapa tahapan atau proses simulasi. Sedangkan tahapan
validasi yang dilakukan untuk memastikan kesesuaian proses simulasi yang dibuat berdasarkan model pengkonsepan dengan formulasi masalah yang dibuat.
Pada intinya, verifikasi dan validasi bertujuan untuk menyakinkan hasil dari aplikasi sentimen ini sesuai dengan yang dikonsepkan sebelumnya
3.2.7 Eksperimentasi (Experimentation)
Pada tahapan ini peneliti melakukan eksperimen sesuai dengan model skenario yang dibuat pada saat tahap pemodelan.
Ekperimen disini bertujuan untuk mengevaluasi hasil simulasi aplikasi.
3.2.8 Analisis Keluaran (Output Analysis)
Tahapan analisis keluaran adalah tahapan simulasi yang paling terakhir. Peneliti melakukan analisa terhadap output-output berdasarkan skenario yang sudah dilakukan yaitu menghitung tingkat akurasi dari algoritma yang dijadikan penelitian.
3.3 Kerangka Berfikir
Berfikir merupakan suatu alur diagram yang menjelaskan proses berjalannya sebuah penelitian. Dalam penelitian ini, penulis mengacu pada alur penelitian sebagai berikut:
Mulai
Gambar 3. 1 Kerangka Berfikir
BAB IV
IMPLEMENTASI, SIMULASI, DAN EKSPERIMEN
4.1 Formulasi Masalah (Problem Formulation)Pada tahap awal dimetode simulasi ini yaitu formulasi masalah, penulis melakukan identifikasi masalah berdasarkan hasi penelitian sebelumnya. Alhasil pada penelitian ini, penulis memformulasikan masalah penelitian pada kombinasi algoritma k-means dan algoritma normalisasi kata yaitu levensthein distance untuk dilakukan kombinasi terhadap kedua algoritma tersebut. Dengan hasil akhirnya yaitu sentiment masyarakat terhadap virus corona dan tingkat akurasi dari algoritma tersebut.
Data yang digunakan pada penelitian ini adalah komentar masyarakat terhadap pembatasan sosial berskala besar (psbb) yang diambil dari Instagram.
4.2 Model Pengkonsepan (Conceptual Model)
Pada tahap pemodelan konsep ini berkaitan dengan eksekusi dari sistem yang peneliti bangun, dari mulai masukan, proses, dan keluaran sistem tersebut. Berdasarkan tahap conceptual model pada sub bab 3.2.2, berikut ini merupakan alur keseluruhan dari sistem yang dibagun oleh peneliti.
4.2.1 Conceptual model pada text mining
Dalam penelitian saat ini, pemodelan pada text mining berkaitan dengan tahapan processing teks. Tahapan pre-processing dilakukan dengan membuat fungsi sendiri dalam pengkodean menggunakan bahasa pemrograman PHP. Pre-processing ini dilakukan dengan tujuan:
1. Menghilangkan kata-kata yang mengganggu proses sentimen, seperti url atau link, hastag pada komentar, angka-angka, maupun tanda baca.
2. Menyeragamkan bentuk kata menjadi kata dasar sesuai dengan KBBI.
3. Mengurangi kata yang tidak digunakan atau tidak berpengaruh terhadap penentuan sentimen, seperti aku, kamu, dia, kita, dll.
Adapun tambahan proses yang dilakukan pada penelitian ini sekaligus pembeda dari penelitian yang sebelum-sebelumnya di tahapan pre-processing ini yaitu proses normalisasi kata menggunakan algoritma levensthein distance, berikut tahap-tahap pre-processing pada penelitian saati ini meliputi proses-proses seperti yang digambarkan pada flow di bawah ini:
Teks
dokumen Case folding Tokenization Normalisasi kata
Stopword removal Stemming
Gambar 4. 1 Flowchart Tahapan Pre-Processing
Berikut penjelasan dari tahapan pre-processing:
1. Tahap awal di pre-processing yaitu proses case folding atau merubah semua kata menjadi huruf kecil semu
Gambar 4. 2 Flowchart Case Folding
2. Tahap ketiga yaitu melakukan proses tokenization, atau proses pemecahan suatu kalimat menjadi kata-kata.
Gambar 4. 3 Flowchart Tokenization
3. Proses selanjutnya yaitu melakukan proses menormalisasikan sebuah kata yang salah atau typo menggunakan algoritma levensthein distance dengan cara menghapus kata yang berlebih, menambah kata yang kurang, dan mengganti kata yang tidak sesuai.
Mulai
Hasil Tokenization
Membandingkan kata pada data awal
dengan database levensthein
Database levensthein
Kata awal != database levensthein
Menghitung matriks denan jarak terkecil antar huruf menggunakan
rumus levensthein distance:
d[i,j-1]+1 d[i-1,j]+1 d[i-1,j-1]+1
Hasil proses levensthein distance Menampilkan kata sugesti dengan jarak
terkecil
Menampilkan kata awal
Selesai Ya
Tidak
Gambar 4. 4 Flowchart Levensthein Distance
4. Selanjutnya melaukan proses stopword removal atau proses penghapusan kata-kata yang dianggap tidak penting, seperti dia, aku, kamu, pada, dan lainnya.
Mulai
Hasil Levensthein
Distance
Membandingkan kata dengan kamus
stopword
Kamus Stopword
Kata = kamus stopword
Hapus Kata
Kata awal
Selesai Hasil stopword
Tidak
Ya
Gambar 4. 5 Flowchart Stopword Removal
5. Tahap terakhir di pre-processing yaitu proses stemming atau merubah kata-kata imbuhan menjadi kata dasar sesuai KBBI menggunalan algoritma Nazief dan Adriani.
Mulai
Hasil stopword atau
kata awal
Membandingkan kata awal dengan kamus kata dasar
KBBI
Kata == kamus kbbi
Menghilangkan kata inflectional suffixes (“-lah”, “-kah”, “-ku”,
“-mu”, “-nya”)
Menghilangkan kata derivational suffixes (i”,
“-an”, “-kan”)
Menghilangkan kata derivational prefix (“di-”, “ke-”, “se-”, “te-”,
“be-”, “me-“, “pe-“)
Kata == kamus KBBI
Kata awal
Selesai
Kata dasar Kamus
KBBI
Tidak
Ya
Tidak
Ya
Gambar 4. 6 Flowchart Stemming Algoritma Nazief dan Andriani
4.2.2 Conceptual model pada data latih
Konsep penentuan sentimen data latih pada penelitian ini dilakukan secara manual. Setelah diberikan sentimen pada setiap dokumen data latih, akan dilakukan proses pre-processing. Untuk lebih jelasnya lagi, alur pada data latih ini sebagai berikut:
Teks
dokumen Case folding Tokenization Normalisasi kata
Stopword removal Stemming
Indexing Pemberian
sentimen
Gambar 4. 7 Penentuan Sentimen Data Latih
Berikut contoh dari setiap proses saat melakukan penentuan sentimen pada data latih:
Teks dokumen :
KEBERSIHAN Sebagian dari IMAN a. Pemberian sentiment
Pada konsep data latih ini, pemberian sentimen akan diberikan secara manual dari setiap dokumen yang dijadikan data latih tersebut. Dimana sentimen yang akan dianalisis pada penelitan ini hanya sentiment positif dan sentiment negatif. Pada contoh ini penulis memberikan sentiment positif.
b. Case folding
Tabel 4. 1 Contoh Proses Case Folding
Teks dokumen Proses case folding KEBRSIHAN Sebagian dari kebrsihan sebagian dari
IMAN !!! iman !!!
c. Tokenization
Tabel 4. 2 Proses Tokenization
d. Normalisasi kata (menggunakan algoritma levensthein distance)
Tabel 4. 3 Contoh Proses Normalisasi Kata
Hasil tokenization Proses normalisasi
| kebrsihan | sebagian | dari | | kebersihan | sebagian | dari
iman | | iman |
e. Stopword removal
Tabel 4. 4 Contoh Proses Stopword Removal
Hasil normalisasi Proses stopword removal
| kebersihan | sebagian | dari | | kebersihan | iman | iman |
Hasil filtering Proses tokenization Kebersihan Sebagian dari
iman
| kebersihan | sebgaian | dari
| iman |
f. Stemming
Tabel 4. 5 Contoh Proses Stemming
g. Indexing
Pada tahap ini, dilakukan proses pengindeksan pada hasil pre-processing dan sentiment dari setiap dokumen. Pada inverted index akan tersimpan informasi berupa id dokumen, komentar, hasil pre-processing dan hasil sentimen.
4.2.3 Conceptual model sentimen dengan algoritma k-means
Skenario pertama pada penelitian ini secara alur dari analisa sentimen dengan menggunakan algoritma k-means tanpa bantuan algoritma levensthein distance sebagai algoritma normalisasi kata dapat dijelaskan pada gambar dibawah ini:
Hasil stopword removal
Proses stemming
| kebersihan | iman | | bersih | iman |
Mulai
Data yang ingin di uji
Proses pre-processing
Proses pencocokan index data uji dengan
data latih
Proses pembobotan TF-IDF
Index data latih
Proses K-Means
Hasil Sentimen
k-means
Selesai Proses pelabelan sentimen manual
Hasil sentimen
manual
Proses pre-processing Hitung Akurasi dengan
Confusion Matrix
Hasil Akurasi
Gambar 4. 8 Flowchart Proses Sentimen Skenario 1
Berikut penjelasan dari setiap proses saat melakukan penentuan sentimen menggunakan k-means:
1) Mengumpulkan data yang ingin di uji
2) Melakukan proses pre-processing tanpa bantuan algoritma levensthein distance sebagai algoritma normalisasi kata pada data uji
3) Hasil index dari pre-processing pada data uji, dicari yang cocok atau yang sama pada index data latih. Kemudian ambil kalimat yang terdapat index yang cocok atau sama itu untuk ke tahap selanjutnya.
4) Lakukan pembobotan kata pada index yang ada pada kalimat yang sudah diambil ditahap sebelumnya dan data ujinya menggunakan algoritma tf-idf dan diambil nilai total weightingnya untuk diproses ditahap selanjutnya.
5) Dari nilai total weighting yang sudah didapat dari proses tf-idf akan diproses menggunakan algoritma k-means untuk menentukan sentimennya. Alur dari algoritma k-means dapat digambarkan seperti berikut:
Mulai
Jumlah k cluster
Menentukan centroid awal dai setiap cluster
Hitung jarak objek ke centroid menggunakan rumus Euclidean Distance
Membagi data berdasarkan kedekatan dengan centroid (jarak terkecil)
Tidak ada data yang berubah
Selesai
Memperbaharui nilai centroid dengan menghitung rata-rata setiap cluster
Tidak
Ya
Gambar 4. 9 Flowchart Proses Algoritma K-Means
6) Menentukan pelabelan sentimen secara manual terhadap data uji sebagai perbandingan pada tahap akhir nanti.
7) Hitung akurasi dari perbandingan yang sudah dilakukan sebelumnya antara sentimen yang dihasilkan dari algoritma k-means dan sentimen dari pelabelan manual menggunakan rumus confusion matrix. Kalau sentimen yang dihasilkan keduanya sama maka akurasinya baik, dan sebaliknya kalau sentimen yang dihasilkan keduanya berbeda maka akurasi tidak baik.
8) Mendapatkan nilai akurasi dari scenario pertama.
4.2.4 Conceptual Model Sentimen Algoritma K-Means dengan bantuan Algoritma Levensthein Distance
Skenario kedua pada penelitian ini secara alur dari analisa sentimen dengan menggunakan algoritma k-means dan bantuan algoritma levensthein distance sebagai algoritma normalisasi kata dapat dijelaskan pada gambar dibawah ini:
Mulai index data uji dengan
data latih Hitung Akurasi dengan
Confusion Matrix
Hasil Akurasi
Gambar 4. 10 Flowchart Proses Sentimen Skenario 2
Berikut penjelasan dari setiap proses saat melakukan penentuan sentimen menggunakan k-means dan levensthein distance:
1) Mengumpulkan data yang ingin di uji
2) Melakukan proses pre-processing dengan bantuan algoritma levensthein distance sebagai algoritma normalisasi kata pada data uji
3) Hasil index dari pre-processing pada data uji, dicari yang cocok atau yang sama pada index data latih. Kemudian ambil kalimat yang terdapat index yang cocok atau sama itu untuk ke tahap selanjutnya.
4) Lakukan pembobotan kata pada index yang ada pada kalimat yang sudah diambil ditahap sebelumnya dan data ujinya menggunakan algoritma tf-idf dan diambil nilai total weightingnya untuk diproses ditahap selanjutnya.
5) Dari nilai total weighting yang sudah didapat dari proses tf-idf akan diproses menggunakan algoritma k-means untuk menentukan sentimennya. Setelah melakukan proses k-means, cari di cluster manakah data ujinya berada. Setelah ditemukan, hiraukan cluster yang lainnya. Kemudian kita lihat sentiment apakah yang paling banyak pada cluster tersebut. Dan itulah hasil sentimen yang kita ambil.
6) Menentukan pelabelan sentimen secara manual terhadap data uji sebagai perbandingan pada tahap akhir nanti.
7) Hitung akurasi dari perbandingan yang sudah dilakukan sebelumnya antara sentimen yang dihasilkan dari algoritma k-means dan sentimen dari pelabelan manual menggunakan rumus confusion matrix. Kalau sentimen yang dihasilkan keduanya sama maka akurasinya baik, dan sebaliknya kalau sentimen yang dihasilkan keduanya berbeda maka akurasi tidak baik.
8) Mendapatkan nilai akurasi dari scenario kedua.
4.3 Data Masukan/Keluaran (Input/Output Data)
Pada penelitian ini data yang diperoleh sebagai data input yaitu komentar-komentar masyarakat terhadap virus corona yaitu sebanyak 200 data yang diambil dari komentar Instagram. Dimana proses pengambilan data ini dinamakan dengan teknik crawling. Pada pengambilan data dari sosial media peneliti mengambilnya secara manual. Selain data-data komentar yang dikumpulkan pada penelitian ini yaitu kamus kata dasar KBBI, stopwords, dan kamus levensthein.
Hasil atau output yang didapatkan dari penelitian ini yaitu sentimen akhir dari suatu komentar dan hasil akurasi pada skenario pertama dan kedua.
4.4 Pemodelan (Modelling)
Dalam modelling phase atau fase pemodelan pada penelitian ini, dilakukan pemodelan konstruksi analisis sentimen dengan menggunakan algoritma k-means saja dan kombinasi algoritma k-means dan algoritma levensthein distance sebagai algoritma normalisasi kata. Berikut ini dapat dilihat pemodelan-pemodelan tersebut secara lengkap.
4.4.1 Kontruksi Sentimen pada Algoritma K-Means
Konstruksi menggunakan algoritma k-means dalam menentukan sentimen ini merupakan salah satu skenario di dalam penelitian saat ini. Dimana dalam penentuan sentimen menggunakan algoritma k-means membutuhkan proses penunjang lainnya agar hasilnya lebih maksimal. Secara keseluruhan konstruksi analisa sentimen menggunakan algoritma k-means dapat dijelaskan dibawah ini (konsep diambil dari sub-bab 4.2.3 dan dapat dilihat pada gambar 4.8):
1. Pelatihan data latih
Proses contoh dalam pelatihan data latih (konsep diambil dari sub-bab 4.2.2 dan dapat dilihat pada gambar 4.7):
a. Mengumpulkan dokumen yang didapat dari kumpulan komentar yang sudah dicrawling sebelumnya. Sebagai contoh digunakan 8 dokumen sebagai data latih.
Tabel 4. 6 Dokumen data latih
No Komentar
1 Doa Kami selalu untuk pak Anies, pemimpin yg amanah.
Semoga pak anies sekeluarga diberi kesehatan dan keselamatan.
2 Ekonomi, kebenaran,kesehatan,buktiin dulu sih kebenarannya apa? Gedeg gua lama lama
3 krn psbb pendidikan saya gak mutu. Jangan salahin generasi selanjutnya yak lo pemerintahan ntar bobrok gegara daring. Krn otak ku online
4 Kopad kopid . gagal lagi nih dapet kerjaan. Kosan kaga kebayar makan susah cicilan nunggk gara gara PHK 5 Mundur aja pak mundur
6 Yg paling penting sehat ya semuanya, semangat pakkk 7 @aniesbaswedan PSBB PERPANJANG SMPE KIAMAT
YA A.. BIAR MANUSIA INDO PADA MATI KELAPARAN
8 RASANYA ANJING BANGET GW PSBB MULU DIRUMAH NGK NGAPANGAPAIN
b. Memberikan sentimen secara manual setiap dokumennya
Tabel 4. 7 Penentuan Sentimen Data Latih
NO. KOMENTAR SENTIMEN
1 Doa Kami selalu untuk pak Anies, pemimpin yg amanah. Semoga pak anies
sekeluarga diberi kesehatan dan keselamatan.
Positif
2 Ekonomi, kebenaran,kesehatan,buktiin dulu sih kebenarannya apa? Gedeg gua lama lama
Negatif
3 krn psbb pendidikan saya gak mutu. Jangan salahin generasi selanjutnya yak lo pemerintahan ntar bobrok gegara daring.
Krn otak ku online
Negatif
4 Kopad kopid . gagal lagi nih dapet kerjaan.
Kosan kaga kebayar makan susah cicilan nunggk gara gara PHK
Negatif
5 Mundur aja pak mundur Negatif
6 Yg paling penting sehat ya semuanya, semangat pakkk
Posistif
7 @aniesbaswedan PSBB PERPANJANG SMPE KIAMAT YA A.. BIAR MANUSIA
INDO PADA MATI KELAPARAN
Negatif
8 RASANYA ANJING BANGET GW PSBB MULU DIRUMAH NGK
NGAPANGAPAIN
Negatif
c. melakukan proses case folding
Tabel 4. 8 Hasil Proses Case Folding
NO. KOMENTAR
1 doa kami selalu untuk pak anies, pemimpin yg amanah.
Semoga pak anies sekeluarga diberi kesehatan dan keselamatan.
2 ekonomi, kebenaran,kesehatan,buktiin dulu sih kebenarannya apa? gedeg gua lama lama
3 krn psbb pendidikan saya gak mutu. jangan salahin
d. Melakukan proses filtering
Tabel 4. 9 Hasil Proses Filtering
generasi selanjutnya yak lo pemerintahan ntar bobrok gegara daring. krn otak ku online
4 kopad kopid . gagal lagi nih dapet kerjaan. kosan kaga kebayar makan susah cicilan nunggk gara gara phk
5 mundur aja pak mundur
6 yg paling penting sehat ya semuanya, semangat pakkk 7 @aniesbaswedan psbb perpanjang smpe kiamat ya a.. biar
manusia indo pada mati kelaparan
8 rasanya anjing banget gw psbb mulu dirumah engk ngapangapain
NO. KOMENTAR
NO. KOMENTAR