• Tidak ada hasil yang ditemukan

BAB III METODOLOGI PENELITIAN

3.3 Preprocessing Data

Setelah didapat data mentah, Langkah pertama yaitu preprocessing data.

Preprocessing Data sangat penting sebelum dilakukannya tahap klasifikasi. Tahap ini merupakan pengolahan data mentah menjadi data bersih. Data tersebut diproses terlebih dahulu untuk menghilangkan noise agar data menjadi terstruktur. Tahap preprocessing menggunakan stemming dan tanpa stemming berikut penjelasannya:

A. Tahapan dari preprocessing menggunakan 5 tahapan yaitu casefolding, cleansing, tokenize, stopword removal, dan stemming. Berikut tahapan dari preprocessing seperti pada gambar 3.3.

Gambar 3.2 Data Ulasan GoFood dari Twitter

Gambar 3.3 Tahapan Preprocessing menggunakan Stemming

a. Casefolding

Pada tahap ini, kalimat tweet akan disamakan dengan mengubah semua huruf kapital menjadi huruf kecil. Contoh penggunaan casefolding seperti pada tabel 3.1.

Tabel 3.1 Contoh Penggunaan Casefolding

Tweet Sebelum Casefolding Tweet Sesudah Casefolding

Mantapp bangett sih ini promo gofood nya https://t.co/7huw577hhd

mantapp bangett sih ini promo gofood nya https://t.co/7huw577hhd

Abis gofood piscok dan ternyata isinya banyak banget

abis gofood piscok dan ternyata isinya banyak banget

@gofoodindonesia GoFood selalu jadi andalanku ketika mau pesan nasi goreng. ✨

✨ Pesan makanan nasi

goreng di GoFood, pagi hari adalah hal yg paling mantap banget. GoFood bestie aku

banget. ❀️

#RekomendasiAsikGoFood

🌟🌟🌟🌟🌟

https://t.co/uIinY4eXm4

@gofoodindonesia gofood selalu jadi andalanku ketika mau pesan nasi goreng.

✨ ✨ pesan makanan nasi goreng di

gofood, pagi hari adalah hal yg paling mantap banget. gofood bestie aku banget. ❀️ #rekomendasiasikgofood

🌟🌟🌟🌟🌟

https://t.co/uiiny4exm4

b. Data Cleansing

Pada tahap ini, kalimat tweet berupa tag (@users), simbol-simbol, angka, emoticon, link URL akan dibersihkan. Contoh penggunaan data cleaning pada tabel 3.2 dibawah ini.

Tabel 3.2 Contoh Penggunaan Data Cleaning

Tweet Sebelum Data Cleansing Tweet Setelah Data Cleansing

Mantapp bangett sih ini promo

gofood nya

https://t.co/7huw577hhd

Mantapp bangett sih ini promo gofood nya

Abis gofood piscok dan ternyata isinya banyak banget

Abis gofood piscok dan ternyata isinya banyak banget

@gofoodindonesia GoFood selalu jadi andalanku ketika mau pesan nasi goreng. ✨ ✨ Pesan makanan nasi goreng di GoFood, pagi hari adalah hal yg paling mantap banget. GoFood bestie aku

banget. ❀️

#RekomendasiAsikGoFood

🌟🌟🌟🌟🌟

https://t.co/uIinY4eXm4

GoFood selalu jadi andalanku ketika mau pesan nasi goreng Pesan makanan nasi goreng di GoFood pagi hari adalah hal yg paling mantap banget GoFood bestie aku banget

c. Tokenizing

Pada tahap ini, dilakukan pemecahan kalimat menjadi kata-kata yang berdiri sendiri. Berikut contoh penggunaan tokenizing seperti tabel 3.3.

Tabel 3.3 Contoh Penggunaan Tokenizing

Tweet Sebelum Tokenizing Tweet Setelah Tokenizing

mantapp bangett sih ini promo gofood nya

['mantapp', 'bangett', 'sih', 'ini', 'promo', β€˜gofood’, 'nya']

abis gofood piscok dan ternyata isinya banyak banget

['abis', β€˜gofood’, 'piscok', 'dan', 'ternyata', 'isinya', 'banyak', 'banget']

gofood selalu jadi andalanku ketika mau pesan nasi goreng pesan makanan nasi goreng di gofood pagi hari adalah hal yg paling mantap banget gofood bestie aku banget

[β€˜gofood’, 'selalu', 'jadi', 'andalanku', 'ketika', 'mau', 'pesan', 'nasi', 'goreng', 'pesan', 'makanan', 'nasi', 'goreng', 'di', ' gofood’, 'pagi', 'hari', 'adalah', 'hal', 'yg', 'paling', 'mantap', 'banget', 'gofood’, 'bestie', 'aku', 'banget']

d. Stopword Removal

Pada tahap ini, kata-kata yang tidak memiliki makna akan dihilangkan seperti β€œyang”, β€œdan”, β€œini”, β€œdi”, dan sebagainya. Berikut Contoh penggunaan stopword removal seperti tabel 3.4 dibawah ini:

Tabel 3.4 Contoh Penggunaan Stopword Removal

Tweet Sebelum Stopword Removal Tweet Setelah Stopword Removal

mantapp bangett sih ini promo gofood nya

mantapp bangett promo gofood

abis gofood piscok dan ternyata isinya banyak banget

gofood piscok isi banyak banget

gofood selalu jadi andalanku ketika mau pesan nasi goreng pesan makanan nasi goreng di gofood pagi hari adalah hal yg paling mantap banget gofood bestie aku banget

gofood selalu andalan aku ketika mau pesan nasi goreng pesan makanan nasi goreng gofood pagi hari paling mantap banget gofood bestie aku banget

e. Stemming

dikembalikan ke bentuk kata dasar. Berikut contoh penggunaan stemming seperti tabel 3.5 dibawah ini:

Tabel 3.5 Contoh Penggunaan Stemming

Tweet Sebelum Stemming Tweet Setelah Stemming

mantapp bangett sih ini promo gofood nya

mantap promo gofood

abis gofood piscok dan ternyata isinya banyak banget

gofood piscok isi banyak

gofood selalu jadi andalanku ketika mau pesan nasi goreng pesan makanan nasi goreng di gofood pagi hari adalah hal yg paling mantap banget gofood bestie aku banget

gofood selalu andalan aku ketika pesan makan nasi goreng di gofood pagi hari yang paling mantap gofood

B. Tahapan dari preprocessing menggunakan 4 tahapan yaitu casefolding, cleansing, tokenize, dan stopword removal. Berikut tahapan dari preprocessing seperti pada gambar 3.4.

a. Casefolding

Pada tahap ini, kalimat tweet akan disamakan dengan mengubah semua huruf kapital menjadi huruf kecil. Contoh tahapan casefolding seperti pada tabel 3.6 dibawah ini:

Tabel 3.6 Contoh Tahapan Casefolding

Tweet Sebelum Casefolding Tweet Sesudah Casefolding

Mantapp bangett sih ini promo

gofood nya

https://t.co/7huw577hhd

mantapp bangett sih ini promo

gofood nya

https://t.co/7huw577hhd Abis gofood piscok dan ternyata

isinya banyak banget

abis gofood piscok dan ternyata isinya banyak banget

@GoFoodindonesia GoFood selalu jadi andalanku ketika mau pesan nasi goreng. ✨ ✨ Pesan makanan nasi goreng di GoFood,

@gofoodindonesia gofood selalu jadi andalanku ketika mau pesan nasi goreng. ✨ ✨ pesan makanan nasi goreng di gofood, Gambar 3.4 Tahapan Preprocessing Tanpa menggunakan stemming

pagi hari adalah hal yg paling mantap banget. GoFood bestie aku

banget. ❀️

#RekomendasiAsikGoFood

🌟🌟🌟🌟🌟

https://t.co/uIinY4eXm4

pagi hari adalah hal yg paling mantap banget. gofood bestie aku banget. ❀️ #rekomendasiasik

gofood 🌟🌟🌟🌟🌟

https://t.co/uiiny4exm4

b. Data Cleansing

Pada tahap ini, kalimat tweet berupa tag (@users), simbol-simbol, angka, emoticon, link URL akan dibersihkan. Contoh tahapan data cleansing seperti pada tabel 3.7.

Tabel 3.7 Contoh Tahapan Data Cleansing

Tweet Sebelum Data Cleansing Tweet Setelah Data Cleansing

Mantapp bangett sih ini promo

gofood nya

https://t.co/7huw577hhd

Mantapp bangett sih ini promo gofood nya

Abis gofood piscok dan ternyata isinya banyak banget

Abis gofood piscok dan ternyata isinya banyak banget

@GoFoodindonesia GoFood selalu jadi andalanku ketika mau pesan nasi goreng. ✨ ✨ Pesan makanan nasi goreng di GoFood, pagi hari adalah hal yg paling

GoFood selalu jadi andalanku ketika mau pesan nasi goreng Pesan makanan nasi goreng di GoFood pagi hari adalah hal yg paling

mantap banget. GoFood bestie aku

banget. ❀️

#RekomendasiAsikGoFood

🌟🌟🌟🌟🌟

https://t.co/uIinY4eXm4

mantap banget GoFood bestie aku banget

c. Tokenizing

Pada tahap ini, dilakukan pemecahan kalimat menjadi kata-kata yang berdiri sendiri. Berikut contoh tahapan tokenizing seperti tabel 3.8.

Tabel 3.8 Contoh Tahapan Tokenizing

Tweet Sebelum Tokenizing Tweet Setelah Tokenizing

mantapp bangett sih ini promo GoFood nya

['mantapp', 'bangett', 'sih', 'ini', 'promo', 'gofood', 'nya']

abis GoFood piscok dan ternyata isinya banyak banget

['abis', 'GoFood', 'piscok', 'dan', 'ternyata', 'isinya', 'banyak', 'banget']

GoFood selalu jadi andalanku ketika mau pesan nasi goreng pesan makanan nasi goreng di GoFood pagi hari adalah hal yg paling mantap banget GoFood bestie aku banget

['GoFood', 'selalu', 'jadi', 'andalanku', 'ketika', 'mau', 'pesan', 'nasi', 'goreng', 'pesan', 'makanan', 'nasi', 'goreng', 'di', 'GoFood', 'pagi', 'hari', 'adalah', 'hal', 'yg', 'paling', 'mantap', 'banget', 'GoFood', 'bestie', 'aku', 'banget']

d. Stopword Removal

Pada tahap ini, kata-kata yang tidak memiliki makna akan dihilangkan seperti β€œyang”, β€œdan”, β€œini”, β€œdi”, dan sebagainya. Berikut Contoh tahapan stopword removal seperti pada tabel 3.9.

Tabel 3.9 Contoh Tahapan Stopword Removal

Tweet Sebelum Stopword Removal Tweet Setelah Stopword Removal

mantapp bangett sih ini promo gofood nya

mantapp bangett promo gofood

abis gofood piscok dan ternyata isinya banyak banget

gofood piscok isi banyak banget

gofood selalu jadi andalanku ketika mau pesan nasi goreng pesan makanan nasi goreng di gofood pagi hari adalah hal yg paling mantap banget gofood bestie aku banget

gofood selalu andalan aku ketika mau pesan nasi goreng pesan makanan nasi goreng gofood pagi hari paling mantap banget gofood bestie aku banget

Dokumen terkait