• Tidak ada hasil yang ditemukan

Analisis Sentimen Terhadap Kenaikan Harga Bahan Pokok Menggunakan Metode Naive Bayes Classifier

N/A
N/A
Protected

Academic year: 2023

Membagikan "Analisis Sentimen Terhadap Kenaikan Harga Bahan Pokok Menggunakan Metode Naive Bayes Classifier"

Copied!
10
0
0

Teks penuh

(1)

DOI: 10.30865/mib.v7i3.6418

Analisis Sentimen Terhadap Kenaikan Harga Bahan Pokok Menggunakan Metode Naive Bayes Classifier

Muhammad Muslimin*, Veronica Lusiana

Fakultas Teknologi Informasi dan Industri, Program Studi Teknik Informatika, Universitas Stikubank, Semarang, Indonesia Email: 1,*[email protected], 2[email protected]

Email Penulis Korespondensi: [email protected]

Abstrak−Kebutuhan pokok merupakan kebutuhan utama yang penting untuk kehidupan masyarakat. Kenaikan harga bahan pokok tentunya sangat berdampak terhadap biaya operasional masyarakat dan menjadi persoalan yang sangat krusial. Peristiwa ini memunculkan tanggapan pro dan kontra dari masyarakat yang diekspresikan melalui media sosial Twitter. Dari peristiwa tersebut maka dilakukanlah penelitian analisis sentimen terkait dengan kenaikan harga bahan pokok. Jumlah data yang digunakan untuk penelitian ini yaitu 2070 data tweet. Hasil analisis menunjukan bahwa sentimen negatif lebih banyak muncul dibandingkan sentimen positif, dengan persentase 2,8% sentimen positif dan 97,2% untuk sentimen negatif. Pengambilan data tweet dilakukan melalui website netlytic.org dengan kata kunci bahan pokok. Metode pengklasifikasian menggunakan metode Naïve Bayes Classifier. Selanjutnya dilakukan pembagian data pada dateset dengan perbandingan 6:4. Data dibagi menjadi 60% data latih dan 40% data uji. Ukuran data uji sebanyak 40% dari keseluruhan data menghasilkan tingkat akurasi yang paling baik. Dari hasil pengujian model dengan metode Naïve Bayes Classifier diperoleh hasil nilai evaluasi yaitu score accuracy tertinggi yaitu sebesar 94,38%, precision sebesar 59,67%, recall sebesar 67,93%, dan F-measure sebesar 62,32%. Dapat diambil kesimpulan bahwa hasil dari analisis sentimen terhadap kenaikan harga bahan pokok mendapatkan tanggapan yang negatif dari masyarakat. Penelitian ini mengusulkan suatu metode analisis sentimen terhadap kenaikan harga bahan pokok dengan mempertimbangkan tingkat sentimen opini pada Twitter.

Kata Kunci: Masyarakat; Analisis Sentimen; Twitter; Bahan Pokok; Naïve Bayes Classifier

Abstract−Basic necessities are the main needs that are important for people’s lives. The increase in the price of basic necessities certainly has a huge impact on the operational costs of the community and has become a very crucial issue. This event gave rise to pro and con responses from the public expressed through social media Twitter. From this event, sentiment analysis research was conducted related to the increase in the price of basic commodities. The amount of data used for this research is 2070 tweet data. The analysis results show that negative sentiment appears more than positive sentiment, with a percentage of 2,8% positive sentiment and 97,2% for negative sentiment. Retrival of tweet data is done through the netlytic.org website with the keyword staples. The classification method uses the naïve Bayes Classifier method. Furthermore, data division is carried out on the dataset with a ratio of 6:4. The data is divided into 60% training data and 40% test data. The size of the test data as much as 40% of the overall data produces the best accuracy rate. From the results of testing the model with the Naïve Bayes Classifier method the evaluation value results are the highest accuracy score of 94,38%, precision of 59,67%, recall of 67,93%, and F-measure of 62,32%. It can be concluded that the results of sentiment analysis on the increase in the proce of basic commodities get a negative response from the public. This research proposes a method of sentiment analysis of rising prices of basic commodities by considering the level opinion sentiment on Twitter.

Keywords: Community; Sentiment Analysis; Twitter; Basic Materials; Naïve Bayes Classifier

1. PENDAHULUAN

Di era globalisasi dengan teknologi era 4.0, media sosial hal yang lumrah dikalangan masyarakat awam. Media sosial saat ini sudah diibaratkan sebagai teman bagi para pemiliknya dikarenakan begitu ketergantungannya mereka terhadap media sosial tersebut. Melansir dari data yang didapatkan dari wearesocial.com dan Hootsuite, pengguna media sosial di indonesia mencapai 59% di tahun 2020 dan pengguna internet mencapai 64%. Salah satu adalah Twitter yang paling banyak digunakan [1]. Twitter merupakan media sosial yang berbasis pada microblogging dimana penggunanya dapat memberikan suatu pendapatnya yang disebut dengan tweet. Pengguna Twitter di indonesia mencapai sekitar 56% dan menempati tempat ke 5 di media yang sering digunakan pada tahun 2020 [2].

Masyarakat memerlukan bahan pokok, jika kenaikan bahan pokok terus menerus terjadi maka akan berpengaruh juga pada barang lain. Tidak stabilnya harga tentunya sangat berpengaruh kepada masyarakat dalam kesehariannya. Kebijakan dengan melakukan kenaikan terhadap bahan pokok menuai kontroversi di media sosial, terutama di Twitter. Twitter dipenuhi cuitan-cuitan dari masyarakat dengan pendapat-pendapatnya. Maka dari itu, kasus ini sangat menarik diteliti untuk mengetahui tanggapan dari masyrakat. Dalam melakukan analisis terhadap tanggapan masyarakat dimedia sosial banyak metode yang dapat digunakan salah satunya yaitu analisis sentimen [3].

Analisis sentimen merupakan suatu proses analisis teks berupa opini yang terkait dengan objek penelitian untuk ditentukan opini tersebut masuk ke arah positif atau negatif [4]. Tujuan dilakukannya analisis sentimen yaitu menentukan informasi dari data yang tidak terstruktur sehingga dapat diketahui sentimen tersebut positif atau negatif [5]. Terdapat beberapa tahapan dalam melakukan analisis sentimen diantaranya pengumpulan data, pelabelan data, preprocessing, ekstraksi fitur, klasifikasi uji model dan evaluasi model. Dengan beberapa metode yang digunakan yaitu Naïve Bayes Classifier, Support Vector Machine, Decision Tree, Random Forest, K-Nearest

(2)

Neighbor, Machine Learning [6]. Pada penelitian ini menggunakan metode Naïve Bayes Classifier untuk melakukan klasifikasi data.

Tujuan dilakukannya penelitian ini yaitu untuk melihat pendapat masyarakat di Twitter dan juga mengetahui berapa persentase yang dihasilkan dari pendapat yang bernilai positif dan negatif terhadap kenaikan bahan pokok. Data diambil dari media sosial Twitter melalui website netlytic.org dan selanjutnya akan dikelompokan kedalam sentimen positif dan negatif.

Penelitian sebelumnya yang berkaitan dengan penelitian yang membahas mengenai analisis sentimen sebagai berikut diantaranya pernah dilakukan oleh Bambang Tri Buwono Dan Nurhafifah Matondang. Penelitian ini membahas mengenai analisis sentimen yang dikelompokan kedalam sentimen positif dan sentimen negatif.

Metode yang digunakan untk pengklasifikasian yaitu Naïve Bayes Classifier dengan objek penelitian yaitu kebijakan kenaikan bahan bakar minyak. Penelitian ini menghasilkan akurasi sebesar 89% [2].

Penelitian yang dilakukan oleh Ulfa Kurniasih Dan Akrim Teguh Suseno, penelitian ini menggunakan data tweet sebanyak 795 data twet yang digunakan unuk menentukan sentimen bernilai positif dan negatif. Kata kunci yang digunakan BBM dan BSU. Dari hasil analisis sentimen Kata kunci BBM menghasilkan 28,2% sentimen positif dan 71,85 sentimen negatif. Sedangkan kata kunci BSU menghasilkan 65,2% sentimen positif dan 34,8 sentimen negatif. Untuk pengklasifikasian diperoleh akurasi sebesar 82,64% dan 92,89 untuk presisi [3].

Penelitian yang dilakukan oleh Rudy Asrianto dan Melda Herwinanda, penelitian ini membahas tentang kenaikan harga kebutuhan pokok. Pada penelitian ini data diambil melalui sosial media youtube dan menggunakan metode Support Vector Machine. Penelitian ini mengklasifikasikan sentimen positif dan negatif. Pembagian data pada penelitian ini yaitu 9:1 sehingga menghasilkan skor akurasi sebesar 86,33% sedangkan 75 % untuk nilai presisi, 66,67% untuk nilai recall, dan 70,59% untuk nilai F1-score [4].

Penelitian yang dliakukan oleh Sartika Lina Mulani Sito Dan Ria Nadiyanti, penelitian ini membahas tentang kenaikan harga BBM. Data diambil dari cuitan di Facebook dengan 799 data menggunakan metode naïve bayes classifier. Dihasilkan sebanyak 19% sentimen positif, 22% sentimen negatif, dan 59% sentimen netral.

Peneitian ini menghasilkan akurasi tertinggi yaitu 99% [6].

Penelitian yang dilakukan oleh Syamsul Mujahidin, dkk. Penelitian ini membahas mengenai kenaikan harga BBM yang terdapat pada komentar youtube. Menghasilkan data sebanyak 3053 dataset dan dihasilkan klasifikasi berupa sentimen positif dan negatif dengan pelabelan otomatis menggunakan lexicon. Dengan perbandingan data 8:2 menggunakan metode Gausian Naïve Bayes dihasilkan akurasi sebesar 74% [7].

Selanjutnya penelitian yang dilakukan oleh Paulus Samotana Zalukhu, dkk. Penelitian ini membahas mengenai kenaikan BBM. Data diambil dari twiter sebanyak 500 tweet. Dari data tersebut digolongkan kedalam sentimen positif, netral dan negatif. Untuk metode klasifikasi menggunakan algoritma Naïve Bayes Classifier.

Tingkat akurasi yang diperoleh dengan metode tersebut adalah 75% [8].

Berdasarkan beberapa penelitian yang telah dilakukan, penelitian mengenai analisis sentimen di media sosial Twitter terhadap kenaikan harga bahan pokok sudah dilakukan oleh [4] tetapi akurasinya hanya 86,33%

dimana data penelitian tersebut diambil dari youtube dengan menggunakan metode Support Vector Machine sedangkan penelitian ini data diambil dari Twitter menggunakan metode Naïve Bayes Classifier. Sehingga masih ada kemungkinan untuk meningkatkan akurasi analisa sentimen. Metode pengklasifikasian pada penelitian ini menggunakan Naïve Bayes Classifier.

2. METODOLOGI PENELITIAN

Penelitian ini menggunakan metode Naïve Bayes Classifier dalam proses klasifikasi. Data yang digunakan berasal dari Twitter melalui website netlytic.org dengan ruang lingkup indonesia. Gambar 1 merupakan alur tahapan yang digunakan untuk penelitian.

Gambar 1. Tahapan Alur Penelitian 2.1 Pengumpulan Data Tweet

Jenis data dalam penelitian ini berupa tweet yang didapatkan dari media sosial Twitter dengan kata kunci bahan pokok yang diambil melalui website netlytic.org. netlytic.org merupakan wabsite yang digunakan untuk

(3)

DOI: 10.30865/mib.v7i3.6418

melakukan pengambilan data dari media sosial antara lain twitter, youtube, googlesheet, textfile, RSS, dan Reddit dan berbasis cloud [9]. Setelah data berhasil dikumpulkan selanjutnya disimpan dengan format csv. Pada penelitian ini data tweet diambil dengan rentang waktu antara 16 April 2023 sampai 26 April 2023 dan menghasilkan sebanyak 2070 data tweet. Data sebanyak 2070 tweet dipilih karena berhubungan dengan topik kenaikan harga bahan pokok.

2.2 Pelabelan Data Tweet

Tahapan pelabelan data merupakan tahapan dimana ditentukannya suatu keterangan sentimen positif dan negatif pada setiap tweet [7]. Proses pelabelan dilakukan dengan library TextBlob. TextBlob digunakan untuk melakukan pemprosesan terhadap data yang sifatnya tekstual yang salah satunya digunakan untuk kasus analisis sentimen [10].

2.3 Preprocessing

Preprocessing bertujuan untuk pembersihan data dan juga dilakukan penyederhanaan data dari yang awalnya tidak terstruktur menjadi terstruktur [11]. Tahapan preprocesing digunakan sebelum dilakukannya tahapan penerapan metode klasifikasi . Penelitian ini menggunakan beberapa tahapan prerpocessing diantaranya cleaning data, case folding, tokenization, normalization, stopword removal, dan stemming [4].

1) Cleaning Data, tahapan cleaning data memiliki tujuan untuk menghapus kata yang tidak penting dan tidak memiliki makna. Kata-kata yang dihapus sepeti retweet, username, hastag, alamat website, emoji, dan juga duplikat tweet [3]

2) Case Folding, tahapan proses dimana keseluruhan data diubah menjadi huruf kecil [3].

3) Tokenization, tahapan dimana proses memisahkan kata atau memotong string untuk dimasukan kedalam susunan berdasarkan per kata [2].

4) Normalization, tahapan dimana mengubah suatu kata dikembalikan kedaam ejaan yang benar dan merubah menjadi kata baku [4].

5) Stopword, tahapan proses jika terdapat kata yang tidak penting dan tidak memiliki makna maka akan dihapus [4].

6) Stemming, tahapan stemming digunakan untuk menghasilkan kata baru dan menghilangkan kata-kata yang memiliki imbuhan [4].

2.4 Ekstraksi Fitur

Ektraksi fitur digunakan untuk mengubah data menjadi vector. Ektraksi fitur terdapat dua tahapan yaitu pembuatan word vector dan pembobotan kata dengan TF-IDF (Tem Frequency-Inverse Document Frequency) [12]. Dalam tahapan ini term dirubah kedalam bentuk numerik [13].

1) Word Vector, digunakan untuk mengubah kumpulan array menjadi matriks [12].

2) TF-IDF, digunakan untuk memberikan suatu bobot terhadap term pada dokumen sehingga dapat menghasilkan word vector yang terbobot. TF-IDF gabungan dari TF (Term Frequecy) dan IDF (Inverse Document Frequency) [12]. TF-IDF memberikan nilai kecil dengan frekuensi yang tinggi, sedangkan term memberikan nilai yang besar dengan frekuensi rendah [14]. TF (term Frequency) digunakan untuk menghitung frequnecy kemunculan pada term dalam dokumen [15]. Untuk menghitung TF digunakan rumus :

TF(t, d) = 0,5 + 0,5 f(t,d)

max{f(w,d):w∈d} (1)

IDF (Inverse document Frequency) digunakan untuk mengitung banyak dokumen yang mengandung term.

Pada IDF diperlukan 1+Df(t,d) sebagai pengganti pembagian nilai 0 [15]. Untuk menghitung IDF digunakan rumus :

IDF(𝑡, 𝑑) = 𝑙𝑜𝑔 𝑁

𝐷𝑓(𝑡,𝑑) (2)

TF-IDF digunakan untuk mengitung bobot yang dihasilkan oleh term dengan mengalikan TF dan IDF [15].

Untuk menghitung TF-IDF digunakan rumus :

𝑇𝐹 − 𝐼𝐷𝐹(𝑡, 𝑑, 𝐷) = 𝑡𝑓(𝑡, 𝑑) × 𝑖𝑑𝑓(𝑡, 𝐷) (3)

2.5 Klasifikasi Naïve Bayes Classifier

Thomas bayes merupakan orang yang menemukan metode Naïve Bayes Classifier. Metode Naïve Bayes merupakan metode yang digunakan sebagai pengklasifikasian yang didasarkan pada teorema bayes [16]. Metode ini digunakan untuk memprediksi kasus dalam hal pengambilan keputusan [12]. Performa dari Naïve Bayes untuk melakukan klasifikasi teks untuk analisa sentimen memiliki performa akurasi yang tinggi [12]. Naïve bayes memanfaatkan fitur-fitur teks seperti jumlah kemunculan term pada suatu dokumen untuk diklasifikasikan menjadi sentimen kedalam positif atau negatif [17]. Naïve Bayes memiliki dua proses yaitu pelatihan dan pengujian [18].

Untuk menghitung Naïve bayes digunakan rumus seperti berikut :

(4)

𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴)×𝑃(𝐴)

𝑃(𝐵) (4)

2.6 Uji Model

Pada tahapan uji model menggunakan data yang sudah diberikan label sentimen dan dilakukan preprocessing sehingga menghasilkan data bersih dengan mengimplementasikan metode TF-IDF untuk menghitung bobot pada kata serta menggunakan metode Naïve Bayes Classifier. Sehingga dengan proses tersebut dapat dilakukan pengujian data model. Pada tahapan ini dilakukan pembagian dataset untuk data latih dan data uji terlebih dahulu.

Tahapan pengujian model dilakukan menggunakan confusion matrix yang digunakan untuk menghitung nilai akurasi berdasarkan metode Naïve Bayes Classifier [8]. Confusion matrix merupakan tabel yang terdiri dari nilai prediksi dan nilai aktual yang terdiri dari TP (True Positive), TN (True Negative), FP (False Positive), FP (False Negative) [19].

2.7 Evaluasi Model

Evaluasi model digunakan untuk melihat kinerja dari model klasifikasi yang digunakan. Metode evaluasi yang digunakan adalah confusion matrix. Berdasarkan confusion matrix pengujian model dilakukan dengan menghitung nilai accuracy, precision, recall, dan juga F-measure [20].

Tabel 1. Confusion Matrix Actual Class

Predicted Class Positive Negative Positive True Positive (TP) False Positive (FP) Negative False Negative (FN) True Negative (TN)

Perhitungan untuk metode confusion matrix yaitu nilai skor Accuracy, Precision, Recall, dan F-measure [20].

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑇𝑃+𝑇𝑁

𝑇𝑃+𝐹𝑃+𝑇𝑁+𝐹𝑁 × 100% (5)

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃

𝑇𝑃+𝐹𝑃 × 100% (6)

𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃

𝑇𝑃+𝐹𝑁 × 100% (7)

𝐹 − 𝑚𝑒𝑎𝑠𝑢𝑟𝑒 =2 × 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 × 𝑅𝑒𝑐𝑎𝑙𝑙

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑅𝑒𝑐𝑎𝑙𝑙 × 100% (8)

3. HASIL DAN PEMBAHASAN

Penelitian ini mengimplementasikan suatu analisis yang dilakukan secara bertahap. Tahapan yang dilakukan antara lain melakukan pengumpulan data tweet dari Twitter melalui website netlytic.org yang selanjutnya dilakukan pelabelan data lalu dilanjutkan dengan tahapan preprocessing untuk dilakukan pembersihan data dan penyederhanaan data yang selanjutnya dilakukan tahapan ekstraksi fitur yang terdiri dari tahapan word vector dan pembobotan kata TF-IDF. Dan dilanjutkan dengan proses klasifikasi menggunakan metode Naïve Bayes Classifier.

3.1 Pengumpulan Data

Tahapan pertama yang dilakukan dalam menganalisa tentang analisis sentimen yaitu melakukan pengumpulan data tweet dimana data tersebut diambil dari platform media sosial Twitter. Data tweet diambil menggunakan website netlytic.org dengan kata kunci bahan pokok. Dalam melakukan pengumpulan data menggunakan netlytic.org dihasilkan data sebanyak 2070 data tweet yang selanjutnya akan dilakukan proses yaitu tahapan pelabelan data dan dilanjutkan tahapan preprocessing. Data yang sudah terkumpul nantinya akan disimpan dengan format csv. Untuk contoh hasil pengumpulan data tweet yang sudah diambil dari twitter dapat dilihat pada tabel 2.

Tabel 2. Contoh Hasil Pengumpulan Data Twitter Nama

Pengguna

Data Tweet

@Urrangawak Jelang lebaran idul Fitri 1444 H, Polres Tegal Kota sambangi sejumlah pusat perbelanjaan di Kota Tegal. . selain memantau bahan pokok petugas juga menyampaikan himbauan kamtibmas kepada warga maupun petugas keamanan https://t.co/McVWFxVeMO

@fencywecast Bikin malu saat Bupati Kunjungan Kerja pengecekan harga bahan pook menjelang Lebaran.

Mungkin lupa pernah punya utang ke pedagang, tiba2 ada pedagang marah2 danmengamuk di pasar tagih utang ke Bupati Sula Maluku Utara, Fifian Adeningsih Mus, katanya pernah ambil sembako untuk- https://t.co/LUj63MWMRI

(5)

DOI: 10.30865/mib.v7i3.6418 3.2 Pelabelan Data

Dalam melakukan pelabelan data dilakukan menggunakan library python yaitu TextBlob. Textblob digunakan dalam analisis sentimen digunakan untuk melakukan klasifikasi sentimen terhadap opini pengguna Twitter.

Pelabelan data menghasilkan data sentimen bernilai positif yaitu sebanyak 58 data tweet dan data sentimen bernilai negatif yaitu sebanyak 2012 data tweet dari total keseluruhan 2070 data tweet. Untuk hasil dari pelabelan data dapat dilihat pada tabel 3.

Tabel 3. Hasil Pelabelan Data

Data Tweet Sentimen

Good News Menjelang lebaran, harga pertalite Turun, harga 9 bahan pokok cenderung stabil, sebagian malah turun. Utang luar negeri Indonesia turun, seiring dengan menguatnya Rupiah.

Kalau berita seperti ini kurang menarik buat sebagian orang ya? https://t.co/hzZyDGAL9h

Positif

@jokowi melakukan pengecekan harga bahan-bahan pokok di pasar tradisional dalam kunjungan kerja di Provinsi Jawa Tengah https://t.co/xd1x20qvsY

Negatif

3.3 Preprocessing

Tahapan preprocessing digunakan untuk pembersihan data dan juga penyederhanaan data sehingga menjadi data yang terstruktur. Preprocessing dilakukan melalui beberapa proses tahapan diantaranya cleaning data, case folding, tokenization, normalization, stopword, dan stemming. Untuk hasil dari tahapan preprocessing dapat dilihat pada tabel 4.

Tabel 4. Hasil Preprocessing Data Tahapan

Preprocessing

Data Tweet

Data awal @Okto @hannajoe20 @kurawa @sigitwid Nah iya heran banget. Kemarin ngeluh harga bahan pokok mahal. Nah ini ada kader partai yang kebetulan dibenci oposisi digetok harga kok dikatakan wajar

Cleaning data Nah iya heran banget Kemarin ngeluh harga bahan pokok mahal Nah ini ada kader partai yang kebetulan dibensi oposisi mengelu digetok harga kok dikatakan wajar

Case folding nah iya heran banget kemarin ngeluh harga bahan pokok mahal nah ini ada kader partai yang kebetulan dibenci oposisi mengeluh digetok harga kok dikatakan wajar

Tokenization [nah, iya, heran, banget, kemarin, ngeluh, harga, bahan, pokok, mahal, nah, ini, ada, kader, partai, yang, kebetulan, dibenci, oposisi, mengeluh, digetok, harga, kok, dikatakan, wajar]

Normalization [nah, iya, heran, banget, kemarin, ngeluh, harga, bahan, pokok, mahal, nah, ini, ada, kader, partai, yang, kebetulan, dibenci, oposisi, mengeluh, digetok, harga, kok, dikatakan, wajar]

Stopword removal [iya, heran, banget, kemarin, ngeluh, harga, bahan, pokok, mahal, kader, partai, dibenci, oposisi, mengeluh, digetok, harga, wajar]

Stemming iya heran banget kemarin ngeluh harga bahan pokok mahal kader partai benci oposisi keluh getok harga wajar

Pada tahapan clening data terdapat proses penghapusan duplikat tweet, maka diperoleh sebanyak 934 data tweet dengan rincian 32 data tweet sentimen benilai positif dan 902 data tweet dengan sentimen bernilai negatif.

Serta membersihkan data yang tidak penting semisal retweet, username, link website. Setelah itu dilakukan proses case folding yang digunakan untuk mengubah semua kalimat tweet menjadi huruf kecil. Lalu dilanjutkan tahap tokenization, digunakan untuk memotong string pada tweet menjadi per kata yang disebut token. Lalu dilakukan normalization, digunakan untuk mengubah kata menjadi kata yang baku, contohnya yg menjadi yang. Kemudian tahapan stopword untuk menghilangkan kata yang dianggap tidak penting, contohnya adalah ada, karena. Kemudia terakhir stemming, tahapan ini digunakan untuk menghilangkan kata yang memiliki imbuhan untuk menghasilkan kata baru, contohnya kenaikan menjadi naik, terkendali menjadi kendali.

3.4 Ekstraksi Fitur

Pada tahapan ektraksi fitur, bertujuan mengubah data tweet kedalam bentuk vector yang dinamakan word vector.

Selanjutnya dilakukan pembobotan kata menggunakan metode TF-IDF. Berikut pada tabel ke 5 merupakan contoh 3 dokumen yang akan dilakukan ektraksi fitur.

Tabel 5. Dokumen Ekstraksi Fitur

Dokumen Data Tweet

D1 hadap jokowi menteri dagang harga bahan pokok lebaran kendali D2 rutin pantau harga pokok

D3 wali kota pasti stok bahan pokok aman

(6)

Tahapan word vector digunakan untuk mengubah dataset ke bentuk vector. Jika term terdapat pada sebuah dokumen maka akan diberikan nilai 1. Dan apabila term tidak terdapat pada sebuah dokumen akan diberikan nilai 0. Selanjutnya jika word vector sudah diketahui maka dilanjutkan dengan tahap TF-IDF sebagai metode untuk pembobotan kata. Tahapan word vector dapat dilihat pada tabel 6.

Tabel 6. Hasil Word Vector

term D1 D2 D3

hadap 1 0 0

jokowi 1 0 0

menteri 1 0 0

dagang 1 0 0

harga 1 1 0

bahan 1 0 1

pokok 1 1 1

lebaran 1 0 0

kendali 1 0 0

rutin 0 1 0

pantau 0 1 0

wali 0 0 1

kota 0 0 1

pasti 0 0 1

stok 0 0 1

aman 0 0 1

Tahap kedua mencari nilai TF-IDF, akan tetapi dalam menghasikan nilai TF-IDF terlebih dahulu mencari nilai TF (Term Frequency) seperti yang terlihat pada tabel 7.

Tabel 7. Hasil Tahapan TF (Term Frequency)

term D1 D2 D3

hadap 0,11 0 0

jokowi 0,11 0 0

menteri 0,11 0 0

dagang 0,11 0 0

harga 0,11 0,25 0

bahan 0,11 0 0,142

pokok 0,11 0,25 0,142

lebaran 0,11 0 0

kendali 0,11 0 0

rutin 0 0,25 0

pantau 0 0,25 0

wali 0 0 0,142

kota 0 0 0,142

pasti 0 0 0,142

stok 0 0 0,142

aman 0 0 0,142

Selanjutnya melakukan perhitungan untuk mencari nilai (IDF) Inverse Document Frequency. Untuk nilai IDF dapat dilihat pada tabel 8.

Tabel 8. Hasil Tahapan IDF (Inverse Document Frequency)

term DF IDF IDF+1

hadap 1 0,602 1,602

jokowi 1 0,602 1,602

menteri 1 0,602 1,602

dagang 1 0,602 1,602

harga 2 0,301 1,301

bahan 2 0.301 1,301

pokok 3 0,124 1,124

lebaran 1 0,602 1,602

kendali 1 0,602 1,602

rutin 1 0,602 1,602

pantau 1 0,692 1,602

(7)

DOI: 10.30865/mib.v7i3.6418

term DF IDF IDF+1

wali 1 0,602 1,602

kota 1 0,602 1,602

pasti 1 0,602 1,602

stok 1 0,602 1,602

aman 1 0,602 1,602

Jika nilai TF dan IDF sudah diperoleh, maka dilanjutkan dengan menghitung nilai TF-IDF dengan mengalikan dua komponen (TF dan IDF) tersebut untuk menentukan bobot pada setiap term pada masing-masing dokumen. Nilai TF-IDF dapat dilihat pada tabel 9.

Tabel 9. Hasil Tahapan Perhitungan TF-IDF

term D1 D2 D3

hadap 0,178 0 0

jokowi 0,178 0 0

menteri 0,178 0 0

dagang 0,178 0 0

harga 0,144 0,325 0

bahan 0,144 0 0,185

pokok 0,124 0,281 0,160

lebaran 0,178 0 0

kendali 0,178 0 0

rutin 0 0,40 0

pantau 0 0,40 0

wali 0 0 0,288

kota 0 0 0,288

pasti 0 0 0,288

stok 0 0 0,228

aman 0 0 0,228

3.5 Klasifikasi Naïve Bayes

Setelah mendapatkan data dari proses tahapan preprocessing maka akan dilanjutkan ke proses tahapan pengklasifikasian. Pada tahapan ini digunakan metode Naïve Bayes Classifier untuk memperoleh probabilitas apakah termasuk kedalam kelas positif atau kelas negatif. Digunakan perhitungan menggunakan probabilitas dan juga statistik pada metode ini dan digunakan untuk melakukan suatu prediksi terhadap suatu kasus berdasarkan hasil dari klasifikasi. Nilai prior merupakan langkah dimana dilakukan untuk mencari nilai probabilitas pada setiap kelas [12]. Dari perhitungan prior dihasilkan probabilitas sebesar 0,0342 untuk kelas positif yang artinya peluang kejadian sebesar 3,42%. Sedangkan perhitungan prior dihasilkan probabilitas sebesar 0,9657 untuk kelas negatif yang artinya peluang kejadian sebesar 96,57%. Untuk perhitungan dengan rumus terdapat dibawah ini.

𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑎𝑠 𝑃𝑟𝑖𝑜𝑟 𝑃𝑜𝑠𝑖𝑡𝑖𝑓 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝐾𝑒𝑙𝑎𝑠 𝑃𝑜𝑠𝑖𝑡𝑖𝑓

𝐽𝑢𝑚𝑙𝑎ℎ 𝐾𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝐷𝑎𝑡𝑎 = 32

934 = 0,0342 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑎𝑠 𝑃𝑟𝑖𝑜𝑟 𝑁𝑒𝑔𝑎𝑡𝑖𝑓 = 𝐽𝑢𝑚𝑙𝑎ℎ 𝐾𝑒𝑙𝑎𝑠 𝑁𝑒𝑔𝑎𝑡𝑖𝑓

𝐽𝑢𝑚𝑙𝑎ℎ 𝐾𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝐷𝑎𝑡𝑎 = 902

934 = 0,9657

3.6 Uji Model

Pengujian model digunakan untuk mengetahui model kinerja terhadap model klasifikasi dengan metode tertentu.

Terdapat dataset yang digunakan untuk pelatihan dan pengujian dalam melakukan pengujian model. Semakin banyak data yang digunakan maka akan menjadi lebih baik juga model tersebut. Data training atau data latih digunakan sebagai pelatihan model sedangkan untuk data testing atau data uji digunakan sebagai pengujian model [12]. Untuk pembagian data dilakukan dengan perbandingan 6:4 yang artinya 60% untuk proporsi data latih dan 40% untuk proporsi data uji. Proses pembagian data menghasilkan 560 tweet data latih dan 374 tweet data uji.

Pada data tweet data latih didapatkan 22 tweet bernilai sentimen positif dan 538 bernilai sentimen negatif sedangkan pada data tweet data uji didapatkan 10 tweet bernilai sentimen positif dan 364 tweet bernilai sentimen negatif.

3.7 Evaluasi Model

Proses evaluasi model dilakukan setelah tahapan pengklasifikasian dan pengujian model. Evaluasi bertujuan untuk menghitung hasil dari performa metode yang didapatkan dengan menggunakan metode Naïve Bayes Classifier.

Dari proses pengujian model dihasilkan confusion matrix dengan matrix 2x2 [12]. Untuk hasil dari confusion matrix dapat dilihat pada tabel 10.

(8)

Tabel 10. Hasil Confusion Matrix Naive Bayes Classifier Actual Class

Predict Class Positive Negative

Positive 4 15

Negative 6 349

Dari hasil yang didapatkan melalui confusion matrix dengan metode Naïve Bayes Classifier didapatkan data true postive (TP) sebesar 4 data, False postive (FP) sebesar 15 data, True Negative (TN) sebesar 349 data, False Negative (FN) sebesar 6 data.

Berdasarkan hasil confusion matrix pada tabel 10 untuk metode naïve bayes classifier pada kelas sentimen yang bernilai positif didapatkan nilai precision sebesar 21,05% nilai recall diperoleh sebesar 40%, dan untuk nilai F-measure sebesar 27,58%. Sedangkan untuk kelas sentimen negatif diperoleh nilai precision diperoleh nilai sebesar 98,30%, recall sebesar 95,87%, F-measure sebesar 97,06%. Untuk nilai accuracy yang diperoleh menggunakan metode Naïve Bayes Classifier mendapatkan hasil sebesar 94,38%. Hasil accuracy, precision, recall, F-measure dapat dilihat pada tabel 11.

Tabel 11. Nilai Accuracy, Precision, Recall, F-measure

Klasifikasi Accuracy Precision Recall F-measure

Positif 94,38% 21,05% 40% 27,58%

Negatif 94,38% 98,30% 95,87% 97,06%

Dari hasil nilai evaluasi tersebut maka didapatkan nilai rata-rata terhadap nilai accuracy, precision, recall, F-measure. Untuk nilai rata-rata evaluasi model dapat dilihat pada tabel 12.

Tabel 12. Hasil Evaluasi Model

Accuracy Precision Recall F-measure

Rata-Rata 94,38% 59,67% 67,93% 62,32%

3.8 Visualisasi

Setelah tahapan selesai semua dilakukan, selanjutnya adalah melakukan visualisasi yang berupa histogram dan juga representasi wordcloud. Pada tampilan histogram sendiri dapat juga dikatakan sebagai bagian berapa persentase yang didapatkan kelas sentimen bernilai positif dan sentimen bernilai negatif sedangkan untuk wordcloud merupakan bentuk gambaran yang mempresentasikan kata yang sering muncul pada data [21]. Untuk tampilan histogram terdapat pada gambar 2 sedangkan tampilan WordCloud terdapat pada gambar 3.

Gambar 2. Tampilan Histogram

Gambar 3. Tampilan Wordcloud

(9)

DOI: 10.30865/mib.v7i3.6418

4. KESIMPULAN

Penelitian ini merupakan analisis sentimen mengenai pendapat masyarakat pada media sosial Twitter terhadap kenaikan harga bahan pokok dengan metode Naïve Bayes Classifier. Penelitian ini menggunakan data yang diambil dari platform Twitter berupa data tweet. Pengambilan data dilakukan di website netlytic.org dan pelabelan data dilakukan dengan menggunakan library TextBlob. Untuk kata kunci yang digunakan dalam pengambilan data yaitu bahan pokok. Didapatkan sebanyak 2070 tweet dengan persentase 2,8% sentimen positif dan 97,2% sentimen negatif. Setelah dilakukan tahapan preprocessing atau pemrosesan data didapatkan 934 data tweet dengan rincian 3,43% data dengan sentimen positif dan 96,57% dengan sentimen negatif. Hasil klasifikasi menggunakan metode Naïve Bayes Classifier didapatkan tingkat accuracy sebesar 94,38%, dilanjutkan dengan precision 59,67%, recall 67,93%, dan F-measure 62,32%. Penelitian sebelumnya data diambil dari komentar youtube dengan perbandingan 9:1 menghasilkan tingkat accuracy sebesar 86,33% sedangkan pada penelitian ini data diambil dari Twitter dengan perbandingan 6:4 menghasilkan tingkat accuracy sebesar 94,38%. Penting bagi pembuat kebijakan untuk menanggapi sentimen negatif yang mencermikan ketidakpuasan masyarakat. Dari hasil penelitian tersebut pembuat kebijakan dapat melakukan stabilisasi harga seperti operasi pasar dalam mengantisipasi kenaikan harga bahan pokok. Pembuat kebijakan bisa juga menentukan harga jual tertinggi dari bahan pokok agar penjual bahan pokok tidak menjual lebih dari harga maksimal yang ditentukan.

REFERENCES

[1] D. A. Wulandari, R. R. Saedudin, and R. Andreswari, “Analisis Sentimen Media Sosial Twitter Terhadap Reaksi Masyarakat Pada Ruu Cipta Kerja Menggunakan Metode Klasifikasi Algoritma Naive Bayes,” e-Procedding of Engineering, 2021, vol. 8, no. 5, pp. 9007-90016.

[2] B. T. Buwono and N. Matondang, “Analisis Sentimen Pada Media Sosial Twitter Mengenai Kebijakan Kenaikan Harga Bahan Minyak Menggunakan Metode Naïve Bayes,” Senamika, 2022, vol. 3, no. 2, pp. 584-591.

[3] U. Kurniasih and A. T. Suseno, “Analisis Sentimen Terhadap Bantuan Subsisi Upah (BSU) Pada Kenaikan Harga Bahan Bakar Minyak (BBM),” Jurnal Media Informatika Budidarma, 2022, vol. 6, no. 4, pp. 2335-2340, 2022, doi:

10.30865/mib.v6i4.4958.

[4] R. Asrianto and M. Herwinanda, “Analisis Sentimen Kenaikan Harga Kebutuhan Pokok Dimedia Sosial Youtube Menggunakan Algoritma Support Vector Machine,” Jurnal CoSciTech (Computer Science and Information Technology), vol. 3, no. 3, pp. 431–440, Dec. 2022, doi: 10.37859/coscitech.v3i3.4368.

[5] M. Riski Qisthiano, I. Ruswita, and A. Prayesy, “Implementasi Metode SVM dalam Analisis Sentimen Mengenai Vaksin dengan Menggunakan Python 3,” Teknologi: Jurnal Ilmiah Sistem Informasi, vol. 13, no. 1, pp. 1–7, 2023, doi:

10.26594/teknologi.v13i1.3105.

[6] S. L. M. Sitio, and R. Nadiyanti, “Analisis Sentimen Kenaikan Harga BBM Pertamax Pada Media Sosial Menggunakan Metode Naïve Bayes Classifier,” Technology and Science (BITS), vol. 4, no. 3, 2022, doi: 10.47065/bits.v4i3.2331.

[7] S. Mujahidin, B. Prasetio, and M. C. C. Utomo, “Implementasi Analisis Sentimen Masyarakat Menegnai Kenaikan Harga BBM Pada Komentar Youtube Dengan Metode Gaussian Naïve Bayes,” Jurnal Vocational Teknik Elektronika Dan Informatika, 2022, Vol. 10. No. 3, pp. 17-24.

[8] P. S. Zalukhu, T. Handhayani, and M. Sitorus, “Analisis Sentimen Terhadap Kenaikan BBM Di Indonesia Pada Media Sosial Twitter Menggunakan Metode Naïve Bayes,” Jurnal Sistem Informasi dan Teknik Informatika, 2023, vol. 8, no. 1, pp. 65-69.

[9] P. Rohimi, “SNA Dengan Netlytic Pada Kolom Komentar Video Youtube Gus Miftah Ceramah Di Gereja,” Proceeding Of Conference On Strengthening Islamic Studies In The Digital Era, 2021, vol. 1, no. 1, pp. 360-377.

[10] R. Azhar, A. Surahman, and C. Juliane, “Analisis Sentimen Terhadap Cryptocurrency Berbasis Python TextBlob Menggunakan Algoritma Naïve Bayes,” Jurnal Sains Komputer & Informatika (J-SAKTI), 2022, Vol. 6, No. 1, pp. 267- 281.

[11] H. Irsyad and A. Taqwiym, “Sentimen Analisis Masyarakat Terhadap Rakyat Palestina dengan Klasifikasi Naive Bayes,”

Jurnal Sistem Telekomunikasi Elektronika Sistem Kontrol Power Sistem & Komputer (JTECS), 2021, Vol. 1, No. 2, pp.

167-176.

[12] R. A. Raharjo, I. M. G. Sunarya, and D. G. H. Divayana, “Perbandingan Metode Naïve Bayes Classifier Dan Support Vector Machine Pada Kasus Analisis Sentimenerhadap Data Vaksin Covid-19 Di Twitter,” Jurnal Ilmiah Elektronika Dan Komputer, 2022, vol.15, no.2, pp. 456-464.

[13] D. I. Mulyana, N. Lutfianti, “Analisis Sentimen Dengan Algoritma SVM Dalam Tanggapan Netizen Terhadap Berita Resesi 2023,” Jurnal SISFOTENIKA, vol. 13, no. 1, 2023, doi: 10.30700/jst.v13i1.1339.

[14] M. Zaki Anbari, M. Zaki Anbari, and B. Sugiantoro, “Studi Komparasi Metode Analisis Sentimen Naïve Bayes, SVM, dan Logistic Regression Pada Piala Dunia 2022,” Jurnal Media Informatika Budidarma, 2023, Vol. 7, No. 2, pp. 688-695 doi: 10.30865/mib.v7i2.5383.

[15] R. Asmara, M. F. Ardiansyah, and M. Ansori, “Analisa Sentiment Masyarakat Terhadap Pemilu 2019 Berdasarkan Opini Di Twitter Menggunakan Metode Naïve Bayes Classifier,” Jurnal Inovtek Polbeng – Seri Informatika, 2020, vol. 5, no. 2, pp. 193-204.

[16] E. Salim and A. Solichin, “Analisis Sentimen Pada Media Sosial Twitter Terhadap Pelayanan Dinas Kependudukan Dan Pencatatan Sipil Menggunakan Algoritma Naïve Bayes,” Indonesia Journal Information System (IDEALIS), 2022, Vol.

5, No. 2, pp. 79-86.

[17] A. Budiman, A. Suryadibrata, and J. C. Young, “Implementasi Algoritma Naïve Bayes untuk Klasifikasi Konten Twitter dengan Indikasi Depresi,” Jurnal Pengembangan IT, 2021, vol. 6, no. 2, pp. 133-138.

(10)

[18] F. Rejeki and V. Ayumi, “Analisa Sentimen Mengenai Kenaikan Harga Bbm Menggunakan Metode Naïve Bayes Dan Support Vector Machine,” JSAI : Journal Scientific and Applied Informatics, 2023, vol. 6, no. 1, 2023, pp. 1-10 doi:

10.36085.

[19] I. Najiyah, “Analisis Sentimen Tanggapan Masyarakat Indonesia Tentang Kenaikan Bbm Menggunakan Metode Artificial Neural Network,” Jurnal Responsif, 2023, vol. 5, no. 1, pp. 92–100.

[20] M. R. Nurhusen, J. Indra, and K. A. Baihaqi, “Analisis Sentimen Pengguna Twitter Terhadap Kenaikan Harga Bahan Bakar Minyak (BBM) Menggunakan Metode Logistic Regression,” Jurnal Media Informatika Budidarma, 2023, vol. 7, no. 1, pp. 276-282, doi: 10.30865/mib.v7i1.5491.

[21] F. Amaliah and K. D. Nuryana, “Perbandingan Akurasi Metode Lexicon Based Dan Naïve Bayes Classifier Pada Analisis Sentimen Pendapat Masyarakat Terhadap Aplikasi Investasi Pada Media Twitter,” Journal Of Informatics And Conputer Science, 2022, vol. 3, no. 4, pp. 384-393.

Referensi

Dokumen terkait

Oleh karena itu, pada makalah tugas akhir ini dilakukan sebuah analisis sentimen terhadap berita yang ada di media sosial twitter mengenai pemilihan umum presiden

Judul Skripsi : Analisis Sentimen Terhadap Akun Twitter Samsung Indonesia Dengan Metode Naïve Bayes Sebenarnya, saya di sini untuk mengatakan bahwa penulisan risalah

Berdasarkan penelitian yang telah dilakukan oleh beberapa penulis tersebut di atas, peneliti tertarik untuk melakukan penelitian mengenai analisis sentimen masyarakat di media sosial

Beberapa tahapan yang dilakukan dalam analisis sentimen penelitian ini diantaranya yaitu pengumpulan data, preprocessing, perhitungan skor sentimen, pelabelan kelas sentimen, dan

Oleh karena itu dilakukanlah penelitian analisis sentimen Cyberbullying pada pengguna media sosial twitter untuk mengklasifikasikan tweet yang bermuatan negatif dan netral menggunakan

Simpulan Penelitian tentang analisis kenaikan harga bahan bakar minyak BBM pada media sosial twitter menunjukkan bahwa data yang digunakan sebanyak 4.419 tweet dalam bahasa Indonesia

Contoh Pelabelan Sentimen Opini Sentimen Bisa bilang gak sama tukang parkir liar dan pengamen ga niat Bahkan kadang ga pake bilang Langsung ngeloyor ato cuekin aja Ngapain sungkan

Analisis sentimen publik terhadap Undang-Undang Cipta Kerja dilakukan pada Twitter menggunakan metode Naive Bayes Classifier untuk mengetahui opini masyarakat terhadap kebijakan