• Tidak ada hasil yang ditemukan

ANALISIS SENTIMEN TWITTER TERHADAP KENAIKAN HARGA BAHAN BAKAR MINYAK INDONESIA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE

N/A
N/A
Protected

Academic year: 2023

Membagikan "ANALISIS SENTIMEN TWITTER TERHADAP KENAIKAN HARGA BAHAN BAKAR MINYAK INDONESIA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE"

Copied!
10
0
0

Teks penuh

(1)

1 ANALISIS SENTIMEN TWITTER TERHADAP KENAIKAN HARGA BAHAN

BAKAR MINYAK INDONESIA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE

Rosa Adhawiyah, Zaiful Bahri

Mahasiswa Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia

[email protected], [email protected]

ABSTRACT

Sentiment analysis is a process that aims to determine positive or negative polarity.

Twitter, as a social media platform, is used as a space for public information and opinions in responding to issues, including the increase in fuel prices. The government officially increased fuel prices, which was met with criticism from the public. This study aims to categorize the sentiment polarities of the public and determine the accuracy level in sentiment analysis. The method used in this study is Support Vector Machine with linear, RBF, polynomial, and sigmoid kernels, with the linear kernel being obtained as the best kernel. Based on the results of the testing done on sentiment data related to the increase in fuel prices in Indonesia on Twitter, which consists of 1130 data (485 positive and 645 negative), evaluation was done using a confusion matrix to see how well the model can classify correctly. The results show that the Support Vector Machine method produces an accuracy rate of 88.49%.

Keywords: Twitter, Sentimen Analysis, Support Vector Machine, Fuel Price Increase ABSTRAK

Analisis sentimen merupakan proses yang bertujuan untuk menentukan polaritas bersifat positif atau negatif. Twitter sebagai wadah media sosial yang dijadikan sebagai tempat informasi dan opini publik dalam menanggapi suatu permasalahan, salah satunya yakni kenaikan harga bahan bakar minyak (BBM). Pemerintah secara resmi menaikkan harga BBM, hal tersebut justru menuai kritikan dari kalangan masyarakat. Penelitian ini bertujuan untuk mengelompokkan polaritas sentimen masyarakat dan mengetahui tingkat akurasi dalam m elakukan analisis sentimen. Metode yang digunakan dalam penelitian ini adalah Support Vector Machine dengan kernel linear, RBF, polynomial dan sigmoid sehingga kernel linear yang diperoleh sebagai kernel terbaik.

Berdasarkan hasil pengujian yang dilakukan terhadap data sentimen kenaikan harga BBM Indonesia di twitter sebanyak 1130 data (485 positif dan 645 negatif). Evaluasi dilakukan menggunakan confusion matrix untuk melihat seberapa baik model dapat mengklasifikasikan dengan benar dan menunjukkan bahwa metode Support Vector Machine menghasilkan tingkat akurasi yang diperoleh yaitu 88.49%.

Kata Kunci: Twitter, Analisis Sentimen, Support Vector Machine, Kenaikan Harga BBM

(2)

2 PENDAHULUAN

Indonesia sebagai salah satu diantara negara yang memiliki kemajuan media sosialnya semakin berkembang pesat. Salah satu media sosial yang berkembang adalah twitter sebagai platform yang sering dimanfaatkan untuk menyampaikan pesan berupa pandangan atau penilaian sebagai reaksi terhadap peristiwa terkini. Topik yang sering dibahas oleh pengguna twitter seperti politik, budaya, ekonomi, dan masalah sosial.

Seringkali, sebelum sebuah berita menjadi headline di media, terlebih dahulu sudah menjadi trending topik di twitter (Arsi & Waluyo, 2021). Bahan Bakar Minyak (BBM) adalah bahan bakar yang digunakan oleh rakyat Indonesia sebagai bahan bakar kendaraan seperti mobil dan sepeda motor. Selama ini negara selalu menjaga harga BBM agar tetap stabil dan terjangkau oleh masyarakat, namun meningkatnya permintaan masyarakat akan konsumsi BBM dan juga kenaikan harga BBM internasional menyebabkan harga BBM lokal disesuaikan dengan internasional (Hrp &

Aslami, 2022).

Awal bulan September 2022 pemerintah menetapkan kebijakan kenaikan harga BBM di Indonesia. Presiden Joko Widodo akhirnya memutuskan menaikkan harga BBM bersubsidi. Harga pertalite diputuskan naik dari Rp7.650 menjadi Rp10.000 per liter, pertamax dari Rp12.000 menjadi Rp16.000 dan solar dari Rp5.150 menjadi Rp7.200. Produk BBM yang disediakan SPBU Pertamina menunjukkan kenaikan harga BBM yang cukup signifikan. Tentunya hal tersebut akan berpengaruh pada laju inflasi dan menurunnya daya beli masyarakat. Secara umum juga terlihat jelas bahwa perekonomian Indonesia akan sangat terpengaruh oleh kenaikan harga BBM (Wardani et al., 2022).

Analisis sentimen memerlukan metode dalam mengklasifikasikan teks, salah satunya yakni metode Support Vector Machine (SVM) merupakan algoritma yang digunakan untuk klasifikasi dan termasuk dalam kategori supervised learning. SVM dipilih sebagai metode untuk penelitian ini karena cocok digunakan dalam kasus pengklasifikasian data sentiment dan mampu menghasilkan akurasi yang lebih baik.

Strategi kategori yang digunakan adalah dengan membagi populasi data menjadi dua kelompok yaitu positif dan negatif. Tujuan dari penelitian ini yaitu dengan mengimplementasikan metode Support Vector Machine mampu mendapatkan hasil akurasi yang baik serta dapat diketahui bagaimana kecendrungan sentimen kenaikan harga BBM pada pengguna twitter tergolong positif atau negatif.

LANDASAN TEORI a. Analisis Sentimen

Analisis sentimen merupakan metode dalam mengekstraksi informasi tentang topik dari bahasa lisan maupun tulisan serta menjadi topik populer sebagai hasil dari berbagai studi dan penambangan teks dalam beberapa tahun terakhir. Sehingga dengan menggunakan gabungan pembelajaran mesin dan juga teknik pemrosesan bahasa alami, informasi subjektif yang didapatkan dapat dikumpulkan melalui data teks. Untuk saat ini, analisis sentimen dijadikan sebagai metode paling umum dalam mengekstraksi pandangan terhadap sebuah topik yang bersumber dari media online, yang diklasifikasikan sebagai positif, negatif, atau netral (Hakim Tanjung & Lestari, 2021).

(3)

3 b. Twitter

Twitter adalah wadah media sosial yang dijadikan sebagai tempat informasi dan memungkinkan para penggunanya untuk mengekspresikan diri dan menjadi semakin populer. Makna tweet digunakan di twitter untuk menerangkan bahwa pengguna twitter dapat berbagi informasi terkini, mengungkapkan perasaan dan menyampaikan aspirasi yang diposting oleh para pengguna twitter, terutama membahas tentang topik yang sedang menjadi perdebatan hangat (Darwis et al., 2020).

c. Bahan Bakar Minyak

Bahan Bakar Minyak (BBM) merupakan sebuah komoditas yang sangat penting dalam mendukung kehidupan sehari-hari manusia, baik dalam lingkungan perkotaan maupun pedesaan. BBM juga sangat mempengaruhi kemampuan suatu negara dalam menopang perekonomiannya dan hampir juga semua sektor kehidupan negara ditopang oleh ketersediaan BBM seperti dibidang industri, perikanan, pertanian, pertambangan dan lainnya. BBM sangat penting untuk keberlangsungan perekonomian karena berfungsi sebagai satu-satunya pasokan energi untuk semua operasi ekonomi. Konsumsi BBM tidak mungkin dipisahkan dari kegiatan ekonomi apapun, termasuk kegiatan rumah tangga hingga perusahaan yang menghasilkan barang dan jasa (Hrp & Aslami, 2022).

d. Machine Learning

Machine learning adalah bidang kecerdasan buatan yang dikenal sebagai artificial intelligence berkaitan dengan metode yang dapat dibuat melalui pemrograman menggunakan data historis. Tujuan machine learning dapat menciptakan sistem yang mampu belajar sendiri tanpa diprogram secara terus-menerus. Sebelum memberikan sebuah hasil, proses machine learning membutuhkan sekumpulan data. Dengan demikian, machine learning dapat secara sederhana didefinisikan sebagai pemrograman komputer yang menggunakan sekumpulan data training dalam prosesnya (Chazar &

Erawan, 2020).

e. Preprocessing

Menurut (Darwis et al., 2020) preprocessing adalah tahap awal dari pemrosesan data teks yang ada di komentar tweet dalam pemilihan kata, sehingga menghasilkan kata- kata yang lebih ringkas dan mampu menerangkan sentimen untuk menghapus kata-kata yang berlebihan. Cleansing, case folding, tokenizing, filtering, dan stemming adalah tahapan dari preprocessing.

f. Support Vector Machine

Menurut (Kusuma, 2020) Support Vector Machine (SVM) merupakan metode untuk mengkategorikan kumpulan data menjadi beberapa kelompok. SVM dibuat dengan sebuah garis pemisah berbeda yang memisahkan satu kelompok dari kelompok lainnya. SVM dikategorikan sebagai supervised learning yang memiliki dua jenis data yang berbeda yaitu data training dan data testing.

(4)

4 g. TF-IDF (Term Frequency Inverse Document Frequency)

Metode TF-IDF merupakan suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen. TF-IDF dianggap sebagai pengukuran statistik untuk menentukan sebuah dokumen dianggap penting atau tidak. TF disebut kemunculan kata yang ada pada setiap dokumen mencerminkan pentingnya kata itu dalam dokumen tersebut. DF disebut pula jika dokumen yang ada berisi kata dan menunjukkan seberapa sering kata muncul di dokumen tersebut. Hasil kali TF dengan IDF merupakan hasil pembobotan kata menggunakan TF-IDF. Bobot hubungan antara sebuah kata dan sebuah dokumen akan tinggi jika frekuensi kata tersebut tinggi di dalam dokumen dan frekuensi keseluruhan dokumen yang mengandung kata tersebut juga tinggi (Septian et al., 2019).

Proses perhitungan TF-IDF adalah mencari nilai TF dan IDF terlebih dahulu, lalu dapat melakukan pembobotan TF-IDF dengan menggunakan persamaan sebagai berikut.

𝐼𝐷𝐹𝑡 = 𝑙𝑛((𝑁 + 1)/(𝑑𝑓 + 1)) + 1 (1)

𝑇𝐹 − 𝐼𝐷𝐹 = 𝑡𝑓𝑑𝑡 ∗ 𝐼𝐷𝐹𝑡 (2)

Keterangan:

t = Kata

d = Dokumen ke-d N = Total dokumen

tf = Jumlah kemunculan kata dalam sebuah dokumen df = Jumlah dokumen yang mengandung kata

idf = Inverse document frequency TF-IDF = Bobot dokumen terhadap kata ke-t h. Confusion Matrix

Confusion matrix merupakan alat pengukuran yang berfungsi untuk menghitung tingkat kebenaran dari proses klasifikasi. Pada confusion matrix, hasil kelas yang telah diprediksi akan dibandingkan dengan kelas data yang memiliki nilai sebenarnya. Setiap kelas yang berbeda dapat dianalisis tingkat klasifikasinya menggunakan confusion matrix (Budi et al., 2021).

i. Cross Validation

Metode yang digunakan agar dapat memisahkan data ke dalam lipatan dan memastikan bahwa setiap lipatan digunakan sebagai set pengujian di beberapa titik cross validation. Kumpulan data yang diberikan dibagi menjadi data uji dan data latih untuk lipatan untuk cross validation, dan pada beberapa waktunya setiap lipatan digunakan sebagai kumpulan uji (Peryanto et al., 2020).

METODE PENELITIAN a. Tahapan Penelitian

Langkah-langkah yang digunakan dalam melakukan penelitian ini terdapat pada Gambar 1. Berikut tahapan dari penelitian ini.

(5)

5 Gambar 1. Kerangka Kerja Penelitian

b. Peralatan yang Digunakan

Adapun peralatan yang digunakan dalam penelitian ini terbagi menjadi 2 kategori, yaitu perangkat keras dan perangkat lunak.

Tabel 1. Spesifikasi Perangkat Keras

No Hardware

1 Processor AMD Ryzen 3 5300U 2 RAM: 8 GB

3 SSD: 128 GB

4 Sistem Operasi Windows 10 Home 64-bit 5 Layar 14 inci resolusi 1920 x 1080

Tabel 2. Software yang digunakan

No Software Kegunaan

1 Microsoft Office Home &

Student 2019 Menyusun skripsi dan pengolahan data

2 Python Bahasa pemrograman

3 Google Colaboratory Sebagai compiler untuk menjalankan Bahasa pemrogramana python.

4 Visual Studio Code Sebagai teks editor dalam pembuatan sistem

5 Google Chrome Sebagai pencarian informasi selama proses penelitian.

6 Mendeley Membuat daftar referensi

7 Draw.io Membuat flowchart

(6)

6 HASIL DAN PEMBAHASAN

a. Pengumpulan Data

Proses pengumpulan data dilakukan secara manual dengan keyword BBM naik, harga BBM naik, kenaikan harga BBM, penyesuaian harga BBM naik, dukung kenaikan BBM, wajar kenaikan BBM, tolak BBM naik. Alasan memilih pengumpulan data dilakukan secara teknik manual dikarenakan teknik crawling data yang diperoleh tidak selalu rapi, sehingga peneliti masih perlu merapikan data hasil crawling. Jika menggunakan proses crawling data tweet yang diambil dibatasakan maksimalnya dan juga tidak dapat mengambil data tweet pada bulan tertentu seperti dalam penelitian ini hanya membutuhkan tweet dari bulan September – Oktober 2022. Total keseluruhan dataset yang didapat adalah sebanyak 1130 data.

b. Pelabelan Data

Data yang telah dikumpulkan, selanjutnya dilakukan proses pelabelan terhadap data. Data dikategorikan dalam 2 polaritas, yaitu positif dan negatif untuk mengetahui bagaimana sentimen masyarakat terhadap kenaikan harga BBM di Indonesia. Label positif menunjukkan bahwa masyarakat menyetujui dan mendukung kebijakan pemerintah dalam menaikkan harga BBM, sedangkan label negatif menununjukkan bahwa masyarakat menolak kebijakan pemerintah dalam menaikkan harga BBM.

Setelah dilakukan pelabelan dengan total 1130 data, maka didapatkan 485 label positif dan 645 label negatif.

c. Data Preprocessing

Sebuah proses persiapan data, terdiri dari beberapa cara untuk membersihkan dan menstandarisasi data teks yang siap untuk dianalisis dan diperlukan sebagai salah satu tahapan yang penting dalam melakukan analisis sentimen. Tahapan preprocessing terdiri dari cleansing, case folding, tokenizing, filtering, dan stemming. Hasil dari preprocessing data dapat dilihat pada Tabel 3.

Tabel 3. Sampel Preprocessing

Sebelum preprocessing Sesudah preprocessing

['tuju', 'bbm', 'naik'] tuju bbm naik

['naik', 'harga', 'bbm', 'solution', 'dukung', 'penuh', 'program', 'perintah', 'sejahtera', 'rakyat']

naik harga bbm dukung penuh program perintah sejahtera rakyat

['rakyat', 'sengsara', 'bbm', 'naik'] rakyat sengsara bbm naik ['naik', 'harga', 'bbm', 'dampak', 'sektor',

'ekonomi', 'masyarakat', 'sengsara']

naik harga bbm dampak sektor ekonomi masyarakat sengsara

['nyata', 'naik', 'harga', 'bbm', 'dampak', 'rakyat'] nyata naik harga bbm dampak rakyat

d. Pembobotan TF-IDF

Tahap pembobatan pada setiap kata menggunakan Term Frequency – Inverse Document Frequency TF-IDF. Pembobotan dilakukan untuk mengubah data yang berbentuk kata – kata (string) menjadi bentuk angka (float). Hasil dari pembobotan TF- IDF dapat dilihat pada Tabel 4.

(7)

7 Tabel 4. Hasil TF-IDF

Kata IDF TF-IDF

D1 D2 D3 D4 … D1130

tuju 2,794 2,794 0 0 0 .. 0

bbm 1,014 1,014 1,014 1,014 1,014 .. 1,014

naik 1,055 1,055 1,055 1,055 1,055 .. 1,055

harga 1,765 0 1,765 0 1,765 .. 1,765

dukung 3,218 0 3,218 0 0 .. 0

program 6,239 0 6,239 0 0 .. 0

perintah 3,082 0 3,082 0 0 .. 0

sejahtera 4,986 0 4,986 0 0 .. 0

rakyat 2,201 0 2,201 2,201 0 .. 0

sengsara 3,006 0 0 3,006 3,006 .. 0

dampak 4,041 0 0 0 4,041 .. 4,041

sektor 6,239 0 0 0 6,239 .. 0

ekonomi 3,754 0 0 0 3,754 .. 0

masyarakat 3,339 0 0 0 3,339 .. 0

nyata 5,728 0 0 0 0 .. 5,728

e. Pembuatan Model

Membangun sebuah model dengan algoritma SVM dengan tujuan mengoptimasi model dan menentukan performa dari model tersebut. Untuk itu selanjutnya dilakukan proses hypertuning yang berfungsi sebuah upaya dalam menentukan parameter dan kernel yang dapat mengoptimalkan proses pembelajaran algoritma sehingga menghasilkan parameter yang tepat dalam menghasilkan model yang handal. Proses Hypertuning pada SVM dapat dibantu dengan menggunakan tools dari scikit-learn yaitu bernama GridSearchCV. Untuk melakukan proses Hypertuning dengan GridSearchCV dibutuhkan masukkan berupa perkiraan nilai parameter yang cocok pada model yang akan dibangun. Pada penelitian ini terdapat dua parameter yang akan dilakukan pencarian yaitu parameter C dan fungsi kernel. Proses training model SVM pada Gambar 4.4 dilakukan menggunakan seluruh data yang dimana data tersebut dipisah menggunakan K-Fold Cross Validation dengan jumlah lipatan sebanyak 5.

GridSearchCV memilih jenis kernel dan regularization parameter terbaik sehingga yang dipilih adalah kernel linear dengan regularization parameter 0.001. Model tersebut dicoba sebanyak 5 kali untuk masing-masing kernel dan regularization parameter. Output dari GridSearchCV terhadap pencarian model terbaik dapat dilihat pada Gambar 2.

Gambar 2. Output GridSearchCV f. Hasil dan Evaluasi

Metode evaluasi yang digunakan yaitu confusion matrix yang menghasilkan nilai akurasi. Tujuannya untuk mengevaluasi kinerja model yang sudah dibuat menggunakan metode SVM. Evaluasi yang dilakukan menggunakan confusion matrix dengan metode SVM terhadap data testing sebanyak 226 data.

(8)

8 Tabel 5. Hasil Confusion Matrix

Confusion Matrix Klasifikasi

Positif Negatif

Kondisi Positif 87 5

Negatif 21 113

Berdasarkan Tabel 5 nilai True Positif (TP) ada 87 artinya jumlah data positif yang diklasifikasi positif oleh sistem, True Negatif (TN) ada 113 artinya jumlah data negatif yang diklasifikasi negatif oleh sistem, False Positif (FP) ada 21 artinya jumlah data negatif yang diklasifikasi positif oleh sistem, False Negatif (FN) ada 5 artinya jumlah data positif yang diklasifikasi negatif oleh sistem dan dapat dihasilkan nilai akurasi yaitu 88.49%.

KESIMPULAN

Berdasarkan penelitian yang telah dilakukan, maka dapat diambil kesimpulan sebagai berikut:

1. Data komentar twitter yang diambil dari bulan September – Oktober 2022 berjumlah 1130 data. Terlihat bahwa polaritas negatif masyarakat lebih besar yakni 57.1%

dibandingkan dengan polaritas positif yang hanya berjumlah 42.9%. Hal tersebut menunjukkan bahwa sebagian besar masyarakat tidak menyetujui dan menolak kebijakan pemerintah dalam kenaikan harga BBM. Namun disisi lain ada beberapa masyarakat yang berpikir positif terhadap kenaikan harga BBM dikarenakan dapat menstabilkan perekonomian negara dan BBM subsidi bisa tepat sasaran.

2. Penerapan metode SVM dengan fungsi kernel linear menghasilkan akurasi 88.49%.

Evaluasi menggunakan confusion matrix memperoleh hasil akurasi yang sesuai dengan model yang telah dibuat.

SARAN

Berdasarkan temuan yang telah didapatkan, berikut saran untuk penelitian selanjutnya, yaitu sebagai berikut.

1. Penggunaan data tweet tidak hanya menggunakan bahasa Indonesia, namun dapat menggunakan bahasa asing lainnya seperti bahasa Inggris.

2. Mengumpulkan dataset yang lebih banyak agar menghasilkan prediksi klasifikasi data sentimen yang lebih akurat

3. Pengambilan data yang dilakukan tidak hanya pada media sosial twitter namun juga dapat memanfaatkan media sosial lainnya seperti youtube, instagram, facebook atau situs media lainnya yang dapat mengambil data sentimen.Jumlah dataset masih tergolong sedikit untuk menghasilkan prediksi yang akurat, sehingga diperlukannya dataset yang lebih banyak daripada sebelumnya.

(9)

9 UCAPAN TERIMA KASIH

Penulis mengucapkan terima kasih kepada Bapak Zaiful Bahri, S.Si., M.Kom.

yang telah membimbing, memotivasi serta membantu penelitian dan penulisan karya ilmiah ini.

DAFTAR PUSTAKA

Arsi, P., & Waluyo, R. (2021). Analisis Sentimen Wacana Pemindahan Ibu Kota Indonesia Menggunakan Algoritma Support Vector Machine (SVM). Jurnal Teknologi Informasi Dan Ilmu Komputer, 8(1), 147.

https://doi.org/10.25126/jtiik.0813944

Budi, R. S., Patmasari, R., & Saidah, S. (2021). Klasifikasi Cuaca Menggunakan Metode Convolutional Neural Network ( Cnn ) Weather Classification Using Convolutional Neural Network ( Cnn ) Method. E-Proceeding of Engineering : Vol.8, No.5 Oktober 2021, 8(5), 5047–5052.

Chazar, C., & Erawan, B. (2020). Machine Learning Diagnosis Kanker Payudara Menggunakan Algoritma Support Vector Machine. INFORMASI (Jurnal Informatika Dan Sistem Informasi), 12(1), 67–80.

Darwis, D., Pratiwi, E. S., & Pasaribu, A. F. O. (2020). Penerapan Algoritma Svm Untuk Analisis Sentimen Pada Data Twitter Komisi Pemberantasan Korupsi Republik Indonesia. Edutic - Scientific Journal of Informatics Education, 7(1), 1–

11. https://doi.org/10.21107/edutic.v7i1.8779

Hakim Tanjung, D. Y., & Lestari, S. (2021). Analisis Sentiment Data Twitter Menggunakan Algoritma Support Vector Machine Dan Naive Bayes Terhadap Pemberitaan Perkembangan Pandemik Corona. It (Informatic Technique) Journal, 9(2), 111. https://doi.org/10.22303/it.9.2.2021.111-120

Hrp, G. R., & Aslami, N. (2022). Analisis Dampak Kebijakan Perubahan Publik Harga BBM terhadap Perekonomian Rakyat Indonesia. Jurnal Ilmu Komputer, Ekonomi Dan Manajemen (JIKEM), 2(1), 1464–1474.

Kusuma, P. D. (2020). Machine Learning Teori, Program dan Studi Kasus. CV Budi Utama.

Wardani, W., Suriana, Arfah, S. U., Zulaili, Lubis, P. S. (2022) Dampak Kenaikan Bahan Bakar Minyak Terhadap Inflasi dan Implikasinya Terhadap Makroekonomi di Indonesia. All Fields of Science J-LAS Concept of Area of Flat Shapes. 2(1), 209–217.

Peryanto, A., Yudhana, A., & Umar, R. (2020). Klasifikasi Citra Menggunakan Convolutional Neural Network dan K Fold Cross Validation. Journal of Applied Informatics and Computing, 4(1), 45–51. https://doi.org/10.30871/jaic.v4i1.2017

(10)

10

Referensi

Dokumen terkait

Tujuan dari penelitian ini adalah Mengimplementasikan metode Support Vector Machine dalam analisis sentimen pada media sosial Twitter mengenai E-commerce Shopee dan