• Tidak ada hasil yang ditemukan

Analisis Sentimen Pada Media Sosial Twitter Menggunakan Metode Naïve Bayes Classifier (Studi Kasus: Komentar Publik Kepada Tri Indonesia)

N/A
N/A
Protected

Academic year: 2023

Membagikan "Analisis Sentimen Pada Media Sosial Twitter Menggunakan Metode Naïve Bayes Classifier (Studi Kasus: Komentar Publik Kepada Tri Indonesia) "

Copied!
5
0
0

Teks penuh

(1)

Analisis Sentimen Pada Media Sosial Twitter Menggunakan Metode Naïve Bayes Classifier (Studi Kasus: Komentar Publik Kepada Tri Indonesia)

Devi Aditya1, Ade Mubarok, M.Kom2, Sari Susanti, M.Kom3

1Universitas BSI Bandung e-mail: [email protected]

2Universitas BSI Bandung e-mail: [email protected]

3Universitas BSI Bandung e-mail: [email protected]

Abstrak

Penyebaran informasi saat ini menjadi lebih mudah dan cepat. Karena semakin berkembangkan sistem informasi khususnya dalam penyebaran berita. Salah satunya media sosial Twitter yang sangat memudahkan masyarakat mencari informasi atau berinteraksi langsung dengan pengguna Twitter lainnya. Karena banyaknya berita serta informasi yang tersebar luas pada Twitter membuat pengguna harus bisa memilih berita dengan baik. Oleh karena itu dibutuhkan metode untuk mengklasifikasikan komentar publik berupa analisis sentimen pada media sosial Twitter menggunakan metode Naïve Bayes Classifier (NBC). Data yang digunakan yaitu 237 komentar yang terbagi menjadi 2 kategori yaitu positif dan negatif.

Dari percobaan tersebut diperoleh hasil akurasi sebesar 84,28%. Hasil akurasi yang diperoleh tersebut sudah mencapai hasil yang maksimal untuk mengklasifikasi komentar-komentar publik.

Kata Kunci: Analisis Sentimen, Naïve Bayes Classifier, Twitter

Abstract

Dissemination of information is now easier and faster. Because the development of information system especially in news spreding. One of them is social media Twitter makes it very easy for people to find information or interact directly with other Twitter users. Because a lot of news and information that is widespread on Twitter make users have to be able to choose the news well.

Therefore we need a method for classifying public comments in the form of sentiment analysis on Twitter uses the Naïve Bayes Classifier method. The data used are 237 words which are divided into 2 categories, positive and negative. From these experiments obtained an accuracy of 84,28%. The accuracy obtained has reached maximum results for classifying public comments.

Keywords: Sentiment Analysis, Naïve Bayes Classifier, Twitter

1. Pendahuluan

Perkembangan teknologi pada zaman modern seperti ini telah menjadikan internet sebagai hal yang wajar.

Pertumbuhan pengguna internet berpengaruh kepada pertumbuhan pengguna sosial media dan smartphone.

Twitter, Facebook, Instagram merupakan media sosial yang sering digunakan pengguna internet sehingga sekarang seringkali menjadi sumber data bagi para peneliti untuk dianalisa (Zuhri & Alamsyah, 2017).

Sosial media merupakan media komunikasi terbuka dan tidak terbatas, masyarakat dapat secara bebas mengemukakan pendapat mereka di sosial media, salah satunya adalah media sosial Twitter (Pamungkas, et al., 2015). Twitter memungkinkan penggunanya berkirim dan membaca pesan yang lebih dari 280 karakter yang disebut tweet. Sebelumnya, pesan di Twitter hanya sampai 140 karakter tetapi pada tanggal 7 November 2017 ditambah menjadi 280 karakter (Hannani, 2019).

(2)

Informasi dalam bentuk teks adalah informasi yang penting dan banyak didapatkan dari berbagai sumber seperti buku, surat kabar, situs web, ataupun pesan e-mail. Teks merupakan sebuah hamparan bahasa, baik dalam pembicaraan ataupun dalam tulisan, yang memiliki makna, bersifat praktis dan berguna untuk umum serta berhubungan dengan dunia nyata (Ling & Oka, 2014).

Analisis sentimen dibutuhkan untuk proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen yang terkandung dalam suatu kalimat opini (Buntoro, 2017).

Analisis sentimen pada Twitter terdapat kekurangan karena kata-kata yang diposting oleh pengguna Twitter tersebut.

Twitter memungkinkan pengguna menulis sebanyak 280 karakter, tetapi para pengguna Twitter sering menggunakan singkatan kata dan ejaan kata yang salah.

Penulisan kata yang salah tersebut dapat mengakibatkan terjadi kelemahan pada proses text mining, sehingga dapat menyulitkan fitur yang diambil dan mengurangi ketepatan klasifikasi. Maka harus dilakukakan analisis sentimen untuk mempermudah dan menentukan apakah opini atau komentar terhadap suatu permasalahan memiliki kecenderungan positif atau negatif dan dapat dijadikan sebagai acuan dalam meningkatkan suatu pelayanan, ataupun meningkatkan kualitas produk (Nurjanah, et al., 2017).

Dari permasalahan tersebut akan dibuat analisis sentimen untuk menentukan tingkat sentimen kepada akun resmi Tri Indonesia. Data yang digunakan diambil dari tweet masyarakat pada media sosial Twitter, menggunakan metode Naïve Bayes Classifier karena metode tersebut memiliki beberapa kelebihan yaitu sederhana, cepat dan berakurasi tinggi ketika di aplikasikan dalam basis data dan data yang beragam (Nurhuda & Sihwi, 2014). Pada penelitian Pamungkas et al., (2015) Akurasi Naïve Bayes Classifier memberikan hasil sebesar 91 % untuk 1000 data latih yang diberikan.

2. Metode Penelitian

Langkah-langkah penelitian yang didasari oleh pemikiran bahwa apabila suatu pernyataan ingin diterima sebagai suatu kebenaran, maka pernyataan tersebut harus dapat diverifikasi atau diuji kebenarannya secara empiris yang dimulai

dari merumuskan masalah dan diakhiri dengan penarikan kesimpulan (Noor, 2011).

Langkah-langkah penelitian sesuai dengan alur penelitian adalah sebagai berikut:

2.1. Mengumpulkan Data Komentar Data komentar diambil dari mention masyarakat kepada akun Tri Indonesia paaa media sosial Twitter. Data yang diambil yaitu 416 komentar, data tersebut digolongkan menjadi 3 kategori yaitu positif, negatif dan netral. Data yang diolah hanya data dengan kategori positif dan negatif yaitu 237. Data komentar publik dapat dilihat pada tabel 1.

Tabel 1. Data Komentar Publik Komentar Kategori

Untuk biaya

penanganannya kira2 brp ya?

Netral

Pindah we wkwkw Negatif

@triindonesia siang, mau tanya, nomor tri saya hilang tahun lalu, untuk pengaktifan kembali dgn nomor yg sama gmn ya caranya?

Netral

Thx ya Positif

Bukannya sdh saya DM ya min

Netral Belinya jangan di Bimatri,

kalo di Tokopedia, Akulaku, dll masih 60k

Netral

Hallo @triindonesia jaringanmu kenapa lagi?

Negatif halo min, gimana nih

masalah pulsa gue yang kepotong terus dari 95333 gimana? udah lama nih gak ada penyelesaiannya.

udah dm

@3CareIndonesia tetep aja slow respon

Negatif

Tweet jaman batu baru direp

Negatif

@triindonesia bales dm min, udh 7 jam ga ada tanggapan

Negatif

2.2. Preprocessing Data

Tahapan ini merupakan tahap awal untuk mengolah data teks menjadi analisa sentiment. Terdapat beberapa metode yang digunakan pada tahap ini diantaranya:

(3)

1. Transform Cases digunakan untuk mengubah kapitalisme karakter (huruf) menjadi kecil untuk semua kata atau huruf .

2. Tokenization merupakan proses untuk memisahkan data teks menjadi beberapa token.

3. Filter Token (by length) digunakan untuk pemilihan token dengan ukuran panjang minimal 3 karakter (huruf), walaupun beberapa diantaranya adalah stopwords.

4. Stopwords digunakan untuk menyempurnakan tahap fitur token by length. Kata yang terdiri dari 3 huruf dan termasuk dalam stopwords akan dibuang.

5. Stemming pada tahap ini kata-kata komentar akan dikembalikan ke bentuk dasarnya dengan mwnghilangkan imbuhan pada setiap kata.

2.3. Metode Yang Diusulkan

Metode yang diusulkan dalam penelitian ini adalah metode naïve bayes classifier. Naïve Bayes Classifier merupakan suatu metode klasifikasi yang menggunakan perhitungan probabilitas.

Konsep dasar yang digunakan pada Naïve Bayes Classifier adalah Teorema Bayes yang dinyatakan pertama kali oleh Thomas Bayes (Ling & Oka, 2014).

2.4. Evaluasi dan Validasi

Cross validation adalah teknik validasi dengan membagi data secara acak kedalam k bagian dan masing-masing bagian akan dilakukan proses klasifikasi.

Data yang digunakan dalam percobaan ini adalah data training untuk mencari nilai error rate secara keseluruhan dengan pengujian nilai k dilakukan sebanyak 10 kali untuk memperkirakan akurasi estimasi (Puspita , 2016).

1. Confusion Matrix

Menurut (Ernawati, 2016 ) menyatakan bahwa “Confusion matrix merupakan matriks yang menginformasikan hasil prediksi secara keseluruhan dari nilai akurasi dan untuk melihat kinejra pengklasifikasi, yaitu seberapa sering kasus class X yang benar diklasifikasikan sebagai class X atau kesalahan klasifikasi class lainnya”. Ketika dataset hanya memiliki dua kelas, yaitu kelas negatif dan kelas positif maka dibuatkan tablel 2 seperti dibawah ini:

Tabel 2. Class pada Confision Matrix Class

Classification

Classified as

+ -

+ True

Positives

False Negatives

- False

Positives

True Negatives Sumber: Bramer (2007:174)

Akurasi dapat dihitung dengan menggunakan rumus berikut:

Accurasy =

TP = Jumlah kasus positif yang diklasifikasikan sebagai positif

FP = Jumlah kasus negatif yang diklasifikasikan sebagai positif

TN= Jumlah kasus negatif yang diklasifikasikan sebagai negatif

FN= Jumlah kasus positif yang diklasifikasikan sebagai negatif

3. Hasil dan Pembahasan

Penerapan algoritma naïve bayes classifier pada penlitian ini dimaksudkan untuk mengetahui tingkat keakurasian dari analisis sentimen yang diperoleh dari komentar masyarakat kepada akun Twitter Tri Indonesia.

3.1. Tahap Preprocessing

Pada tahap preprocessing, dilakukan 4 langkah sebagai berikut:

A. Transform Case

Pada proses ini, Rapidminer akan mengubah kapitalisasi karakter (huruf) menjadi kecil untuk semua kata dan huruf.

Setelah melalui proses ini, semua isi komentar menjadi non capital. Proses transform case dapat dilihat pada tabel 3.

Tabel 3. Proses Transform Case Teks sebelum

dilakukan proses

Teks setelah dilakukan proses Iya dong pake apk

youtubenya, btw selamat pagi juga gita:)

iya dong pake apk youtubenya, btw selamat pagi juga gita:)

Sudah banyak kuota promo di bimatri, tinggal tunggu kiriman pulsa dari tri, cabcus deh langsung ceki2 paket terus on paket deh

@triindonesia

@3CareIndonesia

sudah banyak kuota promo di bimatri, tinggal tunggu kiriman pulsa dari tri, cabcus deh langsung ceki2 paket terus on paket deh

@triindonesia

@3careIndonesia

(4)

B. Tokenization

Proses Tokenization ini berfungsi untuk membuang semua karakter yang tidak diperlukan termasuk white space yang berlebihan dan semua tanda baca. Proses ini dilakukan pada setiap dokumen yang dimasukkan ke document collection. Proses tokenization dapat dilihat pada tabel 4.

Tabel 4. Proses Tokenization Teks sebelum

dilakukan proses

Teks setelah dilakukan proses Iya dong pake apk

youtubenya, btw selamat pagi juga gita:)

iya dong pake apk youtubenya btw selamat pagi juga gita

Sudah banyak kuota promo di bimatri, tinggal tunggu kiriman pulsa dari tri, cabcus deh

langsung ceki2 paket terus on paket deh

@triindonesia

@3CareIndonesia

sudah banyak kuota promo di bimatri tinggal tunggu kiriman pulsa dari tri cabcus deh langsung ceki2 paket terus on paket deh triindonesia 3careIndonesia C. Filter Token (by length)

Pada tahap ini dilakukan pemilihan token dengan ukuran panjang minimal 3 karakter (huruf), walaupun beberapa diantaranya adalah stopwords. Jika kata yang kurang dari 3 huruf namun termasuk dalam stopwords akan tetap dibuang, karena tahap selanjutnya adalah pembuangan stopwords.

D. Stopwords

Pada tahap ini akan menyempurnakan tahap filter token by length. Kata-kata yang dibuang yaitu seperti “yang”, “di”, “ke” dan sebagainya E. Stemming

Proses pengelompokan kata ke dalam beberapa kelompok yang memiliki kata dasar yang sama dan melakukan transformasi untuk proses pembobotan dengan melakukan perhitungan terhadap kehadiran atau ketidakhadiran sebuah kata di dalam komentar. Beberapa contoh kata yang diubah dapat dilihat pada tabel 5 sebagai berikut:

Tabel 5. Proses Stemming Sebelum Proses Sesudah Proses

Adm Admin

Bener Benar

Ga Tidak

Pake Pakai

Sampe Sampai

3.2. Evaluasi dan Validasi Hasil

Setelah proses preprocessing, selanjutya akan dilakukan proses klasifikasi melalui tahap validation. Hasil yang diperoleh dari pengujian dengan menggunakan model naïve bayes classifier.

Hasil dari implementasi model naïve bayes classifier tersebut akan didapat sebuah rule. Rule yang dihasilkan akan digunakan sebagai dasar prediksi nilai yang akan dilakukan. Sebelumnya rule tersebut harus dievaluasi dan divalidasi sehingga diketahui seberapa akurat hasil prediksi yang akan dilakukan. Pada tahap ini proses evaluasi menggunakan confusion matrix.

Model confusion matrix akan membentuk matriks yang terdiri dari accuracy, true positif dan true negatif, recall, dan precision. Berikut merupakan hasil dari confusion matrix menggunakan algoritma naïve bayes classifier tanpa seleksi fitur. Hasil accurasy dapat dilihat pada gambar 1.

Gambar 1. Hasil Accurasy Algoritma Naïve Bayes Classifier

Dari hasil penelitian diperoleh nilai:

1. Precision prediksi positif Precision = x 100%

= x 100%

=

x 100%

= 66,67%

2. Precision prediksi negatif Precision =

x 100%

= x 100%

= x 100%

= 91,67%

3. Recall true positif

Recall = x 100%

= x 100%

= x 100%

= 76,67%

4. Recall true negatif Recall =

x 100%

= x 100%

= x 100%

= 87,01%

(5)

5. Accurasy

Accurasy = x 100%

=

x 100%

= x 100%

= 84,38%

Hasil akurasi pengujian naïve bayes classifier untuk analisis sentimen pada media sosial Twitter memperoleh hasil sebesar 84,28%, untuk class precision prediksi positif adalah 66,67% sedangkan untuk prediksi negatif memperoleh hasil 91,67% dan recall yang dipeproleh dari true positif sebesar 76,67% sedangkan untuk true negatif sebesar 87,01%. Hasil akurasi yang diperoleh untuk klasifikasi komentar- komentar publik sudah mencapai harapan hasil yang maksimal.

4. Kesimpulan

Metode naïve bayes classifier merupakan metode yang cukup baik dalam pengklasifikasikan text mining. Hal ini dikarenakan metode tersebut dapat menghasilkan akurasi yang cukup tinggi.

Dari hasil penelitian yang dilakukan dengan menggunakan data sampel sebanyak 237 data komentar, dapat diketahui bahwa nilai komentar sentimen negatif lebih banyak terbentuk kepada akun Twitter Tri Indonesia dengan presentase sebesar 84,28%, untuk class precision prediksi positif adalah 66,67% sedangkan untuk prediksi negatif memperoleh hasil 91,67%

dan recall yang dipeproleh dari true positif sebesar 76,67% sedangkan untuk true negatif sebesar 87,01%.

Referensi

Buntoro, G. A. (2017). Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter, 2(1), 32–41.

Ernawati, S. (2016 ). Penerapan Particle Swarm Optimization Untuk Seleksi Fitur Pada Analisis Sentimen Review Perusahaan Penjualan Online Menggunakan Naïve Bayes. Evolusi, Volume 4 Nomor 1 .

Hannani, N. (2019). Pengertian Twitter Beserta Sejarah dan Manfaat Twitter yang Dibahas Secara Lengkap. Diambil kembali dari Nesabamedia.com:

https://www.nesabamedia.com/pen gertian-twitter/

Ling, J., & Oka, T. B. (2014). ANALISIS

SENTIMEN MENGGUNAKAN

METODE NAÏVE BAYES

CLASSIFIER DENGAN SELEKSI FITUR CHI SQUARE, 3(3), 92–99.

Noor, J. (2011). Metode Penlitian: Skripsi, Tesis, Disertasi & Karya Ilmiah . Jakarta : PT. Fajar Interpratama Mandiri .

Nurhuda, F., & Sihwi, S. W. (2014). Analisis Sentimen Masyarakat terhadap Calon Presiden Indonesia 2014 berdasarkan Opini dari Twitter Menggunakan Metode Naive Bayes Classifier, 2(2).

Nurjanah, W. E., Perdana, R. S., & Fauzi, M. A. (2017). Analisis Sentimen Terhadap Tayangan Televisi Berdasarkan Opini Masyarakat pada Media Sosial Twitter menggunakan Metode K-Nearest Neighbor dan Pembobotan Jumlah Retweet, 1(12), 1750–1757.

Pamungkas, D. S., Setiyanto, N. A., &

Dolphina, E. (2015). ANALISIS SENTIMENT PADA SOSIAL MEDIA TWITTER MENGGUNAKAN NAIVE BAYES CLASSIFIER TERHADAP, 14(4), 299–314.

Puspita , A. (2016). Prediksi Kelahiran Bayi Secara Prematur dengan Manggunakan Algoritma C.45 Barbasis Particle Swarm Optimazation. Teknik Informatika STMIK Antar Bangsa .

Zuhri, F. N., & Alamsyah, A. (2017).

MENGGUNAKAN NAIVE BAYES CLASSIFIER DI FORUM KASKUS PUBLIC SENTIMENT ANALYSIS OF SMARTFREN BRAND USING NAIVE BAYES CLASSIFIER ON KASKUS FORUM, 4(1), 242–251.

Referensi

Dokumen terkait

Model pembelajaran explicit instruction adalah model pembelajaran yang digunakan dalam pembelajaran menganalisis teks eksplanasi di kelas XI SMK Negeri 4