• Tidak ada hasil yang ditemukan

ANALISIS SENTIMEN PADA KOMENTAR INSTAGRAM DPR RI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE. Fauzan Arisma, Fatayat

N/A
N/A
Protected

Academic year: 2022

Membagikan "ANALISIS SENTIMEN PADA KOMENTAR INSTAGRAM DPR RI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE. Fauzan Arisma, Fatayat"

Copied!
13
0
0

Teks penuh

(1)

1 ANALISIS SENTIMEN PADA KOMENTAR INSTAGRAM

DPR RI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE

Fauzan Arisma, Fatayat

Mahasiswa Program Studi S1 Sistem Informasi Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Kampus Bina Widya Pekanbaru, 28293, Indonesia

[email protected] ABSTRACT

Instagram is one of the most used social media in Indonesia. Instagram is often used by young people and government agencies to upload their activities. One feature on Instagram for uploading is posting. In the posting feature, Instagram users can write their opinions on the post, including the DPR RI Instagram. Instagram users can give both positive and negative opinions on posts made by the DPR RI Instagram account so that it is easy to give aspirations. One way to get information through Instagram is to do sentiment analysis. The algorithm that will be used in this research is Support Vector Machine (SVM). The results of this study found that the average negative opinion each month was greater that is equal to 58.69% compared to positive opinions which only amounted to 41.31%. From the SVM classification results obtained the highest average accuracy obtained by using the Rational Basic Function (RBF) kernel which is equal to 65.87%, and the lowest average accuracy value obtained using the Polynomial kernel which is equal to 57.44%.

Keywords: DPR RI, RBF, Sentiment Analysis, Support Vector Machine, Polynomial ABSTRAK

Instagram merupakan salah satu media sosial yang paling sering digunakan di Indonesia. Instagram sering dipakai oleh kalangan anak muda dan lembaga pemerintahan untuk mengunggah kegiatan mereka. Salah satu fitur di Instagram untuk mengunggah adalah postingan. Di fitur postingan para pengguna Instagram dapat menuliskan opininya terhadap postingan tersebut termasuk pada Instagram DPR RI. Para pengguna Instagram dapat memberi opini positif maupun negatif terhadap postingan yang dibuat akun Instagram DPR RI sehingga memudahkan untuk memberikan aspirasi. Salah satu cara untuk mendapatkan informasi melalui Instagram adalah dengan melakukan analisis sentimen. Algoritma yang akan digunakan dalam penelitian ini adalah Support Vector Machine (SVM). Hasil dari

(2)

2 penelitian ini didapatkan bahwa opini negatif rata-rata setiap bulan lebih besar yakni sebesar 58.69% dibandingkan dengan opini positif yang hanya berjumlah 41.31%.

Dari hasil klasifikasi SVM didapat nilai rata-rata akurasi tertinggi didapat dengan menggunakan kernel Rasional Basic Function (RBF) yakni sebesar 65.87%, dan nilai akurasi rata-rata terendah didapat dengan menggunakan kernel Polynomial yakni sebesar 57.44%.

Kata Kunci : Analisis Sentimen, DPR RI, RBF, Support Vector Machine, Polynomial

PENDAHULUAN

Salah Satu keunggulan Instagram adalah dapat mengunggah langsung foto/video dari smartphone yang memudahkan pemakai untuk menampilkan kegiatan mereka. Instagram dapat juga digunakan untuk memberi opini bagi pemakainya melalui kolom komentar yang telah di sediakan Instagram. Komentar tersebut dapat mengandung opini positif dan negatif tergantung unggahan yang ditampilkan.

Oleh karena itu penulis akan melakukan penelitian dengan menggunakan komentar Instagram pada akun DPR RI guna untuk mengetahui seberapa tingkat kepuasan masyarakat terhadap kinerja DPR RI. Akun Instagram DPR RI memiliki 3.812 unggahan yang kurang lebih memiliki 100 komentar tiap unggahnya sampai saat ini.

Komentar tersebut berisi komentar positif atau negatif dari pemakai Instagram yang melihat unggahan DPR RI. Komentar itu dapat digunakan sebagai patokan tingkat kepuasan masyarakat atas kinerja DPR RI. Kemudian metode yang dipakai akan membantu untuk mengelompokan data komentar agar dapat diklasifikasikan dengan akurasi yang tinggi.

METODE PENELITIAN a. Teknik Pengumpulan Data

Data yang digunakan pada penelitian ini adalah data yang diambil dari media sosial Instagram dari tanggal 1 Januari 2019 sampai dengan tanggal 30 September 2019.. Teknik pengumpulan data yang digunakan pada penelitia ini yaitu studi literatur. Studi literatur yaitu dilakukan dengan mengambil data-data sample yang terdapat pada jurnal, buku ataupun media eletronik lainnya yang memiliki keterikatan dengan materi penelitian.

b. Peralatan yang Digunakan

Adapun peralatan yang digunakan dalam penelitian ini terbagi menjadi 2 kategori, yaitu hardware dan software. Peralatan hardware dapat dilihat pada Tabel 1 dan software pada Tabel 2.

(3)

3 Tabel 1. Hardware yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Laptop Pengolahan data HP-87UA0C5M

Tabel 2. Software yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan

1 Windows Sistem operasi Windows 10

Home Single Language 64 bit 2 Microsoft Office Penulisan dokumen teks Word 2010 dan

Excel 2010 3 Jupyter Notebook Platform Penghubung

Bahasa Program

Anaconda3 4 Mozilla Firefox Penghubung dengan

internet

4.6.4

c. Text Mining

Menurut (Wijaya, 2017) text mining merupakan proses otomatis atau sebagian proses otomatis untuk teks. Sedangkan definisi lain menyebutkan text mining adalah bidang interdisipliner yang mengacu pada pencarian informasi, pertambangan data, pembelajaran mesin, statistik, dan komputasi linguistik. Dikarenakan kebanyakan informasi (perkiraan umum mengatakan lebih dari 80%) data ini disimpan sebagai teks, text mining diyakini memiliki potensi nilai komersial tinggi.

d. Text Preprocessing

Tahap text preprocessing adalah tahap awal dari text mining. Tahap ini mencakup semua rutinitas, dan proses untuk mempersiapkan data yang akan digunakan pada operasi knowledge discovery sistem text mining(Wijaya, 2017).

Menurut (Nurrun dkk, 2016) Ada beberapa tahap dalam preprocessing ini, antara lain tokenization, cleansing, filtering, steaming, dan normalisasi. Berikut ini adalah penjelasan secara rinci tentang tahap preprocessing:

1. Tokenization adalah sebuah proses yang dilakukan untuk memotong atau memecah kalimat menjadi beberapa bagian atau kata.

2. Cleansing adalah suatu tahap dimana karakter maupun tanda baca yang tidak diperlukan dibuang dari teks. Contoh karakter yang dibuang adalah tanda seru, tanda tanya, koma dan titik.

3. Filtering adalah tahap menghilangkan kata-kata yang muncul dalam jumlah besar, namun dianggap tidak memiliki makna (stopwords).

(4)

4 4. Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata dengan menghilangkan semua imbuhan (affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), akhiran (suffixes) dan confixes (kombinasi dari awalan dan akhiran) pada kata turunan.

5. Normalisasi adalah tahap data yang sudah diakuisisi setelah melalui preprocessing atau normalisasi data tersebut perlu dilakukan penskalaan untuk sebelum dilakukan pelatihan terhadap data tersebut dinormalisasi dengan mean=0 dan standard deviasi=1.

e. Metode Support Vector Machine

Menurut (M. Fachrurrozi and Novi Yusliani, 2015) SVM adalah sistem pembelajaran mesin yang bekerja atas prinsip Structural Risk Minimization (SRM).

SRM bertujuan untuk menemukan hyperplane terbaik yang memisahkan dua buah kelas pada input space. Hyperplane terbaik antara dua kelas dapat ditemukan dengan mengukur margin hyperplane dan mencari titik maksimalnya. Margin adalah jarak antara hyperplane dengan pattern terdekat dari masing-masing kelas. Pattern yang paling dekat disebut sebagai support vector.

Tahapan pembelajaran dalam SVM adalah:

1. Mencari Lagrange Multipliers (αi)

L(a)= ∑ni=1aiajyiyjxiTxj ... (1) Dikenakan (untuk setiap i=1…..n)

Keterangan:

αi : Lagrange multipliers yang bernilai nol atau positif

αj : Lagrange multipliers yang bernilai kurang dari nol atau negatif yi: kelas data latih (+1/-1).

yj : kelas data latih (+1/-1).

xi : vektor bobot kalimat komentar.

xj : vektor bobot kalimat komentar.

2. Mencari Nilai Bobot (w)

W= ∑ni=1( ∝iyixi) ... (2) Keterangan :

w : vektor bobot.

αi : Lagrange multipliers yang bernilai nol atau positif yi : kelas data latih(+1/-1).

xi : vektor bobot kalimat komentar yang menjadi vektor pendukung.

3. Mencari Nilai Bias b= 1

NSVNSVi=1 (w*xi-yi) ... (3) Keterangan :

b : Nilai bias

NSV : jumlah vektor pendukung.

(5)

5 w :vektor bobot.

yi :kelas data latih (+1/-1).

xi :vektor bobot kalimat komentar yang menjadi vektor pendukung.

Proses pengklasifikasian (pengujian) dalam SVM menggunakan persamaan 4 f(t⃗)=sgn[∑ni=1,xieSVaiyi<t⃗*x⃗⃗⃗>+bj ] ... (4) Keterangan :

t : vektor bobot data uji.

xi: vektor pendukung.

b : nilai bias.

yi: kelas atau label dari vektor pendukung (+1/-1).

f. Kernel Trick dan Non Linear Clasification pada SVM

Menurut (Chu, Liu and Gao, 2011) Pada umumnya masalah dalam domain dunia nyata (real world problem ) jarang yang bersifat linear separable. Kebanyakan bersifat non linear. Untuk menyelesaikan problem non linear, SVM dimodifikasi dengan memasukan fungsi Kernel. Dalam non linear SVM, pertama–tama data 𝑥⃗

dipetakan oleh fungsi Φ(𝑥⃗) ke ruang vector yang baru ini, hyperplane yang memisahkan kedua class tersebut dapat dikonstruksikan. Hal ini sejalan dengan teori Cover yang menyatakan “Jika suatu transformasi bersifat non linear dan dimensi dari feature space cukup tinggi, maka data pada input space dapat dipetakan ke feature space yang baru, dimana pattern-pattern tersebut pada probabilitas tinggi dapat dipisahkan secara linear”.

Tabel 1 Kernel yang umum dipakai dalam SVM

Jenis Kernel Definisi

Polynomial K(x⃗⃗⃗,xi ⃗⃗⃗) = (xj ⃗⃗⃗ xi⃗⃗⃗+1)j p Gaussian

K(𝑥⃗⃗⃗⃗, 𝑥𝑖 ⃗⃗⃗⃗) = exp(-𝑗 ‖x⃗⃗⃗⃗-xi⃗⃗⃗⃗‖j

2 2 ) Sigmoid K(𝑥⃗⃗⃗⃗, 𝑥𝑖 ⃗⃗⃗⃗) = tanh(𝑎𝑥𝑗 ⃗⃗⃗⃗. 𝑥𝑖 ⃗⃗⃗⃗ + 𝛽) 𝑗

HASIL DAN PEMBAHASAN a. Data

Data yang akan digunakan dan diuji diambil dari media sosial Instagram dari tanggal 1 Januari 2019 sampai dengan tanggal 30 September 2019. Dari hasil pengumpulan data diperoleh sebanyak 1.169 postingan dimana pada bulan Mei terdapat postingan paling banyak yaitu 172 postingan dan paling sedikit terdapat pada bulan April yaitu 79 postingan.

(6)

6 b. Preprocessing Data

Pada tahap ini dilakukan pembersihan data pada setiap komentar yang diambil dengan menggunakan tahap preprocessing agar dapat diproses ke tahap selanjutnya.Tabel 1 dibawah ini akan menampilkan contoh data komentar yang belum dilakukan tahap preprocessing dan hasil data yang telah melalui tahap cleansing, case colding, tokenization, filtering, dan steaming.

Tabel 2 Contoh Tahap Preprocessing

Komentar Tahap Preprocessing

Sebagai wakil rakyat! Hapus THR pak! Klw ydk mau rakyat sengsara. THR yg dimbil langsung dr rakyat hanya bikin susah semua. THR tdk pernah bikin rakyat senang menikmati perayaan agama. THR hny bikin senang org2 yg sudah bekecukupan....

Komentar sebelum di proses

Sebagai wakil rakyat Hapus THR pak Klw ydk mau rakyat sengsara THR yg dimbil langsung dr rakyat hanya bikin susah semua THR tdk pernah bikin rakyat senang menikmati perayaan agama THR hny bikin senang org yg sudah bekecukupan

Cleansing

sebagai wakil rakyat hapus thr pak klw ydk mau rakyat sengsara thr yg dimbil langsung dr rakyat hanya bikin susah semua thr tdk pernah bikin rakyat senang menikmati perayaan agama thr hny bikin senang org yg sudah bekecukupan

Case Colding

‘sebagai’,’wakil’,’rakyat’,’hapus,’thr’,’pak’,’klw’,’ydk’,’mau’,’rakyat’,

’sengsara’,’thr’,’yg’,’dimbil’,’langsung’,’dr’,’rakyat’,’hanya’,’bikin’,’susah’,

’semua’,’thr’,’tdk’,’pernah’,’bikin’,’rakyat’,’senang’,’menikmati’,

’perayaan’,’agama’,’thr’,’hny’,’bikin’,’senang’,’org’,’yg’,’sudah’,’berkecukupan’

Tokenization

‘sebagai’,’wakil’,’rakyat’,’hapus,’thr’,’pak’,’ydk’,’mau’,’rakyat’,

’sengsara’,’thr’,’dimbil’,’langsung’,’rakyat’,’susah’,’semua’,’thr’,’tdk’,’pernah’,

’rakyat’,’senang’,’menikmati’,’perayaan’,’agama’,’thr’,’senang’,’org’,’sudah’,’ber kecukupan’

Filtering

‘sebagai’,’wakil’,’rakyat’,’hapus,’tunjangan’,’pak’,’tidak’,’mau’,’rakyat’,

’sengsara’,’tunjangan’,’ambil’,’langsung’,’rakyat’ ,’susah’,

’semua’,’tunjangan’,’tidak’, ’pernah , ’rakyat’,’senang’,’nikmat’,

’raya’,’agama’,’tunjangan’,’senang’,’orang’,’sudah’,’cukup’

Steaming

c. Klasifikasi Metode Support Vector Machine

(7)

7 Untuk Mendapatkan Hasil Support Vector Machine terlebih dahulu hasil TF IDF diubah ke dalam format SVM. Dalam Penelitian ini format SVM yang dipakai berbentuk seperti format berikut

[-1 1:0.241908355065988]

Bobot Term

Urutan Bobot

Kelas

Variabel pertama yang dipakai adalah kelas yang telah diberikan label pada komentar di instagram tersebut secara manual, dimana angka 1 menyatakan nilai label positif pada komentar dan angka -1 menyatakan nilai label negatif pada komentar.

Setelah kelas, Variabel urutan bobot menyatakan dimensi data abtraks yang ke- n dalam vektor. Selanjutnya bobot angka 0.241908355065988 menyatakan nilai bobot dari term tersebut.

Tahap selanjutnya menghitung nilai x, nilai x digunakan untuk perhitungan kernel. Untuk nilai x1= {term1, term2, …. termi} merupakan nilai yang diambil dari setiap term yang ada pada komentar dan di kelompokan sesuai komentar yang diambil maka nilai x1= S1, x2=S2, x3=S3 ,x4=S4, dan x5=S5..

Selanjutnya melakukan kernelisasi menggunakan kernel linear yang umum digunakan dalam perhitungan kernel yaitu K(xi,xj) = xixjT. maka dilakukan perhitungan matriks yang dapat dilihat pada Tabel 3.

Tabel 3 Perhitungan Nilai x1 dengan Kernel

x1 x1T x1x1T= x1 * x1T

[0.241908355065988,0.24190836, 0.23048779

0.13773895, 0.13427817, 0.07682926, 0.06713909 0.07682926, 0.24190836, 0.24190836, 0.24190836 0.13773895, 0.24190836, 0.24190836, 0.13773895 0.24190836, 0.2754779, 0.24190836, 0.24190836 0.24190836, 0.24190836, 0.13773895, 0.24190836

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

[0.241908355065988,0.24190836, 0.23048779

0.13773895, 0.13427817, 0.07682926, 0.06713909 0.07682926, 0.24190836, 0.24190836, 0.24190836 0.13773895, 0.24190836, 0.24190836, 0.13773895 0.24190836, 0.2754779, 0.24190836, 0.24190836 0.24190836, 0.24190836, 0.13773895, 0.24190836

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

1.00539503

(8)

8

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

Setelah dilakukan perhitungan pada seluruh nilai x pada data abstrak, maka matriks yang terbuat adalah sebagai berikut:

x1x1 x2x1 x3x1 x4x1 x5x1 xixjT= x1x2 x2x2 x3x2 x4x2 x5x2 x1x3 x2x3 x3x3 x4x3 x5x3 x1x4 x2x4 x3x4 x4x4 x5x4 x1x5 x2x5 x3x5 x4x5 x5x5

1.00539503, 0.101058619, 0.010383151, 0.025683659, 0.0083688 0.10105862, 0.999999998, 0.068664847, 0, 0.008906146

xixjT= 0.01038315, 0.068664847, 1.000000003, 0, 0.001471867 0.02568366, 0. 0, 0.999999998, 0

0.0083688, 0.008906146, 0.001471867, 0, 0.999999995

Kemudian tahap selanjutnya adalah melakukan perhitungan terhadap nilai y, Untuk nilai y didapat dari nilai label yang telah diberikan. Nilai y tersebut dapat dilihat pada Tabel 4.

Tabel 4 Nilai Label Pada y

y1 y2 y3 y4 y5

-1 -1 1 -1 1

Sehingga matriks yang terbentuk dari hasil perhitungan yiyjT adalah hasilnya sebagai berikut.

Tahap selanjutnya mengubah nilai abstrak menjadi nilai vektor (support vector ) = (𝑥𝑦) agar mendapatkan nilai ai, Nilai x didapatkan menggunakan

(9)

9 persamaan (7) kernel linear untuk x berikut.

L(a)= ∑ni=1aiajyiyjxiTxj ... (5)

Xs1= x1x1T + x1x2T + x1x3T + x1x4T + x1x5T

= 1.00539503 + 0.101058619 + 0.010383151, 0.025683659 + 0.0083688 = 1.150889257

Xs2= x2x1T + x2x2T + x2x3T + x2x4T + x2x5T

= 0.10105862 + 0.999999998 + 0.068664847 + 0 + 0.008906146 = 1.17862961

Xs3= x3x1T + x3x2T + x3x3T + x3x4T + x3x5T

= 0.01038315 + 0.068664847 + 1.000000003 + 0 + 0.001471867 = 1.080519868

Xs4= x4x1T + x4x2T + x4x3T + x4x4T + x4x5T

= 0.02568366 + 0 + 0 + 0.999999998 + 0 = 1.025683657

Xs5= x5x1T + x5x2T + x5x3T + x5x4T + x5x5T

= 0.0083688 + 0.008906146 + 0.001471867 + 0 + 0.999999995 = 1.018746808

Nilai y didapatkan menggunakan persamaan 5 kernel linear seperti nilai x sehingga mendapatkan nilai sebagai berikut.

Ys1= y1y1T + y1y2T + y1y3T + y1y4T + y1y5T = 1 + 1 + (-1) + 1 + (-1)

= 1

Ys2= y2y1T + y2y2T + y2y3T + y2y4T + y2y5T = 1 + 1 + (-1) + 1 + (-1)

= 1

Ys3= y3y1T + y3y2T + y3y3T + y3y4T + y3y5T = (-1) +(-1) + 1 + (-1) + 1

= -1

Ys4= y4y1T + y4y2T + y4y3T + y4y4T + y4y5T = 1 + 1 + (-1) + 1 + (-1)

= 1

Ys5= y5y1T + y5y2T + y5y3T + y5y4T + y5y5T

(10)

10 = (-1) +(-1) + 1 + (-1) + 1

= -1

Setelah nilai x dan y didapatkan, maka akan disubsitusikan ke persamaan berikut ini.

∅ [𝑥 𝑦 ] =

{

√𝑥𝑛2+ 𝑦𝑛2 > 2 𝑚𝑎𝑘𝑎 [√𝑥𝑛2+ 𝑦𝑛2 − 𝑥 + |𝑥 − 𝑦|

√𝑥𝑛2+ 𝑦𝑛2− 𝑦 + |𝑥 − 𝑦|]

√𝑎2+ 𝑏2 ≤ 2 𝑚𝑎𝑘𝑎 [𝑥 𝑦]

... (6)

Nilai xn yang didapat dari xs3 dan yn dari ys3 yang disubsitusikan ke dalam persamaan √𝑥𝑛2+ 𝑦𝑛2 = √1.0805198682+ (−1)2 = 1.47225106 ≤ 2. Karena hasilnya menunjukan lebih dari lebih dari dua maka hasil seluruh perhitungannya adalah seperti Tabel 5.

Tabel 5 Support Vector Bias Abstra

k

S1 S2 S3 S4 S5

Suppor t Vector

[1.150889257

1 ] [1.17862961

1 ] [1.080519868

−1 ] [1.02568366

1 ] [1.018746808

−1 ]

.

Setelah mendapat nilai support vector. Kemudian tahap selanjutnya adalah mencari nilai αi, didapatkan dengan mengalikan setiap data abstrak menggunakan persamaan sebagai berikut.

𝑛𝑖=1,𝑗=1𝛼𝑖𝑆𝑖𝑇𝑆𝑗 ...(7) Setelah dilakukan perhitungan pada seluruh abstrak Kemudian cari parameter 𝛼𝑖 menggunakan persamaan (8), dengan cara subsitusikan nilai hasil dari perhitungan menggunakan persamaan (7), sehingga bentuknya dapat dilihat sebagai berikut.

𝑛𝑖=1,𝑗=1𝛼𝑖𝑆𝑖𝑇𝑆𝑗 = 𝑦𝑖 ... (8) 3,324546082𝛼1+ 3.3564722𝛼2+1.2435587𝛼3+3,1804483𝛼4+1,1724648𝛼5 = 1 3,3564721561𝛼1+3,3891678𝛼2+1,2735327𝛼3+3,2089011𝛼4+1,2007252𝛼5 = 1 1,2435587𝛼1+1,2735327𝛼2+3,1675232𝛼3+1,1082716𝛼4+3,1724648𝛼5 = -1 3,2435587𝛼1+3,2735327𝛼2+1,1675232𝛼3+3,1082716𝛼4+1,1724648𝛼5 = 1 1,1724648𝛼1+1,2007252𝛼2+3,1007762𝛼3+1,044912𝛼4+3,0378451𝛼5 = -1

(11)

11 Dari persamaan diatas, untuk mendapatkan nilai 𝛼1, 𝛼2, 𝛼3, 𝛼4, 𝛼5 maka digunakan metode gauss jordan dan subsitusi. Sehingga didapatlah nilai 𝛼1 sampai 𝛼5 berikut.

𝛼1= 6,76 𝛼2= -5,08 𝛼3= -0,53 𝛼4= -1,19 𝛼5= 0,02

Karena nilai 𝛼5 adalah bernilai nol dan positif, maka nilai 𝛼1, 𝛼2, 𝛼3, dan 𝛼4 tidak dihitung ke tahap selanjutnya. Setelah didapatkan nilai 𝛼5 masukan ke dalam persamaan berikut.

Ẃ = ∑𝑛𝑖=1,𝛼𝑖𝑆𝑖 ... (9) Ẃ = 0,02 [

1,0187468

−1 1

] = [

0,020374936

−0,02 0,02

]

Kemudian hasil yang didapatkan melalui perhitungan dengan menggunakan persamaan 7, digunakan persamaan 8 dengan hasil yang didapatkan :

Ẃ= [0,02374936

0,02 ], dan dengan b = 0,02

Sehingga didapatkanlah nilai hyperplane untuk mengklasifikasikan kedua kelas, yaitu b=0,02.

d. Evaluasi Model

Gambar 1 Hasil Skor Rata – Rata Setiap Kernel SVM

SVM RBF SVM POLYNOMIAL SVM SIGMOID

80%/20% 66.39 57.8 58.3

70%/30% 65.39 60.34 61.29

60%/40% 65.83 54.17 59.03

0 10 20 30 40 50 60 70

Jumlah(%)

Nilai Rata-Rata (Mean Score)

(12)

12 Gambar 1 menunjukan hasil skor rata–rata yang didapat oleh kernel RBF, Polynomial, dan Sigmoid menggunakan tiga split data. Dapat dilihat bahwa skor rata- rata pada kernel SVM RBF terlihat lebih stabil akurasinya dibandingkan dengan akurasi kernel lainnya dan terlihat nilai akurasi tertinggi pada kernel SVM RBF terdapat pada split data 80% /20% yaitu sebesar 66,39% dan terkecil terdapat pada split data 70%/30% yaitu sebesar 65,39%. Pada kernel SVM Polynomial terlihat mengalami penurunan akurasi sebesar 5,05%-11,66% dari kernel SVM RBF dan terlihat nilai akurasi tertinggi pada kernel Polynomial terdapat pada split data 70%/30% yaitu sebesar 60,34% dan terkecil pada split data 60%/40% yaitu sebesar 54.17%. Pada kernel SVM Sigmoid terlihat mengalami kenaikan 0.5%-4,86% dan terlihat nilai akurasi tertinggi pada kernel Sigmoid terdapat pada split data 70%/30%

yaitu sebesar 61,29% dan terkecil terdapat pada split data 80%/20% yaitu sebesar 58,3%.

KESIMPULAN

Berdasarkan penelitian yang dilakukan oleh penulis dengan mengamati dan menganalisa sistem pengolahan data yang digunakan serta didukung teori dan alat yang berkaitan dengan penelitian, maka dapat diambil kesimpulan sebagai berikut:

1. Dari data komentar Instagram yang didapat dari tanggal 01 Januari s/d 30 September terlihat bahwa opini negatif rata-rata setiap bulan lebih besar yakni sebesar 58.69% dibandingkan dengan opini positif yang hanya berjumlah 41.31% . Ini dapat diartikan bahwa masyarakat yang memiliki akun sosial media Instagram belum merasa puas dengan kinerja DPR RI pada periode 2015 s/d 2019

2. Dari hasil klasifikasi SVM didapat nilai rata-rata akurasi tertinggi didapat dengan menggunakan kernel Rasional Basic Function (RBF) yakni sebesar 65.87% ,dan nilai akurasi rata-rata terendah didapat dengan menggunakan kernel Polynomial yakni sebesar 57.44%.

3. Klasifikasi dengan perbandingan data split yang berbeda memiliki pengaruh yang cukup signifikan terhadap akurasi klasifikasi SVM.

(13)

13 DAFTAR PUSTAKA

Chu, Y. X., Liu, X. G. and Gao, C. H. (2011) ‘Multiscale models on time series of silicon content in blast furnace hot metal based on Hilbert-Huang transform’, Proceedings of the 2011 Chinese Control and Decision Conference, CCDC 2011, pp. 842–847. doi: 10.1109/CCDC.2011.5968300.

M. Fachrurrozi, M. T. and Novi Yusliani, M. T. (2015) Analisis Sentimen Pengguna

Jejaring Sosial. Available at:

https://www.researchgate.net/publication/303942719%0AANALISIS.

Nurrun Muchammad Shiddieqy Hadna, Paulus Insap Santosa, W. W. W. (2016) Studi Literatur Tentang Perbandingan Metode Untuk Proses Analisis Sentimen di Twitter. Yogyakarta.

Wijaya, D. (2017) Aplikasi Text Mining Untuk Pencarian Dokumen Tugas Akhir Berdasarkan Semantic Relatedness Menggunakan Machine Readable Dictionary. Universitas Muhammadiyah Malang.

Gambar

Tabel 2. Software yang digunakan
Tabel 2  Contoh Tahap Preprocessing
Tabel 3 Perhitungan Nilai x1 dengan Kernel
Tabel 4 Nilai Label Pada y
+3

Referensi

Dokumen terkait

Dalam analisis sentimen ini dilakukan dengan memanfaatkan machine learning salah satu metodenya adalah Support Vector Machine yang merupakan metode pengklasifikasian

Dalam ulasan ini, peneliti menggunakan metode Naive Bayes dan Support Vector Machine dalam sentimen analisis ulasan positif atau negatif pada pengguna aplikasi

Dalam rangka kegiatan Sertifikasi Guru dalam Jabatan untuk guru-guru di lingkungan Departemen Agama (Depag), Panitia Sertifikasi Guru Rayon 15 telah melaksanakan Pendidikan dan

Dengan mengelola arsip digital memungkinkan lembaga pengelola arsip memastikan informasi yang disimpan dapat format digital dapat diakses oleh masyarakat sampai kapanpun

(22,23) menyimpulkan bahwa efektivitas mikroba.. pendegradasi hidrokarbon tergantung dari jenis tanah. Pemberian bahan organik seperti kompos dapat membantu mikroba dalam

Dalam rangka meningkatkan kualitas hidup dan kehidupan masyarakat, pemerintah daerah berupaya untuk meningkatkan kualitas penduduk, perlindungan dan kesejahteraan

Makna dan rujukan yang ditemukan setelah melakukan analisis terhadap iklan ini adalah Erigo yang berusaha untuk memotivasi kaum muda untuk memantik semangat mereka

para manajer di dalam suatu oragnisasi, dengan cara-cara aktivitas tertentu mereka mempengaruhi personil atau anggota organisasi. Humas adalah proses membangun relasi,