• Tidak ada hasil yang ditemukan

Analisis Sentimen Terhadap Universitas Gunadarma Berdasarkan Opini Pengguna Twitter Menggunakan Metode Naive Bayes Classier

N/A
N/A
Protected

Academic year: 2022

Membagikan "Analisis Sentimen Terhadap Universitas Gunadarma Berdasarkan Opini Pengguna Twitter Menggunakan Metode Naive Bayes Classier"

Copied!
15
0
0

Teks penuh

(1)

Analisis Sentimen Terhadap Universitas Gunadarma Berdasarkan Opini Pengguna Twitter Menggunakan

Metode Naive Bayes Classier

Imam Mulya dan Cut Maisyarah Karyati Universitas Gunadarma, Indonesia

E-mail : imammulya21@gmail.com, csyarah@gmail.com

Abstrak

Dalam upaya meningkatkan peminat mahasiswa baru, Universitas Gunadarma perlu mengetahui dan memperoleh opini masyarakat mengenai reputasi dan layanan- nya sendiri. Hal ini dapat dianalisa melalui kalimat pada media sosial diantaranya melalui tweet pada twitter. Data yang digunakan pada penelitian ini berasal dari twitter yang berupa data opini pengguna komentar dari situs: https://www.twitter.com dengan kata kunci Gunadarma pada kolom pencarian, data opini yang diambil 365 data pada tanggal 26 April 2020 yang didapatkan dengan menggunakan bantuan aplikasi Crawling tweet Twitter pada sistus: https://netlytic.org/ yang di generated otomatis ke dalam format .csv. Data latih dianalisis berdasarkan nilai atributnya dengan menggunakan suatu metode klasikasi. Proporsi data latih berjumlah 187 data dari total 267 data. Sementara jumlah data uji adalah sebanyak 80 data dari total data. Penelitian ini menggunakan bahasa R dengan IDE RStudio. Kemu- dian proses klasikasi dilakukan menggunakan 2 metode yakni: lexicon based un- tuk menentukan kalimat supaya memiliki makna sentimen positif atau negatif dan naive bayes classier untuk menghitung akurasi antara prediksi dan hasil actual dari sistem. Analisis sentimen memperoleh hasil 211 sentimen positif dan 56 sentimen negatif. Hasil analisis ini divisualisasikan dalam bentuk histogram, diagram pie dan wordcloud. Pada penelitian analisis sentimen ini didapatkan hasil akurasi klasikasi data tweet dari sistem analisis sentimen dengan menggunakan naive bayes classier sebesar 86.42% dengan kesalahan system sebesar 13.58%. Berdasarkan hasil analisis sentimen tersebut dapat disimpulkan bahwa sentimen pengguna Twitter terhadap Universitas Gunadarma memiliki kecenderungan sentimen positif. Analisis sentimen terhadap Universitas Gunadarma dapat dimanfaatkan pihak Universitas Gunadarma dan dijadikan acuan untuk kemajuan dan meningkatkan kinerja dari berbagai pihak terkait.

Kata kunci : Analisis Sentimen, Kalimat Positif, Kalimat Negatif, Naive Bayes, Universitas Gunadarma

Pendahuluan

Teknologi informasi dapat meningkatkan kin- erja dan memungkinkan berbagai kegiatan da- pat dilaksanakan dengan cepat, tepat dan akurat, sehingga dapat memberikan kema- juan yang signikan dalam berbagai bidang

seperti bermunculannya berbagai jenis kegiatan yang berbasis teknologi informasi, aplikasi atau perangkat lunak pada beberapa jenis kebu- tuhan seperti media sosial. Media sosial adalah sebuah media online, dimana para peng- gunanya bisa dengan mudah berpartisipasi, berbagi dan menciptakan isi meliputi blog, je-

DOI : http://dx.doi.org/10.32409/jikstik.19.4.354

(2)

jaring sosial, forum dan dunia virtual Blog je- jaring social serta wiki yang merupakan bentuk media sosial yang paling umum digunakan oleh masyarakat di seluruh dunia [1].

Pemanfaatan media sosial tidak hanya un- tuk berkomunikasi antara teman saja, tetapi sering juga dijadikan sebuah sarana untuk menyampaikan suatu aspirasi bagi masyarakat khususnya masyarakat Indonesia mengenai masalah pemerintah, ataupun masalah yang berhubungan dengan dunia pendidikan. Salah satu aspirasi yang disampaikan ini seperti beberapa hastag mengenai Universitas Gu- nadarma yang berhubungan dengan senti- men negatif dan positif. Dalam upaya meningkatkan peminat mahasiswa baru, Uni- versitas Gunadarma perlu mengetahui dan memperoleh opini masyarakat mengenai rep- utasi dan layanannya sendiri, karena apabila terdapat lebih banyak sentimen negatif dari- pada sentimen positif maka dapat membuat reputasi Universitas Gunadarma menjadi bu- ruk di mata masyarakat sehingga mengurangi minat calon mahasiswa yang ingin bergabung dengan Universitas Gunadarma. Permasala- han ini diangkat peneliti dengan membuat sebuah analisis hastag terkait sentimen apa yang terjadi pada masyarakat baik senti- men positf maupun sentimen negatif. Anal- isis sentimen ini menggunakan metode Naive Bayes Classier yang merupakan salah satu metode machine learning yang menggunakan perhitungan probabilitas dasar [2]. Adapun alasan peneliti melakukan analisis sentimen terhadap Universitas Gunadarma adalah agar dapat dimanfaatkan pihak Universitas Gu- nadarma dan dijadikan acuan untuk kemajuan dan meningkatkan kinerja dari berbagai pihak terkait.

Analisis sentimen pada penelitian ini meng- gunakan data dari twitter yang merupakan layanan jejaring sosial dan microblog daring yang memungkinkan penggunanya untuk men- girim dan membaca pesan berbasis teks hingga 280 karakter yang dikenal dengan sebutan ki- cauan (tweet) [3].

Penelitian tentang analisis sentimen telah banyak dilakukan dengan menggunakan metode Naive Bayes dari Tweet Twitter yang menghasilkan nilai akurasi lebih besar dari 90%

[4, 5]

Berdasarkan uraian diatas peneliti tertarik melakukan analisis sentimen pengguna Twitter

terhadap Universitas Gunadarma berdasarkan opini dari tweet Twitter menggunakan metode Naive Bayes Classier. Alasan pemilihan objek penelitian ini karena pada saat tahun ajaran baru ini, universitas sedang menjaring calon mahasiswa dan salah satunya melalui media sosial Twitter. Data sentimen digunakan untuk melihat tweet pengguna Twitter terhadap Uni- versitas Gunadarma tentang apa yang mereka bicarakan, positif atau negatif. Universitas Gu- nadarma merupakan salah satu Universitas ter- baik di Indonesia dan memiliki banyak ulasan atau opini di media sosial salah satu nya di Twitter.

Text Mining

Teknik yang dapat digunakan untuk melakukan klasikasi text adalah Text Mining yang meru- pakan variasi dari data mining yang berusaha menemukan pola yang menarik dari sekumpu- lan data tekstual yang berjumlah besar [6]. Tu- juan dari text mining adalah untuk mendap- atkan informasi yang berguna dari sekumpu- lan dokumen. Jadi, sumber data yang digu- nakan pada text mining adalah kumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Tugas khusus- nya adalah pengkategorisasian teks dan pen- gelompokan teks. Text mining lebih luas dapat diartikan sebagai proses mencari tahu secara intensif dimana pengguna berinteraksi dengan kumpulan dokumen yang merupakan sumber data pada text mining dan pola yang menarik tidak ditemukan pada record database yang ter- bentuk melainkan pada data kata per kata yang tidak terstruktur pada kumpulan dokumen [7].

Pada dasarnya proses kerja dari text mining banyak mengapdopsi dari penelitian data min- ing namun yang menjadi perbedaan adalah pola yang digunakan oleh text mining diam- bil dari sekumpulan bahasa alami yang tidak terstruktur sedangkan dalam data mining pola yang diambil dari database yang terstruktur [8].

Analisis Sentimen

Opini mining (analisis sentimen) merupakan salah satu cabang penelitian Teks Mining.

Opini mining adalah riset komputasional dari opini, sentimen dan emosi yang diekspresikan secara tekstual. Jika diberikan suatu set doku- men teks yang berisi opini mengenai suatu objek, maka opinion mining bertujuan untuk

(3)

mengekstrak atribut dan komponen dari objek yang telah didokumentasi pada setiap dokumen dan untuk menentukan apakah komentar terse- but bermakna positif atau negatif [9]. Anal- isis Sentimen digunakan untuk mengotomati- sasi proses identikasi pendapat apakah itu adalah pandangan positif atau negatif. Sis- tem ini dapat mengekstrak opini publik tentang topik tertentu, produk atau jasa yang tertanam dalam teks yang tidak terstruktur [10]. Anali- sis sentimen dapat dibedakan berdasarkan sum- ber datanya, beberapa level yang sering digu- nakan dalam penelitiannya adalah pada level dokumen dan pada level kalimat. Berdasarkan level sumber datanya analisis sentimen terbagi menjadi 2 kelompok besar yaitu: coarse- grained dan ned-grained. Pada analisis senti- men coarse-grained dilakukan pada level doku- men. Secara garis besar fokus utama dari je- nis ini adalah menganggap seluruh isi dokumen sebagai sebuah sentimen positif atau sentimen negatif. Ned-grained dilakukan pada level kali- mat. Fokus utamanya adalah menentukan sen- timen pada setiap kalimat [11].

Naive Bayes

Naïve bayes yaitu teorema dalam statistika untuk menghitung peluang. Bayes Optimal Classier menghitung peluang dari satu ke- las dari setiap kelompok atribut yang ada dan menentukan kelas mana yang paling opti- mal. Adapun kelebihan dari penggunaan Naive Bayes Classier dalam klasikasi dokumen da- pat ditinjau dari prosesnya yang mengambil aksi berdasarkan data yang telah ada sebelum- nya [12]. Oleh karena itu, klasiskasi doku- men dengan metode ini dapat dipersonalisasi, maksudnya adalah proses klasikasi dokumen dapat disesuaikan dengan sifat dan kebutuhan, informasi ini dapat dilihat secara nyata melalui hastag ltering, dengan mengetikkan nama l- ter hastagnya. Proses klasikasi ini meng- gunakan Naive Bayes classier pengklasikasi hastag otomatis ini dapat disesuaikan sehingga meminimalisasi aksi salah pengklasikasi secara personal dengan memperoleh informasi senti- men positif atau negatif.

Pengumpulan Data

Data opini pengguna komentar diambil dari situs: https://www.twitter.com dengan kata kunci Gunadarma pada kolom pencarian, data

opini yang diambil 365 data pada tanggal 26 April 2020 yang didapatkan dengan menggu- nakan bantuan aplikasi Crawling tweet Twitter pada sistus: https://netlytic.org/ yang di gen- erated otomatis ke dalam format .csv. Data yang digunakan adalah data tweet pengguna Twitter. Berikut ini salah satu contoh tweet pengguna Twitter yang memiliki makna sen- timen positif: Universitas Gunadarma ter- buka luas. Sedangkan ini contoh tweet peng- guna Twitter yang memiliki makna sentimen negatif: Universitas Gunadarma masalah yang di demo kemarin sudah beres kah atau belum mau masuk disitu labil banget. Data masukan untuk analisis sentimen pada penelitian ini merupakan kumpulan opini yang sudah dikat- egorikan kedalam data uji ataupun data latih.

Data opini terdiri dari 187 data latih dan 80 data uji.

Data Latih

Dalam analisis sentimen, data latih digunakan pada tahap pelatihan. Data latih di anali- sis berdasarkan nilai nilai atributnya dengan menggunakan suatu metode klasikasi. Proses pembelanjaran untuk melatih sistem agar da- pat mengklasikasikan suatu kata apakah ter- masuk dalam sentimen positif atay sentimen negatif pada saat proses atau tahap pengujian.

Proporsi data latih jumlahnya lebih banyak dibandingkan dengan data uji. Dari total data 267 data, jumlah data latih dalam penelitian ini sebanyak 187 data.

Data Uji

Data uji adalah sekumpulan data yang meru- pakan proses ini analisis sentimen yakni proses pengujian menggunakan metode Naive Bayes Classier. Dari hasil pengujian dengan data uji didapatkan akurasi sistem yang dibandingkan dengan pengklasikasian dengan metode lexi- con based. Proporsi data uji jumlahnya lebih sedikit dibandingkan dengan data latih. Dari total 267 data, jumlah data uji pada penelitian ini sebanyak 80 data.

Analisis Sentimen terhadap Uni- versitas Gunadarma

Dalam tahap analisis sentimen, struktur data yang baik dapat memudahkan proses anali- sis sentimen secara otomatis. Oleh karena

(4)

itu, data opini yang strukturnya masih ku- rang terstruktur diubah menjadi lebih terstruk- tur sesuai dengan kebutuhan. Tahap untuk melakukan analisis sentimen dapat dilihat pada Gambar 1.

Gambar 1: Alur Analisis Sentimen

Tahap awal analisis sentimen adalah mem- baca data opini (dataset) yang merupakan data opini pengguna twtter terhadap Universi- tas Gunadarma. Selanjutnya dilakukan tahap pembersihan (pre-processing) yaitu mengubah kapitalisasi, menghilangkan tanda baca / pem- batas (delimiter), mehilangkan nama username pengguna Twitter seperti (@), dan menghi- langkan Url yang terdapat pada tweet seperti (http//). Dataset yang sudah melewati tahap pembersihan (pre-processing) dilakukan klasi-

kasi menggunakan metode lexicon based un- tuk menentukan sentimen data positif atau negatif. Setelah itu, proses pelabelan data latih dan data uji dengan proporsi 70:30 yang akan digunakan pada tahap klasikasi menggunakan metode Naïve Bayes Classier, terlebih dulu dilakukan proses pembelajaran menggunakan data latih, kemudian dilakukan proses pengu- jian menggunakan data uji untuk mendapatkan hasil klasikasi dan melihat akurasi menggu-

nakan perhitungan confusion matrix dari klasi-

kasi yang dilakukan oleh sistem.

Tahap Membaca Data Opini

Tahap membaca data komentar merupakan tahap utama yang dilakukan sebelum ke tahap selanjutnya. File data opini (dataset) harus didenisikan terlebih dahulu agar dapat di proses. Berikut penggalan sintaks untuk mendenisikan le data opini (dataset) untuk tahap pembersihan (pre-processing).

DatasetGunadarma

<read.csv("D:\tesis\\Gunadarma_Dataset_clean.csv") DatasetGunadarma$text <- as.factor(DatasetGunadarma$text)

Tahap Pembersihan ( Pre-processing) Tahap pembersihan atau pre-processing meru- pakan tahap yang dilakukan sebelum ke tahap metode klasikasi. Tujuan dari tahap ini adalah menyeragamkan ukuran kata, menghi- langkan username pengguna Twitter. Tahap pembersihan (pre-processing) meliputi men- gubah kapitalisasi, menghapus tanda baca, menghapus Url, menghapus username peng- guna Twitter. Dalam tahap pre-processing dibutuhkan package R yang harus diinstall dan dipanggil pada saat program dijalankan di RStudio yaitu:

install. packages(tm) install. packages(corpus) install. packages(plyr) install. packages(stringr) install. packages(wordcloud)

library (tm) #untuk proses text mining library (corpus) #untuk membaca data dari suatu le

library (plyr) #untuk split data library (stringr)#untuk proses data string

library (wordcloud)#untuk pembuatan word cloud

Mengubah Kapitalisasi

Dalam tahap ini dilakukan transformasi huruf kapital pada data opini menjadi huruf kecil.

Hanya menerima `a' sampai dengan huruf `z'.

Karakter selain huruf dihilangkan atau diang- gap sebagai tanda baca (delimiter). Diagram alur mengubah kapitalisasi dapat dilihat pada Gambar 2.

(5)

Gambar 2: Diagram alur mengubah Kapitalisasi

Algoritma mengubah kapitalisasi yaitu:

1. Membaca data opini (dataset).

2. Memerika ukuran setiap karakter dari awal hingga akhir karakter.

3. Mengubah huruf kapital menjadi huruf kecil.

4. Hasil data opini seluruhnya telah diubah menjadi huruf kecil dan hasil data tahap mengubah kapitalisasi disimpan untuk tahap tokenisasi.

Tabel 1: Tabel Aturan Tahapan Mengubah Kapitalisasi

Untuk melakukan tahap mengubah kapital- isasi, berikut penggalan sintaks pada RStudio.

kalimat = tolower(kalimat)

Pada tahap mengubah kapitalisasi, ada be- berapa aturan proses agar hasil mengubah kapi- talisasi dapat sesuai yang diharapkan. Adapun aturan-aturan tersebut disajikkan pada Tabel 1. Ilustrasi tahap mengubah kapitalisasi yang disajikan pada Tabel 2.

Tabel 2: Tahap Ilustrasi Mengubah Kapital- isasi

Tokenisasi (Tokenizing)

Tokenisasi merupakan proses pemotongan string berdasarkan tiap kata, menghilangkan tanda baca / pembatas (delimiter) seperti

(6)

tanda titik (.), tanda koma (,), spasi dan karak- ter angka yang ada pada kata data opini terse- but. Tahapan ini dilakukan setelah data opini

(dataset) melewati tahap mengubah kapital- isasi. Diagram alur tahap (Tokenizing) dapat dilihat pada Gambar 3.

Gambar 3: Diagram Alur Tokenisasi

Algoritma dalam tahap tokenisasi adalah sebagai berikut: 1) Membaca data hasil tahap mengubah kapitalisasi. 2) Memeriksa apakah ada delimiter atau tidak. 3) Menghilangkan tanda baca / pembatas (delimiter) seperti tanda titik (.), tanda koma (,), spasi dan karak- ter angka. 4) Hasil data tahap mengubah kapi- talisasi sudah tidak mengandung delimiter dan hasil data tahap tokenisasi disimpan.

Untuk melakukan tahap tokenisasi, berikut penggalan sintaks pada RStudio.

#kalimat = gsub('\\w+:(\\/?\\/?)[^\\s]+', , kalimat)

kalimat = gsub('@\\w+', , kalimat) kalimat = gsub('#\\w+', , kalimat) kalimat = gsub('[[:punct:]]', , kalimat) kalimat = gsub('[[:cntrl:]]', , kalimat) kalimat = gsub('\\d+', , kalimat)

Pada tahapan tokenisasi (Tokenizing),ada beberapa aturan proses agar hasilnya sesuai dengan yang diharapkan. Aturan- aturan terse- but disajikan pada Tabel 3.

Tabel 3: Tabel Aturan Tahap Tokenisasi

Kondisi Aksi Jika data opini yang sudah melalui proses mengubah kapitalisasi mengan- dung tanda baca / pembatas (delimiter) Tanda baca / pembatas (delimiter) yang terdapat pada data opini akan dihilangkan Jika data opini yang sudah melalui proses mengubah kap- italisasi mengandung simbol dan angka Simbol dan angka yang terdapat pada data opini akan dihilangkan

Ilustrasi tahap tokenisasi (Tokenizing) yang disajikan pada Tabel 4.

(7)

Tabel 4: Tabel Ilustrasi Tahapan Tokenisasi

Klasikasi Lexicon Based

Klasikasi sentimen dengan lexicon based merupakan klasikasi berdasarkan kata positif dan kata negatif yang ada dalam kata opini

yang telah melalui tahap pembersihan (pre- processing). Klasikasi ini mencocokan kata- kata yang terdapat dalam database kata positif dan negatif pada penelitian sebelumnya. Jika data opini dalam satu kalimat memiliki pro- porsi kata positif lebih besar dari kata negatif, maka kalimat itu digolongkan pada sentimen positif. Namun jika data opini dalam satu kali- mat memiliki proporsi kata negatif lebih be- sar dari kata positif, maka kalimat itu digo- longkan pada sentimen negatif. Diagram alur tahap klasikasi Lexicon Based dapat dilihat pada Gambar 4.

Gambar 4: Diagram Alur Tahap Klasikasi Lexicon Based

(8)

Algoritma klasikasi lexicon based adalah sebagai berikut:

1. Membaca data hasil tahap preprocessing.

2. Pencocokan kata dengan daftar kata posi- tif dan kata negatif.

3. Dilakukan perhitungan skor.

4. Jika proporsi kata positif dan negatif = o (no), data hasil tahap preprocessing ter- masuk sentimen positif.

5. Jika proporsi kata positif lebih besar dari- pada kata negatif, maka data hasil tahap

preprocessing termasuk sentimen positif.

6. Jika proporsi kata negatif > kata positif, maka data hasil tahap preprocessing ter- masuk sentimen negatif.

7. Hasil tahap preprocessing yang sudah melalui tahap klasikasi menggunakan lexicon based disimpan untuk tahap klasi-

kasi Naïve Bayes Classier.

Hasil klasikasi metode lexicon based dapat dil- ihat pada Gambar 5.

Gambar 5: Hasil Klasikasi Metode Lexicon Based

Database Kata Positif dan Kata Negatif

Penentuan suatu kalimat yang termasuk senti- men positif atau negatif dengan cara menghi- tung proporsi jumlah kata positif dan negatif dilakukan dengan menggunakan metode lexicon

based. Penentuan suatu kata dalam kalimat memiliki makna sentimen postif atau negatif ditentukan berdasarkan kamus / database kali- mat positif dan negatif pada penelitian se- belumnya. Berikut ini adalah sebagian kamus / database kata positif dan kata negatif yang dapat dilihat pada gambar 6 dan 7.

(9)

Gambar 6: Lampiran Sebagian Kata Positif

Gambar 7: Lampiran Sebagian Kata Negatif

(10)

Klasikasi Naïve Bayes Classier

Tahap klasikasi menggunakan metode Naïve Bayes Classier merupakan tahap untuk pengk- lasikasian apakah data yang diuji termasuk kedalam sentimen positif atau negatif. Metode ini terdiri dari 2 proses yaitu, proses pelatihan dan proses pengujian. Berikut ini adalah taha- pan proses klasikasi menggunakan metode Naïve Bayes Classier:

1. Mendenisikan Dataset

Dalam penelitian ini dataset yang digu- nakan adalah data opini pengguna Twit- ter sebanyak 267 data yang telah melalui tahap pembersihan (Pre-processing) dan telah dilakukan klasikasi lexicon based.

Dibawah ini pengglan sintaks untuk me- manggil le yang menjadi dataset untuk klasikasi menggunakan metode Naïve Bayes Classier.

DatasetGunadarma <- read.csv

("C:\\Users\\ASUS\\Downloads\\sentimen_analisis\\

sentimen_analisis\\Gunadarma_Dataset_clean.csv")

Untuk menampilkan dataset digunakan

sintaks View dan hasilnya dapat dilihat pada Gambar 8.

Kemudian melihat jumlah dan probabil- itas dataset berdasarkan eld sentimen, lalu menampilkan Panjang karakter pada setiap baris kalimat. Dibawah ini peng- galan sintaks untuk melihat jumlah prob- abilitas eld sentimen dan menampilkan Panjang karakter pada setiap kalimat padaeld text.

textlength <- str_length(kalimat)

Output panjang karakter dengan mem- buateld baru bernama textlength dapat dilihat pada Gambar 9.

2. Pelabelan Data Dalam tahap ini di- lakukan proses pelabelan untuk menen- tukan rentang data yang masuk kategori data latih dan data uji. Proporsi pada pembagian data latih dan data uji sebesar 70:30 (dalam persen) dari 267 data. Field yang digunakan adalah sentimen karena dalam penelitian ini pokok perhitungan sentimen positif atau negatif.

View (DatasetGunadarma)

Gambar 8: Dataset Yang Telah Terdenisi

(11)

Gambar 9: Field Panjang Karakter

Gambar 10: Histogram Data Sentimen

Hasil Visualisasi Data

Visualisasi data digunakan untuk memaparkan hasil dari proses klasikasi analisis sentimen berdasarkan nilai dalam bentuk histogram, di- agram pie, dan wordcloud.

Bentuk Histogram

Data yang dipaparkan merupakan hasil dari se- tiap tahapan analisis sentimen. Pada Gambar 10 dipaparkan histogram dengan sumbu x seba- gain data ke-n dan sumbu y berisi banyak data yang sering muncul, lihat Gambar 10.

Pada Gambar 11 dipaparkan histogram dengan sumbu x sebagai data ke-n dan sumbu y adalah presentase data dari jumlah total data sentimen positif dan negatif untuk parameter panjang karakter.

Pada Gambar 12 dipaparkan histogram dengan sumbu x sebagai data ke-n dan sumbu y adalah presentase data dari jumlah total data sentimen positif atau negatif untuk parameter summary.

Bentuk Diagram Pie

Data yang dipaparkan merupakan proporsi an- tara sentimen positif dengan negatif dari ke-

(12)

seluruhan data. Pada Gambar 13 dipaparkan diagram pie proporsi data sentimen positif dan negatif.

Gambar 11: Histogram Perbandingan Panjang Karakter dengan Sentimen

Gambar 12: Perbandingan Summary dengan Sentimen

Bentuk Wordcloud

Data yang dipaparkan pada wordcloud meru- pakan data dalam bentuk kata yang memiliki makna sentimen positif dan negatif yang sering muncul menurut system aplikasi. Pada Gam- bar 14 dipaparkan wordcloud untuk kata yang bermakna sentimen positif.

Gambar 13: Diagram Pie Proporsi Sentimen Positif dan Negatif

Gambar 14: Wordcloud Positif

Pada gambar 15 dipaparkan wordcloud un- tuk kata yang bermakna sentimen negatif.

Gambar 15: Wordcloud Negatif

(13)

Pengujian Akurasi Metode Klasikasi Menggunakan

Confu-

sion Matrix

Pengujian akurasi klasikasi sistem berguna untuk mengetahui tingkat akurasi klasikasi data tweet dengan menggunakan metode lex- icon based dan metode naïve bayes classier.

Pengujian ini menggunakan Confusion matrix yaitu sebuah matrix prediksi yang diband- ingkan dengan kelas dari data inputan asli.

Data yang digunakan merupakan data uji yang berjumlah 186 data. Data uji yang sudah melalui tahap klasikasi menggunakan lexi-

con based dan metode naïve bayes classier dibandingkan. Crosstable merupakan sintaks yang tersedia pada RStudio untuk membuat su- atu label lalu menghitung probabilitasnya se- cara vertikal dan horizontal. Tabel merupakan sintaks untuk menampilkan jumlah sentimen data positif dan negatif. Di bawah ini adalah penggalan sintaks pengujian menggunakan con- fusion matrix serta output dari crosstable dapat dilihat pada Gambar 16.

Sintaks untuk menghasilkan hasil pengujian dapat dilihat pada Gambar 17.

Output dari akurasi sistem pengujian meng- gunakan confusion matrix dapat dilihat pada Gambar 18.

Gambar 16: Hasil Pengujian Naive Bayes Classier (Crosstable)

Gambar 17: Sintaks Pengujian Naive Bayes

(14)

Gambar 18: Hasil Akurasi sistem Menggunakan Confusion Matrix

Dari data pengujian akurasi tersebut, diper- oleh hasil akurasi klasikasi dengan meng- gunakan metode naive bayes classier sebe- sar 86.42% dengan kesalahan sistem sebesar 13.58%. Kesimpulan dari pengujian akurasi menggunakan confusion matrix adalah bahwa naive bayes classier dapat digunakan sebagai metode pengklasikasian pada penelitian anal- isis sentimen ini.

Penutup

Penelitian ini telah dilakukan analisis senti- men terhadap Universitas Gunadarma. Proses analisis sentimen dilakukan menggunakan ba- hasa R dengan IDE RStudio. Kemudian proses klasikasi dilakukan menggunakan 2 metode yakni: lexicon based untuk menentukan kali- mat supaya memiliki makna sentimen posi- tif atau negatif dan naive bayes classier un- tuk menghitung akurasi antara prediksi dan hasil aktual dari sistem. Analisis sentimen divisualisasikan dalam bentuk histogram, di- agram pie dan wordcloud. Pada penelitian analisis sentimen ini didapatkan hasil akurasi klasikasi data tweet dari sistem analisis sen- timen dengan menggunakan naïve bayes clas- sier sebesar 86.42% dengan kesalahan sistem sebesar 13.58%. Berdasarkan hasil analisis sen- timen tersebut dapat disimpulkan bahwa sen- timen pengguna Twitter terhadap Universitas Gunadarma memiliki kecenderungan sentimen positif dimana berdasarkan hasil analisis senti- men diperoleh 211 sentimen positif dan 56 sen- timen negatif. Hasil analisis ini telah divisual- isasikan dalam bentuk histogram, diagram pie dan wordcloud.

Daftar Pustaka

[1] Puguh Kurniawan, Pemanfaatan Media Sosial Instagram sebagai Komunikasi Pe-

masaran Modern Batik Burneh, Kom- petensi, Universitas Trunojoyo, Vol 11, No 2, Oktober 2017, ISSN: 1907-4824 (print), ISSN: 2541-2655(online), pp. 217- 225, 2017.

[2] Paisal, Analisis Sentimen Masyarakat Berdasarkan Opini dari Sosial Media Menggunakan Metode Naive Bayes Classier (Study Kasus : Universitas Sjakhyakirti), Jurnal Ilmiah Informatika Global, vol. 11 No. 01, Juli 2020, ISSN PRINT : 2302-500X ISSN ONLINE : 2477-3786, pp. 41-46, 2020.

[3] Nabila Hal, Analisis Sentimen terhadap universitas Sriwijaya berdasarkan Opni Masyarakat dari Twitter menggunakan Naïve Bayes Classier, Program Studi Sistem Informasi, Fakultas Ilmu Kom- puter, universitas Sriwijaya, 2019.

[4] Deden Rustiana, Nina Rahayu, Analisis Sentimen Pasar otomotif Mobil: Tweet Twitter menggunakan Naïve Bayes, Ju- rnal SIMETRIS, Vol 8 No 1 April 2017, ISSN: 2252-4983, pp. 113-120, 2017.

[5] Fajar Ratnawati, Implementasi Algo- ritma Naive Bayes Terhadap Analisis Sen- timen Opini Film Pada Twitter, Jurnal INOVTEK POLBENG  Seri Informatika, Vol. 3, No. 1 , Juni 2018, ISSN : 2527-9866, 50-59, 2018.

[6] Bambang Kurniawan, Syahril Eendi, Opim Salim Sitompul, Klasikasi Kon- ten Berita Dengan Metode Text Mining, Journal Dunia Teknologi Informasi, Vol.1 issue 1, 2012.

[7] Ria Ine Pristiyanti, Mochammad Ali Fauzi, Laili Muikhah, Sentimen Anal- ysis Peringkasan Review Film Menggu- nakan Metode Information Gain dan K -

(15)

Nearest Neighbor, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, ISSN: 2548-964X, Vol. 2 No. 3, Maret 2018, hlm. 1179-1186, Fakultas Ilmu Komputer, Universitas Brawijaya, 2018.

[8] Jiawei Han, Jian Pei, Micheline Kamber,

Data Mining: Concepts and Techniques, Third Edition, Morgan Kauman Publish- ers, Elsevier, USA, 2011.

[9] Falahah, Dyar Dwiki Adriadi Nur,

Pengembangan Aplikasi Sentimen Anal- ysis menggunakan Metode Naive Bayes (Studi Kasus Sentimen Analysis dari media Twitter), Seminar Nasional Sistem Informasi Indonesia, 2-3 November 2015.

[10] Lila Dini Utami, Romi Satria Wahono,

Integrasi Metode Information Gain un-

tuk Seleksi Fitur dan Adaboost untuk Mengurangi Bias pada Analisis Sentimen Review Restoran menggunakan Algoritma Naive Bayes, Journal of Intelligent Sys- tems, Jilid 1, Terbitan 2, Halaman 120- 126, 2015.

[11] Fink, R. Clayton, Implementasi Opinion Mining (Analisis Sentimen), Coarse- and Fine-Grained Sentimen. Analysis of Social Media Text, Johns Hopkins APL Techni- cal, 2011.

[12] Fauziah Afshoh, Analisa Sentimen meng- gunakan Naïve Bayes untuk Melihat Persepsi Masyarakat terhadap Kenaikan Harga Jual Rokok pada Media Sosial Twit- ter, Program Studi Informatika, Fakultas Komunikasi dan informatika, Universitas Muhammdyah Surakarta, 2017.

Gambar

Gambar 1: Alur Analisis Sentimen
Gambar 2: Diagram alur mengubah Kapitalisasi
Gambar 3: Diagram Alur Tokenisasi
Gambar 4: Diagram Alur Tahap Klasikasi Lexicon Based
+7

Referensi

Dokumen terkait

naïve bayes dapat digunakan dalam penelitian untuk memprediksi suatu kejadian yang akan datang. Metode naïve bayes merupakan salah satu teknik data mining untuk memanfaatkan

Berdasarkan hasil pengujian untuk melakukan prediksi retweet dengan fitur berbasis pengguna dan tingkat sentiment menggunakan metode klasifikasi naïve bayes menghasilkan nilai

Pada penelitian ini, proses dimulai dengan memasukan data yang didapatkan dari hasil web scraping , lalu data akan dianalisis menggunakan algoritma Naïve Bayes, dan dihasilkan

“Analisis Sentimen Masyarakat Terhadap Penerapan Work From Home Berdasarkan Data Twitter Menggunakan Metode Naïve Bayes.. Classifier

Penelitian untuk menganalisis sentimen terhadap data restoran yang ada di Singapura dengan algoritma Naïve Bayes classifier yang telah dilakukan menghasilkan kesimpulan bahwa

Pada penelitian ini, proses dimulai dengan memasukan data yang didapatkan dari hasil web scraping , lalu data akan dianalisis menggunakan algoritma Naïve Bayes, dan dihasilkan

Penelitian terdahulu yang berkaitan dengan analisis sentimen diantaranya adalah penggunaan naïve bayes untuk menganalisis pendapat masyarakat terhadap vaksinasi covid-19 di

Klasifikasi Naïve Bayes dapat digunakan untuk mengolah data dalam jumlah yang besar maupun kecil, Kekurangan dari metode Naïve Bayes dalam penelitian ini adalah Naïve Bayes bergantung