Analisis Sentimen Aplikasi Go-Jek Menggunakan Metode LVQ

(1)

Implementasi Metode Learning Vector Quantization (LVQ) Untuk Sentimen Analisis Terhadap Aplikasi Go-Jek Pada Playstore

Arif Pratama B¹, Elvia Budianita^2*, Novi Yanti³, Reski Mai Candra⁴ Teknik Informatika UIN Sultan Syarif Kasim Riau Jl. Subrantas Km. 15, Pekanbaru, 28293, 0761-562223

e-mail: [email protected]

Abstrak— Perkembangan teknologi dan informasi pada saat ini sangat pesat, terutama di Indonesia. Salah satu teknologi yang berkembang pesat di Indonesia saat ini adalah teknologi dalam bidang transportasi yaitu, transportasi online. Dengan adanya transportasi online ini sangat membantu segala aktifitas masyarakat.

Terdapat beberapa platform tranasportasi yang ada di Indonesia, salah satu yang terkenal adalah transportasi online Gojek. Apliikasi Gojek dapat dengan dengan mudah di download pada google plyastore. Playstore adalah sebuah aplikasi yang berguna untuk mengunduh berbagai aplikasi. Playstore juga menyediakan fitur penilaian terhadap aplikasi yang tersedia di platform tersebut, dengan adanya fitur penilaian ini pengguna dapat memberikan penilaiannya dan juga berkomentar terhadap aplikasi yang digunakannya. Dengan adanya fitur komentar ini maka dapat di lakukannya sentimen analisis untuk mengetahui sentimen publik terhadap suatu aplikasi. Dalam penelitian ini langkah awal yang dilakukan adalah mengumpulkan data dan juga memberikan laber terhadap seluruh data, pada penelitian ini terdapat 3 label yaitu positif, netral, dan Negatif dengan jumlah 900 data. Selanjutnya melakukan proses analisa preprocessing dan juga dilanjutkan dengan proses pembobotan TF, kemudian baru dilakukannya proses klasifikasi menggunakan metode Learning Vector Quantization (LVQ). Hasil pengujiannya sendiri dilakukan dengan menggunakan metode Confussion Matrix. Berdasarkan dari proses dan hasil pengujian yang di lakukan di dapatkan akurasi terbaik pada perbandingan 90 : 10 sebesar 84,44% yang sebagian besar bernilai positif.

Kata Kunci: transportasi online, Sentiment analysis , Playstore, Klasifikasi, Learning Vector Quantization Abstract— The development of technology and information is currently very fast, especially in Indonesia. One technology that is developing rapidly in Indonesia today is technology in the field of transportation, namely online transportation. The existence of online transportation is very helpful for all community activities. There are several transportation platforms in Indonesia, which is well-known online transportation called Gojek.

The Gojek application can be easily downloaded on the Google Playstore. Playstore is an application that is useful for downloading various applications. Playstore also provides an assessment feature for applications available on the platform, with this assessment feature users can provide an assessment and also comment on the applications they use. With this comment feature, sentiment analysis can be done to find out public sentiment towards an application. In this study, initial step was taken to collect data and also provide a label for all data, in this study there were 3 labels, namely positive, neutral, and negative with a total of 900 data.

Next, perform the preprocessing analysis process and also continue with the TF-IDF weighting process, then the classification process is carried out using the Learning Vector Quantization (LVQ) method. The results of the test itself are carried out using the Confusion Matrix method. Based on the process and the results of the tests , the best accuracy obtained is at ratio of 90 : 10 by 84,44%,which is most of it are positive

Keywords:Online Transportation,sentiment analysis , Playstore, Classification, Learning Vector Quantization 1. Pendahuluan

Perkembangan teknologi dan informasi saat ini sangat lah pesat, terutama di bidang tranportasi dan internet.

Perkembangan teknologi dan informasi ini sangat berpengaruh pada kehidupan masyarakat, terutama di Indonesia. Teknologi tranportasi yang berkembang sangat pesat saat ini adalah transportasi online, terdapat beberapa transportasi online yang berkembang pesat di indonesia, salah satu yang terkenal adalah transportasi online Gojek. Gojek adalah salah satu transportasi online yang berasal dari Indonesia, didirikan pada tahun 2010 dan telah di unduh sebanyak 142 juta pengguna. Transportasi online ini menggunakan teknologi berupa sebuah aplikasi yang dapat di akses masyarakat untuk memesan ojek, memesan makanan, mengirim barang, dan juga berbagai fitur lainnya yang telah di sediakan. Aplikasi tranportasi online ini juga dengan mudah dapat di download pada google playstore.

Playstore adalah sebuah aplikasi yang berguna untuk mengunduh berbagai aplikasi. Dengan berbagai aplikasi yang yang di sediakan membuat pengguna memiliki banyak pilihan untuk memilih aplikasi yang populer atau yang di rekomendasikan banyak orang. Pengguna juga dapat mengetahui pendapat pengguna lain terhadap suatu aplikasi melalui ulasan yang disediakan playstore, biasanya ulasan dari pengguna terdapat dua

(2)

bagian, yakni nilai rating dan juga komentar secara tekstual. Dengan adanya fitur ulasan ini, maka dapat di lakukannya sentimen analisis untuk mengetahui sentimen publik terhadap suatu aplikasi.

Sentimen analisis yang dapat diamati di lingkungan masyarakat saat ini adalah di bidang transportasi online, dimana era teknologi informasi saat ini banyak masyarakat yang mengandalkan jasa transportasi online ini baik driver maupun pelanggan, terutama di perkotaan yang pada umumnya terjadi kemacetan. Tanggapan masyarakat terhadap penyedia layanan transportasi online ini juga bermacam-macam, ada yang memberi tanggapan positif netral dan negatif. Dampak mengetahui sentimen publik untuk transportasi online ini, pengguna layanan dapat mengetahui tingkat di terimanya layanan jasa transportasi online ini, sehingga dapat menentukan layanan mana yang baik mereka gunakan. Pihak penyedia layanan juga dapat menggunakan file informasi untuk mengetahui apakah layanan mereka telah di terima dengan baik dan memuaskan para pelanggan atau tidak, sehingga dapat meningkatkan kualitas layanannya [1].

Salah satu metode yang dapat digunakan dalam pengklasifikasian analisis sentimen adalah metode Learning Vector Quantization (LVQ), dan penelitian yang membahas sentimen analisis menggunakan metode Learning Vector Quantization adalah penelitian dari Alfi pada tahun 2019 [2] yang berjudul “Analisis Sentimen Berdasarkan Knowledge Pattern Dan Learning Vector Quantization”, pada penelitian ini penulis melakukan klasifikasi opini positif dan negatif terhadap review film berbahasa inggris dan mendapatkan hasil yang memiliki akurasi 84%. Penelitian lainnya yang menggunakan metode Learning Vector Quantization (LVQ) adalah penelitian dari Huda pada tahun 2020 [3], yang mengklasifikasikan berita. Pada penilitian ini menggunakan skenario uji coba 70% : 30%, 80% : 20%, dan 90% :10%. Pada skenario uji coba 70% : 30%

didapat nilai akurasi 47,78%, presisi 79,65%, recall 47,78%, f-measure 59,73%, seknario ujicoba 80% : 20%

didapat hasil akurasi 80%, presisi 87,50%, recall 80%, f-measure 83,58%, dan untuk skenario uji coba 90% : 10% di dapat hasil akurasi 96,67%, presisi 96,97%, recall 96,67%, f-measure 96,82%.

Berdasarkan uraian di atas, pada penelitian ini akan dilakukan pengklasifikasian sentimen transportasi online GO-JEK pada aplikasi playstore berbahasa indonesia dengan menerapkan metode Learning Vector Quantization (LVQ). Penilitian ini diharapkan dapat menganalisa sentiment pada ulasan komentar aplikasi Gojek di playstore , dan juga mengklasifikasikannya menjadi postif, netral dan negatif, serta mendapatkan hasil akurasi pengklasifikasian yang baik.

2. Tinjauan Pustaka 2.1 Analisa Sentimen

Sentiment analisis bertujuan untuk menganalisa suatu pendapat, sentiment, sikap, penilaian dan emosi seseorang baik pembicara atau penulis terhadap suatu topik, produk, layanan, individu, organisasi, ataupun kegiatan tertentu [4]. Tugas dasar dari sentiment analisis adalah mengelompokkan teks yang ada di sebuah kalimat atau dokumen kemudian menentukan pendapat yang dikemukakan dalam kalimat atau dokumen tersebut apakah pendapatnya bersifat positif, netral atau negative [5].

2.2 Text Mining

Texs Mining adalah menambang data yang berupa teks dimana sumber data nya didapatkan dari dokumen, dimana tujuannya adalah mencari kata-kata yang dapat mewakili dari isi dari dokumen itu, sehingga dapat dilakukan analisa keterhubungan antar dokumen [6][7]. Secara luas teks mining di artikan sebagai penerapan konsep teknik data mining untuk mencari pola dalam teks, proses penganalisaan guna untuk mencari informasi yang bermanfaat untuk tujuan tertentu. Tujuan utama dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan pada text mining adalah teks yang tidak terstruktur atau minimal semi terstruktur [5].

2.3 Text Preprocessing

Data yang telah dikumpulkan belum dapat langsung di lakukan proses pengklasifikasian karena data tersebut masih terdapat banyak symbol dan juga kata-kata yang tidak dibutuhkan, maka untuk membersihkan dan menyiapkan data agar dapat diklasifikasikan perlu dilakukannya proses pre-processing. Text Processing adalah tahapan proses awal untuk mempersiapkan teks menjadi data yang akan di olah selanjutnya.

Sekumpulan karakter yang bersambungan (teks) harus dipecah-pecah menjadi unsur yang lebih berarti[8].

2.4 Pembobotan

Pembobotan berfungsi untuk mendapat nilai threshold parameter dalam klasifikasi LVQ nantinya. Hal tersebut dilakukan dengan melakukan pengamatan terhadap distribusi frekuensi kemunculan kata dan jumlah feature [9]. Pendekatan ekstraksi yang dilakukan dalam penelitian ini yaitu Term Frequency (TF). Term Frequency merupakan salah satu metode untuk menghitung bobot tiap term dalam teks. Dalam metode ini tiap term diasumsikan memiliki nilai kepentingan yang sebanding dengan jumlah kemunculan term tersebut pada teks.

(3)

2.5 Feature Selection

Hasil dari tahapan ini yaitu diperolehnya nilai bobot pada masing-masing atribut atau fitur dan kemudian dilakukan perangkingan berdasarkan nilai tertinggi ke terendah.

2.6 Klasifikasi

Di dalam KBBI, klasifikasi adalah penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Secara harfiah bisa pula dikatakan bahwa klasifikasi adalah pembagian sesuatu menurut kelas-kelas. Menurut ilmu pengetahuan, klasifikasi adalah proses pengelompokkan benda berdasarkan ciri-ciri persamaan dan perbedaan, sedangkan dalam ilmu kecerdasan buatan klasifikasi adalah sebuah proses untuk menemukan model yang dapat membedakan sebuah objek yang kelasnya belum diketahui sebelumnya [10].

2.7 Learning Vector Quantization (LVQ)

Learning Vector Quantization (LVQ) merupakan suatu metode yang digunakan untuk melakukan pembelajaran pada lapisan kompetitif yang terawasi. Suatu lapisan kompetitif akan secara otomatis belajar untuk mengklasifikasikan vektor-vektor input. Kelas-kelas yang didapatkan sebagai hasil dari lapisan kompetitif ini hanya tergantung pada jarak antara vektor-vektor input. Jika dua vektor input mendekati sama, maka lapisan kompetitif akan meletakkan kedua vektor input tersebut kedalam kelas yang sama [11]. Jaringan LVQ mempunyai target yang akan dicapai. Lapisan kompetitif belajar mengenali dan mengklasifikasikan vektor-vektor masukan. Jika ada 2 vektor yang hampir sama, maka lapisan kompetitif akan menempatkan keduanya pada kelas yang sama.

2.8 Confusion Matrix

Confusion matrix merupakan sebuah cara yang berguna untuk menganalisis seberapa baik classifier mengenali data. Metode ini menggunakan tabel matriks seperti terlihat pada tabel berikut ini, jika data set hanya terdiri dari dua kelas, kelas yang satu dianggap sebagai positif dan yang lainnya negatif.

Klasifikasi Yang

Benar + -

+ True Positive False Positive

- Flase Netral True Netral

Table 1. Confusion Matrix

True positive adalah jumlah record positif yang diklasifikasikan sebagai positif, false positives adalah jumlah record positif yang diklasifikasikan sebagai negatif, false negatives adalah jumlah record negatif yang diklasifikasikan sebagai positif, true negatives adalah jumlah record negatif yang diklasifikasikan sebagai negatif, kemudian masukan data uji [12].

3. Metode Penelitian

Pada penelitian ini terdapat beberapa tahapan metode penelitian, diantaranya dapat dilihat di gambar 1 sebagai berikut :

Gambar 1. Metode Penelitian

(4)

4.1 Identifikasi Masalah

Tahap ini merupakan tahapan awal dari metodologi penelitian untuk menentukan latar belakang dan rumusan masalah serta tujuan dari penelitian ini. Selain itu pada tahap ini juga menentukan batasan-batasan penelitian

4.2 Analisa

3.2.1 Analisa Kebutuhan Data

Analisa kebutuhan data merupakan tahapan untuk menganalisa data masukan yang dikumpulkan dan kemudian akan digunakan pada sebuah penelitan. Pada penelitian ini digunakan dataset sebanyak 900 data yang menggunakan bahasa Indonesia. Analisa kebutuhan data akan membahas mengenai kategori data yang akan digunakan dalam proses analisa serta teknik sampling dalam pengumpulan data

3.2.2 Pelabelan

Setelah mengumpulkan data pada ulasan komentar di Playstore untuk aplikasi Gojek serta menyeleksinya, selanjutnya yaitu memberi label pada seluruh data yang telah terkumpul sesuai dengan kategori atau kelas yang telah ditentukan. Data set tersebut kemudian di bagi menjadi 2 bagian, yaitu data latih dan juga data uji. Terdapat tiga kategori yang akan di tentukan untuk klasifikasi berdasarkan informasi yang di kandung di setiap kalimat yaitu, kategori positif, netral, dan negative.

3.2.3 Text Prepocessing

Tahap ini akan menjelaskan bagaimana proses awal terhahap teks untuk dipersiapkan menjadi data yang akan diolah lebih lanjut. Menurut Triawati tahun 2019 [13],tahapan tersebut adalah:

1. Case Folding

Case Folding merupakan proses pengubahan karakter huruf menjadi seragam sehingga menjadi huruf kecil, juga menghilangkan tanda baca dan angka.

2. Cleaning

Cleaning merupakan proses penghilangan karakter-karakter untuk mengurangi noise pada proses pengklasifikasian. Kata yang perlu dihilangkan seperti username dan mention, dan symbol (@), link, hashtag (#), emoticon maupun symbol (@#$%^&*()+":{}<>?!~/[]) serta angka.

3. Tokenezing

Memisahkan teks menjadi kata, yang dikenal sebagai token. Tokenisassi dilakukan berdasarkan pemisah yaitu karakter angka dan huruf dengan tanda baca dan spasi.

4. Normalisasi

Merupakan proses pengembalian kata-kata yang tidak baku kedalam bahasa baku dalam kamus bahasa Indonesia

5. Filtering

Menghapus kata yang tidak penting atau tidak memiliki ketergantungan pada suatu topic, seperti: kata konjungsi, kata preposisi, dan kata artikel

6. Stemming

Stemming digunakan untuk menghilangkan imbuhan – imbuhan yang ada dalam kata – kata sehingga didapatkan kata dasar [14].

3.2.4 Pembobotan

Pada tahap ini dilakukan proses perubahan token teks menjadi nilai bobot yang berupa numerik. Proses tersebut menggunakan pembobotan TF. Pada tahap ini dilakukan seleksi fitur dari keseluruhan token yang sudah di transformasi dan memiliki bobot TF. Tahap ini penting karena dengan tujuan mengurangi fitur dan memilih fitur-fitur dengan token yang memiliki bobot tertinggi saja agar dapat mewakili keunikan setiap dokumen.

3.2.5 Feature Selection

Setelah melakukan tahap pembobotan , maka akan dilakukan tahap Featur Selection agar data yang digunakan dapat di pangkas sehingga akan menyisakan fitur yang berpengaruh (fitur optimal) saja dan mengesampingkan fitur yang tidak berpengaruh.

3.2.6 Klasifikasi Learning Vector Quantization (LVQ)

Pada tahap ini kita melakukan klasifikasi menggunakan algoritma Learning Vector Quantization (LVQ), dengan metode LVQ Data testing akan di cocokkan dengan data training berdasarkan bobot yang di dapat dari hasil pola pembelajaran. Setelah dilakukannya semua langkah-langkah, akan didapat hasil klasifikasi berupa kelas positif,negatif dan netral terhadap objek yang di teliti.

4.3 Pengujian Confusion Matrix

Setelah di lakukan perancangan sistem, langkah selanjutnya adalah melakukan pengujian terhadap sistem pada penelitian ini. Tahap ini menandakan bahwa aplikasi yang dirancang siap untuk digunakan pada keadaan yang sebenarnya, sehingga akan diketahui apakah aplikasi sudah berjalan dengan tujuan yang diinginkan atau

(5)

belum.

4. Hasil dan Pembahasan

Setelah melakukan proses-proses di atas, selanjutnya akan dijabarkan hasil dan pembahasan dari penelitian ini. Antara lain sebagai berikut :

4.4 Analisa Kebutuhan Data

Dari banyaknya review pada aplikasi Gojek, akan di pilih dataset sebanyak 900 data review yang menggunakan bahasa Indonesia. Data yang di dapatkan, selanjutnya akan diberi label positif, negatif, dan netral oleh responder. Perbadingan dataset yang digunakan yaitu 80% dan 20% dari tiap masing – masing data latih dan data uji. Dapat dilihat pada tabel 2 berikut

Data Latih 720 (80%)

Data Uji 180 (20%)

Jumlah 900

Table 2. Pembagian Data Set

Contoh dari data komentar dari aplikasi Gojek pada PlayStore yang telah di beri label dapat di lihat pada tabel 4.2 sebagai berikut :

No Data Label

1

Terimakasih, promo gofood nya selalu ada... jadi selalu bisa makan enak dan murah... cara pembayaran nya juga fleksibel... bisa gopay dan cash dan paylater...

Positif

2 Cara ngecek saldo gopay, dan melakukan penarikan via pulsa gemana?? Netral

3

Pelayanan amat sangat buruk di saat cuaca hujan, sya pelanggan setia gojek amat sangat kecewa, karena selalu dan selalu klo pas kondisi hujan nggak dapat driver,

Negatif

Table 3. Contoh Data Komentar 4.5 Text Prepocessing

1. Case Folding

No Case Folding Label

1 terimakasih, promo gofood nya selalu ada... jadi selalu bisa makan enak dan murah... cara pembayaran nya juga fleksibel...

bisa gopay dan cash dan paylater...

Positif

2 cara ngecek saldo gopay, dan melakukan penarikan via pulsa gemana??

Netral 3 pelayanan amat sangat buruk di saat cuaca hujan, saya pelanggan

setia gojek amat sangat kecewa, karena selalu dan selalu klo pas kondisi hujan nggak dapat driver,

Negatif

Table 4. Case Folding 2. Cleaning

No Cleaning Label

1 terimakasih promo gofoodnya selalu ada jadi selalu bisa makan enak dan murah cara pembayarannya juga fleksibel bisa gopay dan cash dan paylater

Positif

2 cara ngecek saldo gopay dan melakukan penarikan via pulsa gemana Netral 3 pelayanan amat sangat buruk di saat cuaca hujan saya pelanggan setia

gojek amat sangat kecewa karena selalu dan selalu kalo pas kondisi hujan nggak dapat driver

Negatif

Table 5. Cleaning 3. Tokenezing

(6)

Data Tokenezing

1 “[‘terimakasih’, ‘promo’, ‘gofoodnya’, ‘selalu’, ‘ada’, ‘jadi’, ‘selalu’, ‘bisa’, ‘makan’,

‘enak’, ‘dan’, ‘murah’, ‘cara’, ‘pembayarannya’, ‘juga’, ‘bisa’, ‘gopay, ‘dan’, ‘cash’,

‘dan’, ‘paylater’]”

2 “[‘cara’, ‘ngecek’, ‘saldo’, ‘gopay’, ‘dan’, ‘melakukan’, ‘penarikan’, ‘via’, ‘pulsa’,

‘gemana’]”

3 “[‘pelayanan’, ‘amat’, ‘sangat’, ‘buruk’, ‘di’, ‘saat’, ‘cuaca’, ‘hujan’, ‘saya’,

‘pelanggan’, ‘setia’, ‘sangat’, ‘kecewa’, ‘karena’, ‘selalu’, ‘dan’, ‘selalu’, ‘kalo’,

‘ketika’, ‘kondisi’, ‘hujan’, ‘tidak’, ‘dapat’]”

Table 6. Tokenezing 4. Normalisasi

Data Normalisasi

1 “[‘terimakasih’, ‘promo’, ‘gofoodnya’, ‘selalu’, ‘ada’, ‘jadi’, ‘selalu’, ‘bsia’, ‘makan’,

‘enak’, ‘dan’, ‘murah’, ‘cara’, ‘pembayarannya’, ‘juga’, ‘fleksibel’, ‘bisa’, ‘gopay’,

‘dan’, cash‘, ‘dan’, ‘paylater’]”

2 “[‘cara’, ‘memeriksa’, ‘saldo’, ‘gopay’, ‘dan’, ‘melakukan’, ‘penarikan’, ‘via’, ‘pulsa’,

‘bagaimana’]”

3 “[‘pelayanan’, ‘sangat’, ‘sangat’, ‘buruk’, ‘di’, ‘saat’, ‘cuaca’, ‘hujan’, ‘saya’,

‘pelanggan’, ‘setia’, ‘gojek’, ‘sangat’, ‘sangat’, ‘kecewa’, ‘karena’, ‘selalu’, ‘dan’,

‘selalu’, ‘kalau’, ‘saat’, ‘kondisi’, ‘hujan’, ‘tidak’, ‘dapat’, ‘driver’]”

Table 7. Normalisasi 5. Filtering

Data Filtering

1 “[‘terimakasih’, ‘promo’, ‘gofoodnya’, ‘selalu’, ‘ada’, ‘selalu’, ‘bisa’, ‘makan’,

‘enak’, ‘murah’, ‘cara’, ‘pembayarannya’, ‘fleksibel’, ‘bisa’, ‘gopay’, ‘paylater’]”

2 “[‘cara’, ‘memeriksa’, ‘saldo’, ‘gopay’, ‘melakukan’, ‘penarikan’, ‘via’, ‘pulsa’,

‘bagaimana’]”

3 “[‘pelayanan’, ‘sangat’, ‘sangat’, ‘buruk’, ‘saat’, ‘cuaca’, ‘hujan’, ‘saya’,

‘pelanggan’, ‘setia’, ‘gojek’, ‘sangat’, ‘sangat’, ‘kecewa’, ‘selalu’, ‘selalu’, ‘saat’,

‘kondisi’, ‘hujan’, ‘tidak’, ‘dapat’, ‘driver’]”

Table 8. Filtering 6. Stemming

Data Stemming

1 ‘[terimakasih ‘, ‘promo’, ‘’gofood” , ‘selalu’, ‘ada’, ‘selalu’, ‘bisa’, ‘makan’, ‘enak’,

‘murah’, ‘cara’, ‘bayar’, ‘fleksibel’, ‘bisa’, ‘gopay’, ‘paylater’] ‘’

2 “[‘cara’, ‘periksa’, ‘saldo’, ‘gopay’, ‘laku’, ‘tarik’, ‘via’, ‘pulsa’, ‘bagaimana’]”

3 “[‘layan’, ‘sangat’, ‘sangat’, ‘buruk’, ‘saat’, ‘cuaca’, ‘hujan’, ‘saya’, ‘langgan’, ‘setia’,

‘gojek’, ‘sangat’, ‘sangat’, ‘kecewa’, ‘selalu’, ‘selalu’, ‘saat’, ‘kondisi’, ‘hujan’, ‘tidak’,

‘dapat’]”

Table 9. Stemming 4.6 Pembobotan

Pembobotan adalah proses merubah kata menjadi bentuk angka. Penelitian ini menggunakan pembobotan tf (term frequency), yaitu menghitung jumlah kemunculan suatu kata/term dalam dokumen.

TF

No ` Kata D1 D2 D3 DF 1 terimakasih 1 0 0 1

2 promo 1 0 0 1

3 gofood 1 0 0 1

4 selalu 2 0 2 4

5 Ada 1 0 0 1

6 Bisa 2 0 0 2

7 makan 1 0 0 1

8 enak 1 0 0 1

(7)

9 murah 1 0 0 1

10 Cara 1 1 0 2

11 bayar 1 0 0 1

12 gopay 1 1 0 2

13 paylater 1 0 0 1

14 periksa 0 1 0 1

15 saldo 0 1 0 1

16 laku 0 1 0 1

17 tarik 0 1 0 1

18 Via 0 1 0 1

19 Pulsa 0 1 0 1

20 Bagaimana 0 1 0 1

21 layan 0 0 1 1

22 sangat 0 0 4 4

23 buruk 0 0 1 1

24 Saat 0 0 2 2

25 Cuaca 0 0 1 1

26 Hujan 0 0 2 2

27 Saya 0 0 1 1

28 Langgan 0 0 1 1

29 Setia 0 0 1 1

30 Gojek 0 0 1 1

31 Kecewa 0 0 1 1

32 Kondisi 0 0 1 1

33 Tidak 0 0 1 1

34 Dapat 0 0 1 1

35 driver 0 0 1 1

Table 10. Pembobotan TF (Term Frequency)

Setelah dilakukan pembobotan, maka langkah berikutnya adalah melakukan Feature Selection, yaitu pemilihan fitur dari seluruhan token yang sudah di preprocessing dan telah memiliki bobot TF (term frequency). Proses ini di lakukan dengan metode pruning nilai DF ≥ 2. Pada tabel 11 adalah hasil feature selection dari pembobotan kata sebelumnya.

Feature Selection

A1 selalu

A2 sangat

A3 bisa

A4 gopay

A5 cara

A6 saat

A7 hujan

Table 11. Feature Selection 4.7 Klasifikasi Learning Vector Quantization (LVQ)

Langkah-langkah dari metode Leraning Vector Quantization yaitu [15] : 1. Siapkan data learning rate (α), x (m,n) dan target T (1,n)

2. Inisialisasi bobot (W), maksimum epoch (Max Epoch), error minimum yang di harapkan (Eps), dan learning rate (α). Max Epoch dan α digunakan untuk menentukan batas ambang komputasi

3. Selama (epoch<MaxEpoch) atau (α>eps), lakukan proses sebagai berikut : a. Epoch = epoch + 1

b. Kerjakan untuk i = 1, 2, 3, ..., n

1. Tentukan j sedemikian hingga ||X-Wj|| minimum dengan menggunakan perhitungan rumus jarak ecludian distance.

Dj = √∑(𝑋𝑖 − 𝑊𝑗)² 2. Perbaiki Wj dengan ketentuan :

a. Jika T = Cj maka :

Wj(baru) = Wj(lama) + α (X-Wj(lama)) b. Jika T ≠ Cj maka :

Wj(baru) = Wj(lama) – α (X-Wj(lama))

(8)

c. Kurangi nilai learning rate (α) α = α – Decα

4. Kembali ke langkah 3, jika (epoch<maxEpoch) atau (α>eps) tidak terpenuhi.

Keterangan yang digunakan adalah sebagai berikut : x : Vektor pelatihan (input) (x1,...,xi,...,xn) T : Target kelas untuk vektor pelatihan

Wj : bobot vektor untuk unit output ke-j (w1j,....,wij,...,wnj) Cj : kategori atau kelas yang ditampilkan oleh unit output

||x - wj|| : jarak Euclidean antara vektor input dan bobot vektor untuk layer output ke-j Setelah dilakukan pelatihan, maka diperoleh nilai bobot akhir (W). Nilai bobot tersebut akan digunakan untuk melakukan klasifikasi terhadap data uji.

4.8 Pengujian Confusion Matrix

Pada tahap pengujian Confusion Matrix ini akan di uji dengan perbandingan 90:10, 80:20, dan juga 70:30.

Dapat di lihat pada tabel 12 di bawah ini :

No Perbandingan Jumlah Data Training

Jumlah Data Testing

Akurasi

1 70 : 30 630 270 71,11%

2 80 : 20 720 180 83,33%

3 90 : 10 810 90 84,44%

Table 12. Hasil Akurasi 3 Perbandingan

1. Hasil yang di dapat dari percobaan pertama dengan perbandingan 70 :30 menggunakan algoritma Learning Vector Quantization (LVQ) dan dengan jumlah data sebanyak 270 data ulasan adalah 71%. Hasil dari confusion matrix dapat dilihat pada tabel 13 dibawah ini :

Kelas Positif Netral Negatif

Positif 101 64 0

Netral 0 62 0

Negatif 0 14 29

Tabel 13. Tabel Confusion Matrix Perbandingan 70 :30 Perhitungan akurasi :

𝑇𝑃 + 𝑇𝑁𝑅 + 𝑇𝑁

𝑇𝑃 + 𝑇𝑁𝑅 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁𝑅 + 𝐹𝑁 101 + 62 + 29

101 + 62 + 29 + (64 + 0) + (0 + 0) + (0 + 14) = 192 270 𝑥 100

= 71,1%

2. Percobaan yang kedua menggunakan perbandingan 80 : 20 dengan jumlah data 180 data ulasan dan di dapat akurasi sebesar 83,33% , hasil pengujiannya dapat dilihat pada tabel 14 berikut :

Positif 94 21 0

Netral 0 40 0

Negatif 0 9 16

𝑇𝑃 + 𝑇𝑁𝑅 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁𝑅 + 𝐹𝑁

(9)

94 + 40 + 16

94 + 40 + 16 + (21 + 0) + (0 + 0) + (0 + 9) = 150 180 𝑥 100

= 83,33%

3. Percobaan ketiga menggunakan perbandingan 90 : 10 dengan jumlah data sebanyak 90 data ulasan dan di dapatkan niilai akurasi sebesar 76%, hasiil pengujiannya sebagai berikut dapat dilihat di tabel 15 berikut :

Positif 44 9 0

Netral 0 25 0

Negatif 0 5 7

𝑇𝑃 + 𝑇𝑁𝑅 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁𝑅 + 𝐹𝑁 44 + 25 + 7

44 + 25 + 7 + (9 + 0) + (0 + 0) + (0 + 5) =76 90 𝑥 100

= 84,44%

5. Kesimpulan

Setelah dilakukan penelitian ini dengan menggunakan algoritma Learning Vector Quantization (LVQ) di dapatkan kesimpulan sebagai berikut :

1. Metode Learning Vector Quantization (LVQ) dapat digunakan dalam klasifikasi data ulasan aplikasi gojek pada playstore .

2. Pada pengujian yang dilakukan dengan menggunakan 3 perbandingan yaitu 70:30, 80:20, dan 90:10, di dapatkan hasil bahwa nilai akurasi terbaik terdapat pada perbandingan 90 : 10, yakni dengan akurasi sebesar 84,44%.

3. Dari analisa yang telah dilakukan terhadap data ulasan aplikasi gojek, didapatkan hasil bahwa terdapat banyak ulasan yang bernilai positif

Daftar Pustaka

[1] I. P. Windasari, F. N. Uzi, and K. I. Satoto, “Analisis sentimen di Twitter Posts : Analisis Opini positif atau negatif pada GoJek,” pp. 18–19, 2017.

[2] M. Alfi, “Analisis Sentimen Berdasarkan Knowledge Pattern Dan Learning Vector Quantization,” p. 79, 2019.

[3] N. Huda, “Klasifikasi Berita Menggunakan Metode Learning Vector Quantization,” p. 107, 2020.

[4] R. Y. Yanis, “Sentiment Analysis of Bpjs Kesehatan Services To Smk Eklesia and Bina Insani Jailolo Teachers,” J. Terap. Teknol. Inf., vol. 2, no. 2, pp. 25–34, 2018.

[5] A. D. Faishol Nurhuda, Sari Widya Sihwi, “Analisis Sentimen Masyarakat terhadap Calon Presiden Indonesia 2014 berdasarkan Opini dari Twitter Menggunakan Metode Naive Bayes Classifier,” J.

ITSMART, vol. Vol 2. No, p. 42, 2013.

[6] M. H. Ch, Text Mining. 2006.

[7] N. R. S. Purba and F. Riandari, “Implementasi Data Mining Menggunakan Algoritma Apriori Untuk Analisis Keranjang Belanja Transaksi Penjualan Pada PT Madu Kembang Joyo,” J. Nas. Komputasi dan Teknol. Inf., vol. 4, no. 1, 2021.

[8] J. S. Ronen Feldman, THE TEXT MINING HANDBOOK. 2007.

[9] B. R. T. Enda Esyudha Pratama, “Klasifikasi Topik Keluhan Pelanggan Berdasarkan Tweet dengan Menggunakan Penggabungan Feature Hasil Ekstraksi pada Metode Support Vector Machine (SVM)No Title,” Edukasi dan Penelit. Inform., p. 8, 2015.

[10] J. E. S. Nesi Syafitri, “Sistem Klasifikasi Jamur Dengan Algoritma Iterative Dichotomiser 3,” IT J. Res.

Dev., p. 11, 2016.

(10)

[11] A. Agustina, S. Suwarno, and U. Proboyekti, “Pengenalan Aksara Jawamenggunakan Learning Vector Quantization (Lvq),” Inform. J. Teknol. Komput. dan Inform., no. 1, 2011.

[12] M. A. Amelia Mustika, “PENERAPAN METODE SUPPORT VECTOR MACHINE DALAM KLASIFIKASI SENTIMEN TWEET PUBLIC FIGUR,” Sentra, 2015.

[13] Darma Juang, “ANALISIS SPAM DENGAN MENGGUNAKAN NAÏVE BAYES,” J. Teknovasi, 2016.

[14] L. F. Narulita, “Pengaruh Proses Stemming Pada Kinerja Analisa Sentimen Pada Review Buku,”

GARUDA.

[15] B. FARADILLA, “ANALISIS SENTIMEN TERHADAP APLIKASI TRAVELOKA MENGGUNAKAN METODE LEARNING VECTOR QUANTIZATION (LVQ) BERDASARKAN ULASAN DI GOOGLE PLAY STORE,” 2019.