BAB IV HASIL PENELITIAN DAN PEMBAHASAN
1. Support Vector Machine (SVM)
2.2 Tinjauan Studi
2.2.1 Penelitian Terkait
Penelitian terdahulu sangatlah penting sebagai kajian untuk mengetahui keterkaitan antara penelitian terdahulu dengan penelitian yang akan di lakukan, untuk menghindari terjadinya tindakan duplikasi. Tujuan dari tinjauan studi ini adalah untuk menunjukkan bahwa penelitian ini sangat bermanfaat dan mempunyai arti penting sehingga dapat diketahui kotribusi penelitian terhadap ilmu pengetahuan. Berikut beberapa ulasan tentang penelitian-penelitian terdahulu yang pernah dilakukan sebelumnya berkenaan dengan data dan metode yang digunakan.
Beberapa jurnal dan penelitian yang jadikan sebagai acuan adalah sebagai berikut.
1. Penelitian pertama dilakukan oleh Fatmawati, Muhammad Affandes yang membahas tentang Klasifikasi Keluhan Menggunakan Metode Support Vector Machine (SVM) (Studi Kasus : Akun Facebook Group iRaise Helpdesk), Facebook Group iRaise Helpdesk merupakan salah satu layanan media sosial yang digunakan pihak PTIPD UIN Suska Riau sebagai layanan pelanggan (customer services) sistem akademik. Mengingat sistem akademik baru
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri mengalami peralihan yang sebelumnya bernama SIMAK menjadi iRaise, sehingga masih ada permasalahan yang ditimbulkan, dan menjadi keluhan bagi penggunanya. Untuk pengolahan data keluhan, pihak PTIPD masih menggunakan proses manual dengan menggunakan microsoft word dan excel.
Sehingga pada penelitian ini akan dilakukan pengklasifikasian permasalahan sistem iRaise pada kategori multiclass yaitu: login, krs, nilai dan personal.
Dengan menggunakan metode Support Vector Machine (SVM) dengan kernel RBF. Jumlah dataset sebanyak 1040 data keluhan. Pengujian dilakukan menggunakan aplikasi RapidMiner dan diuji dengan menggunakan 10-Fold cross validation dan diukur dengan confussion matrix. Dari hasil uji coba aplikasi menunjukkan akurasi tertinggi sebesar 95.67% pengujian tanpa menggunakan feature selection pada titik C=2 dan 𝜸 = 0.09(Fatmawati &
Affandes , 2017)
2. Penelitian kedua dilakukan oleh I Komang Dharmendra, Komang Oka Saputra, Nyoman Pramaita mengenai Analisa Sentiment Untuk Opini Alumni Pada Perguruan Tinggi, Opini merupakan salah satu bagian terpenting dalam pengambilan keputusan, dalam pengolahan opini memerlukan proses analisa yang menyeluruh. Penelitian ini melakukan pengelompokan opini dari alumni Perguruan Tinggi dengan menggunakan algoritma SVM dan NBC dimana dalam penelitian ini dibagi menjadi 3 komponen utama yaitu komponen input, sistem pengelompokan opini, serta komponen output. Opini yang akan diolah merupakan data berupa file opini format *.csv, yang selanjutnya melakukan proses pengelompokan terhadap opini. Kemudian sistem menghasilkan output berupa 3 jenis opini yaitu, opini positif, opini netral dan opini negative. Dari hasil pengujian secara umum menunjukkan akurasi dengan nilai akurasi tertinggi pada algoritma NBC mencapai 94,45%, sedangkan tingkat akurasi tertinggi pada algoritma SVM mencapai 75,76% (Dharmendra et al., 2019)
3. Penelitian ketiga dilakukan oleh Hilda Rachmi mengenai penerapan principal component analysis dan genetic algorithm pada analisis sentimen review pengiriman barang menggunakan algoritma support vector machine, mempelajari pendapat orang, sentimen, sikap, penilaian, evaluasi, dan emosi
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri terhadap entitas seperti produk, layanan, kejadian, organisasi, individu, isu, topik dan atribut. Masalah dalam penelitian ini adalah pemilihan fitur untuk meningkatkan akurasi Support Vector Machine dan menemukan nilai parameter untuk mendapatkan akurasi tertinggi dalam analisis sentimen tinjauan terhadap pengiriman barang serta menghasilkan klasifikasi hasil negatif dan positif dari tinjau dengan tepat Penulis menggunakan Principal Component Analysis dan Genetic Algorithm sebagai optimasi untuk meningkatkan akurasi metode Support Vector Machine. Keakuratan yang dihasilkan dari algoritma Support Vector Machine sebesar 86.00%, setelah dioptimalkan dengan menggunakan Principal Component Analysis dan Genetic Algorithm accuracy telah meningkat menjadi 98,33% (Rachmi & Hilda, 2017).
4. Penelitian keempat dilakukan oleh Annisya Aprilia Prasanti, M. Ali Fauzi, M.
Tanzil Furqon, dalam penelitian ini menganalisis data Sambat Online merupakan fasilitas yang berfungsi untuk menampung saran, kritik, keluhan atau pertanyaan dari masyarakat, Dalam penelitian ini, sistem klasifikasi pengaduan otomatis menggunakan Neighbor Weighted K-Nearest Neighbor (NW-KNN) diangkat karena Sambat Online memiliki data yang tidak seimbang. Sistem yang dikembangkan terdiri dari tiga fase utama termasuk preprocessing, ekstraksi fitur N-Gram, dan klasifikasi menggunakan NWKNN. Berdasarkan hasil percobaan, dapat dilanjutkan bahwa algoritma NW-KNN mampu mengklasifikasikan data yang tidak seimbang dengan baik dengan nilai k-tetangga paling optimal adalah 3 dan unigram sebagai fitur terbaik dengan presisi 77,85%, 77,18% penarikan kembali, dan 75,25% nilai f-ukur. Dibandingkan dengan KNN konvensional, algoritma NW-KNN juga terbukti lebih baik untuk masalah data yang tidak seimbang dengan perbedaan yang sangat sedikit (Annisya Aprilia Prasanti, M.
Ali Fauzi, M. Tanzil Furqon, 2018)
5. Penelitian kelima dilakukan oleh Yonghe, Lu Minghui, Liang Zeyuan, YeLichao, Cao mengenai Particle Swarm Optimization (PSO) menyeleksi fitur dan menggunakan metode KNN dalam pengklasifikasian teks. Teks preprocessing menggunakan Analyzer standar di Lucene 3.0. Dataset dari Corpus Reuters-21578. Fitur dataset tersebut kemudian diolah dengan PSO
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri melakukan 6 percobaan yaitu Fixed inertia weight, Improved inertia weight, Fixed constriction factor, Improved constriction factor, Improved synchronously inertia weight and constrictionfactor. Improved asynchronously inertia weight and constriction factor. Hasil eksperimen tersebut menunjukan akurasi dapat stabil saat percobaan ke 6. Evaluasi pada penelitian ini menggeunakan Convergence Curve dan MacF1. Setelah itu dilakukan uji signifikan
menggunakan T-test dan pada percobaan ke 6 terjadi perbedaan yang signifikan dengan nilai akurasi sebesar 80.64%. (Yonghe, Lu Minghui, Liang Zeyuan, YeLichao,)
6. Penelitian keenam dilakukan oleh Kang, HanhoonYoo, Seong JoonHan, Dongil dalam penelitian ini mengusulkan senti-lexicon baru untuk analisis sentimen restoran. Ketika mengklasifikasi review dokumen sebagai sentimen positif dan negatif sentimen yang menggunakan learning algorithm , ada kecendrungan untuk akurasi klasifikasi positif muncul kira-kira 10% lebih tinggi dari akurasi klasifikasi negatif. Ini menciptakan penurunan akurasi rata-rata ketika akurasi dua kelas dinyatakan sebagai nilai rata-rata. Oleh karena itu diusulkan peningkatan Naïve Bayes algorithm. Hasil dari percobaan menunjukan bahwa unigram + bigrams digunakan sebagai fitur, dapat mempersempit kesenjangan akurasi. Ketika SVM digunakan kesenjangan maksimum kesenjangan mencapai 5.6% dibandingkan Naiv Bayes maksimum 1.9%.(oleh Kang, HanhoonYoo, Seong JoonHan, Dongil, 2012).
7. Penelitian selanjutnya dilakukan oleh Enda Esyudha Pratama, Bambang Riyanto Trilaksono. Penelitian ini menganalisis data keluhan customer Speedy di twitter pada akun @TelkomSpeedy. Kelas yang digunakan dalam penelitian kali ini berdasarkan topik keluhan pelanggan yaitu billing, pemasangan/instalasi, putus (disconnect), dan lambat. Faktor penting lainnya dalam hal klasifikasi adalah penentuan feature atau atribut kata yang akan digunakan. Metode feature selection yang digunakan pada penlitian ini adalah term frequency (TF), document frequency (DF), information gain, dan chi-square. Pada penelitian ini juga dilakukan metode penggabungan feature yang telah dihasilkan dari beberapa metode feature selection sebelumnya. Dari hasil penelitian
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri menunjukan bahwa SVM mampu melakukan klasifikasi keluhan dengan baik, hal ini dibuktikan dengan akurasi 82,50% untuk klasifikasi bentuk keluhan dan 86,67% untuk klasifikasi jenis keluhan. Sedangkan untuk kombinasi penggunaan feature dapat meningkatkan akurasi menjadi 83,33% untuk bentuk keluhan dan 89,17% untuk jenis keluhan (Pratama & Trilaksono, 2015).
Ketujuh penelitian diatas dirangkum dalam tabel berikut:
Tabel II.2.3 Penelitian Terkait
Judul Penelitian Text Processing
Feature
Selection Classifier Accuracy Klasifikasi
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri 2.2.2 Kerangka Konsep Penelitian
Penelitian dilakukan dengan menggunakan algoritma k-nearest neighbor dan support vector machine untuk pengklasifikasian. Hasil dari pengklasifikasian algoritma k-nearest neighbor dan support vector machine tersebut akan dibandingkan dan dicari nilai akurasi mana yang terbaik sehingga akan mendapatkan nilai akurasi yang lebih baik. Data diambil dari database sisfo akademik mahasiswa dari tabel komplain email mahasiswa. Data di ambil sebanyak 8699 data, data yang didapat dari database sisfo akademik, maka dilakukan proses yang dinamakan cleaning data. Hal ini dilakukan guna menghapus duplicate data maupun yang tidak bisa digunakan dalam penelitian ini. Setelah dilakukan cleaning didapatkan data sebanyak 7304 data yang kemudian membagi statusnya menjadi dua bagian yaitu 3959 complaint dan 3345 not complaint yang di ambil pada tahun 2019. Sebelum data diklasifikasikan, data tersebut akan diproses melalui tahapan preprocessing yaitu transform cases, tokenization, filter token (by lenght), stemming dan. stopwords removal dalam pembobotan yang akan dilakukan menggunakan term frequency invers document frequency (TF-IDF). Pengujian akan dilakukan menggunakan 10 fold cross validation, akurasi algoritma akan di ukur dengan confusion matrix dan hasilnya akan ditampilkan dalam bentuk kurva ROC dan accuracy. Pada tahap ini diusulkan model untuk data komplain mahasiswa dengan menerapkan algoritma k-nearest neighbor k-nn dan algoritma support vector machine svm berikut adalah alur penelitian yang akan dilakukan bisa dilihat dari gambar 2.10. alur penelitian sebagai berikut:
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Gambar 2.9. Kerangka Pemikiran
36
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri METODE PENELITIAN