BAB IV. HASIL DAN PEMBAHASAN
4.4. Modelling
Modelling merupakan fase pemilihan teknik mining dengan menentukan algoritma yang akan digunakan dalam mengolah data. Sedangkan tools yang digunakan adalah KNIMEversi 4.1.2. Hasil pengujian model yang dilakukan adalah mengklasifikasikan data reviewdengan menggunakan algoritma SVM, KNN dan Naive Bayes dengan menggunakan model Partitioning dan Cross Validation. Berikut adalah desain model pengolahan data review aplikasi tik-tok dengan menggunakan KNIME:
Sumber: hasil penelitian
Gambar 4.3. Model Penelitian pengolahan data review aplikasi tik-tok
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri
Berdasarkan Gambar 4.3. Merupakan model penelitian yang di buat untuk pengolahan data review dari pengguna aplikasi tik-tok yang ada di playstore, dari data yang ada penulis mencoba menggunakan algoritma KNN, SVM dan NB untuk menentukan hasil accuracy dan ROC. Pada tahap dalam penelitian ini di awali dengan excel reader, string to document, pre-processing, document vector, category to class, column filter, cross validation, partitioning, SVM learner, naive bayes learner, SVM predictor, naive bayes predictor, K-Nearest Neighbor, scoring dan ROC curve. Berikut adalah tahap modelling dalam penelitian ini:
1. Read Data Excel
Permodelan awal menggunakan excel reader sebagai media untuk membaca file dataset yang terdiri ulasan positif dan ulasan negatif , data yang dibaca dalam bentuk excel yang terdiri dari dua kolom yaitu kolom komentar dan label negatif dan positif
Sumber: hasil penelitian
Gambar 4.4 Hasil Output tabel Read Data Excel
2. String To Document
Pada tahap string to Document adalah untuk mengonversi string yang di tentukan ke dokumen. Setelah tahap pembacaan dataset yang kemudian di dalam proses Node String To Document proses selanjutnya adalah tahap preprocessing.
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian
Gambar 4.5. Hasil Output tabel String to document
3. Preprocessing
. Pada preprocessing ini dokumen secara keseluruhan di seragamkan mulai dari menfilter notasi (@), hastag (#), tanda baca (. , ?) serta tanda baca lainya, menfilter kata yang kurang dari N karakter, menyeragamkan dokumen menjadi huruf kecil semua atau huruf besar, tokenisasi serta pembobotan term TF-IDF.
Sumber: hasil penelitian
Gambar 4.6.Hasil Output preprocessing
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri
4. Document Vector
Setelah tahap Preprocessing tahap selanjutnya adalah tahap node Documen Vector digunakan untuk mengubah tipe data pada kolom yang telah difilter menjadi dokumen.
Sumber: hasil penelitian
Gambar 4.7. Hasil Output Document Vector
5. Categori To Class
Selanjutnya proses node Category To Class, Proses ini digunakan untuk menentukan kelas yang digunakan sebagai label atau kategori adalah postif dan negatif, kelas ini nantinya akan menunjukkan hasil klasifikasi dari tiap-tiap algoritma yang digunakan dalam penelitian ini.
Sumber: hasil penelitian
Gambar 4.8. Hasil Output Category To Class
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri
6. Column Filter
Selanjutnya adalah proses node column Filter digunakan untuk menfilter data yang ada antara data training dan data testing.
Sumber: hasil penelitian
Gambar 4.9. Hasil Output dari column Filter 7. Partitioning
Metode evaluation yang digunakan adalah partitioning dimana metode ini membagi dataset secara otomatis menjadi data training dan data testing.
Sumber: hasil penelitian
Gambar 4.10. Hasil Output First Partition
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian
Gambar 4.11. Hasil Output Secon Partition
8. Cross Validation
Model evaluation yang digunakan selanjutnya adalah cross validation yang membagi menjadi 9 kali data training dan 1 kali data testing.
Sumber: hasil penelitian
Gambar 4.12. Hasil Output X-Partitioning data training
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian
Gambar 4.13. Hasil Output X-Partitioning data testing
Pada node SVM learner dan naive bayes learner berfungsi sebagai penghubung untuk menggunakan algoritma predictor yaitu SVM predictor dan naive bayes predictor sebagai penentu klasifikasi. Pada node K-Nearest Neighbour merupakan salah satu algoritma yang digunakakan untuk mengklasifikasikan data yang akan menghasilkan nilai akurasi yang diperoleh.
Sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.
4.4.1 Desain Model Partitioning
Berikut adalah desain model menggunakan partitioning dengan proses pengujian menggunakan metode SVM, KNN, dan NB yang di gunakan dengan KNIME sebagi berikut:
Sumber: hasil penelitian
Gambar 4.14. Model Partitioning
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri
1. Model Partitioning dengan metode SVM
Berikut ini desain proses pengujian model partitioning SVM yang di gunakan menggunakan KNIME
Sumber: hasil penelitian
Gambar 4.15 Desain Model Proses SVM
BerdasarkanGambar 4.15.dapat di lihat desain proses di dalam model Partitioning dengan menggunakan metode SVM . Pada pengujian ini data yang digunakan adalah data bersih yang telah melalui proses preprocessing. Pada node SVM learner berfungsi sebagai penghubung untuk menggunakan algoritma predictor yaitu SVM predictor sebagai penentu klasifikasi. Nilai akurasi dapat dilihat dari scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.
2. Model Partitioning dengan metode Naive Bayes
Berikut ini desain proses pengujian model Partitioning NB yang di gunakan menggunakan KNIME
Sumber: hasil penelitian
Gambar 4.16. Desain Model Proses NB
Gambar 4.16menunjukan desain proses di dalam model Partitioning dengan menggunakan metode SVM . Pada pengujian ini data yang digunakan adalah data bersih yang telah melalui proses preprocessing. Pada node naive
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri
bayes learner berfungsi sebagai penghubung untuk menggunakan algoritma predictor yaitu naive bayes predictor sebagai penentu klasifikasi. Nilai akurasi dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.
3. Model Partitioning dengan metode KNN
Berikut ini desain proses pengujian model Partitioning KNN yang di gunakan menggunakan KNIME
Sumber: hasil penelitian
Gambar 4.17. Desain Model Proses KNN
Gambar 4.17.menunjukan desain proses di dalam model Partitioning dengan menggunakan metode KNN. Pada pengujian ini data yang digunakan adalah data bersih yang telah melalui proses preprocessing. Pada node K-Nearest Neighbour merupakan salah satu algoritma yang digunakakan untuk mengklasifikasikan data yang akan menghasilkan nilai akurasi yang diperoleh.
Sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.
4.4.2. Desain Model Cross Validation
Berikut adalah desain model menggunakan Cross Validation dengan proses pengujian menggunakan metode SVM, KNN, dan NB yang di gunakan dengan KNIME sebagi berikut:
1. Model Cross Validation dengan metode SVM
Berikut ini desain proses pengujian model Cross Validation SVM yang di gunakan menggunakan KNIME
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian
Gambar 4.18. Desain Model Proses SVM
Gambar 4.18. menunjukan desain proses di dalam model Cross Validation dengan menggunakan metode SVM. Pada proses cross validation ini melakukan 10 kali iterasi yaitu dengan melakukan 9 kali data training dan 1 kali data testing.
Nilai accuracy, precicion dan recall dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.
2. Model Cross Validation dengan metode NB
Berikut ini desain proses pengujian model Cross ValidationNB yang di gunakan menggunakan KNIME
Sumber: hasil penelitian
Gambar 4.19. Desain Model Proses NB
Gambar 4.19. menunjukan desain proses di dalam model Cross Validationdengan menggunakan metode NB. Pada proses cross validation ini melakukan 10 kali iterasi yaitu dengan melakukan 9 kali data training dan 1 kali data testing. Nilai accuracy, precicion dan recall dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.
Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri
3. Model Cross Validation dengan metode KNN
Berikut ini desain proses pengujian model Cross Validation KNN yang di gunakan menggunakan KNIME
Sumber: hasil penelitian
Gambar 4.20. Desain Model Proses KNN
Gambar 4.20. menunjukan desain proses di dalam model Cross Validation dengan menggunakan metode KNN. Pada proses cross validation ini melakukan 10 kali iterasi yaitu dengan melakukan 9 kali data training dan 1 kali data testing.
Nilai accuracy, precicion dan recall dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.