Modelling - HASIL DAN PEMBAHASAN - ANALISIS SENTIMEN REVIEW APLIKASI TIK-TOK DENGAN ALGORITMA K

BAB IV. HASIL DAN PEMBAHASAN

4.4. Modelling

Modelling merupakan fase pemilihan teknik mining dengan menentukan algoritma yang akan digunakan dalam mengolah data. Sedangkan tools yang digunakan adalah KNIMEversi 4.1.2. Hasil pengujian model yang dilakukan adalah mengklasifikasikan data reviewdengan menggunakan algoritma SVM, KNN dan Naive Bayes dengan menggunakan model Partitioning dan Cross Validation. Berikut adalah desain model pengolahan data review aplikasi tik-tok dengan menggunakan KNIME:

Sumber: hasil penelitian

Gambar 4.3. Model Penelitian pengolahan data review aplikasi tik-tok

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri

Berdasarkan Gambar 4.3. Merupakan model penelitian yang di buat untuk pengolahan data review dari pengguna aplikasi tik-tok yang ada di playstore, dari data yang ada penulis mencoba menggunakan algoritma KNN, SVM dan NB untuk menentukan hasil accuracy dan ROC. Pada tahap dalam penelitian ini di awali dengan excel reader, string to document, pre-processing, document vector, category to class, column filter, cross validation, partitioning, SVM learner, naive bayes learner, SVM predictor, naive bayes predictor, K-Nearest Neighbor, scoring dan ROC curve. Berikut adalah tahap modelling dalam penelitian ini:

1. Read Data Excel

Permodelan awal menggunakan excel reader sebagai media untuk membaca file dataset yang terdiri ulasan positif dan ulasan negatif , data yang dibaca dalam bentuk excel yang terdiri dari dua kolom yaitu kolom komentar dan label negatif dan positif

Sumber: hasil penelitian

Gambar 4.4 Hasil Output tabel Read Data Excel

2. String To Document

Pada tahap string to Document adalah untuk mengonversi string yang di tentukan ke dokumen. Setelah tahap pembacaan dataset yang kemudian di dalam proses Node String To Document proses selanjutnya adalah tahap preprocessing.

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian

Gambar 4.5. Hasil Output tabel String to document

3. Preprocessing

. Pada preprocessing ini dokumen secara keseluruhan di seragamkan mulai dari menfilter notasi (@), hastag (#), tanda baca (. , ?) serta tanda baca lainya, menfilter kata yang kurang dari N karakter, menyeragamkan dokumen menjadi huruf kecil semua atau huruf besar, tokenisasi serta pembobotan term TF-IDF.

Sumber: hasil penelitian

Gambar 4.6.Hasil Output preprocessing

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri

4. Document Vector

Setelah tahap Preprocessing tahap selanjutnya adalah tahap node Documen Vector digunakan untuk mengubah tipe data pada kolom yang telah difilter menjadi dokumen.

Sumber: hasil penelitian

Gambar 4.7. Hasil Output Document Vector

5. Categori To Class

Selanjutnya proses node Category To Class, Proses ini digunakan untuk menentukan kelas yang digunakan sebagai label atau kategori adalah postif dan negatif, kelas ini nantinya akan menunjukkan hasil klasifikasi dari tiap-tiap algoritma yang digunakan dalam penelitian ini.

Sumber: hasil penelitian

Gambar 4.8. Hasil Output Category To Class

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri

6. Column Filter

Selanjutnya adalah proses node column Filter digunakan untuk menfilter data yang ada antara data training dan data testing.

Sumber: hasil penelitian

Gambar 4.9. Hasil Output dari column Filter 7. Partitioning

Metode evaluation yang digunakan adalah partitioning dimana metode ini membagi dataset secara otomatis menjadi data training dan data testing.

Sumber: hasil penelitian

Gambar 4.10. Hasil Output First Partition

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian

Gambar 4.11. Hasil Output Secon Partition

8. Cross Validation

Model evaluation yang digunakan selanjutnya adalah cross validation yang membagi menjadi 9 kali data training dan 1 kali data testing.

Sumber: hasil penelitian

Gambar 4.12. Hasil Output X-Partitioning data training

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian

Gambar 4.13. Hasil Output X-Partitioning data testing

Pada node SVM learner dan naive bayes learner berfungsi sebagai penghubung untuk menggunakan algoritma predictor yaitu SVM predictor dan naive bayes predictor sebagai penentu klasifikasi. Pada node K-Nearest Neighbour merupakan salah satu algoritma yang digunakakan untuk mengklasifikasikan data yang akan menghasilkan nilai akurasi yang diperoleh.

Sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

4.4.1 Desain Model Partitioning

Berikut adalah desain model menggunakan partitioning dengan proses pengujian menggunakan metode SVM, KNN, dan NB yang di gunakan dengan KNIME sebagi berikut:

Sumber: hasil penelitian

Gambar 4.14. Model Partitioning

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri

1. Model Partitioning dengan metode SVM

Berikut ini desain proses pengujian model partitioning SVM yang di gunakan menggunakan KNIME

Sumber: hasil penelitian

Gambar 4.15 Desain Model Proses SVM

BerdasarkanGambar 4.15.dapat di lihat desain proses di dalam model Partitioning dengan menggunakan metode SVM . Pada pengujian ini data yang digunakan adalah data bersih yang telah melalui proses preprocessing. Pada node SVM learner berfungsi sebagai penghubung untuk menggunakan algoritma predictor yaitu SVM predictor sebagai penentu klasifikasi. Nilai akurasi dapat dilihat dari scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

2. Model Partitioning dengan metode Naive Bayes

Berikut ini desain proses pengujian model Partitioning NB yang di gunakan menggunakan KNIME

Sumber: hasil penelitian

Gambar 4.16. Desain Model Proses NB

Gambar 4.16menunjukan desain proses di dalam model Partitioning dengan menggunakan metode SVM . Pada pengujian ini data yang digunakan adalah data bersih yang telah melalui proses preprocessing. Pada node naive

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri

bayes learner berfungsi sebagai penghubung untuk menggunakan algoritma predictor yaitu naive bayes predictor sebagai penentu klasifikasi. Nilai akurasi dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

3. Model Partitioning dengan metode KNN

Berikut ini desain proses pengujian model Partitioning KNN yang di gunakan menggunakan KNIME

Sumber: hasil penelitian

Gambar 4.17. Desain Model Proses KNN

Gambar 4.17.menunjukan desain proses di dalam model Partitioning dengan menggunakan metode KNN. Pada pengujian ini data yang digunakan adalah data bersih yang telah melalui proses preprocessing. Pada node K-Nearest Neighbour merupakan salah satu algoritma yang digunakakan untuk mengklasifikasikan data yang akan menghasilkan nilai akurasi yang diperoleh.

Sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

4.4.2. Desain Model Cross Validation

Berikut adalah desain model menggunakan Cross Validation dengan proses pengujian menggunakan metode SVM, KNN, dan NB yang di gunakan dengan KNIME sebagi berikut:

1. Model Cross Validation dengan metode SVM

Berikut ini desain proses pengujian model Cross Validation SVM yang di gunakan menggunakan KNIME

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri Sumber: hasil penelitian

Gambar 4.18. Desain Model Proses SVM

Gambar 4.18. menunjukan desain proses di dalam model Cross Validation dengan menggunakan metode SVM. Pada proses cross validation ini melakukan 10 kali iterasi yaitu dengan melakukan 9 kali data training dan 1 kali data testing.

Nilai accuracy, precicion dan recall dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

2. Model Cross Validation dengan metode NB

Berikut ini desain proses pengujian model Cross ValidationNB yang di gunakan menggunakan KNIME

Sumber: hasil penelitian

Gambar 4.19. Desain Model Proses NB

Gambar 4.19. menunjukan desain proses di dalam model Cross Validationdengan menggunakan metode NB. Pada proses cross validation ini melakukan 10 kali iterasi yaitu dengan melakukan 9 kali data training dan 1 kali data testing. Nilai accuracy, precicion dan recall dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

Program Studi Ilmu Komputer (S2) STMIK Nusa Mandiri

3. Model Cross Validation dengan metode KNN

Berikut ini desain proses pengujian model Cross Validation KNN yang di gunakan menggunakan KNIME

Sumber: hasil penelitian

Gambar 4.20. Desain Model Proses KNN

Gambar 4.20. menunjukan desain proses di dalam model Cross Validation dengan menggunakan metode KNN. Pada proses cross validation ini melakukan 10 kali iterasi yaitu dengan melakukan 9 kali data training dan 1 kali data testing.

Nilai accuracy, precicion dan recall dapat di lihat pada node scorer, sedangkan ROC untuk menampilkan kurva ROC yang juga menunjukkan nilai AUC.

Dalam dokumen ANALISIS SENTIMEN REVIEW APLIKASI TIK-TOK DENGAN ALGORITMA K-NEAREST NEIGHBOR, NAIVE BAYES DAN SUPPORT VECTOR MACHINE (Halaman 71-81)