Studi Literatur Sejenis - LANDASAN TEORI - Skripsi. Oleh : Muhammad Haris Al Farisi PROGRAM STU

BAB 2 LANDASAN TEORI

2.17 Studi Literatur Sejenis

Peneliti ( Tahun Penelitian )

Gregorius Agung Purwanto Nugroho (2016)

Setyo Budi (2017) Prananda Antinasari, dkk (2017) Christian Rosandhy (2017) Penelitian Penulis Sekarang

Judul Penelitian

Analisis Sentimen Data Twitter Menggunakan K-Means Clustering

Text Mining Untuk Analisis Sentimen Review Film Menggunakan K-Means Clustering

Analisis Sentimen Tentang Opini Film Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Naive Bayes Dengan Perbaikan Kata Tidak Baku

Sistem Analisis Sentimen Pada Komentar Evaluasi Dosen di SION STIKOM Bali Menggunakan Gabungan Metode Means dan K-Nearest Neighbor

Analisis Sentimen Tentang Kebijakan Pemerintah Sistem Zonasi Sekolah dari Kemendikbud dengan Menggunakan Algoritma K-Means Clustering dan Algoritma Levensthein Data yang

diambil sentimennya

Hasil pencarian twitter dengan mengghunakan hastag #cinta, #sedih,

Hasil Pencarian twitter berbahasa Indonesia

Komentar Evaluasi Dosen di SION STIKOM Bali

Facebook Page Resmi Kemendikbud RI dan Youtube CNN Indonesia

Algoritma atau Metode yang

digunakan

Algoritma K-Means Algoritma K-Means Algoritma Naïve Bayes Algoritma K-Means Algoritma K-Means

Nilai k k =5

(cinta, sedih, senang, marah, dan takut)

- - k = 2

(positif dan negatif)

k = 2

(positif dan negatif)

Tools /

digunakan dengan total tweets yaitu 1000 tweets

data latih dan 50 data uji)

Stemming Algoritma Nazief dan Adriani

Porter - Algoritma Nazief dan Adriani Algoritma Nazief dan Adriani

Pembobotan Algoritma (TF-IDF) Algoritma (TF-IDF) - Algoritma (TF-IDF) Algoritma (TF-IDF)

Normalisasi kata

- - Normalisasi Algoritma

Levensthein

- Normalisasi Algoritma

Levensthein Tahap

Pengujian

Pengujian dilakukan 1 kali dengan 1000 tweets Hasilnya berupa sentimen Positif, Negatif, dan Netral

Pengujian dilakukan 1 kali

Hasilnya berupa sentimen Positif dan Negatif

Pengujian dilakukan 3x yaitu dengan menggunakan pre-proccesing tanpa menggunakan perbaikan kata baku, menggunakan perbaikan kata baku tanpa menggunakan pre-processing, dan menggunakan keduanya

Hasilnya berupa akurasi setiap tahap.

Hasilnya berupa akurasi dari penggunaan Algoritma K-Means

Pengujian dilakukan 2 kali dengan menggunakan Algoritma K-Means dan kombinasi Algoritma K-Means dan Algoritma Levensthein

Adapun perbedaan antara peneliti saat ini dengan peneliti sebelumnya yaitu :

1. Peneliti melakukan penelitian tentang analisis sentimen masyarakat terhadap kebijakan pemerintah sistem zonasi sekolah dari Kemendikbud.

dari peneliti sebelumnya.

3. Peneliti melakukan 2x percobaan dalam tahap pengujian yaitu tahap pengujian menggunakan algoritma k-means saja dan tahap pengujian menggunakan kombinasi aloritma k-means dan algoritma levensthein distance

BAB 3

METODOLOGI PENELITIAN

3.1 Metode Pengumpulan Data

Pada penelitian ini penulis mengumpulkan data dan informasi sebagai penunjang kebutuhan dalam proses pembuatan sistem ini menggunakan studi lapangan dan studi pustaka.

3.2.1 Studi Lapangan 1. Teknik Observasi

Peneliti melakukan observasi atau pengamatan secara langsung dan mengambil data dari bulan Juni 2018 – Agustus 2018 melalui YouTube API dan Facebook secara manual yaitu komentar masyarakat mengenai kebijakan pemerintah tentang Zonasi Sekolah dari Facebook Page Kemendikbud RI dan Channel YouTube CNN Indonesia. Didapat data sebanyak 200 komentar. Setelah mendapatkan data, peneliti melakukan pelabelan sentimen secara manual mengguanakan 150 data secara random sebagai data latih. Pada saat pelabelan peneliti dibantu oleh 4 orang mahasiswa lulusan S1 agar data tidak subjektif.

2. Teknik Wawancara

Peneliti melakukan wawancara pada tanggal 24 Oktober 2018 di Kemendikbud RI kepada 2 pihak dari Kemendikbud RI-nya langsung secara bersamaan yaitu ibu Any Sayekti selaku kepala bagian hokum, tatalaksana, dan kepegawaian dan ibu Sopha Julia selaku pegawai pada bagian tersebut.

3.2.2 Studi Pustaka

Proses pengumpulan data-data akurat dengan cara mengumpulkan literatur-literatur sejenis dari berbagai buku, jurnal

dan skripsi yang berkaitan dengan permasalahan yang dibahas oleh peneliti.

3.2 Metode Simulasi

Metode simulasi ini digunakan untuk melihat hasil sentimen masyarakat dari objek yang diteliti yaitu kebjikan pemerintah tentang zonasi sekolah dengan menggunakan algoritma k-means clustering dan algoritma levenshtein distance sebagai normalisasi kata menjadi kata baku.

Pada metode simulasi ini meliputi beberapa langkah atau tahap yang akan dilakukan yaitu:

3.2.1 Formulasi Masalah (Problem Formulation)

Tahap formulasi masalah merupakan langkah awal dalam perancangan pada model motode simulasi. Formulasi masalah merupakan suatu kegiatan untuk melakukan identifikasi masalah berdasarkan hasil penelitian sebelumnya (pada tabel 2.). Dalam tahap formulasi masalah ini peneliti merumuskan sebuah masalah yaitu mengimplementasikan kombinasi algoritma k-means clustering dan algoritma levenshtein distance dalam proses penentuan sentimen masyarakat terhadap kebijakan pemerintah tentang zonasi sekolah. Pada penelitian-penelitian sebelumnya yaitu penelitian dari (Nugroho, 2016), (Budi, 2017), dan (Rosandhy, 2017), belum ada yang mengkombinasikan antara algoritma k-means clustering dan algoritma levensthein distance sebagai algorimta pendukung untuk normalisasi kata baku. Adapun yang mengimplementasikan kombinasi dengan algoritma levensthein distance yaitu penelitian dari (Antinasari et al., 2017), pada penelitiannya peneliti mengkobinasikan algoritma naïve bayes dan algoritma levensthein distance.

3.2.2 Model Pengkonsepan (Conceptual Model)

Pada tahapan ini peneliti membuat model konsep yang akan dilakukan yaitu membahas keseluruhan penelitian ini. Konsep

pertama membuat konsep pada proses text mining yang ingin digunakan. Kedua, dengan mengidentifikasikan input pada penelitian ini, yaitu komentar-komentar masyarakat terkait kebijakan zonasi sekolah dari channel youtube CNN Indonesia dan facebook page Kemendikbud, kemudian komentar yang telah dikumpulkan kemudian diolah dan diproses dengan secara manual untuk pelabelan terhadap data latih. Ketiga, membuat konsep untuk tahap uji pada skenario 1 yaitu dengan melihat hasil sentimen dan tingkat akurasi menggunakan algoritma K-Means saja. Keempat, tahap uji pada skenario 2 yaitu melihat hasil sentimen dan tingkat akurasi menggunakan kombinasi algoritma K-Means dan dibantu algoritma Levensthein Distance sebagai normalisasi kata pada tahap pre-processing.

3.2.3 Data Masukan/Keluaran (Input/Output Data)

Data masukan seperti kamus kata dasar, kamus stopword, kamus untuk levensthein, dan data komentar yang didapat dari Youtube API dan Facebook API dijadikan input pada penelitian ini dalam aplikasi berbasis PHP. Data yang diambil sebanyak 200 komentar. Data terdiri dari 150 komentar dijadikan data latih dan 50 komentar dijadikan data uji. Data pada aplikasi ini diolah menggunakan algoritma K-Means dan algoritma Levensthein Distance untuk menghasilkan output berupa hasil sentimen akhir dan tingkat akurasi dari skenario 1 dan skenario 2.

3.2.4 Pemodelan (Modelling)

Pada tahapan ini peneliti menentukan model skenario yang akan digunakan. Pada tahap ini penulis melakukan pemodelan dalam membuat rancangan sistem yang akan dibuat secara manual.

Pemodelan atau skenario yang dibuat yaitu skenario kombinasi antara algoritma K-Means dan algoritma Levensthein Distance dan

skenario tanpa menggunakan algoritma Levensthein Distance (hanya menggunakan algoritma K-Means saja).

3.2.5 Simulasi (Simulation)

Pada tahapan ini, sisem akan dijalankan untuk mensimulasikan kinerja masing-masing algoritma sesuai dengan konsep dan skenario yang telah ditentukan sebelumnya. Simulasi yang akan dilakukan adalah dengan melakukan input dataset latih dan uji, melakukan pelabelan terhadap data latih secara manual untuk dikelompokkan sentimennya, melakukan pelatihan terhadap data latih dan melakukan clustering data uji. Hasil simulasi berupa perbandingan akurasi dari algoritma yang dijadikan penelitian, kemudian akan dicatat dan kemudian dilakukan tahap verifikasi.

3.2.6 Verifikasi dan Validasi (Verification and Validation)

Pada tahapan ini peneliti melakukan verifikasi dan validasi dari tahapa sebelumnya. Pada tahap verifikasi dilakukan untuk memastikan adanya kesalahan atau tidak yang terjadi dalam beberapa tahapan atau proses simulasi. Sedangkan tahapan validasi dilakukan untuk memastikan kesesuaian proses simulasi yang dibuat berdasarkaan model pengkonsepan dengan formulasi masalah yang dibuat.

Pada intinya, verifikasi dan validasi bertujuan untuk menyakinkan hasil dari aplikasi sentimen ini sesuai dengan yang dikonsepkan sebelumnya.

3.2.7 Eksperimentasi (Experimentation)

Pada tahapan ini peneliti melakukan eksperimen sesuai dengan model skenario yang dibuat pada saat tahap pemodelan.

Eksperimen disini bertujuan untuk mengevaluasi hasil simulasi aplikasi.

3.2.8 Analisis Keluaran (Output Analysis)

Tahapan analisis keluaran adalah tahapan simulasi yang paling terakhir. Peneliti melakukan analisa terhadap output-output berdasarkan skenario yang sudah dilakukan yaitu menghitung tingkat akurasi dari algoritma yang dijadikan penelitian.

3.3 Kerangka Berfikir

Berfikir merupakan suatu alur diagram yang menjelaskan proses berjalannya sebuah penelitian. Dalam penelitian ini, penulis mengacu pada alur penelitian sebagai berikut:

Mulai

Gambar 3.1 Kerangka Berfikir

40 UIN Syarif Hidayatullah Jakarta

BAB 4

IMPLEMENTASI, SIMULASI, DAN EKSPERIMEN

4.1 Formulasi Masalah (Problem Formulation)

Pada tahap awal dimetode simulasi ini yaitu formulasi masalah, penulis melakukan identifikasi masalah berdasarkan hasi penelitian sebelumnya. Alhasil pada penelitian ini, penulis memformulasikan masalah penelitian pada kombinasi algoritma k-means dan algoritma normalisasi kata yaitu levensthein distance untuk dilakukan kombinasi terhadap kedua algoritma tersebut. Dengan hasil akhirnya yaitu sentiment masyarakat terhadap kebijakan pemerintah tentang sistem zonasi sekolah dan tingkat akurasi dari algoritma tersebut.

Data yang digunakan pada penelitian ini adalah komentar berbahasa Indonesia tentang kebijakan pemerintah yaitu sistem zonasi sekolah yang diambil dari channel YouTube dan Facebook page.

4.2 Model Pengkonsepan (Conceptual Model)

Pada tahap pemodelan konsep ini berkaitan dengan eksekusi dari sistem yang peneliti bangun, dari mulai masukan, proses, dan keluaran sistem tersebut. Berdasarkan tahap conceptual model pada sub bab 3.2.2, berikut ini merupakan alur keseluruhan dari sistem yang dibagun oleh peneliti.

4.2.1 Conceptual Model Pada Text Mining

Dalam penelitian saat ini, pemodelan pada text mining berkaitan dengan tahapan processing teks. Tahapan pre-processing dilakukan dengan membuat fungsi sendiri dalam pengkodean menggunakan bahasa pemrograman PHP. Pre-processing ini dilakukan dengan tujuan:

1. Menghilangkan kata-kata yang mengganggu proses sentimen, seperti url atau link, hastag pada komentar, angka-angka, maupun tanda baca.

2. Menyeragamkan bentuk kata menjadi kata dasar sesuai dengan KBBI.

3. Mengurangi kata yang tidak digunakan atau tidak berpengaruh terhadap penentuan sentimen, seperti aku, kamu, dia, kita, dll.

Adapun tambahan proses yang dilakukan pada penelitian ini sekaligus pembeda dari penelitian yang sebelum-sebelumnya di tahapan pre-processing ini yaitu proses normalisasi kata menggunakan algoritma levensthein distance, berikut tahap-tahap pre-processing pada penelitian saati ini meliputi proses-proses seperti yang digambarkan pada flow di bawah ini:

Teks

dokumen Case folding Tokenization Normalisasi

kata

Stopword removal Stemming

Gambar 4.1 Flowchart Tahapan Pre-Processing

Berikut penjelasan dari tahapan pre-processing :

1. Tahap awal di pre-processing yaitu proses case folding atau merubah semua kata menjadi huruf kecil semua.

Mulai

Teks dokumen

Proses case folding

Hasil case folding

Selesai

Gambar 4.2 Flowchart Case Folding

2. Tahap ketiga yaitu melakukan proses tokenization, atau proses pemecahan suatu kalimat menjadi kata-kata.

Mulai

Hasil case folding

Proses Tokenization

Hasil Tokenization

Selesai

Gambar 4.3 Flowchart Tokenization

3. Proses selanjutnya yaitu melakukan proses menormalisasikan sebuah kata yang salah atau typo menggunakan algoritma levensthein distance dengan cara menghapus kata yang berlebih, menambah kata yang kurang, dan mengganti kata yang tidak sesuai.

Mulai

Hasil Tokenization

Membandingkan kata pada data awal

dengan database levensthein

Database levensthein

Kata awal != database levensthein

Menghitung matriks denan jarak terkecil antar huruf menggunakan

rumus levensthein distance:

d[i,j-1]+1 d[i-1,j]+1 d[i-1,j-1]+1

Hasil proses levensthein distance Menampilkan kata sugesti dengan jarak

terkecil

Menampilkan kata awal

Selesai Ya

Tidak

Gambar 4.4 Flowchart Levensthein Distance

4. Selanjutnya melaukan proses stopword removal atau proses penghapusan kata-kata yang dianggap tidak penting, seperti dia, aku, kamu, pada, dan lainnya.

Mulai

Hasil Levensthein

Distance

Membandingkan kata dengan kamus

stopword

Kamus Stopword

Kata = kamus stopword

Hapus Kata

Kata awal

Selesai Hasil stopword

Tidak

Gambar 4.5 Flowchart Stopword Removal

5. Tahap terakhir di pre-processing yaitu proses stemming atau merubah kata-kata imbuhan menjadi kata dasar sesuai KBBI menggunalan algoritma Nazief dan Adriani.

Mulai

Hasil stopword atau

kata awal

Membandingkan kata awal dengan kamus kata dasar

KBBI

Kata == kamus kbbi

Menghilangkan kata inflectional suffixes (“-lah”, “-kah”, “-ku”,

“-mu”, “-nya”)

Menghilangkan kata derivational suffixes (i”,

“-an”, “-kan”)

Menghilangkan kata derivational prefix (“di-”, “ke-”, “se-”, “te-”,

“be-”, “me-“, “pe-“)

Kata == kamus KBBI

Kata awal

Selesai

Kata dasar Kamus

KBBI

Tidak

Gambar 4.6 Flowchart Stemming Algoritma Nazief dan Adriani

4.2.2 Conceptual Model Sentimen Pada Data Latih

Konsep penentuan sentimen data latih pada penelitian ini dilakukan secara manual. Setelah diberikan sentimen pada setiap

dokumen data latih, akan dilakukan proses pre-processing. Untuk lebih jelasnya lagi, alur pada data latih ini sebagai berikut:

Teks

dokumen Case folding Tokenization Normalisasi

kata

Stopword removal Stemming

Indexing Pemberian

sentimen

Gambar 4.7 Flowchart penentuan sentimen data latih

Berikut contoh dari setiap proses saat melakukan penentuan sentimen pada data latih:

Teks dokumen:

KEBRSIHAN sebagian dari IMAN !!!

1. Pemberian sentiment

Pada konsep data latih ini, pemberian sentimen akan diberikan secara manual dari setiap dokumen yang dijadikan data latih tersebut. Dimana sentimen yang akan dianalisis pada penelitan ini hanya sentiment positif dan sentiment negatif. Pada contoh ini penulis memberikan sentiment positif.

2. Case folding

Tabel 4.1 Contoh Proses Case Folding

Teks dokumen Proses case folding KEBRSIHAN sebagian dari

IMAN !!!

kebrsihan sebagian dari iman !!!

3. Tokenization

Tabel 4.2 Contoh Proses Tokenization

Hasil filtering Proses tokenization

kebrsihan sebagian dari iman

4. Normalisasi kata (menggunakan algoritma levensthein distance)

Tabel 4.3 Contoh Proses Normalisasi Kata

Hasil tokenization Proses normalisasi

| kebersihan | sebagian | dari

| iman | 5. Stopword removal

Tabel 4.4 Contoh Proses Stopword Removal

Hasil normalisasi Proses stopword removal

| kebersihan | iman |

6. Stemming

Tabel 4.5 Contoh Proses Stemming

Hasil stopword removal Proses stemming

Pada tahap ini, dilakukan proses pengindeksan pada hasil pre-processing dan sentiment dari setiap dokumen. Pada inverted index akan tersimpan informasi berupa id dokumen, komentar, hasil pre-processing dan hasil sentimen.

4.2.3 Conceptual Model Sentimen dengan Algoritma K-Means Skenario pertama pada penelitian ini secara alur dari analisa sentimen dengan menggunakan algoritma k-means tanpa bantuan algoritma levensthein distance sebagai algoritma normalisasi kata dapat dijelaskan pada gambar dibawah ini:

Mulai

Data yang ingin di uji

Proses pre-processing

Proses pencocokan index data uji dengan

data latih

Proses pembobotan TF-IDF

Index data latih

Proses K-Means

Hasil Sentimen

k-means

Selesai Proses pelabelan sentimen manual

Hasil sentimen

manual

Proses pre-processing Hitung Akurasi dengan

Confusion Matrix

Hasil Akurasi

Gambar 4.8 Flowchart Proses Sentimen Skenario 1

Berikut penjelasan dari setiap proses saat melakukan penentuan sentimen menggunakan k-means:

1. Mengumpulkan data yang ingin di uji

2. Melakukan proses pre-processing tanpa bantuan algoritma levensthein distance sebagai algoritma normalisasi kata pada data uji

3. Hasil index dari pre-processing pada data uji, dicari yang cocok atau yang sama pada index data latih. Kemudian ambil kalimat yang terdapat index yang cocok atau sama itu untuk ke tahap selanjutnya.

4. Lakukan pembobotan kata pada index yang ada pada kalimat yang sudah diambil ditahap sebelumnya dan data ujinya menggunakan algoritma tf-idf dan diambil nilai total weightingnya untuk diproses ditahap selanjutnya.

5. Dari nilai total weighting yang sudah didapat dari proses tf-idf akan diproses menggunakan algoritma k-means untuk menentukan sentimennya. Alur dari algoritma k-means dapat digambarkan seperti berikut:

Mulai

Jumlah k cluster

Menentukan centroid awal dai setiap cluster

Hitung jarak objek ke centroid menggunakan rumus Euclidean Distance

Membagi data berdasarkan kedekatan dengan centroid (jarak terkecil)

Tidak ada data yang berubah

Selesai

Memperbaharui nilai centroid dengan menghitung rata-rata setiap cluster

Tidak

Gambar 4.9 Flowchart Proses Algoritma K-Means

Penjelasan untuk alur algoritma k-means sudah dijelaskan pada sub-bab 2.8.2.

Setelah melakukan proses diatas, cari di cluster manakah data ujinya berada. Setelah ditemukan, hiraukan cluster yang lainnya. Kemudian kita lihat sentiment apakah yang paling banyak pada cluster tersebut. Dan itulah hasil sentimen yang diambil.

6. Menentukan pelabelan sentimen secara manual terhadap data uji sebagai perbandingan pada tahap akhir nanti.

7. Hitung akurasi dari perbandingan yang sudah dilakukan sebelumnya antara sentimen yang dihasilkan dari algoritma k-means dan sentimen dari pelabelan manual menggunakan rumus confusion matrix. Kalau sentimen yang dihasilkan keduanya sama maka akurasinya baik, dan sebaliknya kalau sentimen yang dihasilkan keduanya berbeda maka akurasi tidak baik.

8. Mendapatkan nilai akurasi dari scenario pertama.

4.2.4 Conceptual Model Sentimen Algoritma K-Means dengan Bantuan Algoritma Levensthein Distance

Skenario kedua pada penelitian ini secara alur dari analisa sentimen dengan menggunakan algoritma k-means dan bantuan algoritma levensthein distance sebagai algoritma normalisasi kata dapat dijelaskan pada gambar dibawah ini:

Mulai index data uji dengan

data latih Hitung Akurasi dengan

Confusion Matrix

Hasil Akurasi

Gambar 4.10 Flowchart Proses Sentimen Skenario 2

Berikut penjelasan dari setiap proses saat melakukan penentuan sentimen menggunakan k-means dan levensthein distance:

1. Mengumpulkan data yang ingin di uji

2. Melakukan proses pre-processing dengan bantuan algoritma levensthein distance sebagai algoritma normalisasi kata pada data uji

4. Lakukan pembobotan kata pada index yang ada pada kalimat yang sudah diambil ditahap sebelumnya dan data ujinya

menggunakan algoritma tf-idf dan diambil nilai total weightingnya untuk diproses ditahap selanjutnya.

5. Dari nilai total weighting yang sudah didapat dari proses tf-idf akan diproses menggunakan algoritma k-means untuk menentukan sentimennya. Setelah melakukan proses k-means, cari di cluster manakah data ujinya berada. Setelah ditemukan, hiraukan cluster yang lainnya. Kemudian kita lihat sentiment apakah yang paling banyak pada cluster tersebut. Dan itulah hasil sentimen yang kita ambil.

6. Menentukan pelabelan sentimen secara manual terhadap data uji sebagai perbandingan pada tahap akhir nanti.

8. Mendapatkan nilai akurasi dari scenario kedua.

4.3 Data Masukan/Keluaran (Input / Output Data)

Pada penelitian ini data yang diperoleh sebagai data input yaitu komentar-komentar masyarakat terhadap kebijakan pemerintah tentang zonasi sekolah pada peraturan PPDB yaitu sebanyak 200 data yang diambil dari komentar posting channel YouTube CNN Indonesia dan komentar posting Facebook page Kemendikbud RI. Dimana proses pengambilan data ini dinamakan dengan teknik crawling. Pada pengambilan data dari channel Youtube peneliti memanfaatkan yang namanya YouTube API dan dari Facebook peneliti mengambilnya secara manual. Selain data-data komentar yang dikumpulkan pada penelitian ini yaitu kamus kata dasar KBBI, stopwords, dan kamus levensthein.

Hasi atau output yang didapatkan dari penelitian ini yaitu sentimen akhir dari suatu komentar dan hasil akurasi pada skenario pertama dan kedua.

4.4 Pemodelan (Modelling)

Dalam modelling phase atau fase pemodelan pada penelitian ini, dilakukan pemodelan konstruksi analisis sentimen dengan menggunakan algoritma k-means saja dan kombinasi algoritma k-means dan algoritma levensthein distance sebagai algoritma normalisasi kata. Berikut ini dapat dilihat pemodelan-pemodelan tersebut secara lengkap.

4.4.1 Konstruksi Sentimen dengan Algoritma K-Means

Konstruksi menggunakan algoritma k-means dalam menentukan sentimen ini merupakan salah satu skenario di dalam penelitian saat ini. Dimana dalam penentuan sentimen menggunakan algoritma k-means membutuhkan proses penunjang lainnya agar hasilnya lebih maksimal. Secara keseluruhan konstruksi analisa sentimen menggunakan algoritma k-means dapat dijelaskan dibawah ini (konsep diambil dari sub-bab 4.2.3 dan dapat dilihat pada gambar 4.8):

1. Pelatihan data latih

Proses dan contoh dalam pelatihan data latih (konsep diambil dari sub-bab 4.2.2 dan dapat dilihat pada gambar 4.7):

a. Mengumpulkan dokumen yang didapat dari kumpulan komentar yang sudah dicrawling sebelumnya. Sebagai contoh digunakan 8 dokumen sebagai data latih.

Tabel 4.6 Dokumen data latih

No. Komentar

1. Kemendikbut cerdas mari sikapi kebijakan zonasi PPDB dengan bijak dan pemerintah dlm hal ini kemendikbud

juga harus siap mengatasi kendala mengenai sistem zonasi tersebut

2. Tujuannya baik, tp pelaksanaannya sangat rumit, spt daerah kami, sekolah2 banyak yg belum sesuai dgn 8 SNP, oleh sebab itu Kemendikbud dan Pemerintah daerah hrs berani membuat terobosan jgn sekedar wacana 3. Sistim zonasi tidak efektif...kasian rumahnya yg agak

jauh...akhirnya mereka dengan berat hati masukin anaknya ke sekolah swasta yg serba bayar

4. InshaaAllah mutu seluruh sekolah di Indonesia bisa sama baik negeri maupun swasta . . itulah salah satu maksud dan tujuannya

5. Seharusnya mendikbut kaji dulu dilapangan sebelum menerapkan sisten zonasi. Faktanya banyak sekolah yg sarana dan prasarananya sangat2 minim terutama ruang kelas yg tidak memadai, akhirnya PBM pun berjalan semrawut

6. Zonasi demi keadilan sebenarnya tidak adil.

7. selama sarana prasarana dan sdm masih belum merata di tiap sekolah, sistem zonasi gak guna.

8. Sistim zonasi mngecewakan bnyak phak...kpingin sekola yg lbih dekat ja g bsa msuk zonasi

b. Memberikan sentimen secara manual setiap dokumennya

Tabel 4.7 Penentuan sentimen data latih

No.

Komentar Sentimen

Kemendikbut cerdas mari sikapi kebijakan zonasi PPDB dengan bijak dan pemerintah dlm hal ini kemendikbud juga

Positif

harus siap mengatasi kendala mengenai sistem zonasi tersebut

Tujuannya baik, tp pelaksanaannya sangat

Dalam dokumen Skripsi. Oleh : Muhammad Haris Al Farisi PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH (Halaman 47-0)