• Tidak ada hasil yang ditemukan

III. METODE PENELITIAN

4. RAM: 8 GB

3.3 Alur Kerja Penelitian

Penelitian ini akan melakukan beberapa tahapan seperti studi literatur, pembuatan model, perancangan sistem, dan pengujian sistem. Alur penelitian tersebut dapat dilihat pada Gambar 8.

37

Gambar 8. Alur Kerja Penelitian.

3.3.1 Studi Literatur

Pada tahap proses studi literatur akan dilakukan pengumpulanidata yang akan digunakan dalam penelitian. Data yang diperoleh berasal dari berbagai macam sumber portal berita online, kemudian akan dipilih dan disesuaikan dengan berita yang dibutuhkan untuk diolah.

3.3.2 Pembuatan Model

Dalam pembuatan model pada penelitian ini diperlukan beberapa tahapan yaitu:

3.3.2.1 Pengumpulan Data

Proses pengumpulan data, dilakukan dengan menggunakan metode web scraping pada portal berita online. Web Scraping biasa juga disebut dengan Ekstraksi Data Web, yaitu teknik yang digunakan dalam mengekstrak sejumlah data yang besar dari sebuah situs website yang dimana data akan diekstraksi dan kemudian

disimpan ke dalam file lokal komputer atau ke dalam database dalam bentuk table spreadsheet. Adapun langkah untuk mendapatkan data yaitu diperlukan metode web scraping pada portal berita. Teknik web scraping digunakan untuk

mendapatkan informasi dari sebuah website berupa data yang besar, nantinya akan diekstrak dan disimpan ke dalam file lokal komputer.

Web scraping berfokus untuk mendapatkan data dengan cara pengambilan dan ekstraksi. Adapun proses scrapping yaitu:

1) Melakukan impor fungsi get() dari request module.

2) Menetapkan alamat halaman website menjadi variabel url.

3) Request the server yaitu melakukan permintaan HTTP isi yang terdapat pada halaman website dengan menggunakan fungsi get(), kemudian menyimpannya respon server kedalam sebuah variable response.

4) Menyimpan data konten halaman website yang telah diambil dan diubah menjadi data yang terstruktur dalam data frame berbentuk .txt.

3.3.2.2 Preprocessing Data

Pada tahapan preprocessing ini akan melakukan tokenisasi kata kemudian dilakukan pemberian fitur pada kata untuk mendapatkan vektor kata. Beberapa tahapan preprocessing akan dilakukan pada dataset yang diperoleh yaitu:

39

1. Tagging

Tagging digunakan untuk memperoleh data training yang lebih baik dan meningkatkan kualitas pada training data. Tagging digunakan untuk memberikan pelabelan pada setiap kata, yang dimana setiap kata kemudian akan digunakan untuk menentukan kata-kata yang memiliki entitas nama, tanggal, hari, lokasi, penyakit, produk_pertanian, musim, organisasi, harga.

Proses tagging dilakukan menggunakan bantuan dari website

https://tecoholic.github.io/ner-annotator/ untuk mempermudah proses pelabelan pada data berita. Setiap token yang sesuai pada dokumen bidang pertanian dilakukan secara manual dianotasi menjadi sembilan kelas menggunakan label yang disajikan pada Tabel 3.

Tabel 3. Anotasi Pelabelan Dokumen.

Entity Deskripsi

Nama_orang Menunjukkan Nama Yang Tertera Atau Tertulis Di Dalam Halaman Web Berita.

Tanggal Menunjukkan Tanggal Dipublikasikannya Sebuah Berita Pada Halaman Web Serta Tanggal Yang Tertera Pada Isi Berita.

Hari Menunjukkan Hari Dipublikasikannya Sebuah Berita Pada Halaman Web Serta Hari Yang Tertera Pada Isi Berita.

Lokasi Menunjukkan Lokasi Dipublikasikannya Sebuah Berita Pada Halaman Web Serta Hari Yang Tertera Pada Isi Berita.

Penyakit Menunjukkan Jenis Penyakit,Wabah, Dan Hama Yang Tertera Pada Halaman Web.

Produk Pertanian

Menunjukkan hasil dari pertanian yang tertera pada halaman web.

2. Pembagian data menjadi training set dan testing set

Proses splitting yang dilakukan pada data yang telah di preprocessing akan dibagi ke dalam dua bagian yaitu training set 60%, testing set 40% dan training set 70%, testing set 30%.

3.3.2.3 Pelatihan Data

Pada tahapan ini, menjelaskan tahapan pada saat melakukan training pada data model Named Entity Recognition Bahasa Indonesia yang telah dibuat. Tahapan Musim Menunjukkan Kondisi Cuaca Ataupun Musim Yang Ada Pada

Isi Berita

Organisasi Menunjukkan Nama Sebuah Organisasi Yang Tertera Pada Isi Berita.

Harga Menunjukkan nominal harga yang tertera pada text berita.

training melakukan kompilasi model yang telah dibuat dengan cara menentukan loss function dan optimizer menggunakan hyperparameter yang akan digunakan dalam tahapan training. Dalam melakukan pelatihan data menggunakan dua skenario yang diterapkan pada data untuk menentukan skenario yang

menghasilkan nilai lebih besar berdasarkan hyperparameter yang ditentukan dari batchsize, epoch, dan learning rate. Skenario yang dilakukan pada penilitian ini dapat dilihat pada Tabel 4.

Tabel 4. Skenario pengujian data.

Skenario Pembagian Data hyperparameter

epoch batchsize Learning rate 1 Training set 70%

Testing set 30%

100 1000 0.001

2 50 256 0.0001

3 50 128 0.001

4 Training set 60%

Testing set 40%

100 1000 0.001

5 50 256 0.0001

6 50 128 0.001

3.3.2.4 Evaluasi Model

Untuk mengukur performa dari Model Named Entity Recognition menggunakan fungsi yang telah disediakan oleh spaCy yaitu evaluate yang dapat menghitung skor evaluasi dari model, yang memiliki tiga kriteria umum, untuk mengetahui skor evaluasi digunakan perhitungan nilai ents_p(precision) yaitu menghitung persentase tingkat akurasiiantara data yang diminta dengan hasil prediksi yang diberikan oleh model, ents_r(recall) yaitu menghitung persentase keberhasilan dari model, ents_f(F-score) merupakan fungsi dari tingkat keseimbangan antara precision dan recall. Berikut persamaan yang digunakan untuk menghitung hasil evaluasi dari precision, recall, F-score.

Precision = 𝑇𝑃

𝑇𝑃+𝐹𝑃

Recall = 𝑇𝑃

𝑇𝑃+𝐹𝑁

𝑓1 𝑠𝑐𝑜𝑟𝑒 = 2 × recall × presisi recall + presisi

TP (True Positif) = Jumlah prediksi dimana pengklasifikasian dilakukan dengan benar memprediksi kelas positif sebagai positif.

FP (False Positif) = Jumlah prediksi dimana pengklasifikasian salah memprediksi kelas negatif sebagai positif.

41

FN (False Negative) = Jumlah Prediksi dimana pengklasifikasian salah memprediksi kelas positif sebagai negatif.

3.3.3 Perencanaan Sistem

Tahapan perencanaan sistem dilakukan untuk menganalisis masalah pada sistemi yang ingin dibuat dan mengetahui kebutuhan yang diperlukan oleh pengguna.

Perencanaan sistem dilakukan dengan cara menganalisis penelitian terdahulu, untukimengetahui kebutuhan apa saja yang diperlukan pada sistem.

3.3.4 Perancangan Sistem

Perancangan sistem dilakukan sesuai dengan kesepakatan yang telah disetujui terkait kebutuhan sistem. Perancangan sistem akan menggambarkan tahapan kerja sistem dan siapa saja yang akan menggunakan sistem. Diagram Use case

digunakan untuk memberikan gambaran secara ringkas terkait pengguna sistem ini nantinya dan proses apa saja yang dapat dilakukan di dalam sistem. Berikut ini merupakan desain diagram sistem dan desain antarmuka sistem.

Dokumen terkait