ANALISIS DAN PERANCANGAN SISTEM
3.3. Perancangan Sistem
Sistem yang dihasilkan merupakan program identifikasi topik berita berbasis desktop, pada sejumlah artikel berita online yang telah dipilih. Proses perancangan sistem tersusun atas beberapa tahap, yaitu perancangan diagram aktivitas dan perancangan antar muka. Proses perancangan antar muka pada sistem pada penelitian ini dibagi menjadi dua bagian yakni perancangan sistem bagian belakang (back-end) yang ditujukan untuk melakukan kegiatan seperti meng-input daftar index situs berita, mengakses database, dan melakukan proses penghitungan perplexity. Sementara perancangan sistem bagian depan (front-end) ditujukan untuk mengimplementasikan proses back-end dan menjalankan setiap proses pada penelitian ini, serta memvisualisasikan hasil dari proses identifikasi topik berita tersebut.
3.3.1 Diagram Aktifitas
Alur pertukaran informasi antara user, system dan database dapat dilihat dalam diagram aktivitas pada gambar 3.7. Proses identifikasi topik berita dimulai pada saat sistem menampilkan halaman program. Selanjutnya user meng-input artikel berita dari index situs berita. Kemudian sistem melakukan proses data cleaning dan menyimpan hasilnya pada database. Setelah itu, user memilih sejumlah artikel berita dari hasil proses data cleaning yang telah ditampilkan oleh sistem untuk dilakukan proses topic modelling. Setelah proses selesai dilakukan, selanjutnya sistem akan menyimpan hasil pemrosesan tersebut pada database, untuk kemudian ditampilkan pada halaman tampilan. Dan akhirnya user dapat melihat tampilan visualisasi dari hasil proses identifikasi artikel berita tersebut.
User System Database
Gambar 3.7. Diagram Aktivitas Sistem 3.3.2 Perancangan Antarmuka
Pada bagian ini terdapat penjelasan rancangan antar muka yang akan dibuat sebagai sarana untuk menjalankan sistem, dengan tujuan untuk memudahkan user dalam penggunaan sistem secara keseluruhan nantinya. Sistem front-end pada penelitian ini mempresentasikan setiap tahapan pada proses identifikasi topik berita dari sejumlah artikel yang dijadikan data. Hasil dari proses topic modelling yang telah dilakukan akan divisualisasikan ke dalam sebuah grafik yang dapat menampilkan topik-topik apa saya yang muncul dan jumlah representasinya pada setiap dataset,
Menampilkan
26
sehingga akan lebih mudah untuk dipahami. Rancangan ini terdiri dari beberapa bagian tab halaman utama, diantaranya,
- Halaman Source Configuration, untuk menambahkan daftar sumber index berita.
- Halaman Collection & Retrieval, untuk menambahkan koleksi artikel berita ke dalam database.
- Halaman Data Processing (Single & Batch), untuk melakukan input dan pemrosesan terhadap artikel berita, baik secara tunggal atau jamak.
- Halaman Result (Evaluation & Visualization), untuk mengevaluasi dan memvisualisasikan hasil identifikasi topik berita pada setiap datasetnya.
Adapun penjelasan rancangan antar muka yang akan diterapkan tersebut pada sistem adalah sebagai berikut:
Gambar 3.8. Tampilan Halaman Source Configuration
Keterangan dari Gambar 3.8. adalah sebagai berikut :
1) Di setiap halaman tampilan terdapat beberapa menu halaman pada sidebar, terdiri dari halaman home, source configuration, collection & retrieval, data processing, dan result.
2) Pada bagian Source List terdapat daftar website berita online yang dijadikan data pada penelitian ini.
3) Pada bagian Add New Data Source terdapat form untuk mengisi daftar website berita, yang terdiri dari:
▪ Name, untuk menginput nama website yang dipilih.
▪ Index URL, untuk menginput URL dari website index berita yang dipilih.
▪ Category, untuk menginput kategori dari index berita yang dipilih, pada penelitian ini penulis mengkhususkan untuk menginput index berita seputar finasial.
▪ Index Container, untuk menginput sintaks website pada index berita yang dipilih.
▪ Document Container, untuk menginput sintaks content pada website index berita yang dipilih.
▪ Container to Ignore, untuk menginput sintaks lain seperti, foto, video atau slideshow yang terdapat pada bagian content, untuk nantinya tidak dimasukkan sebagai bagian dari data.
4) Tombol Add Source, untuk mengeksekusi proses input daftar index berita yang dipilih.
Gambar 3.9. Tampilan Halaman Collection & Retrieval
28
Keterangan dari Gambar 3.9. adalah sebagai berikut :
1) Di setiap halaman tampilan terdapat beberapa menu halaman pada sidebar, terdiri dari halaman home, source configuration, collection & retrieval, data processing, dan result.
2) Pada bagian Document Collection, terdapat daftar artikel berita yang telah melalui proses data cleaning dan disimpan pada database, Daftar koleksi artikel tersebut terdiri dari URL berita, kategori berita, dan tanggal pada saat artikel tersebut di-input pada sistem.
3) Pada bagian Retrieve Data from URL terdapat form untuk mengisi daftar koleksi artikel berita, yang terdiri dari:
▪ Web Source, terdapat select box yang memuat kategori dan sumber artikel berita yang akan diinput pada sistem.
▪ Doc Date, untuk menginput tanggal artikel berita yang dipilih.
4) Tombol Add Source, untuk mengeksekusi proses input artikel berita yang dipilih.
5) Pada bagian Process Steps, terdapat tampilan uraian proses yang berjalan pada system back-end pada saat menginput artikel berita yang dipilih.
Gambar 3.10. Tampilan Halaman Data Processing
Keterangan dari Gambar 3.10. adalah sebagai berikut :
1) Di setiap halaman tampilan terdapat beberapa menu halaman pada sidebar, terdiri dari halaman home, source configuration, collection & retrieval, data processing, dan result.
2) Pada bagian Select Document, terdapat check box yang memuat daftar artikel berita yang nantinya akan diproses. Daftar artikel ini terdiri dari judul artikel, kategori, dan tanggal artikel.
3) Pada bagian Set Parameter, terdapat form untuk mengisi parameter untuk memproses dataset koleksi artikel berita yang dipilih, yang terdiri dari:
▪ No. of Topics, untuk menginput jumlah topik artikel berita yang dijadikan dataset.
▪ No. of Topic Words, untuk menginput jumlah kata untuk setiap satu topik pada dataset.
▪ No. of Interval, untuk menginput jumlah optimasi hyperparameter pada pemrosesan dataset.
▪ No. of Burn In, untuk menginput jumlah iterasi pada pemrosesan dataset.
▪ Insert Name, untuk menginput nama dataset.
▪ Description, untuk menginput deskripsi dataset.
4) Tombol Create Dataset, untuk mengeksekusi proses input dataset dari koleksi artikel berita yang dipilih.
5) Pada bagian Process Steps, terdapat tampilan uraian proses yang berjalan pada system back-end pada memproses setiap dataset.
Keterangan dari Gambar 3.11 adalah sebagai berikut :
1) Di setiap halaman tampilan terdapat beberapa menu halaman pada sidebar, terdiri dari halaman home, source configuration, collection & retrieval, data processing, dan result.
2) Pada bagian atas terdapat radio button yang memuat sejumlah dataset yang telah diproses dan disimpan pada database, serta tombol Use Dataset untuk mengeksekusi dataset terpilih yang akan dievaluasi.
30
3) Pada bagian Dataset Selected, terdapat tampilan daftar topik yang muncul dari dataset terpilih. Daftar topik tersebut terdiri dari id topik, probabilitas distribusi dan topiknya.
4) Pada bagian kanan bawah terdapat opsi untuk mengevaluasi setiap artikel berita pada dataset.
Gambar 3.11 Tampilan Halaman Evaluation
Gambar 3.12. Tampilan Halaman Visualization
Keterangan dari Gambar 3.12. adalah sebagai berikut :
1) Di setiap halaman tampilan terdapat beberapa menu halaman pada sidebar, terdiri dari halaman home, source configuration, collection & retrieval, data processing, dan result.
2) Pada bagian atas terdapat radio button yang memuat sejumlah dataset yang telah diproses dan disimpan pada database, serta tombol Use Dataset untuk mengeksekusi dataset terpilih yang akan dievaluasi.
3) Pada bagian Accuracy, terdapat grafik pie chart yang berisi informasi kesesuain artikel dengan topik yang dihasilkan.
4) Pada bagian Topic Over Days, terdapat grafik linier yang berisi informasi trend untuk setiap topik yang dihasilkan perharinya.
5) Pada bagian Generated Topics, terdapat tampilan daftar topik yang muncul dari dataset terpilih. Daftar topik tersebut terdiri dari id topik, probabilitas distribusi dan topiknya.
6) Pada bagian Dataset Details, terdapat daftar uraian dari setiap komponen dataset.
3.4. Evaluasi
Proses evaluasi identifikasi artikel berita dengan metode topic modelling dengan menggunakan algoritma Latent Dirichlet Allocation dilakukan dengan menghitung distribusi topik yang dihasilkan pada setiap percobaan,. Bobot distribusi yang mendekati angka 1 adalah distribusi topik yang paling mewakili persebaran topik pada dataset, dan bobot distribusi yang mendekati angka 0 adalah yang paling tidak mewakili persebaran topik pada dataset. Hasil distribusi topik tersebut dijadikan acuan untuk membandingkan kesesuaian artikel pada dataset dengan topik yang dihasilkan.
Proses evaluasi dilakukan dengan beberapa kali percobaan dengan menggunakan jumlah parameter yang berbeda-beda, diantaranya ialah jumlah topik, jumlah kata pada topik, jumlah interval, dan jumlah burn-in/iterasi. Penentuan jumlah topik dan jumlah kata pada topik diperoleh berdasarkan pertimbangan kegunaan atau usefulness. Semakin sedikit jumlah topik menunjukkan bahwa topik terlalu umum, saling bercampur antara bahasan satu dengan yang lainnya dan tidak dapat mencakup
32
bahwa topik terlalu spesifik sehingga mengandung kata-kata yang tidak dapat disimpulkan.
Penelitian ini menggunakan sejumlah 339 artikel berita sebagai data, yaitu artikel berita yang diterbitkan oleh situs berita online Detik Finance selama seminggu dari tanggal 01 Januari 2019 hingga 07 Januari 2019.
BAB 4