I-1
PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA
INDONESIA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Kelulusan Program Pendidikan Sarjana
Oleh:
Suci Wulandari D1A.18.0434
PROGRAM STUDI SISTEM INFORMASI
FAKULTAS ILMU KOMPUTER UNIVERSITAS SUBANG SUBANG
2022
i
PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA
INDONESIA
Oleh:
Suci Wulandari D1A.18.0434
Subang, 2 Agustus 2022 Menyetujui,
Mengetahui
PROGRAM STUDI SISTEM INFORMASI
FAKULTAS ILMU KOMPUTER UNIVERSITAS SUBANG SUBANG
2022 Pembimbing I
Drs. M. Hairiyanov, MT
Pembimbing II
Ir. Syarif Hidayat, MT
Dekan Fakultas Ilmu Komputer
Dr. Tepi Peirisal, S.Sos., M.Si
Ketua Program Studi
Bagus Ali Akbar, S.Si., M.Kom
ii
SURAT PERNYATAAN KEASLIAN SKRIPSI
Saya yang bertanda tangan dibawah ini:
Nama : Suci Wulandari
NPM : D1A180434
Jurusan : Sistem Informasi Fakultas : Ilmu Komputer
Judul : Perancangan dan Implementasi Fitur Automatic Text Summarization pada Artikel Berbahasa Indonesia
Dengan ini saya menyatakan dan bertanggung jawab dengan sebenarnya bahwa skripsi ini adalah benar-benar hasil karya sendiri berdasarkan penelitian dan pemikiran yang dibuat oleh saya sendiri. Selain itu, sumber informasi dan cuplikan telah saya cantumkan sumbernya dengan jelas sesuai dengan etika keilmuan yang berlaku.
Atas pernyataan ini, saya siap menanggung segala risiko dan sanksi yang dijatuhkan kepada saya apabila terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini dan dikemudian hari ada pihak lain yang mengklaim bahwa skripsi ini sebagai karyanya.
Demikian pernyataan ini saya buat dengan sebenar-benarnya tanpa paksaan dari pihak manapun untuk dipergunakan sebagaimana mestinya.
Subang, 2 Agustus 2022 Yang membuat pernyataan,
Suci Wulandari
iii ABSTRAK
Di era saat ini, perkembangkan ilmu pengetahuan dan teknologi terus berkembang pesat sehingga mudahnya menerima informasi terutama pada media online yang secara unggul dapat menyajikan informasi bersifat up to date dan real time. Banyaknya jenis informasi yang disuguhkan pada media online jumlahnya tidak terbatas mulai dari artikel sampai berita dimana memiliki jumlah kalimat atau paragraf yang tidak sedikit. Dengan jumlah kalimat yang terlalu banyak, mengkibatkan pembaca kesulitan untuk menyerap permasalahan atau intisari dari artikel tersebut. Untuk itu pembaca menghabiskan banyak waktu dalam memahami keseluruhan isi artikel atau berita. Untuk mengatasi permasalahan tersebut, maka diperlukan sistem peringkas teks otomatis agar mendapatkan hasil teks artikel yang lebih ringkas. Peringkas teks otomatis (automatic text summarization) adalah suatu alat yang berfungsi untuk meringkas teks secara otomatis dengan memanfaatkan perangkat komputer dalam mengoperasikannya.
Metode pengembangan yang dipakai sistem automatic text summarization pada penelitian ini menggunakan RUP (Rational Unified Languange) dengan pendekatan yang dilakukan secara berulang-ulang. Dalam menghasilkan sebuah ringkasan, sistem akan memproses kata dengan melakukan tahap preprocessing dan dilanjutkan dengan penghitungan TF-IDF untuk menentukan hasil ringkasan berdasarkan bobot kalimat tertinggi. Teknik peringkasan menggunakan pendekatan extractive summary dimana hasil ringkasan berupa kalimat-kalimat informatif tanpa ada penambahan kalimat baru yang tidak terdapat pada teks aslinya.
Hasilnya adalah teks ringkasan mengandung poin-poin penting dengan jumlah kalimat disesuaikan dengan persentase ringkasan. Pengujian menunjukkan bahwa, artikel berita yang diambil dari media berita online dapat memberikan hasil ringkasan yang efektif jika dirangkum menggunakan persentase ringkasan sebesar 40%, 50%, dan 75%.
Kata Kunci: automatic text summarization, RUP, preprocessing, TF-IDF, extractive summary
iv ABSTRACT
In the current era, the development of science and technology continues to grow rapidly so that it is easy to receive information, especially on online media which can superiorly present up to date and real time information. The number of types of information that is presented in online media is not limited from articles to news which has a number of sentences or paragraphs that are not small. With too many sentences, it makes it difficult for readers to absorb the problem or essence of the article. For that the reader spends a lot of time in understanding the entire content of the article or news. To overcome this problem, an automatic text summarizing system is needed in order to get more concise article text results. Automatic text summarization is a tool that functions to summarize text automatically by utilizing computer equipment to operate it.
The development method used by the automatic text summarization system in this study uses RUP (Rational Unified Language) with an iterative approach. In generating a summary, the system will process the words by performing the preprocessing stage and proceed with the TF-IDF calculation to determine the summary results based on the highest sentence weight. The summary technique uses an extractive summary approach where the summary results are in the form of informative sentences without the addition of new sentences that are not in the original text.
The result is a summary text containing important points with the number of sentences adjusted to the percentage of the summary. Tests show that news articles taken from online news media can provide effective summary results if they are summarized using summary percentages of 40%, 50%, and 75%.
Keywords: automatic text summarization, RUP, preprocessing, TF-IDF, extractive summary
v
KATA PENGANTAR
Bismillahirrahmanirrahim
Assalamu’alaikum Warahmatullahi Wabarakatuh
Alhamdullillahi Rabbil ‘Alamiin, dengan mengucap rasa puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan karunia-Nya yang sangat luar biasa sehingga penulis dapat menyelesaikan penyusunan skripsi dengan judul “PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA INDONESIA”.
Adapun skripsi ini diajukan sebagai salah satu syarat kelulusan mata kuliah Skripsi guna memperoleh gelar Sarjana di Program Studi Sistem Informasi Fakultas Ilmu Komputer, Universitas Subang. Selain itu, tujuan penulisan skripsi ini diharapkan dapat memberikan pemahaman dan wawasan bagi para pembaca dan juga penulis.
Dengan rendah hati, penulis menyadari penyusunan skripsi ini jauh dari kata sempurna. Untuk itu penulis mengharapkan kritik dan saran yang membangun untuk penelitian yang lebih baik di masa yang akan datang. Akhir kata semoga skripsi ini bermanfaat bagi penulis dan semua pembaca.
Wassalamu’alaikum Warahmatullahi Wabarakatuh
Subang, 2 Agustus 2022
Suci Wulandari
vi
UCAPAN TERIMAKASIH
Alhamdulillah, dengan mengucap rasa puji syukur yang tak terhingga akhirnya skripsi dapat terselesaikan dengan baik dan lancar. Selama penyusunan skripsi, penulis menyadari tidak sedikit kesulitan yang dialami namun berkat usaha dan dukungan dari berbagai pihak yang turut berperan dalam membantu serta membimbing sehingga skripsi dapat diselesaikan. Pada kesempatan ini, penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada:
1. Ucapan syukur dan terimakasih kepada Allah SWT yang tiada henti-hentinya memberikan petunjuk, kelancaran dan kesehatan dalam proses penyusunan skripsi.
2. Yth. Bapak Dr. Ir. Drs. H. A Moeslihat Komara, M.Si selaku Rektor Universitas Subang.
3. Yth. Bapak Dr. Tepi Peirisal, S.Sos., M.Si selaku Dekan Fakultas Ilmu Komputer Universitas Subang.
4. Yth. Bapak Bagus Ali Akbar, S.Si., M.Kom selaku Ketua Program Studi Fakultas Ilmu Komputer Universitas Subang.
5. Yth. Bapak Drs. M. Hairiyanov, MT selaku Dosen Pembimbing I yang telah meluangkan waktu untuk membimbing penulis dengan penuh kesabaran memberikan masukan dan arahan selama pelaksanaan pengerjaan skripsi.
6. Yth. Bapak Ir. Syarif Hidayat, MT selaku dosen pembimbing II yang telah banyak memberikan pelajaran, dukungan dan motivasi dalam menyelesaikan skripsi.
7. Yth. Segenap tim Dosen dan Staf Universitas Subang yang telah memberikan ilmunya dan membantu selama proses perkuliahan.
8. Keluarga tercinta khususnya orang tua dengan kasih sayangnya yang selalu setia memberikan doa, motivasi maupun finansial dari awal kuliah sampai penulis berhasil meraih gelar sarjana.
vii
9. Kepada adik saya Teguh yang telah banyak menghibur dan mau mendengarkan keluh dan kesah selama menyusun skripsi ini.
10. Teman-teman dan sahabat seperjuangan angkatan 2018 Fasilkom atas kekompakan dan kebersamaan dalam melewati masa-masa perkuliahan.
11. Kepada seseorang yang telah mengajari arti untuk bersabar dan selalu bersyukur dalam menjalani hidup.
12. Coldplay, Imagine Dragons, Troye Sivan, Zedd dengan lagu-lagunya yang sangat luar biasa telah menemani penulis dalam mengerjakan skripsi. Kalian adalah musisi hebat!
13. Semua pihak yang tidak dapat penulis sebutkan satu persatu.
Semoga Allah SWT senantiasa membalas segala bentuk kebaikan-kebaikan yang telah membantu menyelesaikan penyusunan skripsi. Amin Ya Rabbal Alamin
viii DAFTAR ISI
LEMBAR PENGESAHAN... i
SURAT PERNYATAAN KEASLIAN SKRIPSI ... ii
ABSTRAK ... iii
KATA PENGANTAR... v
UCAPAN TERIMA KASIH ... vi
DAFTAR ISI ... viii
DAFTAR GAMBAR ... xiii
DAFTAR TABEL ... xv
DAFTAR SIMBOL ... xviii BAB I PENDAHULUAN ... I-1 1.1 Latar Belakang ... I-1 1.2 Rumusan Masalah... I-3 1.3 Batasan Masalah ... I-3 1.4 Maksud dan Tujuan ... I-4 1.4.1 Maksud Penelitian ...I-4 1.4.2 Tujuan Penelitian ...I-4 1.5 Manfaat Penelitian ... I-4 1.6 Metodologi Penelitian ... I-5 1.6.1 Metode Pengumpulan Data ...I-6 1.6.2 Metode Pembangunan Sistem ...I-6 1.7 Waktu Penelitian... I-7 1.8 Sistematika Penulisan ... I-8 BAB II LANDASAN TEORI ... II-1 2.1 Konsep Dasar Sistem ... II-1 2.2 Analisa dan Perancangan Sistem... II-2 2.2.1 Analisa Sistem ... II-2
ix
2.2.2 Perancangan Sistem ... II-3 2.3 Kata ... II-3 2.4 Kalimat ... II-4 2.4.1 Unsur Kalimat ... II-4 2.4.2 Jenis Kalimat Menurut Fungsinya... II-5 2.5 Artikel ... II-6 2.6 Ringkasan (Summary) ... II-8 2.7 Information Retrieval ... II-8 2.8 Peringkas Teks Otomatis ... II-9 2.8.1 Definisi Peringkas Teks Otomatis ... II-9 2.8.2 Pendekatan Peringkas Teks Otomatis ... II-10 2.8.3 Tujuan Peringkas Teks Otomatis... II-10 2.8.4 Proses Peringkas Teks Otomatis ... II-11 2.8.5 Gambaran Umum Peringkas Teks Otomatis ... II-12 2.9 Algoritma Peringkas Teks Otomatis ... II-13 2.9.1 Preprocessing ... II-13 2.9.1.1 Pemisahan Kalimat ... II-13 2.9.1.2 Case Folding... II-14 2.9.1.3 Filtering ... II-14 2.9.1.4 Tokenizing ... II-15 2.9.1.5 Stop Word ... II-16 2.9.1.6 Stemming... II-19 2.9.2 TF-IDF (Term Frequency – Inverse Document Frequency) ... II-29 2.9.2.1 Pengertian TF-IDF ... II-29 2.9.2.2 Langkah Pengerjaan TF-IDF ... II-30 2.9.2.3 Ilustrasi Pengerjaan TF-IDF ... II-31 2.9.3 Compression Rate ... II-33 2.10 Dataset ... II-33 2.10.1 Dataset Peringkasan Chat ... II-33
x
2.10.2 Dataset Indosum ... II-34 2.11 UML (Unified Modeling Languange) ... II-34 2.12 Peralatan Pendukung (Tool Program) ... II-37 2.12.1 PHP ... II-37 2.12.2 XAMPP ... II-39 2.12.3 MySQL ... II-39 2.13 Metode RUP (Rational Unified Languange) ... II-40 BAB III ANALISIS KEBUTUHAN SISTEM ... III-1 3.1 Gambaran Sistem Peringkas Teks Otomatis ... III-1 3.2 Analisis Sistem ... III-2 3.3 Analisis Data Masukan ... III-3 3.3.1 Analisis Text Preprocessing ... III-4 3.3.1.1 Proses Pemisahan Kalimat ... III-5 3.3.1.2 Proses Case Folding ... III-6 3.3.1.3 Proses Filtering ... III-7 3.3.1.4 Proses Tokenizing ... III-9 3.3.1.5 Proses Stop Word ... III-11 3.3.1.6 Proses Stemming ... III-13 3.3.2 Metode TF-IDF (Term Frequency - Inverse Document Frequency)... III-15 3.4 Spesifikasi Kebutuhan Perangkat Lunak ... III-23 3.5 Analisis Kebutuhan Non Fungsional ... III-24 3.5.1 Kebutuhan Perangkat Keras (Hardware) ... III-24 3.5.2 Kebutuhan Perangkat Lunak (Software) ... III-25 3.5.3 Kebutuhan Perangkat Pikir ... III-25 3.6 Pemodelan Sistem ... III-26 3.6.1 Use Case Diagram ... III-26 3.6.1.1 Definisi Aktor... III-27 3.6.1.2 Definisi Use Case ... III-27 3.6.1.3 Skenario Use Case ... III-28
xi
3.6.2 Activity Diagram... III-31 3.6.2.1 Activity Diagram Ringkas Teks Otomatis ... III-31 3.6.2.2 Activity Diagram Lihat Tentang Aplikasi ... III-33 3.6.2.3 Activity Diagram Kirim Pengaduan Aplikasi ... III-34 3.6.3 Robustness Diagram ... III-35 BAB IV PERANCANGAN ... IV-1 4.1 Perancangan Class Diagram ... IV-1 4.2 Perancangan Sequence Diagram... IV-2 4.2.1 Sequence Diagram Ringkas Teks Otomatis ... IV-3 4.2.2 Sequence Diagram Lihat Tentang Aplikasi ... IV-4 4.2.3 Sequence Diagram Kirim Pengaduan Aplikasi ... IV-4 4.3 Perancangan Basis Data ... IV-5 4.4 Perancangan Antarmuka Sistem ... IV-5 4.4.1 Perancangan Tampilan Home ... IV-6 4.4.2 Perancangan Tampilan About ... IV-8 4.4.3 Perancangan Tampilan Contact Us ... IV-9 4.5 Perancangan Prosedural ... IV-10 BAB V IMPLEMENTASI DAN PENGUJIAN ... V-1 5.1 Implementasi Sistem ... V-1 5.1.1 Implementasi Perangkat Keras (Hardware) ... V-1 5.1.2 Implementasi Perangkat Lunak (Software) ... V-2 5.1.3 Implementasi Basis Data ... V-2 5.1.4 Implementasi Antarmuka Sistem ... V-4 5.1.4.1 Tampilan Halaman Home ... V-4 5.1.4.2 Tampilan Halaman About ... V-5 5.1.4.3 Tampilan Halaman Contact Us ... V-6 5.1.5 Prosedur Operasional ... V-6 5.2 Pengujian Sistem... V-9
xii
5.2.1 Skenario Pengujian ... V-9 5.2.1.1 Skenario Pengujian Fungsionalitas ... V-9 5.2.1.2 Skenario Pengujian Hasil Ringkasan ... V-11 5.2.1.3 Skenario Pengujian Persentase Ringkasan ... V-14 5.2.2 Hasil Pengujian... V-15 5.2.2.1 Hasil Pengujian Fungsionalitas ... V-15 5.2.2.2 Hasil Pengujian Ringkasan ... V-17 5.2.2.3 Hasil Pengujian Persentase Ringkasan ... V-21 5.2.3 Kesimpulan Hasil Pengujian ... V-24 BAB VI KESIMPULAN DAN SARAN ... VI-1 6.1 Kesimpulan ... VI-1 6.2 Saran ... VI-2 DAFTAR PUSTAKA ... xxiv
xiii
DAFTAR GAMBAR
Gambar 1.1 Skema Penelitian ... I-5 Gambar 2.1 Model Sistem ... II-2 Gambar 2.2 Gambaran Umum Sistem Peringkas Teks Otomatis ... II-13 Gambar 2.3 Proses Iteratif RUP ... II-41 Gambar 2.4 Alur Rational Unified Process (RUP) ... II-41 Gambar 3.1 Alur Sistem Automatic Text Summarization ... III-2 Gambar 3.2 Tahapan Preprocessing ... III-5 Gambar 3.3 Proses Pemisahan Kalimat ... III-5 Gambar 3.4 Proses Case Folding ... III-6 Gambar 3.5 Proses Filtering ... III-8 Gambar 3.6 Proses Tokenizing ... III-9 Gambar 3.7 Proses Stop Word ... III-11 Gambar 3.8 Proses Stemming ... III-14 Gambar 3.9Use Case Diagram Automatic Text Summarization ... III-27 Gambar 3.10 Activity Diagram Ringkas Teks Otomatis ... III-32 Gambar 3.11 Activity Diagram Lihat Tentang Aplikasi ... III-33 Gambar 3.12 Activity Diagram Kirim Pengaduan Aplikasi ... III-34 Gambar 3.13 Robustness Diagram Automatic Text Summarization ... III-35 Gambar 4.1 Class Diagram Automatic Text Summarization... IV-1 Gambar 4.2 Sequence Diagram Ringkas Teks Otomatis ... IV-3 Gambar 4.3 Sequence Diagram Lihat Tentang Aplikasi ... IV-4 Gambar 4.4 Sequence Diagram Kirim Pengaduan Aplikasi ... IV-4 Gambar 4.5 Rancangan Halaman Home... IV-6 Gambar 4.6Rancangan Halaman Upload File ... IV-7 Gambar 4.7Rancangan Halaman Tampil Teks ... IV-7 Gambar 4.8 Rancangan Halaman Hasil Ringkasan ... IV-8
xiv
Gambar 4.9 Rancangan Halaman About ... IV-9 Gambar 4.10 Rancangan Halaman Contact Us ... IV-10 Gambar 4.11 Flowchart Prosedur Sistem Automatic Text Summarization ... IV-11 Gambar 4.12 Flowchart Prosedur Algoritma Automatic Text Summarization ... IV-12 Gambar 5.1 Basis Data db_summarization ... V-3 Gambar 5.2 Implementasi Tabel tbl_katadasar ... V-3 Gambar 5.3 Implementasi Tabel tbl_stopword ... V-4 Gambar 5.4 Tampilan Implementasi Halaman Home ... V-5 Gambar 5.5 Tampilan Implementasi Halaman About ... V-5 Gambar 5.6 Tampilan Implementasi Halaman Contact Us ... V-6 Gambar 5.7 Tampilan Pilih File ... V-7 Gambar 5.8 Tampilan Proses Pemilihan File ... V-7 Gambar 5.9 Tampilan File Sesudah Upload ... V-8 Gambar 5.10 Tampilan Pilih Button Process ... V-8 Gambar 5.11 Tampilan Hasil Ringkasan ... V-9
xv
DAFTAR TABEL
Tabel 1.1 Jadwal Penelitian ... I-7 Tabel 2.1 Perubahan Kata Dasar Menjadi Kata Turunan yang Mengandung Berbagai Arti ... II-4 Tabel 2.2 Contoh Pemisahan Kalimat ... II-14 Tabel 2.3 Contoh Case Folding ... II-14 Tabel 2.4 Contoh Filtering... II-15 Tabel 2.5 Contoh Tokenizing ... II-15 Tabel 2.6 Contoh Stop Word ... II-18 Tabel 2.7 Kombinasi Awalan-Akhiran yang Tidak Diizinkan ... II-23 Tabel 2.8 Cara Menentukan Tipe Awalan untuk Kata yang Diawali Dengan “te-” ... II-24 Tabel 2.9 Jenis Awalan Berdasarkan Tipe Awalannya ... II-24 Tabel 2.10 Aturan untuk Inflectional Particle... II-24 Tabel 2.11 Aturan untuk Inflectional Possesive Pronoun ... II-24 Tabel 2.12 Aturan untuk First Order Derivational Prefix... II-25 Tabel 2.13 Aturan untuk Second Order Derivational Prefix ... II-25 Tabel 2.14 Aturan untuk Derivational Suffix ... II-26 Tabel 2.15 Aturan Pemenggalan Awalan Stemmer Nazief dan Adriani ... II-27 Tabel 2.16 Contoh Stemming ... II-28 Tabel 2.17 Kata Hasil Proses Stemming ... II-31 Tabel 2.18 Contoh Perhitungan TF-IDF ... II-32 Tabel 2.19 Hasil Perangkingan Kalimat ... II-33 Tabel 2.20 Simbol-simbol Use Case Diagram ... II-35 Tabel 2.21 Simbol-simbol Activity Diagram... II-36 Tabel 3.1 Analisis Kebutuhan Sistem ... III-3 Tabel 3.2 Data Masukan ... III-4 Tabel 3.3 Hasil Pemisahan Kalimat ... III-5
xvi
Tabel 3.4 Hasil Case Folding ... III-6 Tabel 3.5 Hasil Filtering ... III-8 Tabel 3.6 Hasil Tokenizing... III-9 Tabel 3.7 Hasil Stop Word ... III-12 Tabel 3.8 Hasil Stemming ... III-14 Tabel 3.9 Hasil Perhitungan TF-IDF ... III-16 Tabel 3.10 Hasil Perangkingan Kalimat ... III-20 Tabel 3.11 Kalimat Ringkasan Terpilih ... III-22 Tabel 3.12 Hasil Ringkasan ... III-22 Tabel 3.13 SKPL ... III-23 Tabel 3.14 Kebutuhan Perangkat Keras ... III-24 Tabel 3.15 Kebutuhan Perangkat Lunak ... III-25 Tabel 3.16 Pengetahuan dan Pengalaman Pengguna ... III-25 Tabel 3.17 Karakteristik Fisik Pengguna... III-26 Tabel 3.18 Definisi Aktor Use Case Diagram ... III-27 Tabel 3.19 Definisi Use Case ... III-28 Tabel 3.20 Skenario Use Case Ringkas Teks Otomatis ... III-28 Tabel 3.21 Skenario Use Case Lihat Tentang Aplikasi ... III-29 Tabel 3.22 Skenario Use Case Kirim Pengaduan Aplikasi ... III-30 Tabel 4.1 Struktur Tabel tbl_katadasar ... IV-5 Tabel 4.2 Struktur Tabel tbl_stopword ... IV-5 Tabel 5.1 Implementasi Perangkat Keras ... V-1 Tabel 5.2 Implementasi Perangkat Lunak... V-2 Tabel 5.3 Implementasi Basis Data ... V-2 Tabel 5.4 Implementasi Antarmuka ... V-4 Tabel 5.5 Daftar Skenario Pengujian Fungsionalitas ... V-10 Tabel 5.6 Daftar Artikel Pengujian ... V-11 Tabel 5.7 Rancangan Uji Fungsionalitas ... V-15 Tabel 5.8 Hasil Pengujian Fungsionalitas Data Benar ... V-16
xvii
Tabel 5.9 Hasil Pengujian Fungsionalitas Data Salah ... V-17 Tabel 5.10 Pengujian Sampel Data ... V-18 Tabel 5.11 Hasil Evaluasi Kuesioner ... V-21
xviii DAFTAR SIMBOL
Simbol Flowmap
No Simbol Nama Keterangan
1 Terminator
Menunjukkan simbol awalan dan akhiran dari proses sistem yang digambarkan
2 Proses
Kegiatan proses yang dilakukan oleh sistem
3
Dokumen (Document)
Menunjukkan dokumen input atau output untuk proses yang dilakukan komputer
4
Garis Aliran (Flow Line)
Menunjukkan alur data antar simbol/proses
Simbol Use Case Diagram
No Simbol Nama Keterangan
1 Use Case
Fungsionalitas yang disediakan sistem sebagai unit-unit yang saling bertukar pesan antar unit atau aktor;
biasanya dinyatakan dengan menggunakan kata kerja di awal frase nama use case
2 Aktor / Actor
Orang,proses, atau sistem lain yang berinteraksi dengan sistem informasi yang akan dibuat itu sendiri
xix 3
Asosiasi / Association
Komunikasi antara aktor dan use case yang berpartisipasi pada use case atau use case memiliki interaksi dengan aktor Sumber: Rosa dan Shalahuddin (2019: 156)
Simbol Activity Diagram
No Simbol Nama Keterangan
1 Status Awal
Status awal aktivitas sistem, sebuah diagram aktivitas memiliki sebuah status awal
2 Aktivitas
Aktivitas yang dilakukan sistem, aktivitas biasanya diawali dengan kata kerja
3 Status Akhir
Status akhir yang dilakukan sistem
4 atau Swimlane
Memisahkan organisasi bisnis yang bertanggung jawab terhadap aktivitas yang terjadi
Sumber: Rosa dan Shalahuddin (2019: 162)
xx Simbol Robustness Diagram
No Simbol Nama Keterangan
1 Boundary Class
Menggambarkan sebuah gambaran view dari sistem
2 Control Class
Menggambarkan penghubung antara boundary dengan entity
3 Entity Class
Menggambarkan sebuah gambaran model dari sistem
4 Message
Menggambarkan perilaku sistem yang ditandai adanya suatu interaksi alur informasi atau transisi antar elemen
Simbol Class Diagram
No Simbol Nama Keterangan
1 Kelas Kelas pada struktur sistem
2
Asosiasi / Association
Relasi antar kelas dengan makna umum, asosiasi biasanya juga disertai dengan multiplicity
Sumber: Rosa dan Shalahuddin (2019: 146)
xxi Simbol Sequence Diagram
No Simbol Nama Keterangan
1 Aktor
Orang, proses, atau sistem lain yang berinteraksi dengan sistem informasi yang akan dibuat di luar sistem informasi yang akan dibuat itu sendiri
2
Garis Hidup / Lifeline
Menyatakan kehidupan suatu objek
3 Objek
Menyatakan objek yang berinteraksi pesan
4 Waktu Aktif
Menyatakan objek dalam keadaan aktif dan berinteraksi, semua yang terhubung dengan waktu aktif ini adalah sebuah tahapan yang dilakukan di dalamnya
5 Pesan Tipe Call
Menyatakan suatu objek memanggil operasi/metode yang ada pada objek lain atau dirinya sendiri
Arah panah mengarah pada objek yang memiliki
operasi/metode, karena ini memanggil operasi/metode
xxii
maka operasi/metode yang dipanggil harus ada pada diagram kelas sesuai dengan kelas objek yang berinteraksi
6
Pesan Tipe Send
Menyatakan bahwa suatu objek mengirimkan
data/masukan/informasi ke objek lainnya, arah panah mengarah pada objek yang dikirimi
7
Pesan Tipe Return
Menyatakan bahwa suatu objek yang telah menjalankan suatu operasi atau metode
menghasilkan suatu kembalian ke objek tertentu, arah panah mengarah pada objek yang menerima kembalian Sumber: Rosa dan Shalahuddin (2019: 165)
Simbol Flowchart
No Simbol Nama Keterangan
1 Terminator
Simbol yang menandakan permulaan dan akhiran dari program (prosedur)
2 Process
Simbol menunjukkan proses operasional yang dilakukan oleh komputer
3
Simbol Input - Output
Simbol yang menyatakan proses input ataupun output
xxiii
4 Flow
Simbol yang disebut dengan Connecting Line ini digunakan untuk menghubungkan alur antara satu simbol dengan simbol lainnya
I-1 BAB I PENDAHULUAN
1.1 Latar Belakang
Di era globalisasi saat ini, perkembangkan ilmu pengetahuan dan teknologi terus berkembang pesat sehingga mudahnya menerima informasi. Dengan perkembangan teknologi yang semakin canggih, mempermudah pengguna mendapatkan informasi yang tepat dan akurat dari media online. Pengguna internet di Indonesia dari tahun ke tahun semakin meningkat sehingga berdampak pada bertambahnya jumlah artikel atau jurnal yang disajikan untuk memberi informasi setiap harinya. Hal tersebut bisa dilihat dari hasil survey yang diselenggarakan oleh We Are Social 2021. Dalam mengakses media sosial, pengguna internet di Indonesia rata-rata menghabiskan waktu untuk membaca media pers secara online setiap harinya kurang lebih selama 1 jam 38 menit. Sehingga ada istilah tiada hari kebutuhan masyarakat tanpa pasokan berita yang didapat karena adanya rasa penasaran terhadap suatu peristiwa atau kejadian yang dinilai begitu penting.
Media online secara unggul dapat menyajikan informasi bersifat up to date dan real time. Pada umumnya artikel yang ada pada situs portal berita memiliki kalimat atau paragraf yang tidak sedikit sehingga pembaca kesulitan untuk menyerap permasalahan atau intisari dari artikel tersebut. Untuk itu pembaca membutuhkan banyak waktu untuk memahami keseluruhan isi artikel dengan rata-rata jumlah kalimat yang tidak sedikit. Agar pembaca dapat menghemat waktu untuk memahami inti bacaan tanpa harus membaca keseluruhan artikel, maka diperlukan aplikasi peringkasan teks secara otomatis agar mendapatkan hasil teks artikel yang lebih ringkas.
Peringkas teks otomatis (Automatic Text Summarization) merupakan alat atau teknik yang memiliki kemampuan dalam meringkas dengan membuat teks menjadi lebih pendek. Sistem peringkas teks termasuk salah satu cabang ilmu pemrosesan bahasa alami manusia (Natural Languange Processing) yang memiliki sistem berupa masukan
I-2
yaitu teks asli sehingga menghasilkan keluaran dalam bentuk ringkasan yang terdiri dari informasi atau poin-poin penting yang diambil dari teks sumber. Sistem dirancang secara tepat dan sesuai guna menghasilkan informasi peringkasan menggunakan algoritma tertentu.
Banyak penelitian yang berkaitan dengan peringkasan teks otomatis salah satu penelitian sebelumnya, yaitu dilakukan oleh Saputra, dkk pada tahun 2017. Saputra, dkk (2017) melakukan penelitian peringkasan teks otomatis pada dokumen berbahasa Indonesia yang menerapkan metode Latent Semantic Analysis (LSA) dan Teknik Steinberger & Jezek dengan menguji 10 teks berita. Pengolahan kata terdiri dari tahap preprocessing dan processing. Pada tahap preprocessing, peneliti melakukan proses pengolahan data awal dari mulai case folding sampai dengan tahap stemming. Sedangkan pada tahap processing melibatkan proses implementasi menggunakan metode Latent Semantic Analysis (LSA), pembobotan TF-IDF, pembuatan matrik term-sentence, melakukan penghitungan SVD terhadap matriks inputan hasil pembobotan serta pemilihan kalimat menggunakan teknik Steinberger & Jezek. Hasil akhir penelitian didapatkan hasil ringkasan sebesar 50% dengan menghasilkan rata-rata recall 0.7027, precision 0.6973 dan f-measure sebesar 0.6974. Sementara penelitian lain yang membahas Automatic Text Summarization (ATS) juga sudah dilakukan oleh Ridok dan Romadhona (2013) yang membahas implementasi peringkas dokumen dengan melakukan pembobotan terhadap kalimat menggunakan fuzzy model inferensi madani. Penelitian tersebut didapatkan hasil akhir uji coba sistem sebesar 20% dan 50% terhadap 15 dokumen berita dengan membandingkan uji coba menggunakan AutoSummarize (Microsoft Word).
Berdasarkan uraian diatas, pada penelitian ini akan dibangun sistem peringkas teks otomatis atau yang dikenal sebagai Automatic Text Summarization (ATS). Adapun sistem peringkas teks yang dibangun dimulai dari tahap pengolahan kata (preprocessing) sampai dengan implementasi metode penghitungan TF-IDF yaitu mencari bobot kalimat untuk membuktikan apakah hasil ringkasan sudah sesuai dengan topik artikel. Perangkingan diurutkan berdasarkan kalimat yang memiliki bobot tertinggi sehingga diharapkan sistem menghasilkan output yang sesuai dengan kebutuhan pengguna dan dapat diakses secara
I-3
umum (public user). Oleh karena itu, penulis bermaksud melakukan penelitian skripsi dengan pokok bahasan berjudul “Perancangan dan Implementasi Fitur Automatic Text Summarization Pada Artikel Berbahasa Indonesia”.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan diatas, setiap proses tidak terlepas dari masalah untuk mencapai tujuan yang diharapkan. Maka dari itu, didapatkan rumusan masalah dari penelitian yang meliputi:
1. Bagaimana merancang sistem automatic text summarization pada artikel berbahasa Indonesia?
2. Bagaimana implementasi sistem automatic text summarization pada artikel berbahasa Indonesia?
3. Bagaimana sistem automatic text summarization yang dibangun dapat menghasilkan sebuah ringkasan dari artikel tanpa mengurangi pokok permasalahan dari teks asli?
1.3 Batasan Masalah
Batasan masalah perancangan sistem terhadap ruang lingkup sehingga penelitian yang dikerjakan dapat lebih fokus dan terarah terhadap satu tujuan. Beberapa batasan masalah dalam penelitian skripsi ini, dintaranya yaitu:
1. Bentuk input data berupa file dengan format .txt dari artikel tunggal berbahasa Indonesia.
2. Analisis dan perancangan sistem peringkas teks otomatis menggunakan metode RUP (Relational Unified Process).
3. Peringkas teks otomatis yang dibangun menggunakan bahasa pemrograman PHP.
4. Database yang digunakan adalah MySQL.
5. Sistem diimplemetasikan pada perangkat komputer berbasis web.
6. Pengujian dilakukan menggunakan artikel yang diambil dari situs berita internet dengan kategori berbeda-beda.
I-4
1.4 Maksud dan Tujuan 1.4.1 Maksud Penelitian
Berdasarkan permasalahan yang ada, maka maksud dari penelitian ini adalah untuk membangun sistem Automatic Text Summarization berbasis website sebagai objek penelitian.
1.4.2 Tujuan Penelitian
Tujuan yang diharapkan dari penelitian tugas akhir ini adalah:
1. Mengetahui alur proses pengolahan kata (preprocessing) dari sistem automatic text summarization pada artikel berbahasa Indonesia.
2. Merancang dan mengetahui implementasi dari sistem automatic text summarization pada artikel berbahasa Indonesia menggunakan penghitungan TF-IDF.
1.5 Manfaat Penelitian
Adapun manfaat yang diperoleh dari penelitian ini yaitu mampu memberikan manfaat baik secara teoritis maupun praktis diantaranya adalah:
1. Manfaat Teoritis
Hasil penelitian diharapkan dapat menambah khasanah ilmu pengetahuan dan menjadi bahan informasi terhadap penelitian-penelitian yang akan datang terkait perancangan dan pembangunan sistem peringkas teks otomatis.
2. Manfaat Praktis
Secara garis besar, manfaat praktis yang diharapkan dari penelitian skripsi dapat menambah pengetahuan mengenai perancangan sistem peringkas teks otomatis.
a. Bagi Penulis
Dengan adanya penelitian ini, diharapkan memberi masukan yang bermanfaat serta menambah pengetahuan dan wawasan di bidang pembangunan sistem peringkas teks otomatis. Selain itu, bermanfaat untuk melatih kemampuan menggunakan bahasa pemrograman dalam pembuatan sistem.
I-5
b. Bagi Program Studi Sistem Informasi Universitas Subang
Menambah referensi penelitian pada Program Studi Sistem Informasi.
Penelitian dapat dipakai sebagai salah satu alternatif guna memantapkan pengetahuan dan menambah wawasan serta melatih kemampuan mahasiswa dalam menerapkan ilmu yang sesuai dengan bidang penelitian.
1.6 Metodologi Penelitian
Metodologi penelitian dilakukan mulai dari tahap identifikasi masalah, pengembangan dan evaluasi yang dilakukan secara sistematis dan objektif. Adapun skema dari tahap penelitian ini, lebih jelasnya dapat dilihat pada Gambar 1.1.
Gambar 1.1 Skema Penelitian
Mulai
Pengumpulan Data Studi Literatur
Metode Pengembangan RUP
Fase Elaboration
Fase Construction
Fase Transition Fase Inception
Kesimpulan dan Saran
Selesai Identifikasi dan Rumusan Masalah
Evaluasi Data
I-6
1.6.1 Metode Pengumpulan Data
Dalam memulai penelitian, langkah pertama yang dilakukan penulis adalah mengumpulkan data yang dijadikan sebagai acuan dasar penelitian. Metode yang digunakan dalam proses pengumpulan data dilakukan dengan beberapa tahap sebagai berikut:
1. Studi Literatur
Membaca dan mempelajari referensi-referensi yang diperoleh dari buku, jurnal, skripsi, hasil-hasil penelitian dan bahan referensi lainnya terkait dengan obyek penelitian. Mencari informasi dengan mengkaji teori dasar sehingga memperoleh ilmu dan pengetahuan dalam melaksanakan penelitian.
2. Pengumpulan Data
Pengumpulan data dengan mengumpulkan dokumen-dokumen yang dibutuhkan serta mempelajari dan menganalisis dokumen terkait dengan objek yang sedang diteliti. Adapun data yang digunakan dalam tahap pengujian berupa artikel dari situs media berita yang diambil secara acak dari sumber berita yang berbeda.
1.6.2 Metode Pembangunan Sistem
Metode pembangunan sistem yang digunakan dalam penelitian ini menggunakan metode RUP. RUP adalah kerangka proses yang menggunakan konsep object oriented dimana peneliti fokus pada pengembangan model dengan menggunakan Unified Model Languange (UML). Adapun perincian mengenai tahapan-tahapan metode RUP dijelaskan sebagai berikut:
1. Inception (Permulaan)
Tahap ini dilakukan dengan memodelkan proses bisnis yang dibutuhkan dalam proses pengembangan sistem automatic text summarization dan mendefinisikan kebutuhan (requirements) terhadap sistem yang akan dibuat.
I-7
2. Elaboration (Perencanaan)
Tahap ini mulai fokus terhadap perencanaan arsitektur sistem meliputi analisis dan desain sistem yang fokus terhadap tampilan sistem (prototype). Analisis dirancang menggunakan diagram UML.
3. Construction (Konstruksi)
Tahap ini difokuskan pada pengembangan komponen dan fitur-fitur sistem.
Selanjutnya dilakukan pengujian terhadap implementasi sistem yang dibuat, sehingga pada tahap ini dapat menghasilkan produk perangkat lunak.
4. Transition (Transisi)
Tahap ini dilakukan instalasi dan pengujian sistem untuk mencari masalah dan kekurangan yang mungkin timbul setelah proses pengujian. Selanjutnya melakukan evaluasi dan pemeliharaan apakah sistem sudah memenuhi harapan user.
1.7 Waktu Penelitian
Pada penelitian skripsi ini, penulis melakukan pengembangan sistem automatic text summarization (peringkas teks otomatis) dengan waktu penelitian dilaksanakan dalam empat bulan terhitung dari bulan Maret 2022 sampai dengan bulan Juni 2022. Rencana penelitian ditargetkan selama 3 bulan sejak diseminarkannya proposal skripsi dengan judul penelitian yang telah diajukan dan dilanjutkan dengan penyusunan skripsi.
Adapun rincian waktu pelaksanakan penelitian menggunakan metode RUP dapat dilihat pada Tabel 1.1 sebagai berikut.
Tabel 1.1 Jadwal Penelitian
No
Rincian Tahap Penelitian
Bulan/Tahun Maret
2022
April 2022
Mei 2022
Juni 2022 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 Proposal
I-8
2
Tahap Inception
3
Tahap Elaboration
4
Tahap Construction
5
Tahap Transition
1.8 Sistematika Penulisan
Sistematika penulisan pada laporan ini terbagi menjadi enam bab dengan beberapa sub pokok bahasan masing-masing bab secara keseluruhan sebagai berikut:
BAB I PENDAHULUAN
Bab I mendeskripsikan secara umum mengenai latar belakang, rumusan masalah, batasan masalah, maksud dan tujuan, manfaat penelitian, metodologi penelitian, waktu penelitian yang digunakan serta gambaran sistematika penulisan dalam melaksanakan penulisan tugas akhir.
BAB II LANDASAN TEORI
Bab II membahas konsep dasar dan teori-teori yang menjadi referensi utama dalam mendukung penelitian skripsi. Teori diambil dari berbagai sumber seperti, skripsi, buku, jurnal dan teori-teori lainnya yang berkaitan dengan penelitian.
BAB III ANALISIS KEBUTUHAN SISTEM
Bab III berisi tentang penjelasan analisis dan gambaran dari permasalahan yang dijadikan topik skripsi beserta pemodelan struktur sistem. Poin-poin pada bab III meliputi gambaran sistem peringkas teks otomatis, analisis sistem, analisis data masukan, spesifikasi kebutuhan perangkat lunak, analisis kebutuhan non fungsional, serta gambaran pemodelan sistem yang dirancang pada penelitian ini.
I-9
BAB IV PERANCANGAN
Bab IV menjelaskan tentang hasil perancangan dari analisis dan pemodelan sistem yang sudah dibuat pada bab sebelumnya untuk melakukan pengembangan sistem automatic text summarization pada artikel berbahasa Indonesia.
BAB V IMPLEMENTASI DAN PENGUJIAN
Bab V menjelaskan tentang implementasi dari spesifikasi perangkat keras dan lunak yang dibutuhkan dalam menjalankan sistem. Serta implementasi basis data, antarmuka dan prosedur operasional untuk dilanjutkan ke tahap pengujian sehingga dapat ditarik kesimpulan.
BAB VI KESIMPULAN DAN SARAN
Bab VI merupakan bab akhir dari penulisan skripsi. Uraian yang telah diulas dari proses pembuatan sistem dituangkan dalam bentuk kesimpulan dan disertakan saran-saran dari penulis untuk pengembangan dan kualitas penelitian lebih lanjut terkait sistem automatic text summarization (peringkas teks otomatis).