• Tidak ada hasil yang ditemukan

PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA INDONESIA

N/A
N/A
Protected

Academic year: 2023

Membagikan "PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA INDONESIA"

Copied!
33
0
0

Teks penuh

(1)

I-1

PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA

INDONESIA

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Kelulusan Program Pendidikan Sarjana

Oleh:

Suci Wulandari D1A.18.0434

PROGRAM STUDI SISTEM INFORMASI

FAKULTAS ILMU KOMPUTER UNIVERSITAS SUBANG SUBANG

2022

(2)

i

PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA

INDONESIA

Oleh:

Suci Wulandari D1A.18.0434

Subang, 2 Agustus 2022 Menyetujui,

Mengetahui

PROGRAM STUDI SISTEM INFORMASI

FAKULTAS ILMU KOMPUTER UNIVERSITAS SUBANG SUBANG

2022 Pembimbing I

Drs. M. Hairiyanov, MT

Pembimbing II

Ir. Syarif Hidayat, MT

Dekan Fakultas Ilmu Komputer

Dr. Tepi Peirisal, S.Sos., M.Si

Ketua Program Studi

Bagus Ali Akbar, S.Si., M.Kom

(3)

ii

SURAT PERNYATAAN KEASLIAN SKRIPSI

Saya yang bertanda tangan dibawah ini:

Nama : Suci Wulandari

NPM : D1A180434

Jurusan : Sistem Informasi Fakultas : Ilmu Komputer

Judul : Perancangan dan Implementasi Fitur Automatic Text Summarization pada Artikel Berbahasa Indonesia

Dengan ini saya menyatakan dan bertanggung jawab dengan sebenarnya bahwa skripsi ini adalah benar-benar hasil karya sendiri berdasarkan penelitian dan pemikiran yang dibuat oleh saya sendiri. Selain itu, sumber informasi dan cuplikan telah saya cantumkan sumbernya dengan jelas sesuai dengan etika keilmuan yang berlaku.

Atas pernyataan ini, saya siap menanggung segala risiko dan sanksi yang dijatuhkan kepada saya apabila terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini dan dikemudian hari ada pihak lain yang mengklaim bahwa skripsi ini sebagai karyanya.

Demikian pernyataan ini saya buat dengan sebenar-benarnya tanpa paksaan dari pihak manapun untuk dipergunakan sebagaimana mestinya.

Subang, 2 Agustus 2022 Yang membuat pernyataan,

Suci Wulandari

(4)

iii ABSTRAK

Di era saat ini, perkembangkan ilmu pengetahuan dan teknologi terus berkembang pesat sehingga mudahnya menerima informasi terutama pada media online yang secara unggul dapat menyajikan informasi bersifat up to date dan real time. Banyaknya jenis informasi yang disuguhkan pada media online jumlahnya tidak terbatas mulai dari artikel sampai berita dimana memiliki jumlah kalimat atau paragraf yang tidak sedikit. Dengan jumlah kalimat yang terlalu banyak, mengkibatkan pembaca kesulitan untuk menyerap permasalahan atau intisari dari artikel tersebut. Untuk itu pembaca menghabiskan banyak waktu dalam memahami keseluruhan isi artikel atau berita. Untuk mengatasi permasalahan tersebut, maka diperlukan sistem peringkas teks otomatis agar mendapatkan hasil teks artikel yang lebih ringkas. Peringkas teks otomatis (automatic text summarization) adalah suatu alat yang berfungsi untuk meringkas teks secara otomatis dengan memanfaatkan perangkat komputer dalam mengoperasikannya.

Metode pengembangan yang dipakai sistem automatic text summarization pada penelitian ini menggunakan RUP (Rational Unified Languange) dengan pendekatan yang dilakukan secara berulang-ulang. Dalam menghasilkan sebuah ringkasan, sistem akan memproses kata dengan melakukan tahap preprocessing dan dilanjutkan dengan penghitungan TF-IDF untuk menentukan hasil ringkasan berdasarkan bobot kalimat tertinggi. Teknik peringkasan menggunakan pendekatan extractive summary dimana hasil ringkasan berupa kalimat-kalimat informatif tanpa ada penambahan kalimat baru yang tidak terdapat pada teks aslinya.

Hasilnya adalah teks ringkasan mengandung poin-poin penting dengan jumlah kalimat disesuaikan dengan persentase ringkasan. Pengujian menunjukkan bahwa, artikel berita yang diambil dari media berita online dapat memberikan hasil ringkasan yang efektif jika dirangkum menggunakan persentase ringkasan sebesar 40%, 50%, dan 75%.

Kata Kunci: automatic text summarization, RUP, preprocessing, TF-IDF, extractive summary

(5)

iv ABSTRACT

In the current era, the development of science and technology continues to grow rapidly so that it is easy to receive information, especially on online media which can superiorly present up to date and real time information. The number of types of information that is presented in online media is not limited from articles to news which has a number of sentences or paragraphs that are not small. With too many sentences, it makes it difficult for readers to absorb the problem or essence of the article. For that the reader spends a lot of time in understanding the entire content of the article or news. To overcome this problem, an automatic text summarizing system is needed in order to get more concise article text results. Automatic text summarization is a tool that functions to summarize text automatically by utilizing computer equipment to operate it.

The development method used by the automatic text summarization system in this study uses RUP (Rational Unified Language) with an iterative approach. In generating a summary, the system will process the words by performing the preprocessing stage and proceed with the TF-IDF calculation to determine the summary results based on the highest sentence weight. The summary technique uses an extractive summary approach where the summary results are in the form of informative sentences without the addition of new sentences that are not in the original text.

The result is a summary text containing important points with the number of sentences adjusted to the percentage of the summary. Tests show that news articles taken from online news media can provide effective summary results if they are summarized using summary percentages of 40%, 50%, and 75%.

Keywords: automatic text summarization, RUP, preprocessing, TF-IDF, extractive summary

(6)

v

KATA PENGANTAR

Bismillahirrahmanirrahim

Assalamu’alaikum Warahmatullahi Wabarakatuh

Alhamdullillahi Rabbil ‘Alamiin, dengan mengucap rasa puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan karunia-Nya yang sangat luar biasa sehingga penulis dapat menyelesaikan penyusunan skripsi dengan judul “PERANCANGAN DAN IMPLEMENTASI FITUR AUTOMATIC TEXT SUMMARIZATION PADA ARTIKEL BERBAHASA INDONESIA”.

Adapun skripsi ini diajukan sebagai salah satu syarat kelulusan mata kuliah Skripsi guna memperoleh gelar Sarjana di Program Studi Sistem Informasi Fakultas Ilmu Komputer, Universitas Subang. Selain itu, tujuan penulisan skripsi ini diharapkan dapat memberikan pemahaman dan wawasan bagi para pembaca dan juga penulis.

Dengan rendah hati, penulis menyadari penyusunan skripsi ini jauh dari kata sempurna. Untuk itu penulis mengharapkan kritik dan saran yang membangun untuk penelitian yang lebih baik di masa yang akan datang. Akhir kata semoga skripsi ini bermanfaat bagi penulis dan semua pembaca.

Wassalamu’alaikum Warahmatullahi Wabarakatuh

Subang, 2 Agustus 2022

Suci Wulandari

(7)

vi

UCAPAN TERIMAKASIH

Alhamdulillah, dengan mengucap rasa puji syukur yang tak terhingga akhirnya skripsi dapat terselesaikan dengan baik dan lancar. Selama penyusunan skripsi, penulis menyadari tidak sedikit kesulitan yang dialami namun berkat usaha dan dukungan dari berbagai pihak yang turut berperan dalam membantu serta membimbing sehingga skripsi dapat diselesaikan. Pada kesempatan ini, penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada:

1. Ucapan syukur dan terimakasih kepada Allah SWT yang tiada henti-hentinya memberikan petunjuk, kelancaran dan kesehatan dalam proses penyusunan skripsi.

2. Yth. Bapak Dr. Ir. Drs. H. A Moeslihat Komara, M.Si selaku Rektor Universitas Subang.

3. Yth. Bapak Dr. Tepi Peirisal, S.Sos., M.Si selaku Dekan Fakultas Ilmu Komputer Universitas Subang.

4. Yth. Bapak Bagus Ali Akbar, S.Si., M.Kom selaku Ketua Program Studi Fakultas Ilmu Komputer Universitas Subang.

5. Yth. Bapak Drs. M. Hairiyanov, MT selaku Dosen Pembimbing I yang telah meluangkan waktu untuk membimbing penulis dengan penuh kesabaran memberikan masukan dan arahan selama pelaksanaan pengerjaan skripsi.

6. Yth. Bapak Ir. Syarif Hidayat, MT selaku dosen pembimbing II yang telah banyak memberikan pelajaran, dukungan dan motivasi dalam menyelesaikan skripsi.

7. Yth. Segenap tim Dosen dan Staf Universitas Subang yang telah memberikan ilmunya dan membantu selama proses perkuliahan.

8. Keluarga tercinta khususnya orang tua dengan kasih sayangnya yang selalu setia memberikan doa, motivasi maupun finansial dari awal kuliah sampai penulis berhasil meraih gelar sarjana.

(8)

vii

9. Kepada adik saya Teguh yang telah banyak menghibur dan mau mendengarkan keluh dan kesah selama menyusun skripsi ini.

10. Teman-teman dan sahabat seperjuangan angkatan 2018 Fasilkom atas kekompakan dan kebersamaan dalam melewati masa-masa perkuliahan.

11. Kepada seseorang yang telah mengajari arti untuk bersabar dan selalu bersyukur dalam menjalani hidup.

12. Coldplay, Imagine Dragons, Troye Sivan, Zedd dengan lagu-lagunya yang sangat luar biasa telah menemani penulis dalam mengerjakan skripsi. Kalian adalah musisi hebat!

13. Semua pihak yang tidak dapat penulis sebutkan satu persatu.

Semoga Allah SWT senantiasa membalas segala bentuk kebaikan-kebaikan yang telah membantu menyelesaikan penyusunan skripsi. Amin Ya Rabbal Alamin

(9)

viii DAFTAR ISI

LEMBAR PENGESAHAN... i

SURAT PERNYATAAN KEASLIAN SKRIPSI ... ii

ABSTRAK ... iii

KATA PENGANTAR... v

UCAPAN TERIMA KASIH ... vi

DAFTAR ISI ... viii

DAFTAR GAMBAR ... xiii

DAFTAR TABEL ... xv

DAFTAR SIMBOL ... xviii BAB I PENDAHULUAN ... I-1 1.1 Latar Belakang ... I-1 1.2 Rumusan Masalah... I-3 1.3 Batasan Masalah ... I-3 1.4 Maksud dan Tujuan ... I-4 1.4.1 Maksud Penelitian ...I-4 1.4.2 Tujuan Penelitian ...I-4 1.5 Manfaat Penelitian ... I-4 1.6 Metodologi Penelitian ... I-5 1.6.1 Metode Pengumpulan Data ...I-6 1.6.2 Metode Pembangunan Sistem ...I-6 1.7 Waktu Penelitian... I-7 1.8 Sistematika Penulisan ... I-8 BAB II LANDASAN TEORI ... II-1 2.1 Konsep Dasar Sistem ... II-1 2.2 Analisa dan Perancangan Sistem... II-2 2.2.1 Analisa Sistem ... II-2

(10)

ix

2.2.2 Perancangan Sistem ... II-3 2.3 Kata ... II-3 2.4 Kalimat ... II-4 2.4.1 Unsur Kalimat ... II-4 2.4.2 Jenis Kalimat Menurut Fungsinya... II-5 2.5 Artikel ... II-6 2.6 Ringkasan (Summary) ... II-8 2.7 Information Retrieval ... II-8 2.8 Peringkas Teks Otomatis ... II-9 2.8.1 Definisi Peringkas Teks Otomatis ... II-9 2.8.2 Pendekatan Peringkas Teks Otomatis ... II-10 2.8.3 Tujuan Peringkas Teks Otomatis... II-10 2.8.4 Proses Peringkas Teks Otomatis ... II-11 2.8.5 Gambaran Umum Peringkas Teks Otomatis ... II-12 2.9 Algoritma Peringkas Teks Otomatis ... II-13 2.9.1 Preprocessing ... II-13 2.9.1.1 Pemisahan Kalimat ... II-13 2.9.1.2 Case Folding... II-14 2.9.1.3 Filtering ... II-14 2.9.1.4 Tokenizing ... II-15 2.9.1.5 Stop Word ... II-16 2.9.1.6 Stemming... II-19 2.9.2 TF-IDF (Term Frequency – Inverse Document Frequency) ... II-29 2.9.2.1 Pengertian TF-IDF ... II-29 2.9.2.2 Langkah Pengerjaan TF-IDF ... II-30 2.9.2.3 Ilustrasi Pengerjaan TF-IDF ... II-31 2.9.3 Compression Rate ... II-33 2.10 Dataset ... II-33 2.10.1 Dataset Peringkasan Chat ... II-33

(11)

x

2.10.2 Dataset Indosum ... II-34 2.11 UML (Unified Modeling Languange) ... II-34 2.12 Peralatan Pendukung (Tool Program) ... II-37 2.12.1 PHP ... II-37 2.12.2 XAMPP ... II-39 2.12.3 MySQL ... II-39 2.13 Metode RUP (Rational Unified Languange) ... II-40 BAB III ANALISIS KEBUTUHAN SISTEM ... III-1 3.1 Gambaran Sistem Peringkas Teks Otomatis ... III-1 3.2 Analisis Sistem ... III-2 3.3 Analisis Data Masukan ... III-3 3.3.1 Analisis Text Preprocessing ... III-4 3.3.1.1 Proses Pemisahan Kalimat ... III-5 3.3.1.2 Proses Case Folding ... III-6 3.3.1.3 Proses Filtering ... III-7 3.3.1.4 Proses Tokenizing ... III-9 3.3.1.5 Proses Stop Word ... III-11 3.3.1.6 Proses Stemming ... III-13 3.3.2 Metode TF-IDF (Term Frequency - Inverse Document Frequency)... III-15 3.4 Spesifikasi Kebutuhan Perangkat Lunak ... III-23 3.5 Analisis Kebutuhan Non Fungsional ... III-24 3.5.1 Kebutuhan Perangkat Keras (Hardware) ... III-24 3.5.2 Kebutuhan Perangkat Lunak (Software) ... III-25 3.5.3 Kebutuhan Perangkat Pikir ... III-25 3.6 Pemodelan Sistem ... III-26 3.6.1 Use Case Diagram ... III-26 3.6.1.1 Definisi Aktor... III-27 3.6.1.2 Definisi Use Case ... III-27 3.6.1.3 Skenario Use Case ... III-28

(12)

xi

3.6.2 Activity Diagram... III-31 3.6.2.1 Activity Diagram Ringkas Teks Otomatis ... III-31 3.6.2.2 Activity Diagram Lihat Tentang Aplikasi ... III-33 3.6.2.3 Activity Diagram Kirim Pengaduan Aplikasi ... III-34 3.6.3 Robustness Diagram ... III-35 BAB IV PERANCANGAN ... IV-1 4.1 Perancangan Class Diagram ... IV-1 4.2 Perancangan Sequence Diagram... IV-2 4.2.1 Sequence Diagram Ringkas Teks Otomatis ... IV-3 4.2.2 Sequence Diagram Lihat Tentang Aplikasi ... IV-4 4.2.3 Sequence Diagram Kirim Pengaduan Aplikasi ... IV-4 4.3 Perancangan Basis Data ... IV-5 4.4 Perancangan Antarmuka Sistem ... IV-5 4.4.1 Perancangan Tampilan Home ... IV-6 4.4.2 Perancangan Tampilan About ... IV-8 4.4.3 Perancangan Tampilan Contact Us ... IV-9 4.5 Perancangan Prosedural ... IV-10 BAB V IMPLEMENTASI DAN PENGUJIAN ... V-1 5.1 Implementasi Sistem ... V-1 5.1.1 Implementasi Perangkat Keras (Hardware) ... V-1 5.1.2 Implementasi Perangkat Lunak (Software) ... V-2 5.1.3 Implementasi Basis Data ... V-2 5.1.4 Implementasi Antarmuka Sistem ... V-4 5.1.4.1 Tampilan Halaman Home ... V-4 5.1.4.2 Tampilan Halaman About ... V-5 5.1.4.3 Tampilan Halaman Contact Us ... V-6 5.1.5 Prosedur Operasional ... V-6 5.2 Pengujian Sistem... V-9

(13)

xii

5.2.1 Skenario Pengujian ... V-9 5.2.1.1 Skenario Pengujian Fungsionalitas ... V-9 5.2.1.2 Skenario Pengujian Hasil Ringkasan ... V-11 5.2.1.3 Skenario Pengujian Persentase Ringkasan ... V-14 5.2.2 Hasil Pengujian... V-15 5.2.2.1 Hasil Pengujian Fungsionalitas ... V-15 5.2.2.2 Hasil Pengujian Ringkasan ... V-17 5.2.2.3 Hasil Pengujian Persentase Ringkasan ... V-21 5.2.3 Kesimpulan Hasil Pengujian ... V-24 BAB VI KESIMPULAN DAN SARAN ... VI-1 6.1 Kesimpulan ... VI-1 6.2 Saran ... VI-2 DAFTAR PUSTAKA ... xxiv

(14)

xiii

DAFTAR GAMBAR

Gambar 1.1 Skema Penelitian ... I-5 Gambar 2.1 Model Sistem ... II-2 Gambar 2.2 Gambaran Umum Sistem Peringkas Teks Otomatis ... II-13 Gambar 2.3 Proses Iteratif RUP ... II-41 Gambar 2.4 Alur Rational Unified Process (RUP) ... II-41 Gambar 3.1 Alur Sistem Automatic Text Summarization ... III-2 Gambar 3.2 Tahapan Preprocessing ... III-5 Gambar 3.3 Proses Pemisahan Kalimat ... III-5 Gambar 3.4 Proses Case Folding ... III-6 Gambar 3.5 Proses Filtering ... III-8 Gambar 3.6 Proses Tokenizing ... III-9 Gambar 3.7 Proses Stop Word ... III-11 Gambar 3.8 Proses Stemming ... III-14 Gambar 3.9Use Case Diagram Automatic Text Summarization ... III-27 Gambar 3.10 Activity Diagram Ringkas Teks Otomatis ... III-32 Gambar 3.11 Activity Diagram Lihat Tentang Aplikasi ... III-33 Gambar 3.12 Activity Diagram Kirim Pengaduan Aplikasi ... III-34 Gambar 3.13 Robustness Diagram Automatic Text Summarization ... III-35 Gambar 4.1 Class Diagram Automatic Text Summarization... IV-1 Gambar 4.2 Sequence Diagram Ringkas Teks Otomatis ... IV-3 Gambar 4.3 Sequence Diagram Lihat Tentang Aplikasi ... IV-4 Gambar 4.4 Sequence Diagram Kirim Pengaduan Aplikasi ... IV-4 Gambar 4.5 Rancangan Halaman Home... IV-6 Gambar 4.6Rancangan Halaman Upload File ... IV-7 Gambar 4.7Rancangan Halaman Tampil Teks ... IV-7 Gambar 4.8 Rancangan Halaman Hasil Ringkasan ... IV-8

(15)

xiv

Gambar 4.9 Rancangan Halaman About ... IV-9 Gambar 4.10 Rancangan Halaman Contact Us ... IV-10 Gambar 4.11 Flowchart Prosedur Sistem Automatic Text Summarization ... IV-11 Gambar 4.12 Flowchart Prosedur Algoritma Automatic Text Summarization ... IV-12 Gambar 5.1 Basis Data db_summarization ... V-3 Gambar 5.2 Implementasi Tabel tbl_katadasar ... V-3 Gambar 5.3 Implementasi Tabel tbl_stopword ... V-4 Gambar 5.4 Tampilan Implementasi Halaman Home ... V-5 Gambar 5.5 Tampilan Implementasi Halaman About ... V-5 Gambar 5.6 Tampilan Implementasi Halaman Contact Us ... V-6 Gambar 5.7 Tampilan Pilih File ... V-7 Gambar 5.8 Tampilan Proses Pemilihan File ... V-7 Gambar 5.9 Tampilan File Sesudah Upload ... V-8 Gambar 5.10 Tampilan Pilih Button Process ... V-8 Gambar 5.11 Tampilan Hasil Ringkasan ... V-9

(16)

xv

DAFTAR TABEL

Tabel 1.1 Jadwal Penelitian ... I-7 Tabel 2.1 Perubahan Kata Dasar Menjadi Kata Turunan yang Mengandung Berbagai Arti ... II-4 Tabel 2.2 Contoh Pemisahan Kalimat ... II-14 Tabel 2.3 Contoh Case Folding ... II-14 Tabel 2.4 Contoh Filtering... II-15 Tabel 2.5 Contoh Tokenizing ... II-15 Tabel 2.6 Contoh Stop Word ... II-18 Tabel 2.7 Kombinasi Awalan-Akhiran yang Tidak Diizinkan ... II-23 Tabel 2.8 Cara Menentukan Tipe Awalan untuk Kata yang Diawali Dengan “te-” ... II-24 Tabel 2.9 Jenis Awalan Berdasarkan Tipe Awalannya ... II-24 Tabel 2.10 Aturan untuk Inflectional Particle... II-24 Tabel 2.11 Aturan untuk Inflectional Possesive Pronoun ... II-24 Tabel 2.12 Aturan untuk First Order Derivational Prefix... II-25 Tabel 2.13 Aturan untuk Second Order Derivational Prefix ... II-25 Tabel 2.14 Aturan untuk Derivational Suffix ... II-26 Tabel 2.15 Aturan Pemenggalan Awalan Stemmer Nazief dan Adriani ... II-27 Tabel 2.16 Contoh Stemming ... II-28 Tabel 2.17 Kata Hasil Proses Stemming ... II-31 Tabel 2.18 Contoh Perhitungan TF-IDF ... II-32 Tabel 2.19 Hasil Perangkingan Kalimat ... II-33 Tabel 2.20 Simbol-simbol Use Case Diagram ... II-35 Tabel 2.21 Simbol-simbol Activity Diagram... II-36 Tabel 3.1 Analisis Kebutuhan Sistem ... III-3 Tabel 3.2 Data Masukan ... III-4 Tabel 3.3 Hasil Pemisahan Kalimat ... III-5

(17)

xvi

Tabel 3.4 Hasil Case Folding ... III-6 Tabel 3.5 Hasil Filtering ... III-8 Tabel 3.6 Hasil Tokenizing... III-9 Tabel 3.7 Hasil Stop Word ... III-12 Tabel 3.8 Hasil Stemming ... III-14 Tabel 3.9 Hasil Perhitungan TF-IDF ... III-16 Tabel 3.10 Hasil Perangkingan Kalimat ... III-20 Tabel 3.11 Kalimat Ringkasan Terpilih ... III-22 Tabel 3.12 Hasil Ringkasan ... III-22 Tabel 3.13 SKPL ... III-23 Tabel 3.14 Kebutuhan Perangkat Keras ... III-24 Tabel 3.15 Kebutuhan Perangkat Lunak ... III-25 Tabel 3.16 Pengetahuan dan Pengalaman Pengguna ... III-25 Tabel 3.17 Karakteristik Fisik Pengguna... III-26 Tabel 3.18 Definisi Aktor Use Case Diagram ... III-27 Tabel 3.19 Definisi Use Case ... III-28 Tabel 3.20 Skenario Use Case Ringkas Teks Otomatis ... III-28 Tabel 3.21 Skenario Use Case Lihat Tentang Aplikasi ... III-29 Tabel 3.22 Skenario Use Case Kirim Pengaduan Aplikasi ... III-30 Tabel 4.1 Struktur Tabel tbl_katadasar ... IV-5 Tabel 4.2 Struktur Tabel tbl_stopword ... IV-5 Tabel 5.1 Implementasi Perangkat Keras ... V-1 Tabel 5.2 Implementasi Perangkat Lunak... V-2 Tabel 5.3 Implementasi Basis Data ... V-2 Tabel 5.4 Implementasi Antarmuka ... V-4 Tabel 5.5 Daftar Skenario Pengujian Fungsionalitas ... V-10 Tabel 5.6 Daftar Artikel Pengujian ... V-11 Tabel 5.7 Rancangan Uji Fungsionalitas ... V-15 Tabel 5.8 Hasil Pengujian Fungsionalitas Data Benar ... V-16

(18)

xvii

Tabel 5.9 Hasil Pengujian Fungsionalitas Data Salah ... V-17 Tabel 5.10 Pengujian Sampel Data ... V-18 Tabel 5.11 Hasil Evaluasi Kuesioner ... V-21

(19)

xviii DAFTAR SIMBOL

Simbol Flowmap

No Simbol Nama Keterangan

1 Terminator

Menunjukkan simbol awalan dan akhiran dari proses sistem yang digambarkan

2 Proses

Kegiatan proses yang dilakukan oleh sistem

3

Dokumen (Document)

Menunjukkan dokumen input atau output untuk proses yang dilakukan komputer

4

Garis Aliran (Flow Line)

Menunjukkan alur data antar simbol/proses

Simbol Use Case Diagram

No Simbol Nama Keterangan

1 Use Case

Fungsionalitas yang disediakan sistem sebagai unit-unit yang saling bertukar pesan antar unit atau aktor;

biasanya dinyatakan dengan menggunakan kata kerja di awal frase nama use case

2 Aktor / Actor

Orang,proses, atau sistem lain yang berinteraksi dengan sistem informasi yang akan dibuat itu sendiri

(20)

xix 3

Asosiasi / Association

Komunikasi antara aktor dan use case yang berpartisipasi pada use case atau use case memiliki interaksi dengan aktor Sumber: Rosa dan Shalahuddin (2019: 156)

Simbol Activity Diagram

No Simbol Nama Keterangan

1 Status Awal

Status awal aktivitas sistem, sebuah diagram aktivitas memiliki sebuah status awal

2 Aktivitas

Aktivitas yang dilakukan sistem, aktivitas biasanya diawali dengan kata kerja

3 Status Akhir

Status akhir yang dilakukan sistem

4 atau Swimlane

Memisahkan organisasi bisnis yang bertanggung jawab terhadap aktivitas yang terjadi

Sumber: Rosa dan Shalahuddin (2019: 162)

(21)

xx Simbol Robustness Diagram

No Simbol Nama Keterangan

1 Boundary Class

Menggambarkan sebuah gambaran view dari sistem

2 Control Class

Menggambarkan penghubung antara boundary dengan entity

3 Entity Class

Menggambarkan sebuah gambaran model dari sistem

4 Message

Menggambarkan perilaku sistem yang ditandai adanya suatu interaksi alur informasi atau transisi antar elemen

Simbol Class Diagram

No Simbol Nama Keterangan

1 Kelas Kelas pada struktur sistem

2

Asosiasi / Association

Relasi antar kelas dengan makna umum, asosiasi biasanya juga disertai dengan multiplicity

Sumber: Rosa dan Shalahuddin (2019: 146)

(22)

xxi Simbol Sequence Diagram

No Simbol Nama Keterangan

1 Aktor

Orang, proses, atau sistem lain yang berinteraksi dengan sistem informasi yang akan dibuat di luar sistem informasi yang akan dibuat itu sendiri

2

Garis Hidup / Lifeline

Menyatakan kehidupan suatu objek

3 Objek

Menyatakan objek yang berinteraksi pesan

4 Waktu Aktif

Menyatakan objek dalam keadaan aktif dan berinteraksi, semua yang terhubung dengan waktu aktif ini adalah sebuah tahapan yang dilakukan di dalamnya

5 Pesan Tipe Call

Menyatakan suatu objek memanggil operasi/metode yang ada pada objek lain atau dirinya sendiri

Arah panah mengarah pada objek yang memiliki

operasi/metode, karena ini memanggil operasi/metode

(23)

xxii

maka operasi/metode yang dipanggil harus ada pada diagram kelas sesuai dengan kelas objek yang berinteraksi

6

Pesan Tipe Send

Menyatakan bahwa suatu objek mengirimkan

data/masukan/informasi ke objek lainnya, arah panah mengarah pada objek yang dikirimi

7

Pesan Tipe Return

Menyatakan bahwa suatu objek yang telah menjalankan suatu operasi atau metode

menghasilkan suatu kembalian ke objek tertentu, arah panah mengarah pada objek yang menerima kembalian Sumber: Rosa dan Shalahuddin (2019: 165)

Simbol Flowchart

No Simbol Nama Keterangan

1 Terminator

Simbol yang menandakan permulaan dan akhiran dari program (prosedur)

2 Process

Simbol menunjukkan proses operasional yang dilakukan oleh komputer

3

Simbol Input - Output

Simbol yang menyatakan proses input ataupun output

(24)

xxiii

4 Flow

Simbol yang disebut dengan Connecting Line ini digunakan untuk menghubungkan alur antara satu simbol dengan simbol lainnya

(25)

I-1 BAB I PENDAHULUAN

1.1 Latar Belakang

Di era globalisasi saat ini, perkembangkan ilmu pengetahuan dan teknologi terus berkembang pesat sehingga mudahnya menerima informasi. Dengan perkembangan teknologi yang semakin canggih, mempermudah pengguna mendapatkan informasi yang tepat dan akurat dari media online. Pengguna internet di Indonesia dari tahun ke tahun semakin meningkat sehingga berdampak pada bertambahnya jumlah artikel atau jurnal yang disajikan untuk memberi informasi setiap harinya. Hal tersebut bisa dilihat dari hasil survey yang diselenggarakan oleh We Are Social 2021. Dalam mengakses media sosial, pengguna internet di Indonesia rata-rata menghabiskan waktu untuk membaca media pers secara online setiap harinya kurang lebih selama 1 jam 38 menit. Sehingga ada istilah tiada hari kebutuhan masyarakat tanpa pasokan berita yang didapat karena adanya rasa penasaran terhadap suatu peristiwa atau kejadian yang dinilai begitu penting.

Media online secara unggul dapat menyajikan informasi bersifat up to date dan real time. Pada umumnya artikel yang ada pada situs portal berita memiliki kalimat atau paragraf yang tidak sedikit sehingga pembaca kesulitan untuk menyerap permasalahan atau intisari dari artikel tersebut. Untuk itu pembaca membutuhkan banyak waktu untuk memahami keseluruhan isi artikel dengan rata-rata jumlah kalimat yang tidak sedikit. Agar pembaca dapat menghemat waktu untuk memahami inti bacaan tanpa harus membaca keseluruhan artikel, maka diperlukan aplikasi peringkasan teks secara otomatis agar mendapatkan hasil teks artikel yang lebih ringkas.

Peringkas teks otomatis (Automatic Text Summarization) merupakan alat atau teknik yang memiliki kemampuan dalam meringkas dengan membuat teks menjadi lebih pendek. Sistem peringkas teks termasuk salah satu cabang ilmu pemrosesan bahasa alami manusia (Natural Languange Processing) yang memiliki sistem berupa masukan

(26)

I-2

yaitu teks asli sehingga menghasilkan keluaran dalam bentuk ringkasan yang terdiri dari informasi atau poin-poin penting yang diambil dari teks sumber. Sistem dirancang secara tepat dan sesuai guna menghasilkan informasi peringkasan menggunakan algoritma tertentu.

Banyak penelitian yang berkaitan dengan peringkasan teks otomatis salah satu penelitian sebelumnya, yaitu dilakukan oleh Saputra, dkk pada tahun 2017. Saputra, dkk (2017) melakukan penelitian peringkasan teks otomatis pada dokumen berbahasa Indonesia yang menerapkan metode Latent Semantic Analysis (LSA) dan Teknik Steinberger & Jezek dengan menguji 10 teks berita. Pengolahan kata terdiri dari tahap preprocessing dan processing. Pada tahap preprocessing, peneliti melakukan proses pengolahan data awal dari mulai case folding sampai dengan tahap stemming. Sedangkan pada tahap processing melibatkan proses implementasi menggunakan metode Latent Semantic Analysis (LSA), pembobotan TF-IDF, pembuatan matrik term-sentence, melakukan penghitungan SVD terhadap matriks inputan hasil pembobotan serta pemilihan kalimat menggunakan teknik Steinberger & Jezek. Hasil akhir penelitian didapatkan hasil ringkasan sebesar 50% dengan menghasilkan rata-rata recall 0.7027, precision 0.6973 dan f-measure sebesar 0.6974. Sementara penelitian lain yang membahas Automatic Text Summarization (ATS) juga sudah dilakukan oleh Ridok dan Romadhona (2013) yang membahas implementasi peringkas dokumen dengan melakukan pembobotan terhadap kalimat menggunakan fuzzy model inferensi madani. Penelitian tersebut didapatkan hasil akhir uji coba sistem sebesar 20% dan 50% terhadap 15 dokumen berita dengan membandingkan uji coba menggunakan AutoSummarize (Microsoft Word).

Berdasarkan uraian diatas, pada penelitian ini akan dibangun sistem peringkas teks otomatis atau yang dikenal sebagai Automatic Text Summarization (ATS). Adapun sistem peringkas teks yang dibangun dimulai dari tahap pengolahan kata (preprocessing) sampai dengan implementasi metode penghitungan TF-IDF yaitu mencari bobot kalimat untuk membuktikan apakah hasil ringkasan sudah sesuai dengan topik artikel. Perangkingan diurutkan berdasarkan kalimat yang memiliki bobot tertinggi sehingga diharapkan sistem menghasilkan output yang sesuai dengan kebutuhan pengguna dan dapat diakses secara

(27)

I-3

umum (public user). Oleh karena itu, penulis bermaksud melakukan penelitian skripsi dengan pokok bahasan berjudul “Perancangan dan Implementasi Fitur Automatic Text Summarization Pada Artikel Berbahasa Indonesia”.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan diatas, setiap proses tidak terlepas dari masalah untuk mencapai tujuan yang diharapkan. Maka dari itu, didapatkan rumusan masalah dari penelitian yang meliputi:

1. Bagaimana merancang sistem automatic text summarization pada artikel berbahasa Indonesia?

2. Bagaimana implementasi sistem automatic text summarization pada artikel berbahasa Indonesia?

3. Bagaimana sistem automatic text summarization yang dibangun dapat menghasilkan sebuah ringkasan dari artikel tanpa mengurangi pokok permasalahan dari teks asli?

1.3 Batasan Masalah

Batasan masalah perancangan sistem terhadap ruang lingkup sehingga penelitian yang dikerjakan dapat lebih fokus dan terarah terhadap satu tujuan. Beberapa batasan masalah dalam penelitian skripsi ini, dintaranya yaitu:

1. Bentuk input data berupa file dengan format .txt dari artikel tunggal berbahasa Indonesia.

2. Analisis dan perancangan sistem peringkas teks otomatis menggunakan metode RUP (Relational Unified Process).

3. Peringkas teks otomatis yang dibangun menggunakan bahasa pemrograman PHP.

4. Database yang digunakan adalah MySQL.

5. Sistem diimplemetasikan pada perangkat komputer berbasis web.

6. Pengujian dilakukan menggunakan artikel yang diambil dari situs berita internet dengan kategori berbeda-beda.

(28)

I-4

1.4 Maksud dan Tujuan 1.4.1 Maksud Penelitian

Berdasarkan permasalahan yang ada, maka maksud dari penelitian ini adalah untuk membangun sistem Automatic Text Summarization berbasis website sebagai objek penelitian.

1.4.2 Tujuan Penelitian

Tujuan yang diharapkan dari penelitian tugas akhir ini adalah:

1. Mengetahui alur proses pengolahan kata (preprocessing) dari sistem automatic text summarization pada artikel berbahasa Indonesia.

2. Merancang dan mengetahui implementasi dari sistem automatic text summarization pada artikel berbahasa Indonesia menggunakan penghitungan TF-IDF.

1.5 Manfaat Penelitian

Adapun manfaat yang diperoleh dari penelitian ini yaitu mampu memberikan manfaat baik secara teoritis maupun praktis diantaranya adalah:

1. Manfaat Teoritis

Hasil penelitian diharapkan dapat menambah khasanah ilmu pengetahuan dan menjadi bahan informasi terhadap penelitian-penelitian yang akan datang terkait perancangan dan pembangunan sistem peringkas teks otomatis.

2. Manfaat Praktis

Secara garis besar, manfaat praktis yang diharapkan dari penelitian skripsi dapat menambah pengetahuan mengenai perancangan sistem peringkas teks otomatis.

a. Bagi Penulis

Dengan adanya penelitian ini, diharapkan memberi masukan yang bermanfaat serta menambah pengetahuan dan wawasan di bidang pembangunan sistem peringkas teks otomatis. Selain itu, bermanfaat untuk melatih kemampuan menggunakan bahasa pemrograman dalam pembuatan sistem.

(29)

I-5

b. Bagi Program Studi Sistem Informasi Universitas Subang

Menambah referensi penelitian pada Program Studi Sistem Informasi.

Penelitian dapat dipakai sebagai salah satu alternatif guna memantapkan pengetahuan dan menambah wawasan serta melatih kemampuan mahasiswa dalam menerapkan ilmu yang sesuai dengan bidang penelitian.

1.6 Metodologi Penelitian

Metodologi penelitian dilakukan mulai dari tahap identifikasi masalah, pengembangan dan evaluasi yang dilakukan secara sistematis dan objektif. Adapun skema dari tahap penelitian ini, lebih jelasnya dapat dilihat pada Gambar 1.1.

Gambar 1.1 Skema Penelitian

Mulai

Pengumpulan Data Studi Literatur

Metode Pengembangan RUP

Fase Elaboration

Fase Construction

Fase Transition Fase Inception

Kesimpulan dan Saran

Selesai Identifikasi dan Rumusan Masalah

Evaluasi Data

(30)

I-6

1.6.1 Metode Pengumpulan Data

Dalam memulai penelitian, langkah pertama yang dilakukan penulis adalah mengumpulkan data yang dijadikan sebagai acuan dasar penelitian. Metode yang digunakan dalam proses pengumpulan data dilakukan dengan beberapa tahap sebagai berikut:

1. Studi Literatur

Membaca dan mempelajari referensi-referensi yang diperoleh dari buku, jurnal, skripsi, hasil-hasil penelitian dan bahan referensi lainnya terkait dengan obyek penelitian. Mencari informasi dengan mengkaji teori dasar sehingga memperoleh ilmu dan pengetahuan dalam melaksanakan penelitian.

2. Pengumpulan Data

Pengumpulan data dengan mengumpulkan dokumen-dokumen yang dibutuhkan serta mempelajari dan menganalisis dokumen terkait dengan objek yang sedang diteliti. Adapun data yang digunakan dalam tahap pengujian berupa artikel dari situs media berita yang diambil secara acak dari sumber berita yang berbeda.

1.6.2 Metode Pembangunan Sistem

Metode pembangunan sistem yang digunakan dalam penelitian ini menggunakan metode RUP. RUP adalah kerangka proses yang menggunakan konsep object oriented dimana peneliti fokus pada pengembangan model dengan menggunakan Unified Model Languange (UML). Adapun perincian mengenai tahapan-tahapan metode RUP dijelaskan sebagai berikut:

1. Inception (Permulaan)

Tahap ini dilakukan dengan memodelkan proses bisnis yang dibutuhkan dalam proses pengembangan sistem automatic text summarization dan mendefinisikan kebutuhan (requirements) terhadap sistem yang akan dibuat.

(31)

I-7

2. Elaboration (Perencanaan)

Tahap ini mulai fokus terhadap perencanaan arsitektur sistem meliputi analisis dan desain sistem yang fokus terhadap tampilan sistem (prototype). Analisis dirancang menggunakan diagram UML.

3. Construction (Konstruksi)

Tahap ini difokuskan pada pengembangan komponen dan fitur-fitur sistem.

Selanjutnya dilakukan pengujian terhadap implementasi sistem yang dibuat, sehingga pada tahap ini dapat menghasilkan produk perangkat lunak.

4. Transition (Transisi)

Tahap ini dilakukan instalasi dan pengujian sistem untuk mencari masalah dan kekurangan yang mungkin timbul setelah proses pengujian. Selanjutnya melakukan evaluasi dan pemeliharaan apakah sistem sudah memenuhi harapan user.

1.7 Waktu Penelitian

Pada penelitian skripsi ini, penulis melakukan pengembangan sistem automatic text summarization (peringkas teks otomatis) dengan waktu penelitian dilaksanakan dalam empat bulan terhitung dari bulan Maret 2022 sampai dengan bulan Juni 2022. Rencana penelitian ditargetkan selama 3 bulan sejak diseminarkannya proposal skripsi dengan judul penelitian yang telah diajukan dan dilanjutkan dengan penyusunan skripsi.

Adapun rincian waktu pelaksanakan penelitian menggunakan metode RUP dapat dilihat pada Tabel 1.1 sebagai berikut.

Tabel 1.1 Jadwal Penelitian

No

Rincian Tahap Penelitian

Bulan/Tahun Maret

2022

April 2022

Mei 2022

Juni 2022 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 Proposal

(32)

I-8

2

Tahap Inception

3

Tahap Elaboration

4

Tahap Construction

5

Tahap Transition

1.8 Sistematika Penulisan

Sistematika penulisan pada laporan ini terbagi menjadi enam bab dengan beberapa sub pokok bahasan masing-masing bab secara keseluruhan sebagai berikut:

BAB I PENDAHULUAN

Bab I mendeskripsikan secara umum mengenai latar belakang, rumusan masalah, batasan masalah, maksud dan tujuan, manfaat penelitian, metodologi penelitian, waktu penelitian yang digunakan serta gambaran sistematika penulisan dalam melaksanakan penulisan tugas akhir.

BAB II LANDASAN TEORI

Bab II membahas konsep dasar dan teori-teori yang menjadi referensi utama dalam mendukung penelitian skripsi. Teori diambil dari berbagai sumber seperti, skripsi, buku, jurnal dan teori-teori lainnya yang berkaitan dengan penelitian.

BAB III ANALISIS KEBUTUHAN SISTEM

Bab III berisi tentang penjelasan analisis dan gambaran dari permasalahan yang dijadikan topik skripsi beserta pemodelan struktur sistem. Poin-poin pada bab III meliputi gambaran sistem peringkas teks otomatis, analisis sistem, analisis data masukan, spesifikasi kebutuhan perangkat lunak, analisis kebutuhan non fungsional, serta gambaran pemodelan sistem yang dirancang pada penelitian ini.

(33)

I-9

BAB IV PERANCANGAN

Bab IV menjelaskan tentang hasil perancangan dari analisis dan pemodelan sistem yang sudah dibuat pada bab sebelumnya untuk melakukan pengembangan sistem automatic text summarization pada artikel berbahasa Indonesia.

BAB V IMPLEMENTASI DAN PENGUJIAN

Bab V menjelaskan tentang implementasi dari spesifikasi perangkat keras dan lunak yang dibutuhkan dalam menjalankan sistem. Serta implementasi basis data, antarmuka dan prosedur operasional untuk dilanjutkan ke tahap pengujian sehingga dapat ditarik kesimpulan.

BAB VI KESIMPULAN DAN SARAN

Bab VI merupakan bab akhir dari penulisan skripsi. Uraian yang telah diulas dari proses pembuatan sistem dituangkan dalam bentuk kesimpulan dan disertakan saran-saran dari penulis untuk pengembangan dan kualitas penelitian lebih lanjut terkait sistem automatic text summarization (peringkas teks otomatis).

Referensi

Dokumen terkait

diibaratkan seperti teknologi penginderaan jarak jauh menggunakan citra satelit yang digunakan untuk mendeteksi potensi sumber daya alam di suatu titik lokasi,

1) Hasil belajar Mata Kuliah Ilmu Gizi Dasar ditinjau dari kemampuan pengetahuan, sikap dan keterampilan mencakup pengertian ilmu gizi, fungsi dan sumber zat gizi,

masalah-masalah/isu-isu strategis, pemilihan strategi alternatif, pengambilan BALANCED SCORECARD Pelanggan Proses Internal Pertumbuhan Keuangan Dipetakan Diterjemahkan

Geschool adalah salah satu jejaring sosial edukasi yang dikembangkan untuk memajukan dunia pendidikan Indonesia, ini terlihat dari fitur-fitur dan reward menarik

Dalam model campuran, misal terdapat dua faktor dalam suatu percobaan yaitu A dan B, bila salah satu dari A atau B yang digunakan dalam penelitian diambil

Selain dari staff, kami juga meminta bantuan dari para pengajar LTC untuk menjadi pembawa acara sekaligus juga ada yang menjadi pembuka dalam berdoa dan juga ada

1) Comonents: fasilitas yang dibuat untuk penulis dalam mengupload file yang akan dikirimkan kepada pengelola jurnal yang dapat berupa hasil wawancara, grafik dan gambar. 2)

Dengan latar belakang yang sama bahkan bisa lebih dibawah dari pedagang yang di Galabo, para tukang becak perlu dibekali bahasa Inggris dasar bagi profesi mereka, karena