• Tidak ada hasil yang ditemukan

ANALISIS DAN IMPLEMENTASI PERINGKASAN TEKS OTOMATIS DENGAN ALGORITMA DE (DIFFERENTIAL EVOLUTION)

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS DAN IMPLEMENTASI PERINGKASAN TEKS OTOMATIS DENGAN ALGORITMA DE (DIFFERENTIAL EVOLUTION)"

Copied!
5
0
0

Teks penuh

(1)

ANALISIS DAN IMPLEMENTASI PERINGKASAN TEKS OTOMATIS DENGAN ALGORITMA DE (DIFFERENTIAL EVOLUTION)

Komang Gede Subhawa¹, Imelda Atastina², Agus Nursikuwagus.mm.³

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Abstrak

Peringkasan teks otomatis adalah pembuatan teks yang lebih singkat dari teks sumbernya dengan menggunakan aplikasi tetapi tetap mempertahankan inti informasi yang diberikan oleh dokumen atau teks sumber. Peringkasan teks otomatis dapat membantu mempersingkat waktu untuk memahami dokumen dibandingkan dengan membaca seluruh isi dokumen.

Pada penelitian ini dibuat sebuah peringkas teks otomatis dengan menggunakan metode

ekstraksi yaitu dengan menentukan kalimat - kalimat yang penting dan akan dijadikan ringkasan . Hasil ringkasan diperoleh dari kalimat - kalimat yang terpilih unt uk menjadi ringkasan, jumlah kalimat yang terpilih tidak lebih dari setengah dokumen sumber. Penyeleksian kalimat - kalimat yang akan menjadi ringkasan dilakukan dengan algoritma DE ( Differential Evolution ). Algoritma DE adalah salah satu dari algoritma evol usi y ang terkenal dengan kecepatan konvergensinya . Setelah ringkasan didapat, ringkasan akan dievaluasi menggunakan 3 faktor atau disebut summary factor yaitu TRF ( Topic - Relation Factor ), RF ( Readibility Factor ), dan CF ( Cohesion Factor ). Pada penelitian i ni masing - masing dari 3 faktor tersebut dapat diset besar prioritasnya sesuai keinginan user.

Peringkas teks otomatis yang dibuat pada tugas akhir ini mampu menghasilkan ringkasan denga n nilai F - measure lebih dari 0.6 melalui pengukuran ROUGE - 1 dan ROUGE - 2 . Dengan adanya peringkas teks otomatis ini waktu yang diperlukan untuk memperoleh informasi dalam suatu dokumen dapat dipersingkat.

Kata Kunci : automatic text summarisation, algoritma Differential Evolution , summary factor, ekstraksi.

Abstract

Automatic text summarisation is the making of shorter version of document by using application but still keep the information provided by the source documen t. Automatic text summarisation can help to get information faster than read the entire document.

n this research, automatic text summarisation is created using exctraction method to determine which sentences are important and will be used as a summary. T he summary result obtained from the sentence that selected to be a summary, the number of sentence s are no more than half of the source document. Differential Evolution is used to choose which sentences will be part of summary. Differential Evolution is one of the evolutionary computation which known for this speed of convergence. The summary from Dif ferential Evolution will be evaluated using 3 factors or called summary factors, which are TRF (Topic - Relation Factor), RF (Readibility Factor), and CF (Cohesion Factor). T he priority of summary factor can be set.

T his automatic text summarisation can prod uce summaries wi th F - measures values over 0.6. W ith this automatic text summarisation the time required to obtain the information in a documen t can be faster.

Keywords : automatic text summarization, Differential Evolution, summary factor, extraction.

Powered by TCPDF (www.tcpdf.org)

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

(2)

1

1. PENDAHULUAN

1.1 Latar Belakang

Peringkasan teks adalah proses menghasilkan dokumen dengan besar tidak lebih dari 50% ukuran dokumen sumber [8]. Salah satu langkah untuk mendapatkan ringkasan yang cepat adalah dengan menggunakan aplikasi yang dapat meringkas teks secara otomatis. Peringkasan teks otomatis adalah sebuah aplikasi untuk melakukan peringkasan pada dokumen dengan tetap memberikan informasi utama dari dokumen sumber. Dengan adanya peringkasan teks otomatis ini maka waktu yang dibutuhkan untuk mendapatkan informasi dari suatu dokumen akan lebih cepat.

Ada 2 kriteria dalam peringkasan teks yaitu peringkasan teks berdasarkan ekstraksi dan abstraksi [4]. Peringkasan teks dengan abstraksi adalah dengan mengambil intisari dari kalimat-kalimat pada dokumen dan kemudian membuat kalimat baru dengan intisari sama yang lebih ringkas daripada kalimat-kalimat sebelumnya. Peringkasan teks dengan abstraksi adalah proses meringkas teks yang umumnya dilakukan oleh manusia secara langsung. Proses ekstraksi adalah menyalin kalimat-kalimat yang dianggap paling mewakilkan dokumen. Karena proses meringkas dengan abstraksi masih sulit diterapkan pada peringkasan teks otomatis, penelitian-penelitian mengenai peringkasan teks otomatis umumnya menggunakan metode ekstraksi.

Pada tugas akhir ini akan dilakukan penelitian dalam peringkasan teks otomatis dengan metode ekstraksi menggunakan algoritma DE (Differential Evolution).

Algoritma DE merupakan salah satu dari algoritma evolusi yang terkenal dengan kecepatan konvergensinya. Sebelum dilakukan proses algoritma DE pada dokumen dilakukan preprocessing terlebih dahulu seperti stopwords removal, stemming dan normalisasi berupa pengecekan sinonim. Hal-hal tersebut kemudian akan berperan dalam pemberian bobot pada kata dan penentuan nilai similarity pada kalimat-kalimat. Setelah preprocessing dan representasi dokumen dilakukan maka akan dilakukan pencarian solusi berupa hasil ringkasan dengan menggunakan algoritma DE. Dalam mendapat hasil ringkasan pada metode ekstraksi, hasil ringkasan yang paling memiliki keterkaitan dengan topik, kemungkinan akan menghasilkan ringkasan yang tidak begitu bagus keterbacaannya, begitu juga sebaliknya. Untuk itu evaluasi dari hasil ringkasan dapat dilakukan dengan menggunakan 3 faktor yang disebut summary factor yaitu TRF (Topic Relation Factor), CF (Cohesion Factor), dan RF (Readibility Factor) [7]. TRF adalah keterhubungan hasil ringkasan dengan judulnya, sedangkan CF digunakan untuk menilai apakah hasil ringkasan masih berbicara mengenai informasi yang sama, dan RF untuk menilai keterbacaan dari suatu ringkasan.

Dengan adanya ketiga faktor ini diharapkan hasil ringkasan akan sesuai dengan keinginan user.

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

(3)

2 1.2 Perumusan Masalah

Berdasarkan latar belakang maka permasalahan yang menjadi objek penelitian dalam Tugas Akhir ini adalah:

 Bagaimana mengimplementasikan algoritma DE untuk mendapatkan ringkasan yang akurat dan dalam waktu cepat

 Bagaimana akurasi dan performansi hasil ringkasan yang dihasilkan peringkasan teks otomatis dengan algoritma DE

Lingkup dan batasan pada pengerjaan peringkasan teks otomatis ini adalah:

 Dokumen yang digunakan adalah dokumen berbahasa Indonesia

 Dokumen yang digunakan bertipe berita

 Peringkasan dilakukan pada dokumen tunggal

 Metode yang digunakan adalah metode ekstraksi

 Kondisi berhenti pada algoritma DE adalah ketika telah mendapatkan nilai fitness maksimum atau pada maksimum generasi yang telah ditentukan

 Summary factor yang digunakan adalah TRF, CF, dan RF

1.3 Tujuan

Tujuan yang ingin dicapai dalam tugas akhir ini adalah :

 Mengimplementasikan algoritma DE dalam peringkasan teks otomatis

 Menganalisis akurasi dan performansi hasil ringkasan yang diperoleh dengan menerapkan algoritma DE

1.4 Hipotesa

Hipotesa pada penelitian ini adalah algoritma DE dapat diterapkan dalam peringkasan teks otomatis dan mampu menghasilkan solusi berupa ringkasan terbaik dengan melalui penentuan parameter yang tepat.

1.5 Metodologi Penyelesaian Masalah

Metodologi yang digunakan untuk menyelesaikan masalah ini adalah a. Studi pustaka dan literatur

Pada tahap ini dilakukan pencarian terhadap sumber-sumber referensi yang berhubungan dengan penelitian yang dilakukan agar mampu memperoleh metode penyelesaian masalah sesuai tujuan riset. Topik-topik yang dipelajari adalah mengenai text summarization, stemming, stopword removal, dan algoritma DE.

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

(4)

3 b. Analisis kebutuhan sistem

Pada tahap ini akan dilakukan analisis perancangan dan penerapan peringkasan teks otomatis menggunakan algoritma DE. Inputan sistem berupa dokumen, kemudian dilakukan preprocessing dan dokumen direpresentasikan dalam bentuk graph, kemudian dilakukan implementasi algoritma DE, dan keluaran adalah berupa hasil ringkasan yang dianggap menjadi solusi terbaik dari hasil algoritma DE dengan panjang tidak lebih dari setengah dari panjang dokumen asal.

c. Implementasi sistem

Pada tahap ini dilakukan realisasi terhadap sistem yang telah dirancang.

Akan dibangun aplikasi peringkasan teks otomatis dengan algoritma Differential Evolution yang terdiri dari beberapa tahap seperti representasi dokumen, penerapan algoritma Differential Evolution, dan pengukuran performansi sistem. Sistem akan dibuat dengan menggunakan bahasa java, software yang digunakan untuk pembuatan peringkasan teks otomatis ini adalah Netbeans. Berikut gambaran secara umum urutan proses yang ingin dibangun dalam tugas akhir ini :

start Dokumen

Preprosesing text

Representasi Dokumen

Finish Algoritma

DE

Ringkasan

d. Pengujian sistem dan analisa hasil uji

Pada tahap ini dilakukan pengujian terhadap sistem yang telah dibuat.

Dalam sistem ini pengujian dilakukan bertujuan untuk menganalisis pengaruh parameter-parameter algoritma DE terhadap hasil ringkasan dan menganalisis performansi algoritma DE dalam menghasilkan ringkasan.

e. Penyusunan laporan tugas akhir

Pada tahap ini ditarik kesimpulan dari hasil analisis dan pegujian yang dilakukan. Kemudian dilakukan dokumentasi semua tahapan proses berupa laporan yang berisi tentang dasar teori dan hasil Tugas Akhir.

Powered by TCPDF (www.tcpdf.org)

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

(5)

29

5. KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan hasil dari implementasi, pengujian dan analisis yang telah dilakukan, maka dapat diambil kesimpulan sebagai berikut :

1. Dari hasil percobaan, pada kasus ini parameter yang mempengaruhi nilai fitness solusi yang dihasilkan adalah parameter ukuran populasi dan Pc.

Semakin besar ukuran populasi dan Pc maka individu yang dihasilkan rata-rata akan memiliki fitness yang semakin tinggi. Nilai Pc 1.0 menghasilkan rata-rata nilai fitness tertinggi, sedangkan pada kasus Tugas Akhir ini percobaan untuk maksimal individu yang diobservasi sejumlah 10.000 nilai ukuran populasi 1000 menghasilkan rata-rata nilai fitness yang tertinggi.

2. Dari hasil percobaan, parameter lamda dan F memiliki pengaruh dalam kecepatan untuk menemukan solusi terbaik. Dari pengujian melalui cara trial and error didapat nilai lamda terbaik adalah 0.5 dan F terbaik adalah 0.005 untuk kasus Tugas Akhir ini.

3. Dengan adanya Stopword Removal dan Stemming maka akurasi ringkasan menjadi lebih baik.

5.2 Saran

1. Tugas Akhir ini dapat dikembangkan dengan menambah faktor koheren agar ringkasan yang dihasilkan semakin baik. Faktor koheren menentukan sejauh mana antar kalimat masih membahas informasi yang sama dengan memperhatikan makna kalimat, bukan hanya dilihat dari kata yang sama.

Powered by TCPDF (www.tcpdf.org)

Fakultas Teknik Informatika Program Studi S1 Teknik Informatika

Referensi

Dokumen terkait

Berdasarkan hasil u ji ahli media booklet me lalu i layanan informasi dala m upaya pencegahan perila ku bullying untuk siswa ke las XI d i SMA Negeri 7 Surabaya kepada

Junaidi, dkk (2007) dalam penelitianya juga menunjukkan bahwa terdapat hubungan yang bermakna antara karies gigi dengan status gizi anak sekolah, dalam penelitiannya

Oleh karena itu sebagai mahasiswa perguruan tinggi di Indonesia( Institut Teknologi Sepuluh Nopember) diperlukan keikutsertaan dalam riset dan pengembangan robotika maka

Beberapa saran untuk penelitian selanjutnya antara lain: pengujian dilakukan pada tipe teks lainnya, seperti jurnal dan skripsi, aturan segmentasi kalimat diperbaiki agar

Setelah pencarian selesai, akan muncul window yang berisi informasi berupa berapa banyak pattern yang ditemukan dalam text dan waktu minimal yang diperlukan untuk

Berikut adalah rancangan Diagram Aktifitas membuat Tambah Data warga baru pada Sistem Informasi yang akan di buat di Kantor Desa Dauwan Barat. Sumber : Hasil

Dan Bagi Penyelenggaraan Dana Pensiun yaitu Mengelola Dana Pensiun untuk memperoleh Keuntungan, Turut membantu dan mendukung program Pemerintah, dan sebagai Bakti

Peningkatan pendapatan dalam usahatani akan berdampak pada pengambilan keputusan rumahtangga untuk meningkatkan alokasi waktu kerja dalam usahatani dan penggunaan