I-1
Kebutuhan akan informasi yang sangat luas dan tidak terbatas merupakan sebuah bukti nyata bahwa informasi sangat diperlukan bagi pencari informasi [16]. Dengan munculnya banyak informasi dan tuntutan kesibukan diperlukan suatu ringkasan yang diharapkan dapat membantu menghemat waktu dalam membaca isi dari keseluruhan teks bacaan dari sumber informasi. Sehingga dari ringkasan tersebut didapat informasi yang lebih ringkas dengan mengambil isi yang dianggap paling penting dari sumber informasi teks bacaan dari penggunanya. Artikel merupakan suatu teks bacaan yang dapat digunakan sebagai media informasi. Artikel didefinisikan sebagai bentuk karangan yang berisi analisis suatu fenomena alam atau sosial dengan maksud untuk menjelaskan siapa, apa, kapan, dimana, bagaimana dan mengapa fenomena alam atau sosial tersebut terjadi. Oleh karena itu, penulis tertarik untuk membuat aplikasi peringkasan otomatis teks berbahasa Indonesia untuk membantu para pembaca artikel untuk menghemat waktu dalam membaca dan juga memberikan informasi yang cepat.
Konsep sederhana ringkasan adalah mengambil bagian terpenting dari keseluruhan isi artikel. Menurut Mani dan Maybury (1999), ringkasan adalah mengambil isi yang paling penting dari sumber informasi yang kemudian menyajikannya kembali dalam bentuk yang lebih ringkas bagi penggunanya.
Berdasarkan keluaran dari ringkasan terbagi menjadi dua macam, yaitu ringkasan ekstraksi dan abstraksi. Ekstraksi merupakan pemilihan terhadap beberapa kalimat yang dianggap paling penting dari sebuah dokumen. Sedangkan abstraksi merupakan ringkasan yang didapat sebagai suatu pengganti terhadap dokumen asli. Penulis akan menggunakan teknik ekstraksi dalam peringkasan pada penelitian ini.
Penelitian mengenai peringkasan otomatis telah dilakukan oleh beberapa peneliti. Diantaranya, Mustaqhfiri, dkk (2011), Luthfiarta, dkk (2013) dan Pratama (2014). Mustaqhfiri menggunakan metode Maximum Marginal
Relevance (MMR). Metode ekstraksi MMR merupakan metode yang digunakan untuk mengurangi redudansi dalam perangkingan kalimat pada multi-dokumen.
Hasil dari penelitian untuk peringkasan berita bahasa Indonesia didapat rata-rata recall 60%, precision 77%, dan f-measure 66%. Luthfiarta menggunakan metode Latent Semantic Analysis (LSA) dan K-Means Clustering. Hasil penelitian dapat disimpulkan bahwa peringkas dokumen otomatis dengan LSA pada proses clustering dokumen dapat meningkatkan kinerja clustering dokumen lebih baik daripada peringkas dokumen otomatis dengan metode Feature Based yaitu dengan f-measure sebanyak 71,04%. Pratama menggunakan metode TF-IDF dan K- Means Clustering yang mengacu pada penelitian Sitawati (2005) dimana evaluasi hasil ringkasan TF-IDF lebih baik daripada frase penunjuk. Hasil penelitian pada tingkat compression 40% didapat rata-rata recall 60%, precision 62% dan f- measure 69%. Kemudian Pratama menyarankan untuk mencoba mengganti teknik clustering dengan metode pengembangan dari K-Means Clustering, yaitu Fuzzy C Means.
Dari permasalahan tersebut, peneliti tertarik untuk mengambil judul
“Aplikasi Peringkas Otomatis Teks Berbahasa Indonesia menggunakan Metode Term Frequency – Inverse Document Frequency (TF-IDF) dan Fuzzy C Means”.
Aplikasi yang akan dibangun berbasis Android yang diberi nama “RingO”.
Sehingga diharapkan hasil ringkasan yang diperoleh nantinya merupakan teks yang berisi informasi penting dari suatu bacaan dan panjang hasil ringkasan yang dihasilkan tersebut tidak lebih dari setengah panjang teks aslinya [5].
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas, adapun rumusan masalah pada penelitian ini adalah:
a. Bagaimana cara membangun aplikasi peringkas otomatis teks berbahasa Indonesia dengan menggunakan metode TF-IDF dan Fuzzy C Means.
b. Bagaimana menganalisis metode TF-IDF dan Fuzzy C Means untuk aplikasi peringkas teks otomatis.
1.3 Batasan Masalah
Adapun batasan masalah dalam penelitian ini, adalah:
a. Menggunakan artikel karya tulis semi ilmiah berbahasa Indonesia sebagai studi kasusnya karena lebih dipahami oleh pembaca secara umum. Sedangkan jumlah sumber dokumen yang akan diringkas berupa dokumen tunggal (single document), single document yaitu ringkasan yang dihasilkan merupakan ringkasan dari satu dokumen [13].
b. Stemming menggunakan algoritma Nazief dan Adriani. Karena hasil stemming tersebut memiliki tingkat akurasi yang lebih besar dibandingkan dengan stemming Porter [11].
c. Kamus kata dasar bahasa Indonesia untuk proses stemming dibatasi sebanyak 28.526 kata. Daftar stemming ini diperoleh berdasarkan sumber yang didapat dari http://hikaruyuuki.lecture.ub.ac.id/kamus-kata-dasar-dan-stopword-list- bahasa-indonesia/ [16].
d. Data kumpulan daftar stopwords berjumlah 758 kata. Daftar stopwords ini bersumber dari penelitian Tala (2003). Daftar stopwords untuk penelitian ini tidak ditambahkan.
e. Bahasa yang digunakan adalah bahasa Indonesia.
f. Maksimum kata dalam artikel yang dicoba dimasukan sebanyak 5.000 kata.
1.4 Tujuan Penelitian
Tujuan penelitian ini adalah sebagai berikut:
a. Untuk mendapat suatu rancangan aplikasi peringkasan teks otomatis dengan menggunakan metode TF-IDF dan Fuzzy C Means.
b. Untuk menganalisis metode TF-IDF dan Fuzzy C Means terhadap peringkasan teks.
1.5 Metodologi Penelitian
Metodologi penelitian yang digunakan dalam pelaksanaan penelitian ini adalah metode penelitian deskriptif. Tujuan dari penelitian deskriptif ini adalah untuk membuat deskripsi, gambaran atau lukisan secara sistematis, factual dan
akurat mengenai fakta-fakta, sifat-sifat sserta hubungan antar fenomena yang diselidiki. Metode penelitian ini memiliki dua metode dalam pelaksanaanya yaitu metode pengumpulan data dan metode pembangunan perangkat lunak. Berikut adalah pemaparannya.
1.5.1 Metode Pengumpulan Data
Adapun metode pengumpulan data pada penelitian ini adalah:
a. Studi Literatur
Pengumpulan data dilakukan adalah dengan cara mempelajari, meneliti, dan menelaah berbagai literatur dari perpustakaan yang bersumber dari buku buku, jurnal ilmiah, situs internet, dan bacaan lainnya yang berkaitan dengan penelitian yang dilakukan seperti konsep peringkasan, clustering, sistem informasi, android, object oriented analysis and design, pengujian black box, dan pengujian kuesioner.
b. Kuisioner
Penyebaran kuesioner dilakukan ketika tahap pengujian acceptance dimana penyebaran dilakukan kepada ahli bahasa Indonesia dan pada tahap pengujian aplikasi kepada pengguna Android.
1.5.2 Metode Pembangunan Perangkat Lunak
Dalam pembangunan perangkat lunak ini menggunakan waterfall model sebagai tahapan pengembangan perangkat lunaknya. Proses-proses yang terjadi didalamnya adalah:
a. Requirement analysis and definition
Tahap requirement analysis and definition yang dilakukan dalam pembangunan perangkat lunak ini adalah dengan melakukan pengumpulan data dengan cara studi literatur. Dari hasil tersebut didapatkan masalah yang kemudian dicarikan solusinya dengan melakukan pendekatan secara objek.
b. System and software design
Tahap system and software design yang dilakukan dalam pembangunan perangkat lunak ini adalah dengan membuat perancangan data, perancangan arsitektural menu, perancangan antarmuka, dan perancangan metode.
c. Implementation and unit testing
Tahap implementation and unit testing yang dilakukan dalam pembangunan perangkat lunak ini adalah dengan sistem android dimana untuk diimplementasikan dengan bahasa pemrograman java mobile dan xml.
d. Integration and system testing
Tahap integration and system testing yang dilakukan dalam pembangunan perangkat lunak ini adalah dengan melakukan integrasi pada database sqlite dan menjalankan aplikasi pada smartphone Android langsung.
e. Operation and maintenance
Tahap operation and maintenance yang dilakukan dalam pembangunan perangkat lunak ini adalah dengan melakukan pemantauan secara berkala mengenai penggunaan perangkat lunak sehingga kedepannya jika ada perubahan dapat dilakukan update untuk optimalisasi pengoperasian.
Dari berbagai tahapan-tahapan tersebut, untuk lebih jelasnya bisa dilihat pada gambar di bawah ini:
Gambar 1.1 DIAGRAM MODEL WATERFALL [6]
Requirement definition
System and Software
Design
implementation and unit testing
integration and system testing
operation and Maintenance
1.6 Sistematika Penulisan Tugas Akhir
Berikut merupakan rencana susunan sistematika penulisan laporan penelitian yang akan dibuat. Sistematika penulisan penelitian ini terdiri atas 5 bab.
Antara lain sebagai berikut : BAB I PENDAHULUAN
Berisi tentang deskripsi umum dari tugas akhir ini, yang meliputi latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, metodologi penelitian, serta sistematika penulisan tugas akhir.
BAB II LANDASAN TEORI
Bab ini berisi penjelasan mengenai teori – teori yang digunakan sebagai landasan dalam melakukan penelitian.
BAB III ANALISIS DAN PERANCANGAN SISTEM
Bab ini akan membahas identifikasi masalah, analisis kebutuhan data, peringkasan teks, alur sistem, arsitektur sistem, kebutuhan non fungsional, dan kebutuhan fungsional, serta peracangan data, arsitektur menu, dan perancangan antarmuka.
BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM
Bab ini menguraikan tentang proses implementasi dari aplikasi yang telah melalui tahap pengujian dan mengidentifikasi lagi aplikasi tersebut agar tidak timbulnya masalah baru saat aplikasi digunakan.
BAB V PENUTUP
Bab ini berisi penjelasan mengenai kesimpulan yang dapat ditarik dari analisa hasil penelitian serta saran yang dapat diberikan oleh peneliti untuk penelitian selanjutnya tentang aplikasi peringkas teks otomatis berbahasa Indonesia.