1.1 Latar Belakang
Saat ini, kita dapat mengakses dokumen berbahasa Jawa melalui situs-situs di internet dan banyak juga dokumen, buku dan majalah berbahasa Jawa yang dapat kita peroleh di perpustakaan-perpustakaan. Sementara itu, banyak generasi muda yang berasal dari Jawa tidak memahami bahasa Jawa. Sayang sekali jika bahasa Jawa semakin lama semakin tidak digunakan dan akhirnya punah.
Membuat dan membaca dokumen berbahasa Jawa merupakan salah satu cara melestarikan penggunaan bahasa Jawa. Bagi mereka yang belum paham tentang bahasa Jawa, membaca keseluruhan dokumen untuk memahaminya akan sangat melelahkan. Namun jika terdapat ringkasan pendek dari sebuah dokumen, maka akan membantu pembaca mendapatkan intisari dari sebuah dokumen berbahasa Jawa.
Membuat ringkasan secara manual membutuhkan waktu lama jika dokumen yang diringkas berjumlah sangat banyak. Maka membutuhkan peringkasan teks otomatis untuk membantu proses ekstraksi dalam penyusunan kalimat mengenai intisari dari dokumen serta menggabungkan menjadi suatu ringkasan (Jezek, Steinberger, 2008). Diharapkan dari membaca ringkasan, akan menumbuhkan niat membaca dokumen berbahasa Jawa menjadi lebih meningkat. Membuat peringkasan teks otomatis dilakukan dengan cara pemberian bobot untuk setiap kata dalam kalimat. Dalam penelitian ini ringkasan yang
2
dihasilkan merupakan kumpulan kalimat dari hasil perhitungan dengan metode TF-IDF (Savoy, 1993). Metode ini bertujuan untuk mengambil sebagian kalimat dari keseluruhan dokumen berbahasa Jawa yang penting, ditandai dengan bobot
tinggi dari hasil perhitungan dengan metode TF-IDF. Ringkasan yang dihasilkan
tersebut akan menampilkan sebuah ringkasan dokumen yang diharapkan sesuai
dengan kebutuhan pembaca. Hasil ringkasan dari sistem secara otomatis tersebut
akan dilakukan pengujian kepada 3 responden berbahasa Jawa secara manual.
Dokumen yang akan diujikan ke dalam sistem berjumlah 50 dokumen berbahasa
Jawa yang bersumber dari DjakaLodang. Dari hasil pengujian akan dilakukan
perhitungan nilai rata-rata untuk mendapatkan hasil akurasinya. Dengan demikian
diketahui nilai rata-rata akurasi sistem ini dalam membantu pembaca untuk memperoleh intisari dari dokumen berbahasa Jawa, sehingga dapat membuat keputusan untuk melanjutkan membaca keseluruhan dokumen atau cukup dengan mambaca ringkasan.
Pada penelitian ini akan dibangun sebuah website majalah bahasa Jawa yang berisi kumpulan dokumen berbahasa Jawa serta dapat melakukan
peringkasan teks otomatis dokumen berbahasa Jawa secara cepat dan akurat,
sehingga dapat menghasilkan ringkasan yang sesuai dengan kebutuhan pengguna.
Diharapkan website majalah bahasa Jawa ini dapat diakses secara umum oleh
pengguna agar dapat digunakan untuk melakukan peringkasan teks dokumen
3
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas maka terdapat rumusan masalah
sebagai berikut :
1. Bagaimana menggunakan metode TF-IDF pada program aplikasi
peringkasan teks otomatis pada dokumen berbahasa Jawa?
2. Bagaimana mengukur akurasi sistem peringkasan teks otomatis
menggunakan metode TF-IDF pada dokumen berbahasa jawa?
1.3 Tujuan Penelitian
Tujuan dari penelitian ini adalah membuat sebuah website majalah bahasa
Jawa yang dapat melakukan peringkasan teks otomatis pada dokumen berbahasa
Jawa dengan metode TF-IDF, serta dapat menghasilkan ringkasan dari dokumen
berbahasa Jawa yang sesuai dengan kebutuhan pengguna.
1.4 Manfaat Penelitian
Manfaat dari penelitian ini adalah menghasilkan ringkasan yang berisi
kumpulan kalimat mengenai intisari dari keseluruhan dokumen berbahasa Jawa.
Ringkasan tersebut akan membantu pembaca dalam memahami intisari dari
dokumen tanpa harus membaca keseluruhan dokumen berbahasa Jawa. Dengan
membaca ringkasan, pembaca dapat membuat keputusan untuk melanjutkan
membaca keseluruhan dokumen atau cukup dengan membaca ringkasan.
Membaca ringkasan berbahasa Jawa diharapkan dapat meningkatkan minat
4
1.5 Batasan Masalah
Ruang lingkup dibatasi pada :
1. Ekstraksi teks yang digunakan adalah pada dokumen berbahasa Jawa.
2. Dokumen yang digunakan bersumber dari Djakalodang tahun 1978,
2002 dan 2003.
3. Teks input diambil dari file teks.
4. Pengujian sistem akan dilakukan kepada 3 responden secara manual
dengan dokumen berjumlah 50, dari hasil pengujian tersebut akan
dihitung nilai rata-rata untuk mendapatkan hasil akurasi peringkasan
teks otomatis pada dokumen berbahasa Jawa.
5. Sistem berbasis web dengan menggunakan jsp.
6. Pembuatan program aplikasi peringkasan teks otomatis menggunakan
java dengan IDE Netbeans 6.9.1.
1.6 Metodologi Penelitian
Pada penelitian ini akan dilakukan dengan beberapa tahap sebagai berikut :
1. Studi Pustaka
Pada tahap ini dilakukan pengumpulan informasi dengan cara
membaca buku referensi, jurnal dan mencari informasi di internet
mengenai pemerolehan informasi serta metode TF-IDF yang
5
2. Pengumpulan Dokumen Berbahasa Jawa
Pada tahap ini dilakukan pengumpulan data dokumen berbahasa
Jawa, dimana data dokumen tersebut akan digunakan untuk pengujian
sistem peringkasan teks otomatis. Dokumen berbahasa Jawa yang
digunakan bersumber dari DjokoLodang, mengenai cerita wayang atau
artikel berita.
3. Perancangan Sistem
Pada tahap ini dilakukan proses perancangan sistem atau rancangan
alur jalannya program. Perancangan akan dilakukan secara terstruktur
dengan langkah pembuatan diagram use case, diagram aktifitas,
diagram sekuensial, diagram kelas untuk memprosesnya, merancang
setiap proses dengan algoritma, serta merancang user interface.
4. Implementasi Perangkat Lunak
Pada tahap ini membangun sistem berbasis komputer berdasarkan
hasil perancangan yang telah dibuat. Sehingga implementasi rancangan
ke dalam program komputer dapat menghasilkan perangkat lunak yang
sesuai dengan kebutuhan.
5. Pengujian Perangkat lunak
Pada tahap ini akan dilakukan analisa perangkat lunak. Apakah
6 6. Pengujian Sistem
Pada tahap ini perangkat lunak yang sudah jadi akan dilakukan
pengujian sistem. Pengujian dilakukan kepada 3 responden secara
manual dengan dokumen berbahasa Jawa berjumlah 50.
7. Evaluasi Pengujian Sistem
Pada tahap ini dilakukan penghitungan dari pengujian sistem yang
sudah dilakukan. Dari hasil pengujian tersebut akan dihitung nilai
rata-rata untuk mendapatkan hasil akurasi sistem. Mengapa hasil dari sistem
sesuai? dan Mengapa hasil dari sistem tidak sesuai? akan dianalisa.
1.7 Sistematika Penulisan
Sistematika penulisan pada penelitian ini dibagi menjadi beberapa bagian sebagai berikut :
BAB I PENDAHULUAN
Bab ini berisi gambaran umum permasalahan yang akan diteliti, meliputi : latar belakang, rumusan masalah, tujuan penelitian, manfaat penelitian, batasan masalah, metodologi penelitian dan sistematika penulisan.