i
PenerjemahKalimatBahasaIndonesiaKedalamKalimatBa hasaMaduraDenganMetode Example Based Machine
Translation (EBMT)
TUGAS AKHIR
Diajukan Untuk Memenuhi
Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Moh. Yudiarso 07560406
JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
April 2013
LEMBAR PERSETUJUAN
PenerjemahKalimatBahasaIndonesiaKedalamKalimatBa hasaMaduraDenganMetode Example Based Machine
Translation (EBMT)
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Mengetahui/ menyetujui
Pembimbing I
YudaMunarko, S.Kom, M.sc NIP.
Pembimbing II
YufisAzhar, S.Kom NIP
iii
LEMBAR PENGESAHAN
PenerjemahKalimatBahasaIndonesiaKedalamKalimatBa hasaMaduraDenganMetode Example Based Machine
Translation (EBMT)
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh : Moh. Yudiarso NIM. 07560406
Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji pada tanggal Mei 2013
Menyetujui
Penguji I Penguji II
Eko Budi Cahyono, S.Kom,. MT Luqman Hakim, S.Kom NIP : 10895040330 NIDN: 0724028602
Mengetahui,
Ketua Jurusan Teknik Informatika
Eko Budi Cahyono, S.Kom,. MT NIP : 10895040330
LEMBAR PERNYATAAN
Yang bertanda tangan di bawah ini : NAMA : MOH. YUDIARSO NIM : 07560406
FAK./JUR. : TEKNIK/INFORMATIKA
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “Penerjemah Kalimat Bahasa Indonesia Kedalam Kalimat Bahasa Madura Dengan Metode Example Based Machine Translation (EBMT)” beserta seluruh isinya adalah karya sendiri dan bukan merupakan karya tulis oranglain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang telahdisebutkan sumbernya.
Demikian surat pernyataan saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya siapmenanggung segala bentuk resiko/sanksi yang berlaku.
Mengetahui Malang, 26 April 2013
Dosen Pembimbing I Yang Membuat Pernyataan
(Yuda Munarko, S.Kom,. MT) (Moh. Yudiarso)
v
ABSTRAK
Example Based Machine Translation (EBMT) adalah mesin penerjemah yang menggunakan referensi proses penerjemahan dengan contoh penerjemahan sebelumnya. Metode lebih terbaru dibandingkan dua metode lain: Rule Based Machine Translationdan Statistical Machine Translation. Keakuratan output terjemahandari EBMT sangat bergantung pada ketersediaan sampel kata atau kalimat dalam data training. Semakin banyak data dalam data training maka akan semakin akurat keluaran penerjemahan yang dihasilkan.
Penelitian ini bertujuan untuk mempermudah masyarakat luas untuk dapat menambah referensi dan memperajari bahasa Madura secara mudah dengan adanya system penerjemah kalimat Indonesia-Madura dengan tingkat akurasi yang tinggi. Uji coba terhadapl iteratur berbahasa indonesia dalam situs online suramadura menunjukkan presisi 96% sedangkan pada portal berita online detik.com menunjukkan presisi 92%
Kata Kunci : EBMT,Indonesia-Madura,Machine Translation.
.
ABSTRACT
Example Based Machine Translation (EBMT) is a machine translator that uses reference translation process with the previous translation example. The latest method than two other methods: Rule Based Machine Translation and Statistical Machine Translation. The accuracy of the translation output EBMT depends on the availability of sample of the word or phrase in the training data.
The more many data are in the training data, the more accurate translation of the resulting output.
This research aims to facilitate the public who wants to add references and learn Madura language easily by helping translation system of Indonesia - madura sentence, with the high degree of accuracy. The trial of Indonesian language literature in the suramadura online site showed 96% precision while the online news portal detik.com showed 92% precision.
EBMT,Indonesia-Madura,Machine Translation.
vii
LEMBAR PERSEMBAHAN
Puji syukur kepada Allah SWT atas rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan Tugas Akhir ini. Penulis menyampaikan terima kasih yang sebesar-besarnya kepada :
1. BapakYudaMunarko dan BapakYufisAzhar selaku pembimbing tugas akhir saya.
2. Bapak/Ibu Dekan Fakultas Teknik Universitas Muhammadiyah Malang.
3. Bapak Ketua Jurusan Teknik Informatika Universitas Muhammadiyah Malang.
4. Bapak dan Ibu tim pengajar (Dosen dan Asisten Dosen) jurusan Teknik Informatikayang telah memberikan bekal ilmu dan pengalamannya selama studi ini. Semoga bermanfaat dan barokah.
5. Papadan MamaQ tercinta dan tersayang “Moh. SurosoEffendy” dan
“Artina”. Doa tulus kepada ananda seperti air dan tak pernah berhenti yang terus mengalir, pengorbanan, motivasi, kesabaran, ketabahan dan tetes air matamu yang terlalu mustahil untuk dinilai, walaupun jauh, engkaulah sebaik - baik panutan meski tidak terlalu sempurna.
6. KhususnyaDian Safitri yang telah mendoakan,MemberikuSemangat mendukungQdanMenghibur selama ini.
7. Teman-temanseperjuangan saya, Dika, Firda, Bayu, Eko, Yulia, Rizki, Fendi,dan semua teman-teman yang tak dapat saya sebutin satu persatu, terima kasih atas dukungan dan semangatnya, kebersamaan kita akan selalu menjadi hal terindah dan untuk semua teman-teman saya terima kasih sedalam-dalamnya.
8. KosWismaZam-Zamterimakasih untuk waktu kebersamaan yang cukup lama telah memberikan hal yang tak pernah terlupakan.
9. Teman-teman informatika angkatan 2007.
10. STMJbesertacemilan-cemilanKatom yang
selalumenemanitiapmalamnyadandiiringiolehlagukesukaansayadariAri LassodanIndiajugaMurrothal.
11. Pihak-pihak lain yang tidak bisa saya sebutkan satu persatu, yang telah banyak membantu saya selama studi.
Semoga dengan ucapan terimakasih ini bisa mengobati kerinduan hati dan perekat silaturahmi diantara kita. Semoga semua jerih payah usaha dan bantuan yang telah diberikan mendapatkan balasan yang lebih baik dari Allah Subhanahu Wa Ta”ala.
Malang, April 2013
Penulis
ix
MOTTO
Bukankah Kami telah melapangkan untukmu dadamu?
Dan Kami telah menghilangkan daripadamu bebanmu, Yang memberatkan punggungmu?
Dan Kami tinggikan bagimu sebutan (nama)mu, Karena Sesungguhnya sesudah kesulitan itu ada kemudahan,
Sesungguhnya sesudah kesulitan itu ada kemudahan.
Maka apabila kamu telah selesai (dari sesuatu urusan), kerjakanlah dengan sungguh-sungguh (urusan) yang lain,
Dan hanya kepada Tuhanmulah hendaknya kamu berharap.
(QS. Al Insyirah; 94)
GunakanWaktu yang adaSebaikMungkin,
JikaKamuInginGagalmakaTundalahSemuaPekerjaanmuuntukHariEsok, Ketidaktahuan yang Paling BaikIalah,
KetidaktahuanterhadapKetidakMungkinan.
KATA PENGANTAR
Dengan memanjatkan puji syukur kehadirat Allah SWT. atas limpahan rahmat dan hidayah-Nya sehingga peneliti dapat menyelesaikan tugas akhir yang berjudul :
“Penerjemah Kalimat Bahasa Indonesia Kedalam Kalimat Bahasa Madura Dengan Metode Example Based Machine Translation (EBMT)”
Pada penelitian ini dibuat sebuah sistem penerjemahkalimatbahasa Indonesia kedalam kalimat bahasa Madura dengan metode example base machine translation (EBMT) yang diharapkan mampu melestarikan bahasa Madura dan membantu halayak ramai untuk mempelajar ibahasa Madura yang merupakan salah satu bahasa pengguna terbanyak di nusantara .
Penulis menyadari sepenuhnya bahwa penulis Tugas Akhir ini masih banyak kekurangan, oleh karena itu penulis mengharapkan saran dan kritik yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu kedepannya.
Akhir kata penulis mengucapkan terima kasih kepada semua pihak yang telah membantu sehingga tugas akhir ini terselesaikan.
Malang, 27April 2013
Penulis
xi
DAFTAR ISI
Halaman Judul ... i
Lembar Persetujuan ... ii
Lembar Pengesahan ... iii
Lembar Pernyataan Keaslian ... iv
Abstrak ... v
Abstract ... vi
Lembar Persembahan ... vii
Motto ... ix
Kata Pengantar ... x
Daftar Isi ... xi
Daftar Gambar ... xiii
Daftar Tabel ... xvi
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 2
1.3 Batasan Masalah ... 2
1.4 Tujuan ... 2
1.5 MetodologiPengerjaan ... 3
1.6 Sistematika Penulisan ... 5
BAB II LANDASAN TEORI ... 7
2.1 Bahasa Madura ... 7
2.2 PHP & MySQL ... 7
2.2.1 PHP ... 7
2.2.2 MySQL ... 9
2.3 Text Mining ... 11
2.3.1 Case Folding ... 11
2.3.2 Tokening Kata ... 12
2.3.3 Stemming ... 13
2.4 Confix Stripping Stemmer ... 13
2.5 Enhanced Confix Stripping Stemmer ... 17
2.6 EBMT ... 19
BAB III ANALISA DAN PERANCANGAN SISTEM ... 23
3.1 Analisa Permasalahan ... 23
3.2 Analisa Sistem ... 23
3.2.1 DesainPerangkatLunak ... 23
3.3 Preprocessing ... 25
3.4 Perancangan Sistem ... 28
3.4.1 UseCase Diagram ... 28
3.4.2 Activity Diagram ... 29
3.4.3 Sequence Diagram Pennerjemahankalimat ... 34
BAB IV IMPLEMENTASI DAN PENGUJIAN ... 35
4.1 Implementasi ... 35
4.1.1 Implementasi Preprocessing ... 35
4.1.1.1 Function Case Folding ... 35
4.1.1.2 Function Tokenizing Kata ... 35
4.1.1.3 Function Stemming ... 36
4.1.1.4 Function EnchancedCS ... 36
4.1.1.5 CekSampelKalimat ... 39
4.1.1.6 Proses Penerjemahan ... 39
4.2 Pengujian ... 40
4.2.1 PengujianFungsi ... 40
4.2.1.1 HalamanSistemPenerjemahan ... 40
4.2.1.1.1 Halaman Input Kalimat ... 40
4.2.1.1.2 Button FungsiTerjemahkan ... 41
4.2.1.1.3 HalamanFungsiTampilkanhasil ... 41
4.2.1.2 Halaman Data ... 42
4.2.1.2.1 HalamanTambah Data Training False ... 42
4.2.1.2.2 HalamanTambah Data Training True ... 43
4.2.1.2.3 Halaman Data SampelKalimat ... 44
4.2.1.2.4 HalamanHasil Data Kata Training Kosong ... 44
4.2.1.2.5 HalamanSampelKalimat Akan Ditraining... 45
xiii
4.2.1.2.6 HalamanSampelKalimatSudahDitraining ... 45
4.2.1.2.7 HalamanHasil Training Terisi ... 46
4.2.1.2.8 Halaman Edit Kata Hasil Training ... 46
4.2.1.2.9 Halaman Edit SampelKalimat ... 47
4.2.1.2.10 HalamanSampelKalimat Delete Data ... 47
4.2.1.2.11 Halaman Proses Cari Kata Keseluruhan ... 48
4.2.1.2.12 Halaman Proses Cari Kata Khusus ... 48
4.2.1.2.13 Halaman Proses CariKalimatKeseluruhan ... 49
4.2.1.2.14 Halaman Proses CariKalimatKhusus ... 49
4.2.2 UjiPresisi ... 50
BAB V KESIMPULAN DAN SARAN ... 52
5.1 Kesimpulan ... 52
5.2 Saran ... 52
DAFTAR PUSTAKA ... 53
BIOGRAFIS PENULIS ... 54
DAFTAR GAMBAR
Gambar 1 : Proses Text Mining ... 11
Gambar 2 : Flowchart SistemPenerjemahKalimat Indo-Madura ... 24
Gambar 3 : Diagram Use Case PenerjemahKalimat ... 28
Gambar 4 : Activity diagram Manajemen Data ... 29
Gambar 5 : Activity Diagram Input Kata Database ... 30
Gambar 6 :Activity DiagramSistem Penerjemah Kalimat Indo-Madura ... 31
Gambar 7 : Activity DiagramPreprocessing ... 31
Gambar 8 : Activity Diagram CaseFolding... 32
Gambar 9 :Activity Diagram Tokenizing ... 33
Gambar 10 : Activity Diagram Stemming ... 33
Gambar 11 : Sequence Diagram Proses Penerjemahan ... 34
Gambar 12 : Halaman Input Kalimat ... 41
Gambar 13 :Button FungsiTerjemahkan ... 41
Gambar 14 : HalamanFungsiTampilkanHasil ... 42
Gambar 15 : HalamanTambah Data Training False ... 43
Gambar 16 : HalamanTambah Data Training True ... 43
Gambar 17 : Halaman Data SampelKalimat ... 44
Gambar 18 : Hasil Data Kata Training Kosong ... 44
Gambar 19 : HalamanSampelKalimat Akan Ditraining ... 45
Gambar 20 : TampilanSampelKalimatSudahDitraining ... 45
Gambar 21 : HalamanHasil Training SudahTerisi ... 46
Gambar 22 : Halaman Edit Kata Hasil Training ... 46
Gambar 23 : Halaman Edit SampelKalimat ... 47
Gambar 24 : HalamanSampelkalimat Delete Data ... 47
Gambar 25 : Halamat Proses Cari Kata Keseluruhan ... 48
Gambar 26 : Proses Cari Kata Khusus ... 48
Gambar 27 : CariKalimatKeseluruhan ... 49
Gambar 28 : CarikalimatSecaraKhusus ... 49
xv
DAFTAR TABEL
Tabel 1: TabelContoh Case Folding ... 12
Tabel 2: TabelContohTokenizing Kata ... 12
Tabel 3: TabelContoh Stemming ... 13
Tabel 4: Tabel Kombinasi Imbuhan Terlarang ... 16
Tabel 5: Tabel Aturan Pemenggalan Awalan... 16
Tabel 6: TabelRevisi untuk Tabel 2.6 ... 18
Tabel 7: Contoh Terjemahan ... 21
Tabel 8: TabelIsi Tabel Word_word_alignment untuk ID_KAL 3 ... 21
Tabel 9: Tabel HasilPengujianTerhadapSitus Online Suaramadura.wordpress.com ... 50
Tabel 10: Hasilpengujianterhdapatsitus online detik.com ... 51
DAFTAR PUSTAKA
[1] Erwin, 2009, Analisis Market Basket Dengan Algoritma Apriori dan FP- Growth, 5:27.
[2] Hanif,2007,Tinjauan Pustaka Market Basket Analysis,[online],(
http://haniif.wordpress.com/2007/08/01/27-tinjauan-pustaka-market-basket- analysis/, diakses tanggal 19 April 2011, 1:13:36).
[3] Kokoh. Philips. 2006. Association Rule Mining. [Online] Tersedia:
http://philips.wordpress.com/2006/05/10/association-rule-mining/ [18 April 2011, 2:48]
[4] Liem.Toni ,2008, market basket analysis, [Online],
(http://greenhornsjava.blogspot.com/2010/09/pelajaran-1-cara-kerja-bahasa- java.html, diakses tangal 25 April 2011).
[5] Samuel, David. 2009 Penerapan Stuktur FP-Tree dan Algoritma FP- Growth dalam Optimasi Penentuan Frequent Itemset,2:6.
[6] Siska,Saprida ,2010, Apa Itu Java , [Online],
(http://saprida.blogspot.com/2010/10/apa-itu-java.html, diakses tangal 5 Mei 2011, 11:25).
[7] Tan, Pang-ning. & Steinbech,M. 2006. INTRODUCTION TO DATA MINING(edisi pertama, cetakan ke-2). Boston:Pearson Education.
[8] Yin, Yiew,Jiawei Han, UniversitasLiverpol, THE LUCKS-KDD IMPLEMENTATIONS OF THE FP-GROWTH ALGORITHM, [omline],(http://www.csc.liv.ac.uk/~frans/KDD/Software/FPgrowth/fpGro wth.html ,diakses 26 April 2011).
2
BIOGRAFI PENULIS
PERSONAL INFORMATION Nama Lengkap : Moh. Yudiarso Tempat Lahir : Sumenep Tanggal Lahir : 19Mei 1988 Golongan Darah : -
Agama : Islam
Kewarganegaraa : Indonesia Jenis Kelamin : Laki-Laki Alamat Asli (Rumah) :Jl. Raya Palasa
Alamat Malang : Jl. TirtoUtomoGg. 12 No. 3Landungsari - Malang
No. Telp : 081937752156
Email : [email protected]
Facebook : [email protected]
EDUCATION BACKGROUND
1995-2001 : SDN Palasa1, Talango, Sumenep.
2000-2003 : SMP Negeri 1 Talango.
2003-2006 : SMA Muhammadiyah 1 Sumenep.
2006-2011 : S1 Jurusan Teknik Informatika Universitas Muhammadiyah Malang