• Tidak ada hasil yang ditemukan

Sistem Penerjemah Alkitab Bahasa Indonesia-Inggris dengan Model Translasi Berbasis Statistik.

N/A
N/A
Protected

Academic year: 2017

Membagikan "Sistem Penerjemah Alkitab Bahasa Indonesia-Inggris dengan Model Translasi Berbasis Statistik."

Copied!
19
0
0

Teks penuh

(1)

vi

UNIVERSITAS KRISTEN MARANATHA

ABSTRAK

Saat ini sistem penerjemah sangat penting dan diperlukan, khususnya untuk bahasa Indonesia. Hal ini diakibatkan oleh kebutuhan pengalihan informasi dari satu bahasa ke bahasa lain yang sangat besar, sedangkan sistem-sistem penerjemah saat ini, seperti Bing Translator dan Google Translate yang menggunakan metode crowd sourcing memerlukan evaluasi dalam suatu domain tertentu. Pada penelitian ini, akan dibuat sebuah model translasi ayat Alkitab bahasa Indonesia-Inggris dengan menggunakan Statistical Machine Translation (SMT) dan IBM Model (GIZA++). Alasan penggunaan Alkitab dalam penelitian ini adalah karena ayat Alkitab merupakan kata baku yang sudah diketahui dengan pasti resource sumber dan resource tujuannya. Model tersebut akan dianalisa dan dievaluasi dengan menggunakan algoritma Bilingual Evaluation Understudy (BLEU). Sistem translasi yang akan digunakan sebagai pembanding hasil translasi pada penelitian ini adalah Bing Translator. Beberapa batasan yang diambil dalam penelitian adalah: (1) hasil translasi untuk proses evaluasi akan diambil dari ayat-ayat Alkitab pada sabda.org, (2) data yang digunakan dalam proses training dan pembentukan model translasi adalah file teks Alkitab terjemahan baru bahasa Indonesia dan bahasa Inggris, dan (3) data yang digunakan dalam proses testing adalah ayat-ayat NATS Alkitab dari renungan harian e-RH (PSM) 1.2.1 pada bulan Juli 2014 dan edisi tahunan dari e-RH (PSM) 1.2.1 pada tahun 2010. Berdasarkan penelitian yang telah dilakukan, didapatkan bahwa permalasahan pada IBM Model terletak pada kata-kata ulang berimbuhan dan frasa. Oleh karena itu, diusulkan beberapa skenario eksperimen guna mengatasi permasalahan tersebut yaitu: (1) evaluasi model GIZA standard, (2) evaluasi model GIZA dengan stemming, (3) evaluasi model GIZA dengan variasi dictionary, (4) evaluasi model GIZA dengan kombinasi dictionary, dan (5) evaluasi model GIZA dengan dictionary kata ulang. Hasil evaluasi memperlihatkan bahwa model GIZA dengan dictionary kata ulang menghasilkan hasil translasi terbaik. Pengujian secara statistik dengan Independent Sample T-Test memperlihatkan bahwa hasil translasi model GIZA++ dan Bing Translator tidak berbeda secara signifikan dan dapat dikatakan setara dalam jangka panjang dengan seiring berkembangnya data. Hal ini mengindikasikan bahwa sebagian besar kata-kata yang terdapat dalam Alkitab adalah kata-kata yang banyak digunakan dalam keseharian dan mendapat masukan yang baik sebagai hasil crowd sourcing dalam sistem Bing.

Kata Kunci: sistem penerjemah Alkitab, Bilingual Evaluation Understudy, GIZA++, Statistical Machine Translation, dan IBM model.

**Catatan : Abstrak ini telah dicoba untuk ditranslasikan dengan menggunakan sistem penerjemah alkitab ini dan dapat dilihat pada bagian Lampiran A.

(2)

ABSTRACT

Nowadays translation system is very important and necessary, especially for Indonesian language. This is because the need for transfer information from one language to another is very large, whereas the present translation systems, such as Bing Translator and Google Translate uses crowd sourcing methods to evaluate in a particular domain. In this research, a model translation is made by bible verse Indonesian-English with Statistical Machine Translation (SMT) and IBM Model (GIZA++). The reason for using it is because bible verse are words raw, which certainty resource and goal resource are well known. The model will be analyzed and evaluated by using Bilingual Evaluation Understudy (BLEU) algorithms. Translation system which will be used as a comparision for the result of the translation is Bing Translator. This research has several corpus to be prepared, such as: (1) the result of translation in evaluation process will be taken from bible verse on sabda.org, (2) the data used in training process and formation of the model translation is text file from Bible New Translation in Indonesian and English language, and (3) the data used in testing process is NATS bible from daily devotional e-RH (PSM) 1.2.1 in July 2014 and annual edition of the e-RH (PSM) in 2010 1.2.1 in 2010. Based on the research that has been conducted, it was found that IBM Model’s problem lies in the repeated word and phrase. Therefore, several experiment scenarios is proposed in order to overcome this problem, namely: (1) evaluation of GIZA standard model, (2) evaluation GIZA model with stemming, (3) evaluation of GIZA model with variations dictionary, (4) evaluation of GIZA model with a combination dictionary, and (5) evaluation of GIZA model with re-word dictionary. The evaluation results shows that GIZA model with re-word dictionary produce the best translations results. Statistical analysis by Independent Sample T-Test shows that the results of model translation by GIZA++ and Bing Translation does not have significant difference and can be equivalent in long-term as the development of the data. This indicates that most of the words contained in the Bible are words that are widely used in everyday life and have good feedback as the result of crowd sourcing in Bing system.

(3)

viii

UNIVERSITAS KRISTEN MARANATHA

DAFTAR ISI

LEMBAR PENGESAHAN ... i

PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... ii

PERNYATAAN PUBLIKASI LAPORAN PENELITIAN ... iii

PRAKATA ... iv

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Rumusan Masalah ... 2

1.3. Tujuan ... 2

1.4. Batasan Masalah... 2

1.5. Sistematika Penyajian ... 3

BAB II LANDASAN TEORI ... 4

2.1. Statistical Machine Translation (SMT) ... 4

2.2. IBM Translation Model ... 5

2.2.1. IBM Model 1 ... 5

2.4. Bing Translator ... 11

2.5. Sabda.org ... 12

2.6. Evaluasi ... 12

2.7. Significant Test ... 16

2.7.1. One Sample T-Test ... 16

2.7.2. Paired / Dependent Sample T-Test ... 17

2.7.3. Unpaired / Independent Sample T-Test... 17

BAB III ANALISIS DAN DESAIN ... 19

3.1. Analisis ... 19

3.1.1. Contoh Penerapan Analisis ... 20

3.1.1.1. Tokenisasi ... 21

3.1.1.2. Pencarian Padanan Kata... 21

3.1.1.3. Melakukan Translasi dengan Bing Translator... 22

(4)

3.2. Gambaran Keseluruhan ... 24

3.2.1. Persyaratan Antarmuka Eksternal ... 24

3.2.2. Antarmuka dengan Pengguna ... 24

3.2.3. Antarmuka Perangkat Keras ... 24

3.2.4. Antarmuka Perangkat Lunak... 24

3.3. Disain Perangkat Lunak ... 25

3.3.1. Pemodelan Perangkat Lunak ... 25

3.3.1.1. Arsitektur Sistem Penerjemah ... 25

3.3.1.2. Use Case ... 27

3.3.1.3. Use Case Skenario ... 27

3.3.1.3.1 Use Case Upload File ... 27

3.3.1.3.2 Use Case Input Kalimat ... 28

3.3.1.3.3 Use Case Pre-processing ... 28

3.3.1.3.4 Use Case Pembacaan Dictionary ... 29

3.3.1.3.5 Use Case Display Result ... 29

3.3.1.3.6 Use Case Evaluasi ... 30

3.3.1.4. Activity Diagram ... 31

3.3.1.4.1 Activity Diagram Upload File ... 31

3.3.1.4.2 Activity Diagram Input Kalimat ... 32

3.3.1.4.3 Activity Diagram Pre-processing ... 32

3.3.1.4.4 Activity Diagram Pembacaan Dictionary ... 33

3.3.1.4.5 Activity Diagram Display Result ... 34

3.3.1.4.6 Activity Diagram Evaluasi ... 35

3.3.2. Disain Antarmuka ... 36

3.3.2.1. Rancangan Halaman Utama Sistem Penerjemah ... 36

3.3.2.2. Rancangan Halaman Evaluasi ... 37

BAB IV PENGEMBANGAN PERANGKAT LUNAK ... 38

4.1. Persiapan Implementasi ... 38

4.2. Implementasi Class / Modul ... 40

4.2.1. Class Query ... 41

4.2.2. Class Dictionary ... 43

4.2.3. Class BLEU ... 44

4.2.4. Class AdmAccessToken ... 45

4.2.5. Static Class ... 46

4.2.6. Main Class ... 46

4.3. Implementasi Antarmuka ... 47

4.3.1. Halaman Utama Sistem Penerjemah ... 47

4.3.2. Halaman Evaluasi... 48

BAB V TESTING DAN EVALUASI SISTEM ... 49

5.1. Skenario Pengujian... 49

5.2. Evaluasi Model GIZA ... 49

5.2.1. Evaluasi Model GIZA Standard ... 49

5.2.2. Evaluasi Model GIZA dengan Variasi Dictionary... 52

5.2.3. Evaluasi Model GIZA dengan Kombinasi Dictionary... 56

5.2.4. Evaluasi Model GIZA dengan Stemming ... 57

5.2.5. Evaluasi Model GIZA dengan Dictionary Kata Ulang ... 59

(5)

x

UNIVERSITAS KRISTEN MARANATHA

5.4. Perluasan Eksperimen ... 63

BAB VI SIMPULAN DAN SARAN ... 67

6.1. Kesimpulan ... 67

6.2. Saran ... 68

(6)

DAFTAR GAMBAR

Gambar 2.1 Contoh Penerapan IBM Model 2 ... 5

Gambar 2.2 Contoh Penerapan IBM Model 3 ... 6

Gambar 3.1 Contoh Kalimat yang Telah Dikonversi Menjadi Huruf Kecil ... 21

Gambar 3.2 Contoh Kalimat yang Telah Dilakukan Pembuangan Karakter Khusus 21 Gambar 3.3 Hasil Dictionary ... 21

Gambar 3.4 File Hasil Tokenizing ... 21

Gambar 3.5 Arsitektur Sistem Penerjemah ... 26

Gambar 3.6 Use Case Diagram ... 27

Gambar 3.7 Activity Diagram Upload File ... 31

Gambar 3.8 Activity Diagram Input Kalimat ... 32

Gambar 3.9 Activity Diagram Pre-processing ... 32

Gambar 3.10 Activity Diagram Pembacaan Dictionary ... 33

Gambar 3.11 Activity Diagram Display Result ... 34

Gambar 3.12 Activity Diagram Evaluasi ... 35

Gambar 3.13 Rancangan Halaman Utama Sistem Penerjemah ... 36

Gambar 3.14 Rancangan Halaman Evaluasi ... 37

Gambar 4.1 Contoh File t3.final ... 38

Gambar 4.2 Contoh File indo.vcb ... 39

Gambar 4.3 Contoh File eng.vcb ... 39

Gambar 4.4 Hasil Filtering t3.final ... 40

Gambar 4.5 Hasil Actual Dictionary ... 40

Gambar 4.6 Class Diagram Sistem Penerjemah ... 41

Gambar 4.7 Class Query ... 41

Gambar 4.8 Class Dictionary ... 43

Gambar 4.9 Class BLEU ... 44

Gambar 4.10 Class AdmAccessToken ... 45

Gambar 4.11 Static Class ... 46

Gambar 4.12 Main Class ... 46

Gambar 4.13 Halaman Utama Sistem Penerjemah ... 47

Gambar 4.14 Halaman Evaluasi ... 48

Gambar 5.1 File t3.final ... 50

Gambar 5.2 Hasil Distinct ... 50

Gambar 5.3 File English.vcb ... 50

Gambar 5.4 File Indonesia.vcb ... 51

Gambar 5.5 File Actual Dictionary ... 51

Gambar 5.6 Unigram Dictionary ... 53

Gambar 5.7 Bigram Dictionary... 53

Gambar 5.8 Trigram Dictionary ... 54

Gambar 5.9 Quadgram Dictionary ... 54

Gambar 5.10 Kalimat yang akan Ditranslasi ... 58

Gambar 5.11 Hasil Translasi Kalimat yang Telah Dilakukan Proses Stemming ... 58

Gambar 5.12 Hasil Translasi Kalimat Tanpa Menggunakan Stemming ... 58

(7)

xii

UNIVERSITAS KRISTEN MARANATHA

Gambar 5.14 Manual Dictionary ... 59

Gambar 5.15 Kata Ulang Tidak Terdeteksi ... 60

Gambar 5.16 Kata Ulang Terdeteksi ... 61

Gambar 5.17 Grafik Hasil Evaluasi Eksperimen ... 62

(8)

DAFTAR TABEL

Tabel 2.1 Fungsionalitas IBM Model 1-5 (Frase, 2011) ... 5

Tabel 2.2 Contoh Hasil Penerapan Unigram ... 14

Tabel 2.3 Contoh Penerapan Evaluasi Algoritma BLEU... 15

Tabel 2.4 Nilai Modified Unigram Precision ... 15

Tabel 2.5 Nilai Modified Bigram Precision ... 15

Tabel 2.6 Nilai Modified Trigram Precision ... 15

Tabel 2.7 Nilai Modified Quadgram Precision ... 15

Tabel 3.1 Contoh Inputan GIZA dalam Pembuatan Dictionary ... 20

Tabel 3.2 Hasil Dictionary ... 20

Tabel 3.3 Hasil Padanan Kata ... 22

Tabel 3.4 Hasil Translasi Bing Translator ... 22

Tabel 3.5 Evaluasi Hasil Translasi ... 22

Tabel 5.1 Tabel Hasil Evaluasi Model GIZA dengan Variasi Dictionary ... 54

Tabel 5.2 Hasil Translasi Kata ‘Roh’ ... 56

Tabel 5.3 Hasil Evaluasi Model GIZA dengan Kombinasi Dictionary ... 57

Tabel 5.4 Hasil Evaluasi Eksperimen ... 61

Tabel 5.5 Hasil Perluasan Eksperimen ... 63

Tabel 5.6 Independent Sample T-Test ... 64

(9)

xiv

UNIVERSITAS KRISTEN MARANATHA

DAFTAR RUMUS

Rumus 2.1 Bayes Rule... 4

Rumus 2.2 Bayes Rule Sederhana ... 4

Rumus 2.3 Pencarian Nilai Probabilitas Maksimum ... 4

Rumus 2.4 BLEU ... 14

Rumus 2.5 One Sample T-Test ... 16

Rumus 2.6 Dependent Sample T-Test ... 17

Rumus 2.7 Independent Sample T-Test ... 17

Rumus 2.8 Standard Error dari Kedua Kelompok ... 18

(10)

DAFTAR PROGRAM

Kode Program 4.1 Pseudocode Token by Sentences ... 42

Kode Program 4.2 Pseudocode Translate by GIZA ... 43

Kode Program 4.3 Pseudocode Create Actual Dictionary ... 44

(11)

xvi

UNIVERSITAS KRISTEN MARANATHA

DAFTAR NOTASI/LAMBANG

Jenis Notasi/Lambang Nama Arti

Use Case

Aktor

Objek yang berhubungan langsung dengan sistem.

hubungan antara aktor dengan Use Case.

Final State Menunjukan kondisi

akhir atau akhir dari kegiatan.

(12)

Jenis Notasi/Lambang Nama Arti

Activity

Diagram

Decision Menunjukan kondisi

percabangan.

Activity

Diagram

Control Flow Menunjukan alur proses.

Activity

Diagram

Action State Menunjukan proses yang

(13)

xviii

UNIVERSITAS KRISTEN MARANATHA

DAFTAR SINGKATAN

(14)

BAB I

PENDAHULUAN

1.1. Latar Belakang

Saat ini sudah banyak sekali ditemukan sistem untuk melakukan translasi dari suatu bahasa ke dalam bahasa lainnya, seperti Google Translate, Bing Translator, dan lain-lain. Hal ini terjadi akibat semakin banyaknya informasi dan resource yang tersedia dalam berbagai bahasa sehingga mengakibatkan tuntutan akan pengalihan informasi menjadi sesuatu yang sangat penting dan diperlukan, terutama untuk bahasa Indonesia. Namun, sistem-sistem translasi tersebut menggunakan metode crowd sourcing yang memerlukan evaluasi dalam suatu domain tertentu. Metode crowd

sourcing adalah suatu metode yang berupaya untuk memperbaiki hasil translasi dalam

mesin pencari dengan melibatkan user dalam melakukan evaluasi. Melalui cara seperti ini dimungkinkan terdapat banyak noise atau kata-kata yang tidak sesuai dengan hasil translasi. Oleh karena itu, pada penelitian ini akan dibuat sebuah model yang berguna untuk mengubah bahasa Indonesia ke dalam bahasa Inggris dengan menggunakan Statistical Machine Translation (SMT) dan akan dianalisa berdasarkan data yang terdapat pada Alkitab. Alasan penggunaan Alkitab dalam penelitian ini adalah karena Alkitab mengandung ayat-ayat yang merupakan kata baku sehingga resource sumber dan resource tujuannya sudah diketahui dengan pasti.

SMT merupakan proses pengubahan (translate) suatu bahasa ke dalam bahasa lainnya dengan memanfaatkan probabilitas dari kata-kata dari bahasa sumber dengan bahasa tujuan. Hasil perbandingan probabilitas yang diperoleh akan dianalisis secara statistik dan menjadi acuan untuk mencari solusi translasi terbaik. Pada penelitian ini juga akan ditekankan mengenai IBM Model yang terdiri dari: (1) lexical translation, (2) model of alignment atau reordering model, (3) fertility model, (4) relative reodering model. IBM Model digunakan sebagai penentu performa dari model

translasi. IBM Model digunakan oleh SMT, dimana SMT sangat cocok untuk melakukan translasi dengan memanfaatkan dan mempelajari resource sumber dan resource tujuan. (S, 2013) Model GIZA ini diharapkan dapat menghasilkan hasil

(15)

2

UNIVERSITAS KRISTEN MARANATHA algoritma BLEU (Bilingual Evaluation Understudy). Algoritma BLEU dianggap sebagai algoritma evaluasi yang cocok pada penelitian ini. (Papineni, Roukos, Ward, & Zhu, 2001) Hal ini dikarenakan pada penelitian ini akan dicari kaitan kecocokan antara padanan kata per kata, bukan konteks kalimat secara keseluruhan.

1.2. Rumusan Masalah

Berdasarkan latar belakang di atas, masalah-masalah yang muncul dapat diidentifikasikan sebagai berikut:

1. Faktor-faktor apa saja yang dapat menentukan performa dari model translasi? 2. Bagaimana cara melakukan pengujian terhadap model translasi yang telah

dibuat?

1.3. Tujuan

Berdasarkan rumusan masalah yang ada, maka tujuan dari pembuatan laporan ini diantaranya:

1. Membuat model translasi dengan kata baku dan mempertimbangkan faktor-faktor yang dapat menentukan performa model translasi, seperti: lexical translation, model of alignment atau reordering model, fertility model, dan

relative reodering model.

2. Membandingkan hasil translasi model GIZA dengan hasil translasi Bing Translator menggunakan algoritma BLEU untuk dievaluasi.

1.4. Batasan Masalah

Batasan dari tugas akhir ini adalah:

1. Data untuk pembentukan model translasi diperoleh dari Alkitab bahasa Indonesia dan bahasa Inggris.

2. Pengujian akan dilakukan pada 31 ayat Alkitab dari renungan harian e-RH (PSM) 1.2.1 bulan Juli 2014 dan edisi tahunan dari e-RH (PSM) 1.2.1 tahun 2010 untuk ekspansi eksperimen.

3. Batasan pembanding untuk hasil translasi diambil dari hasil translasi situs sabda.org.

(16)

3

5. Mesin translasi yang akan digunakan sebagai pembanding adalah Bing Translator.

6. Evaluasi model akan dilakukan dengan cara membandingkan hasil translasi yang dibuat menggunakan model GIZA dengan hasil translasi dari Bing Translator, yaitu dengan mencari nilai kecocokan padanan kata terbesar

dengan menggunakan algoritma BLEU. 1.5. Sistematika Penyajian

Sistematika pembahasan dari penyusunan laporan ini adalah sebagai berikut: BAB I. Pendahuluan

Bab ini berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penyajian laporan tugas akhir.

BAB II. Landasan Teori

Bab ini berisi tentang penjelasan teori-teori yang berkaitan dengan pembuatan dan pendukung perangkat lunak.

BAB III. Analisis dan Desain

Bab ini berisi tentang penjelasan analisis, gambaran arsitektur keseluruhan, dan disain perangkat lunak.

BAB IV. Pengembangan Perangkat Lunak

Bab ini berisi tentang penjelasan perencanaan tahap implementasi modul, penjelasan mengenai analisis dari algoritma yang digunakan, dan implementasi antarmuka.

BAB V. Testing dan Evaluasi Sistem

Bab ini berisi tentang penjelasan rencana pengujian perangkat lunak yang akan dilakukan.

BAB VI. Simpulan dan Saran

(17)

67

UNIVERSITAS KRISTEN MARANATHA

BAB VI

SIMPULAN DAN SARAN

Pada bab ini akan dijelaskan mengenai kesimpulan dari pembahasan pada perancangan perangkat lunak serta analisa pengujian aplikasi yang telah dibuat. 6.1. Kesimpulan

Berdasarkan tugas akhir yang telah dibuat maka dapat ditarik kesimpulan sebagai berikut:

1. Telah dibuat sebuah sistem aplikasi penerjemah Alkitab bahasa Indonesia-Inggris dengan mempertimbangkan faktor-faktor yang dapat menentukan performa model translasi, seperti: lexical translation, model of alignment atau reordering model, fertility model, dan relative reodering model.

2. Berdasarkan hasil evaluasi pengujian yang telah dilakukan, sistem penerjemah ini memiliki kekurangan pada kata ulang berimbuhan dan frasa. Jika dilihat dari sudut pandang IBM Model, maka frasa merupakan masalah dari IBM Model 3 yaitu fertility model, sedangkan kata ulang berimbuhan merupakan masalah dari IBM Model 1,2, dan 4 yang saling berhubungan. Hasil evaluasi dapat dilihat pada sub bab 5.2.

3. Berdasarkan pengujian ayat-ayat NATS Alkitab dari renungan harian e-RH (PSM) 1.2.1 pada bulan Juli 2014, diperoleh kesimpulan bahwa nilai BLEU model GIZA lebih baik dibandingkan dengan Bing Translator, yaitu 0,7814628 berbanding 0,7722841. Hasil pengujian dapat dilihat pada Tabel 5.4.

4. Hasil translasi model GIZA++ dan Bing Translator tidak berbeda secara signifikan dan dapat dikatakan setara dalam jangka panjang dengan seiring berkembangnya data. Hal ini mengindikasikan bahwa sebagian besar kata-kata yang terdapat dalam Alkitab adalah kata-kata-kata-kata yang banyak digunakan dalam keseharian dan mendapat masukan yang baik sebagai hasil crowd sourcing dalam sistem Bing. Hasil pengujian dapat dilihat pada Tabel 5.7.

(18)

68

berhubungan dan penting. Namun kekurangan dari sistem penerjemah ini adalah data testing yang digunakan hanya dapat berupa ayat dalam akitab. 6.2. Saran

Adapun saran yang diberikan untuk aplikasi sistem translasi ini adalah sebagai berikut:

1. Proses translasi dapat dilakukan dari dua arah, yaitu Indonesia-Inggris dan Inggris-Indonesia.

2. Proses evaluasi dapat lebih dikembangkan dengan menggunakan metode lain, contohnya adalah NIST atau METEOR. (G,2002)

3. Proses pendeteksian kata ulang berimbuhan awalan dan akhiran dapat diperbaiki guna memperbaiki hasil translasi model.

4. Pembentukan model semantik untuk pendeteksian frasa dan kata-kata di luar ayat alkitab, sehingga kata-kata yang merupakan satu kelompok dapat diterjemahkan meskipun kata tersebut tidak terdapat dalam ayat alkitab. Contohnya adalah ‘statistik’ dan ‘hitung’.

(19)

69

UNIVERSITAS KRISTEN MARANATHA

DAFTAR PUSTAKA

Collins, M. (n.d.). Statistical Machine Translation IBM Models 1 and 2.

Frase, A. (2011). Statistical Machine Translation Part II : Word Alignments and EM. G, Doddington. (2002). Automatic evaluation of machine translation quality using

n-gram cooccurrence statistics. ARPA Workshop on Human Language Technology.

Knight, K. (1999). A Statistical MT Tutorial Workbook.

Och, F. J., & Ney, H. (2003, March). A Systematic Comparison of Various Statistical Alignment Model. Computational Linguistics, 29, 19-51.

Papineni, K., Roukos, S., Ward, T., & Zhu, W.-J. (2001). IBM Research Report Bleu : a Method for Automatic Evaluation of Machine Translation .

S, S. H. (2013). Sistem Penerjemah Berbasis Statistik Untuk Bahasa Indonesia - Jepang.

Sheskin, D. J. (2003). Handbook of Parametric and Nonparametric Statistical Procedures: Third Edition. CRC Press.

Referensi

Dokumen terkait

Lampiran 21: Uji Normalitas Nilai Post-test Perhitungan Manual

Puji syukur peneliti panjatkan kehadirat Tuhan Yang Maha Esa atas rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi dengan judul “Penerapan Model

Unit ini bertugas untuk mengolah bahan baku dari unit moulding menjadi produk jadi yang berupa garden furniture sehingga siap dipasarkan.. Unit

Dengan kata lain bahwa kamus Frederik de Houtman dapat dijadikan rujukan yang sangat berharga dalam meneliti situasi kebahasaan Melayu di awal abad ke-17, dan

Produk yang diharapkan akan dihasilkan melalui penelitian pengembangan berupa model sarana pembelajaran atletik alat lempar cakram melalui modifikasi ukuran berat,

Disisi lain, ada kendala atau kelemahan pada layanan eksekutif shuttle, yaitu untuk proses reservasi tiket, reservasi kursi, pembatalan tiket, penyampaian keluhan, dan

Disoroti sejarah pertumbuhan negara Islam dan sepanjang kekuasaan Islam didapati warga negara atau rakyat kepada negara Islam tidak terdiri sepenuhnya dari penganut Islam