• Tidak ada hasil yang ditemukan

Konversi Bahasa Indonesia ke SQL (Structured Query Language) dengan Pendekatan Mesin Penerjemah Statistik

N/A
N/A
Protected

Academic year: 2021

Membagikan "Konversi Bahasa Indonesia ke SQL (Structured Query Language) dengan Pendekatan Mesin Penerjemah Statistik"

Copied!
6
0
0

Teks penuh

(1)

Abstrak— Bahasa merupakan alat yang digunakan untuk berkomunikasi. SQL (Structured Query Language) merupakan bahasa pemograman yang bergerak dalam bidang database. Dengan menggunakan bahasa SQL maka setiap orang harus memahami struktur SQL tersebut jika ingin mendapatkan informasi dalam suatu database.Tetapi, hanya dengan menggunakan bahasa alami yang biasa digunakan sehari–hari setiap orang akan lebih dimudahkan dalam mencari dan mendapatkan informasi dalam database tanpa harus memahami struktur SQL itu sendiri. Maka, dibuatlah suatu sistem Konversi bahasa Indonesia ke SQL dengan pendekatan mesin penerjemah statistik untuk mendapatkan nilai akurasi pada bahasa alami. Pada penelitian ini Pengujian dilakukan secara otomatis menggunakan Bilingual Evaluation Understudy (BLEU) dan pengujian menggunakan aplikasi basis data. Hasil pengujian pada BLEU didapatkan nilai akurasi sebesar 64.89% sedangkan pada aplikasi basis data pengujian pada database mahasiswa didapatkan nilai akurasi sebesar 70% terhadap kalimat uji yang diberikan untuk setiap basis data. pada pengujian MOS (Mean Opinion Score) sebesar 70% dengan skala 70-80% yang artinya, mendapatkan kualitas opini baik.

Kata Kunci— SQL, bahasa alami, BLEU Score, aplikasi basis data, MOS (Mean Opinion Score)

I. PENDAHULUAN

Bahasa merupakan alat yang digunakan manusia untuk berkomunikasi. Fungsi bahasa sebagai alat komunikasi yaitu sebagai sarana penyampaian informasi kepada orang lain baik secara lisan maupun tulisan mengenai apa yang ingin disampaikan sebagai media mengekspresikan diri, perasaan, pikiran, keinginan, serta kebutuhan agar orang dapat mengerti maksud dan tujuan yang diinginkan tanpa menghindari tata bahasa yang sudah ada. Tidak hanya untuk melakukan komunikasi antara manusia dengan manusia yang lainnya, namun dalam hal ini bahasa juga menjembatani komunikasi antara manusia dengan komputer.

Bahasa yang digunakan manusia untuk berkomunikasi dengan komputer dikenal dengan bahasa pemograman. Bahasa SQL (Structured Query Language) merupakan bahasa pemograman yang bergerak dalam bidang database. Database dapat diungkapkan sebagai suatu pengorganisasian data dengan bantuan komputer yang memungkinkan data dapat diakses dengan mudah[1].

Database dapat dijumpai di perusahaan, perpustakaan, bahkan di dalam dunia internet pun sering dijumpai penggunaan database untuk melihat informasi dengan kriteria tertentu dalam suatu database. Dengan menggunakan SQL maka setiap orang harus memahami struktur SQL tersebut jika ingin mendapatkan informasi dalam suatu database. Tetapi, hanya dengan menggunakan bahasa alami yang biasa digunakan sehari – hari setiap orang akan lebih dimudahkan dalam mencari dan mendapatkan informasi dalam database tanpa harus memahami struktur SQL itu sendiri.

NLP (Natural Language Processing) atau pengolahan bahasa alami merupakan salah satu bidang ilmu Artificial Intelligence (Kecerdasan Buatan) yang mempelajari komunikasi antara manusia dengan komputer melalui bahasa alami. Bahasa alami tidak bertujuan untuk mentransformasikan bahasa yang diterima dalam bentuk suara menjadi data digital melainkan bertujuan untuk memahami arti dari bahasa yang diberikan dalam bahasa alami dan memberikan respon yang sesuai, misalnya dengan melakukan aksi tertentu atau menampilkan data tertentu. Dengan perkembangan jaman yang semakin maju dan juga dengan semakin pesatnya penggunaan database maka dibutuhkan suatu interaksi manusia dan komputer. Maka, dibuatlah suatu sistem untuk mengkonversikan bahasa Indonesia ke SQL dengan pendekatan mesin penerjemah statistik.

II. URAIANPENELITIAN A. Mesin Penerjemah Statistik

Mesin penerjemah statistik merupakan salah satu jenis mesin penerjemah dengan menggunakan pendekatan statistik. Terdapat 3 komponen yang terlibat dalam proses penerjemahan dari satu bahasa ke bahasa lain pada mesin penerjemah statistik, yaitu language model, translation model, dan decoder, komponen mesin penerjemah statistik dapat dilihat pada gambar 1.

Gambar 1. Komponen mesin penerjemah statistik [2]

Secara umum, arsitektur mesin penerjemah statistik Moses ditunjukkan pada Gambar 2.

Konversi Bahasa Indonesia ke SQL (Structured

Query Language) dengan Pendekatan Mesin

Penerjemah Statistik

Jemi Karlos

1

, Herry Sujaini

2

, Hengky Anra

3

.

Program Studi Teknik Informatika Fakultas Teknik Universitas Tanjungpura

123

(2)

Sumber data utama yang dipergunakan adalah parallel corpus dan monolingual corpus. Proses training terhadap parallel corpus menggunakan GIZA++ menghasilkan translation model (TM). Proses training terhadap bahasa target pada parallel corpus ditambah dengan monolingual corpus bahasa target menggunakan SRILM menghasilkan language model (LM), sedangkan PoS model (PoS-M) dihasilkan dari bahasa target pada parallel corpus yang setiap katanya sudah ditandai dengan PoS. TM, LM dan PoS-M digunakan untuk menghasilkan decoder Moses. Selanjutnya Moses digunakan sebagai mesin penerjemah untuk menghasilkan bahasa target dari input kalimat dalam bahasa sumber.

B. Moses

Moses adalah salah satu Mesin Penerjemah Statistik yang memungkinkan untuk menerjemahkan secara otomatis setiap pasangan bahasa. Moses digunakan untuk melatih model statistik teks terjemahan dari bahasa sumber ke bahasa sasaran. Saat melakukan penerjemahkan bahasa, Moses membutuhkan korpus dalam dua bahasa, bahasa sumber dan bahasa sasaran. Moses dirilis di bawah lisensi LGPL (Lesser General Public License) dan tersedia sebagai kode sumber dan binari untuk Windows dan Linux. Perkembangannya didukung oleh proyek EuroMatrix, dengan pendanaan oleh European Commission [4].

C. Korpus

Korpus didefinisikan sebagai koleksi atau sekumpulan contoh teks tulis atau lisan dalam bentuk data yang dapat dibaca dengan menggunakan seperangkat mesin dan dapat diberi catatan berupa berbagai bentuk informasi linguistik. Korpus dapat diklasifikasikan ke dalam delapan jenis, yaitu korpus khusus (specialised corpus), korpus umum (general corpus), korpus komparatif (comparable corpus), korpus paralel (parallel corpus), korpus pemelajar (learner corpus), korpus pedagogis (pedagogic corpus), korpus historis atau diakronis (historical or diachronic corpus), dan korpus monitor (monitor corpus) [5]. Berdasarkan jenis korpus tersebut, untuk penelitian ini penulis akan memfokuskan pada korpus paralel.

D. Automatic Evaluation

Sitem evaluasi otomatis yang populer saat ini adalah BLEU (Bilingual Evaluation Understudy). BLEU adalah sebuah algoritma yang berfungsi untuk mengevaluasi kualitas dari sebuah hasil terjemahan yang telah diterjemahkan oleh mesin dari satu bahasa alami ke bahasa lain. BLEU mengukur modified n-gram precission score antara hasil terjemahan otomatis dengan tejemahan rujukan dan menggunakan konstanta yang dinamakan brevity penalty.

Nilai BLEU didapat dari hasil perkalian antara brevity penalty dengan rata-rata geometri dari modified precision score. Semakin tinggi nilai BLEU, maka semakin akurat dengan rujukan. Sangat penting untuk diketahui bahwa semakin banyak terjemahan rujukan per kalimatnya, maka akan semakin tinggi nilainya. Untuk menghasikan nilai BLEU yang tinggi, panjang kalimat hasil terjemahan harus mendekati panjang dari kalimat referensi dan kalimat hasil terjemahan harus memiliki kata dan urutan yang sama dengan kalimat referensi. Rumus BLEU sebagai berikut [6]: 𝐵𝑃𝐵𝐿𝐸𝑈= {𝑒(1−𝑟/𝑐)1 𝑖𝑓 𝑐 ≤ 𝑟 𝑖𝑓 𝑐 > 𝑟 (2.1) 𝑃𝑛= ∑𝐶𝜖 𝑐𝑜𝑟𝑝𝑢𝑠 𝑛−𝑔𝑟𝑎𝑚𝜖𝐶∑ 𝑐𝑜𝑢𝑛𝑡𝑐𝑙𝑖𝑝(𝑛−𝑔𝑟𝑎𝑚)𝐶𝜖 𝑐𝑜𝑟𝑝𝑢𝑠 𝑛−𝑔𝑟𝑎𝑚𝜖𝐶∑ 𝑐𝑜𝑢𝑛𝑡 (𝑛−𝑔𝑟𝑎𝑚) (2.2) BLEU = 𝐵𝑃𝐵𝐿𝐸𝑈. 𝑒∑ 𝑤𝑛 𝑁 𝑛−1 log 𝑝𝑛 (2.3) Keterangan: BP = brevity penalty

c = jumlah kata dari hasil terjemahan otomatis r = jumlah kata rujukan

𝑃𝑛 = modified precission score

𝑤𝑛 = 1/N (standar nilai N untuk BLEU adalah 4)

𝑝𝑛 = jumlah n-gram hasil terjemahan yang sesuai dengan rujukan dibagi jumlah n-gram hasil terjemahan

III. HASILDANDISKUSI A. Data Penelitian

Data penelitian yang digunakan berupa database mahasiswa yang terdiri dari 3 tabel basis data yaitu tabel mahasiswa, tabel dosen dan tabel mata kuliah yang akan digunakan dalam Konversi Bahasa Indonesia ke SQL dengan Pendekatan Mesin Penerjemah Statistik.

B. Implementasi Mesin Penerjemah Statistik Bahasa Indonesia ke SQL

1. Implementasi SRILM

Model bahasa digunakan sebagai sumber pengetahuan berbasis teks dengan nilai-nilai probabilistik. Penelitian ini menggunakan n-gram sebagai language model. Model bahasa dibangun dengan tools SRILM. Model bahasa akan menghasilkan output dengan format file *.lm. Berikut merupakan tabel model bahasa yang dihasilkan oleh SRILM pada mesin penerjemah statistik bahasa Indonesia ke SQL.

Pemodelan bahasa oleh SRILM dapat dilihat pada gambar 3.

(3)

\data\ ngram 1=136 ngram 2=280 \1-grams: -2.240037 nidn -0.4768094 -2.150253 nim -0.6977237 -2.240037 nip -0.3940836 -2.150253 nip_dosen -0.2726894 \2-grams -0.5486881 select namamhs -1.550591 select nidn -0.9579124 select nim -1.190379 select nip

Gambar 3. Tabel model bahasa dengan bahasa SQL sebagai bahasa target

2. Implementasi Giza++ Untuk Pemodelan Translasi Model translasi digunakan untuk memasangkan teks input dalam bahasa sumber dengan teks output dalam bahasa target. Model translasi dibangun dengan tools Giza++. Proses pemodelan translasi oleh Giza++ menghasilkan dokumen vocabulary corpus, word alignment dan lexical model table. Dokumen-dokumen tersebut terdapat dalam folder “train” yang didalamnya terdapat 4 file yaitu “corpus, giza.sq-id, giza.id-sq dan model”.

Pemodelan translasi oleh Giza++ dapat dilihat pada gambar 4. 1 UNK 0 2 yang 55 3 ? 53 4 mahasiswa 36 5 mata 28

Gambar 4. Dokumen vocabulary corpus bahasa Indonesia

Angka 1 sampai 10 pada dokumen vocabulary corpus merupakan uniq id untuk setiap data token, sedangkan angka disebelah kanan token menunjukkan frekuensi kemunculan. Vocabulary corpus yang dihasilkan mesin penerjemah Bahasa Indonesia ke Bahasa SQL terdiri dari 193 token untuk korpus bahasa Indonesia dan 139 token untuk bahasa SQL.Dokumen alignment dapat dilihat pada gambar 5.

# Sentence pair (1) source length 12 target length 7 alignment score : 1.82755e-07

tampilkan nim mahasiswa yang diakhiri angka 38 NULL ({ }) select ({ }) nim ({ 2 }) , ({ }) namamhs ({ }) from ({ }) datamahasiswa ({ 3 }) where ({ 4 }) nim ({ }) like ({ }) " ({ }) %38 ({ 1 5 6 7 }) " ({ })

Gambar 5. Dokument alignment bahasa Indonesia - bahasa SQL

Dokumen alignment Bahasa Indonesia ke Bahasa SQL terdapat tiga baris kalimat. Baris pertama berisi letak kalimat target (1) dalam korpus, panjang kalimat sumber (7), panjang kalimat target (9) dan skor alignment. Baris kedua merupakan bahasa sumber dan baris ketiga merupakan alignment kalimat bahasa target terhadap kalimat bahasa sumber. Kata “yang” ({ 4 }) memiliki makna bahwa kata “where” pada kalimat bahasa target, di-align ke kata kelima pada kalimat bahasa sumber yaitu “yang”.

C. Pengujian Hasil Terjemahan Mesin Translasi

Pengujian hasil translasi dilakukan dengan cara pengujian otomatis dari mesin penerjemah. Pengujian otomatis dari mesin penerjemah menghasilkan keluaran berupa nilai akurasi yang dihasilkan oleh BLEU.

Langkah pada pengujian otomatis, korpus yang akan diuji terlebih dahulu melalui langkah translasi otomatis yang akan memberikan output berupa korpus dalam bahasa target yang telah diterjemahkan oleh mesin. Korpus uji yang digunakan pada tahap ini berjumlah 370. Hasil BLEU dapat dilihat pada gambar 6.

karlos@karlos-X45U:~$

~/NLP/mosesdecoder/scripts/generic/multi-bleu.perl ~/NLP/hasil/id-sql.lowercased.sq < ~/NLP/hasil/output.sq

BLEU = 64.89, 83.2/73.0/65.5/59.2 (BP=0.931, ratio=0.934, hyp_len=4128, ref_len=4421)

Gambar 6. Tampilan nilai dari output.sq

Berdasarkan Gambar 6 diperoleh nilai awal dari ouput.id sebesar 64.89%.

D. Pengujian pada aplikasi basis data

Pengujian pada aplikasi basis data dilakukan dengan mengimplementasikan aplikasi basis data terhadap database mahasiswa. Tabel 1, tabel 2 dan tabel 3 merupakan tabel data mahasiswa, tabel data dosen dan tabel mata kuliah.

Tabel 1 data mahasiswa

Tabel 2 data dosen

(4)

Tabel 3 Mata Kuliah

Inputan pada aplikasi basis data ini berupa teks kalimat Bahasa Indonesia dan menghasilkan output hasil berupa teks dalam format SQL. Setelah mengetikkan teks kalimat dalam Bahasa Indonesia, proses pentranslasian dapat dimulai dengan meng-klik tombol “Translate”.Setelah tombol “Translate” di-klik, program akan menampilkan proses translasi serta hasil output dalam format SQL seperti pada Gambar 7 berikut.

Gambar 7. Tampilan Program Pengujian Pada Aplikasi Basis Data

E. Hasil Pengujian Pada Aplikasi Basis Data

Pengujian pada aplikasi basis data menggunakan pengujian Black box. Black box adalah pengujian yang dilakukan hanya mengamati hasil eksekusi melalui data uji dan memeriksa fungsional dari perangkat lunak. Jadi dianalogikan seperti kita melihat suatu kotak hitam, kita hanya bisa melihat penampilan luarnya saja, tanpa mengetahui ada apa dibalik bungkus hitam nya. Sama seperti pengujian black box, hanya mengevaluasi dari tampilan luarnya, tanpa mengetahui apa sesungguhnya yang terjadi dalam proses tersebut.[8]

Tabel hasil pengujian pada aplikasi basis data dapat dilihat pada tabel 4.

Tabel 4

Pengujian pada aplikasi basis data

No. Input Bahasa

Alami Output Format SQL Nilai

1.

tampilkan nim mahasiswa yang diakhiri angka 16

select nim , namamhs from datamahasiswa where nim like " %16 " B 2. tampilkan nama mahasiswa yang lahir di tahun 1993 select namamhs , tempat_tanggal_lahir from datamahasiswa where tempat_tanggal_lahir like " like " %1993% " B 3. tampilkan nama mahasiswa yang lahir di tahun 1994 select namamhs , tempat_tanggal_lahir from datamahasiswa where tempat_tanggal_lahir like " %1994% " B 4. sebutkan mata kuliah yang berada dibawah semester 3 select mata_kuliah , semester from matakuliah where semester <3 B 5. sebutkan nama dosen pembimbing mahasiswa mario anggara select namamhs , dosen_pa from datamahasiswa where namamhs like " %mario anggra% " B 6. tolong carikan nim mahasiswa yang mengandung unsur angka 6 select * from datamahasiswa where nim like " %6% " B 7. tolong carikan nim mahasiswa yang mengandung unsur angka 9 select * from datamahasiswa where nim like " %9% " B 8.

nip dosen mana saja yang diakhiri angka 3

select * from dosen where nip like " %3 "

B

9. coba carikan nidn bu tursina

select nidn , namadsn from dosen where namadsn like " %tursina% " B 10. sebutkan nama dosen pembimbing mahasiswa hasbiansyah select namamhs , dosen_pa from datamahasiswa where namamhs like " %hasbiansyah% " B 11. tampilkan nomer induk pegawai pak arif

select nomer induk pegawai where namadsn like " %arif% " S 12. mata kuliah sistem operasi mempunyai berapa sks ? select namadsn , mata_kuliah from matakuliah where mata_kuliah like " %sistem operasi% " sks " S 13. regina memiliki nim mahasiswa berapa ?

select nim , namamhs from datamahasiswa where " like " %regina% " S 14. yang lahir dibulan oktober siapa saja namanya select from datamahasiswa where like " oktober namanya S 15. apa gelar akademik pak heri priyanto

select gelar from where namadsn like " %heri priyanto% "

(5)

No. Input Bahasa

Alami Output Format SQL Nilai

16. sebutkan nama dosen pembimbing mahasiswa danny indrayana select namamhs , dosen_pa from datamahasiswa where namamhs like " %danny indrayana% " B 17. sebutkan mata kuliah yang berada dibawah semester 7 select mata_kuliah , semester from matakuliah where semester <7 B 18. tampilkan nim mahasiswa yang diakhiri angka 20

select nim , namamhs from datamahasiswa where nim like " %20 "

B

19.

nip dosen mana saja yang diakhiri angka 1

select * from dosen where nip like " %1 "

B

20.

nidn dosen mana saja yang diakhiri angka 6

select * from dosen where nidn like " %6 "

B

21. coba carikan nidn pak arif

select nidn , namadsn from dosen where namadsn like " %arif% "

B

22.

coba carikan nidn pak herry sujaini

select nidn , namadsn from dosen where namadsn like " %herry sujaini% "

B

23.

nidn dosen mana saja yang diakhiri angka 1

select * from dosen where nidn like " %1 " B 24. tolong carikan nim mahasiswa yang mengandung unsur angka 9 select * from datamahasiswa where nim like " %9% " B 25. carikan nim mahasiswa yang diakhiri angka 22

select nim , namamhs from datamahasiswa where nim like " %22 " B 26. sebutkan mata kuliah yang berada dibawah semester 5 select mata_kuliah , semester from matakuliah where semester <5 B 27. nidn dosen mana saja yang diakhiri angka 1

select * from dosen where nidn like " %1 " B 28. carikan nim mahasiswa yang diakhiri angka 38

select nim , namamhs from datamahasiswa where nim like " %38 " B 29. sebutkan nama dosen pembimbing mahasiswa melifa gardenia select namamhs , dosen_pa from datamahasiswa where namamhs like " %melifa gardenia% " B 30. nidn dosen mana saja yang diakhiri angka 3

select * from dosen where nidn like " %3 " B 31. mata kuliah sistem informasi geografis berada disemester berapa ? mata_kuliah from matakuliah where mata_kuliah like " %sistem informasi geografis% " semester from " S 32. nim mahasiswa yang diakhiri angka dua puluh lima

select nim where diakhiri angka dua puluh lima

S

33.

mata kuliah apa saja yang memiliki kode tif-204

select mata_kuliah from matakuliah where kode_mk like " tif-204

S

34.

mata kuliah apa saja yang kurang dari 4 sks ? select mata_kuliah from matakuliah where sks =4 kurang dari " S 35. carikan nama mahasiswa yang lahir nya pada tahun 1994 carikan from datamahasiswa where tempat_tanggal_lahir nya tahun 1994 tempat_tanggal_lahir like " S 36. berapa banyak dosen yang memiliki gelar dr ?

select namadsn from dosen where namadsn like " %dr% " B 37. sebutkan mata kuliah yang berada dibawah semester 7 select mata_kuliah , semester from matakuliah where semester <7 B 38. sebutkan mata kuliah yang berada dibawah semester 8 select mata_kuliah , semester from matakuliah where semester <8 B 39. sebutkan mata kuliah yang berada dibawah semester 4 select mata_kuliah , semester from matakuliah where semester <4 B 40. berapa nip dosen pak helfi

select nip , namadsn from dosen where namadsn like " %helfi% "

B

41.

nip dosen mana saja yang diakhiri angka 2

select * from dosen where nip like " %2 "

B 42. tolong carikan nim mahasiswa yang mengandung unsur angka 5 select * from datamahasiswa where nim like " %5% " B 43. sebutkan nama dosen pembimbing mahasiswa soni mandira select namamhs , dosen_pa from datamahasiswa where namamhs like " %soni mandira% " B 44. carikan nim mahasiswa yang diakhiri angka 22

select nim , namamhs from datamahasiswa where nim like " %22 "

B

45.

tampilkan nama mahasiswa yang lahir pada tanggal 13 april select namamhs , tempat_tanggal_lahir from datamahasiswa where tempat_tanggal_lahir like " %13 april% " B 46. pemrosesan bahasa alami memiliki berapa sks disemester 8 %pemrosesan bahasa alami% " sks from matakuliah 8 like " S 47. sebutkan nama dosen pa mario

anggara select namamhs like " pa " %mario anggara% "

S

48.

carikan mahasiswa yang lahir pada tanggal 24 oktober select namamhs , tempat_tanggal_lahir from datamahasiswa where tempat_tanggal_lahir carikan 24 oktober S

(6)

No. Input Bahasa

Alami Output Format SQL Nilai

49.

mahasiswa mana yang lahir di bulan januari

select * where tempat_tanggal_lahir like " bulan januari% "

S

50.

tolong carikan nip dosen yang mengajar mata kuliah matematika diskrit

select nip carikan mengajar from dosen where mata_kuliah from matakuliah where mata_kuliah like " %matematika diskrit% " S Keterangan :

B = Output format SQL sesuai dengan inputan bahasa alami.

S = Output format SQL tidak sesuai dengan inputan bahasa alami

Dari hasil pengujian pada tabel 4 yang dilakukan oleh user dimana menghasilkan kalimat yang sesuai dengan inputan bahasa alami sebanyak 35 kalimat dan kalimat yang tidak sesuai sebanyak 15 kalimat. Pemberian nilai terhadap keakuratan sistem adalah dengan melihat persentase kebenaran hasil terhadap yang diharapkan. Kebenaran hasil berarti kalimat alami dapat ditranslasikan dalam bentuk format SQL dan terdapat kesesuaian kata antara kalimat inputan dan output format SQL.

Jadi penilaiannya adalah :

∑𝑆𝑐𝑜𝑟𝑒

n 𝑥 100 % (3.1) Keterangan :

score : Jumlah bahasa alami yang sesuai. n : Total seluruh inputan bahasa alami.

Dengan rumus diatas diperoleh hasil persentase sebagai berikut : 35 50 𝑥 100 % = 70 % dari 50 kalimat (n = 50) IV. KESIMPULAN A. Kesimpulan

Berdasarkan hasil analisis dan pengujian, maka kesimpulan yang dapat diambil sebagai berikut.

1. Metode pendekatan mesin penerjemah statistik yang digunakan dalam penelitian ini dapat diimplementasikan untuk mengkonversikan Bahasa Indonesia ke SQL.

2. Dari pengujian pada aplikasi basis data, konversi dengan mesin penerjemah statistik ini berhasil diintegrasikan kedalam sebuah aplikasi basis data. 3. Mesin penerjemah statistik yang digunakan untuk

mengkonversikan bahasa Indonesia ke SQL berhasil mendapatkan nilai akurasi BLEU sebesar 64.89% dan pada aplikasi basis data sebesar 70%.

B. Saran

Beberapa saran yang dapat diberikan sebagai pengembangan dari penelitian ini adalah sebagai berikut.

1. Input yang berupa teks pada penelitian ini dapat dirubah menjadi input ucapan (speech) dengan menambahkan blok “speech recognition” untuk mengubah ucapan tersebut menjadi teks.

2. Perlu adanya penangganan pola perintah query dengan pengecekkan kata yang salah dengan kata-perkata.

DAFTARPUSTAKA

[1] Priadi, Yudi. 2013. Kolaborasi SQL dan ERD dalam implementasi Database. Yogyakarta: Penerbit Andi Yogyakarta.

[2] Manning, Christopher D., Schutze, Hinrich. 2000. Foundations Of

Statistical Natural Language Processing. London : The MIT Press

Cambridge Massachusetts.

[3] Sujaini, Herry., Negara, Arif Bijaksana Putra. 2015. Analysis of

Extended Word Similarity Clustering based Algorithm on Cognate Language. Gujarat: ESRSA Publications Pvt. Ltd.

[4] Koehn, Philipp. 2007. Moses: Open Source Toolkit for Statistical

Machine Translation. Annual Meeting of the Association for Computational Linguistics (ACL), demonstration session, Prague,

Czech Republic.

[5] McEnery, T., et al. 2006. Corpus-Based Language Studies: An

Advanced Resource Book. Oxon: Routledge.

[6] Hunston, S. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge University Press.

[7] Tanuwijaya, Hansel., Manurung, Hisar Maruli. 2009. Penerjemahan Inggris-Indonesia Menggunakan Mesin Penerjemah Statistik Dengan

Word Reordering dan Phrase Reordering. Jakarta, Jurnal ilmu

Komputer dan Informasi Vol 2 No 1.

[8] Kuspriyanto, Sujaini Herry, dkk. 2005. Perancangan Translator Bahasa Alami Ke Dalam Format SQL (Structured Query Language). TEKNOIN. volume 10. No 3. September 2005 : 225 – 236.

Gambar

Gambar 1. Komponen mesin penerjemah statistik [2]
Gambar 2.  Arsitektur mesin pnerjemah statistik Moses [3]
Gambar 3.    Tabel model bahasa dengan bahasa SQL sebagai bahasa target
Tabel 3  Mata Kuliah

Referensi

Dokumen terkait

Berdasarkan uji t statistik yang dilakukan maka dapat disimpulkan bahwa dari kedua faktor pemberian pelayanan nasabahyang dilihat dari kepuasan kerja berpengaruh

Berdasarkan pembuatan laporan yang telah dibuat dari bab 1 sampai bab 4, laporan yang berjudul system pengolahan data penjualan kayu secara langsung di Perum Perhutani

Untuk mengatasi minimnya data usulan Pembebasan Bersyarat (PB) bagi narapidana maka upaya yang dilakukan yaitu berkoordinasi dengan instansi yang meminta Penelitian

Memberikan kuasa dan wewenang kepada Direksi Perseroan [dengan hak substitusi] untuk melaksanakan keputusan persetujuan mengenai pemberian jaminan atau mengagunkan atau

Заштита животне средине овог Плана постићи ће се остваривањем више појединачних циљева, који се односе на: • Заштиту вода

Analisis petrografi bertujuan untuk penamaan batu sedimen serta memperoleh data penunjang bagi Provenance agar dapat diketahui bagaimana kandungan persentase batuan baik

Larutan sampel dengan konsentrasi terkecil yang mampu menghambat pertumbuhan bakteri (ditandai dengan kejernihan secara visual yang dinilai oleh tiga

Berdasarkan analisis yang dilakukan terhadap hipotesis yang dirumuskan, maka dapat diambil kesimpulan sebagai berikut:.. Hasil penelitian dan uji hipotesis pertama dan