• Tidak ada hasil yang ditemukan

mesin penerjemah bahasa indonesia ke bahasa batak

N/A
N/A
Protected

Academic year: 2023

Membagikan "mesin penerjemah bahasa indonesia ke bahasa batak"

Copied!
88
0
0

Teks penuh

PENDAHULUAN

Latar Belakang

Rumusan Masalah

Batasan Masalah

Manfaat Penelitian

Tujuan Penelitian

LANDASAN TEORI

Tinjauan Pustaka

  • Tinjauan Terhadap Literatur 01
  • Tinjauan Terhadap Literatur 02
  • Tinjauan Terhadap Literatur 03
  • Tinjauan Terhadap Literatur 04
  • Tinjauan Terhadap Literatur 05

Tujuan dari penelitian ini adalah membangun aplikasi kamus bahasa Indonesia-Madura berbasis website. Cara ini cocok untuk aplikasi kamus Indonesia – Madura karena istilah pencarian dapat diterjemahkan dengan cepat. Penelitian ini dilatarbelakangi oleh pengembangan aplikasi terjemahan bahasa Indonesia: aksara lampung, sebagai sarana untuk melestarikan dan memperkenalkan aksara lampung kepada masyarakat umum.

Tujuan dari penelitian ini adalah untuk mengembangkan aplikasi penerjemah Bahasa Tetun - Bahasa Indonesia (Tetun Timor Leste) berbasis web.

Landasan Teori

  • Kamus
  • Bahasa Batak
  • Karakteristik Bahasa Batak Toba
  • Penerjemahan
  • Database
  • Bahasa Pemrograman Python
  • Django
  • Visual Studio Code
  • Mesin Penerjemah
  • Direct Machine Translation
  • Flowchart
  • MySQL
  • Xampp
  • Web
  • BLEU

Sibarani (2015) menyatakan bahwa bahasa Batak Toba merupakan salah satu bahasa daerah di wilayah Sumatera Utara yang digunakan dan dipelihara oleh penuturnya yaitu masyarakat Batak Toba atau yang disebut dengan etnis Batak Toba. Bahasa Batak Toba sebagai bahasa daerah terus dipertahankan oleh masyarakatnya, hal ini dibuktikan dengan bahasa Batak Toba yang masih digunakan oleh penuturnya sebagai alat komunikasi sehari-hari baik di daerah penuturnya maupun di daerah lain di luar daerah. Bahasa Batak Toba mempunyai struktur gramatika yang sama dengan bahasa Indonesia, yaitu di dalamnya terdapat subjek, predikat, objek, keterangan, dan sebagainya.

Kalimat dalam bahasa Batak Toba juga mirip dengan kalimat bahasa Indonesia: ada kalimat tunggal, kalimat majemuk, kalimat tanya, kalimat perintah, kalimat berita, kalimat sempurna dan lain-lain (Sihombing, 2011). Misalnya dalam bahasa Batak, 'Ulang Taon si Dina melakukan kesadaran' yang artinya 'hari ini adalah hari ulang tahun Dina'. Dalam terjemahan longgar, Python adalah bahasa pemrograman tingkat tinggi, bekerja dengan aplikasi yang ditafsirkan dan dapat digunakan untuk berbagai jenis tujuan (tujuan umum).

Bahasa pemrograman Python pertama kali dirilis pada tahun 1991 oleh Guide van Rossum, dan telah dikembangkan sejak tahun 1989. Python juga dikenal sebagai bahasa pemrograman yang mudah dipelajari karena struktur sintaksisnya yang rapi dan mudah dipahami (Anwar, 2019). Django adalah kerangka kerja dalam bahasa pemrograman Python untuk membuat aplikasi web full-stack.

Text editor ini mendukung banyak bahasa pemrograman seperti JavaScript, TypeScript dan Node.js, tetapi juga bahasa pemrograman lain yang menggunakan plugin yang dapat diinstal di Visual Studio Code seperti C++, C#, Python, Go, PHP, dll. Aryanto (2016), “Xampp merupakan aplikasi perangkat lunak pemrograman dan database yang mencakup berbagai aplikasi pemrograman seperti: Apache, HTTP, MySQL, database, PHP dan bahasa pemrograman Perl.” Untuk mencari nilai skor presisi yang disesuaikan atau Pn, Anda dapat mencari menggunakan rumus yang dapat Anda lihat pada Gambar 2.6.

Penerapan paradigma Direct Machine Translation (DMT) untuk menyusun kalimat bahasa Indonesia dengan harapan mampu menyusun kalimat bahasa Batak Toba dengan benar.

Gambar 2.1 Paradigma Segitiga Vauquios  Berikut bagian bagian pada paradigma Segitiga Vauquios:
Gambar 2.1 Paradigma Segitiga Vauquios Berikut bagian bagian pada paradigma Segitiga Vauquios:

Tahapan Penelitian

  • Studi Literatur
  • Alat dan Bahan Penelitian
  • Penginputan Kata Bahasa Indonesia – Batak Toba
  • Pembuatan Aplikasi
  • Pengujian (Testing)

Pada tahap ini penulis menyiapkan perangkat keras (Hardware), perangkat lunak (Software) dan Kamus Bahasa Batak Toba - Indonesia, Indonesia - Batak Toba karya Bernhard Limbong yang akan penulis gunakan dalam penelitian ini. Pada tahap ini sebelum aplikasi dikembangkan, kata-kata dari kamus bahasa Batak Toba - Indonesia, bahasa Indonesia - Batak Toba dimasukkan ke dalam excel kemudian dimasukkan ke dalam database MySQL. Pada tahap ini penulis melakukan proses perencanaan pembuatan aplikasi web penerjemah otomatis kalimat bahasa Indonesia ke bahasa Batak Toba.

Pengguna memasukkan kalimat bahasa Indonesia berupa teks ke dalam kotak teks, aplikasi mengambil kalimat yang dimasukkan kemudian melakukan proses penerjemahan kalimat bahasa Indonesia tersebut ke dalam bahasa Batak Toba. Kemudian padanan bahasa Indonesianya yaitu bahasa Batak Toba kembali digabungkan secara berurutan dengan spasi pemisah kata sehingga menghasilkan kalimat dalam bahasa Batak Toba. Kata-kata bahasa Batak yang dicari hasil terjemahan disusun kembali menjadi kalimat-kalimat yang diberi spasi.

Apabila pada aplikasi yang akan dibangun, kata bahasa Indonesia yang akan diterjemahkan tidak menemukan padanannya dalam bahasa Batak Toba, maka akan tercipta kondisi bahwa aplikasi akan menampilkan kembali kata yang tidak memiliki padanan tersebut. Setelah kalimat terjemahan diperoleh, aplikasi akan menampilkan hasil terjemahan berupa kalimat bahasa Batak Toba pada kotak teks. Pada tes BLEU (Bilingual Evaluation Understudy), metode yang digunakan adalah dengan menggunakan terjemahan empat orang yang setiap harinya menggunakan bahasa Batak.

Tes ini menggunakan sampel sepuluh kalimat berbahasa Indonesia sebagai bahasa sumber yang diterjemahkan ke dalam bahasa Batak sebagai bahasa sasaran. Hasil kalimat bahasa sasaran yaitu bahasa Batak Toba akan dihitung dengan menghitung skor BLEU menggunakan perhitungan nilai BLEU.

Gambar 3.3 Bahan Kamus  3.2.2.2 Hardware
Gambar 3.3 Bahan Kamus 3.2.2.2 Hardware

Rancangan Interface

Antarmuka aplikasi mesin penerjemah Bahasa Indonesia ke Batak Toba ditunjukkan pada Gambar 4.1. Tahap percontohan aplikasi penerjemah otomatis dari Bahasa Indonesia ke Batak Toba ini dilakukan setelah memasukkan kalimat bahasa Indonesia yang akan diterjemahkan ke dalam Batak Toba. Kemudian dilanjutkan dengan menggabungkan kalimat-kalimat sehingga menghasilkan suatu keluaran yaitu kalimat-kalimat dalam bahasa Batak Toba.

Pengujian mesin penerjemah kalimat bahasa Indonesia bahasa Batak Toba dilakukan dengan kalimat tunggal, kalimat majemuk, kalimat perintah, kalimat tanya, kalimat berita dan kalimat sempurna dalam percakapan sehari-hari. Pada pengujian ini, pengguna memasukkan contoh satu kalimat dalam bahasa Indonesia “dia telah datang” pada kolom teks yang sesuai. Saat diuji coba contoh satu kalimat ini diterjemahkan dengan baik sesuai ekspektasi, dengan hasil terjemahan dalam bahasa Batak adalah “ibana nunga ro”.

Terjemahan akhir masih belum ada pada struktur kalimat bahasa Batak yang seharusnya “tongtong do au laho tu singkola nangpe au lagi marsahit”. Pada pengujian ini pengguna memasukkan contoh kalimat perintah dalam bahasa Indonesia 'Jangan makan di tempat tidur!' di kotak teks yang disediakan. Kalimat bahasa Indonesia diterjemahkan dengan mesin terjemahan kemudian dibandingkan dengan terjemahan manusia, dimana terjemahan manusia diperoleh dari 4 responden yang merupakan suku Batak dan dapat berbahasa Batak.

Penelitian ini menghasilkan sebuah aplikasi mesin penerjemah bahasa Indonesia ke bahasa Batak Toba yang diimplementasikan dalam bentuk web. Pengembang aplikasi penerjemah Bahasa Indonesia ke Bahasa Batak ini dapat diimplementasikan di aplikasi lain seperti Android, iOS, atau desktop.

Gambar 3.8 Rancangan Interface
Gambar 3.8 Rancangan Interface

HASIL DAN PEMBAHASAN

Implementasi Interface

  • Tampilan Utama Interface

Tahap implementasi antarmuka ini digunakan untuk memudahkan pengguna dalam berinteraksi dengan mesin terjemahan yang telah dibuat.

Uji Coba Aplikasi

Langkah Pengujian Aplikasi

  • Pengujian Kalimat Tunggal
  • Pengujian Kalimat Majemuk
  • Pengujian Kalimat Perintah
  • Pengujian Kalimat Tanya
  • Pengujian Kalimat Berita
  • Pengujian Kalimat Sempurna

Untuk menguji algoritma aplikasi terjemahan, Anda harus memasukkan kalimat bahasa Indonesia terlebih dahulu pada kolom teks yang tersedia. Kalimat yang telah dimasukkan kemudian memasuki tahap kapitalisasi, yaitu proses pengubahan huruf kapital menjadi huruf kecil dan menghilangkan spasi di akhir kalimat untuk memudahkan proses penerjemahan kata berdasarkan database menjadi lebih sederhana. Kode program yang digunakan untuk proses pelipatan kotak ditunjukkan pada Gambar 4.3. Kalimat yang sudah lolos casefolding memasuki tahap tokenisasi, yaitu proses pemisahan kata berdasarkan spasi menjadi bagian-bagian ujaran yang disebut token, yang kemudian diterjemahkan ke dalam bahasa Indonesia satu per satu.

Proses selanjutnya adalah proses penerjemahan kata dimana setiap kata yang tersimpan pada dataset akan diterjemahkan ke dalam bahasa Batak berdasarkan data yang tersedia pada database. Ini akan melakukan proses mengubah atau memindahkan kata-kata dari database ke dalam variabel array yang berisi kata-kata sebelumnya. Proses selanjutnya adalah proses pengelompokan kata menjadi kalimat, yang juga menampilkan keluaran terjemahannya pada kotak teks keluaran.

Pada pengujian ini pengguna memasukkan contoh kalimat majemuk dalam bahasa Indonesia “Aku tetap bersekolah walaupun sakit” pada text box yang tersedia. Hasil terjemahan bahasa Indonesia yang diinput adalah "au tongtong laho tu singkola nangpe au lagi sahit". Pada pengujian ini pengguna memasukkan contoh kalimat tanya dalam bahasa Indonesia “kapan kamu berangkat sekolah?” ke dalam kotak teks di aplikasi penerjemah yang tersedia.

Pada pengujian ini pengguna memasukkan contoh kalimat berita dalam bahasa Indonesia: “Andi dan Dedi lulus ujian sekolah”. di bidang teks yang sesuai. Tes akhir menggunakan contoh kalimat sempurna yang memuat keterangan Subjek, Predikat, Objek dan tempat.

Gambar 4.5 Pencarian Kata Dalam Database
Gambar 4.5 Pencarian Kata Dalam Database

Pengujian BLEU

  • Precision 1-Gram
  • Precision 2-Gram
  • Precision 3-Gram
  • Precision 4-Gram
  • Pengujian BLEU 10 pada 10 Kalimat

Pengujian ini dilakukan untuk mengetahui kualitas hasil terjemahan yang diterjemahkan oleh mesin penerjemah dari kalimat bahasa sumber ke bahasa sasaran. Terjemahan manusia sebagai kalimat acuan untuk mencari nilai skor BLEU ditunjukkan pada Gambar 4.17. Hasil perhitungannya akan diimplementasikan dengan Python, baris kodenya dapat dilihat pada Gambar 4.22.

Mesin terjemahan menerjemahkan semua kata yang terdapat dalam database, dan untuk kosakata yang tidak ada dalam database, mesin terjemahan mereproduksi kata-kata tersebut. BLEU menguji 10 kalimat dimana pengujian ini membandingkan terjemahan mesin penerjemah dengan terjemahan manusia yang sumber terjemahannya diperoleh dari 4 orang suku Batak yang berbahasa Batak. Disarankan bagi pengembang untuk menambahkan algoritma pasangan kata atau pemecah kata agar lebih baik dalam menerjemahkan kata yang mengandung sufiks, baik steaming untuk bahasa Indonesia maupun steaming untuk bahasa Batak.

1992) "Ensiklopedia Bahasa Cambridge". n.d.) "Terjemahan Terjemahan: sarana komunikasi", hal. 2019) “Aplikasi pengolahan data servis mobil dan sepeda motor di Pt. Jurnal Informasi dan Pemodelan Kimia, 53(9), hal. 2019) "Kamus Digital Batak-Indonesia-Inggris Menggunakan Microsoft Visual Studio. Aplikasi Tugas Akhir Kamus Digital Batak-Indonesia-Inggris Menggunakan Microsoft Visual Studio.". Diagram alir P, pembuatan PD jika F, MP jual. 2018) “Algoritma Segmentasi Frasa untuk Meningkatkan Akurasi Terjemahan Mesin Statistik Bahasa Indonesia – Bugis Wajo,” Jurnal Sistem dan Teknologi Informasi (JUSTIN), 6(2), hal.

Putri Handayani Parinduri (2019) "PROGRAM APLIKASI KAMUS INDONESIA-BATAK INDONESIA PROGRAM APLIKASI KAMUS INDONESIA-BATAK MANDAILING.". 2012) "Sistem Terjemahan Mesin untuk Bahasa India", Jurnal Internasional Aplikasi Komputer, 39 (1), hal. 2015) “Pelestarian Bahasa Batak Toba Dari Tinjauan Sosiologi dan Struktur Kebahasaan”, MEDAN MEAKNA: Jurnal Linguistik dan Sastra, XIII(2), hal.

Gambar 4.16 Terjemahan Mesin Penerjemah
Gambar 4.16 Terjemahan Mesin Penerjemah

SIMPULAN DAN SARAN

Simpulan

Pengujian ini memperoleh hasil sebesar 32,3%, nilai tersebut termasuk dalam kategori baik, terjemahan dapat dipahami, namun struktur kalimatnya kurang baik.

Saran

Aplikasi ini dibangun dengan menggunakan Visual Studio Code dan bahasa pemrograman Python dengan framework Django. Saran untuk pengembangan lebih lanjut antara lain menambahkan algoritma yang dapat menyeleksi kata dan menerjemahkan kalimat agar hasil terjemahan dapat lebih tepat. Kosakata yang masuk ke database hanya 6500 kata, kami berharap dapat menambah kosakata lagi di database untuk menambah kosakata yang bisa diterjemahkan.

Karena penelitian ini hanya berfokus pada bagian rendering engine saja, dan hanya menggunakan satu antarmuka, maka diharapkan dapat menambahkan antarmuka seperti halaman add-word dan lain-lain. Tersedia di: http://lecturer.eepis-its.edu/~tessy/lecturenotes/db1/Bab1.pdf. https://dapobas.kemdikbud.go.id/home?show=isidata&id=99. https://cloud.google.com/translate/automl/docs/evaluate. n.d.) “ MENGGUNAKAN METODE ADJECTIVE,” hal. Pengantar Pemrosesan Bahasa Alami”, PENGOLAHAN PIDATO dan BAHASA Pengantar Linguistik Komputasi dan Pengenalan Ucapan Pemrosesan Bahasa Alami, hal.

Gambar

Gambar 2.1 Paradigma Segitiga Vauquios  Berikut bagian bagian pada paradigma Segitiga Vauquios:
Gambar 2.2 Direct Machine Translation  2.2.11  Flowchart
Gambar 2.3 Simbol dalam Flowchart
Tabel 2.1 BLEU Score
+7

Referensi

Dokumen terkait

Abstracts of a health research article seem simple, but it is often found that the abstracts written turned out to not be able to represent the contents of the paper as a whole..