BAB II
LANDASAN TEORI
2.1 Tinjauan Pustaka
Dalam penelitian ini terdapat penelitian yang telah dilakukan peneliti sebelumnya dalam perancangan aplikasi penerjemah. Sehingga, dalam penelitian ini diperlukan tinjauan pustaka untuk membantu dalam perancangan aplikasi ini, berikut beberapa literatur yang mendukung dilakukannya penelitian ini.
2.1.1 Tinjauan Terhadap Literatur 01
Penelitian yang dilakukan oleh Lumbantobing (2019) dari jurusan Teknik Informatika D3, Universitas Sumatera Utara. Dengan judul “Aplikasi Kamus Digital Bahasa Batak-Indonesia-Inggris Menggunakan Microsoft Visual Studio 2010”. Penelitian ini dilatarbelakangi oleh keinginan penulis untuk ikut serta melestarikan bahasa Batak sebagai salah satu bahasa daerah di Indonesia, penggunaan bahasa Indonesia sehar-hari dan kaum pemuda Batak yang sebagian besar sudah tidak bisa menguasai bahasa Batak. Untuk mengartikan bahasa batak maka kamus sangat diperlukan, namun dalam kelangsungannya penggunaan kamus semakin ditinggalkan mengingat era modern ini membuat masyarakat mencari hal yang cepat dan instan. Oleh sebab itulah penulis melakukan penelitian ini untuk membuat aplikasi kamus yang dapat digunakan untuk menerjemahkan bahasa batak sekaligus untuk membantu melestarikan bahasa batak. Dari hasil penelitian ini dapat disimpulkan bahwa aplikasi yang berjalan di desktop ini mampu menerjemahkan kata bahasa batak ke bahasa Indonesia dan ke bahasa inggris.
2.1.2 Tinjauan Terhadap Literatur 02
Penelitian yang dilakukan oleh Putri Handayani Parinduri (2019), dari program studi Teknik Informatika D3, Universitas Sumatera Utara. Dengan judul
“Program Aplikasi Kamus Bahasa Indonesia Batak Mandailing”. Latar belakang pembuatan aplikasi kamus ini ialah semakin berkurangnya minat masyarakat yang berasal dari daerah Mandailing yang menggunakan bahasa daerah Mandailing serta kurangnya minatnya membaca buku bahasa daerah Mandailing ke bahasa Indonesia. Program aplikasi kamus bahasa Indonesia – Batak Mandailing ini adalah salah satu media belajar bahasa Batak Mandailing, bagi yang berasal dari daerah atau suku lain di Indonesia. Dan juga untuk mereka yang sebenarnya orang mandailing, tetapi lingkungan hidup mereka diluar daerah Mandailing. Aplikasi ini dimulai dengan memasukkan kata dalam bentuk bahasa Batak Mandailing terlebih dahulu baru setelahnya akan muncul translate dari bahasa Indonesianya. Aplikasi ini dapat digunakan dengan meng-install aplikasi pembuatnya, yaitu Microsoft Visual Studio 2010. Dari hasil penelitian yang telah dilakukan ialah bahwa aplikasi mampu menerjemahkan setiap kata yang diinputkan oleh user. Aplikasi ini telah diuji dan layak untuk digunakan sebagai media pembelajaran bahasa Batak Mandailing.
2.1.3 Tinjauan Terhadap Literatur 03
Penelitian yang dilakukan oleh Nurholis, Anam dan Airlangga (2019) dari Fakultas Teknologi Informasi, Universitas KH. A. Wahab Hasbullah. Dengan judul
“Aplikasi Kamus Bahasa Madura Berbasis Website”. Minat masyarakat akan pentingnya mempelajari bahasa Madura semakin berkurang pada era teknologi informasi yang semakin pesat beberapa faktor yang dapat mempengaruhi minat
tersebut diantaranya adalah dengan semakin turunnya pemakaian bahasa Madura yang terkesan statis. Penelitian ini dilatarbelakangi keinginan membuat aplikasi kamus bahasa Madura berbasis Web untuk mendayagunakan teknologi informasi dalam rangka melestarikan salah satu kebudayaan Indonesia. Tujuan dari penelitian ini adalah untuk membangun aplikasi kamus bahasa Indonesia ke bahasa Madura berbasis Website. Aplikasi yang akan dikembangkan akan fokus pada bagaimana menyediakan fasilitas untuk menerjemahkan kata/kalimat dari bahasa Indonesia ke bahasa Madura. Metode yang digunakan dalam penelitian ini adalah algoritma pencarian Sekuensial, yaitu pemrosesan pencarian kata. Metode ini cocok digunakan untuk aplikasi kamus bahasa Indonesia – Madura karena dapat menerjemahkan dengan cepat istilah pencarian. Hasil penelitian ini menghasilkan aplikasi kamus bahasa Indonesia – bahasa Madura berbasis Website. Aplikasi ini telah diuji dan hasilnya aplikasi ini mampu melakukan penerjemahan kalimat/kata dengan baik.
2.1.4 Tinjauan Terhadap Literatur 04
Penelitian yang dilakukan oleh Wibowo dan Fahrizal (2021) dengan judul
“Metode Parsing Tree dalam Rancang Bangun Penerjemah Bahasa Indonesia ke Bahasa Lampung”. Latar belakang penelitian ini adalah bagaimana mengembangkan aplikasi penerjemah bahasa Indonesia – Aksara Lampung sebagai sarana proses pelestarian dan pengenalan Aksara Lampung kepada masyarakat umum. Penelitian ini bertujuan untuk membangun aplikasi penerjemah bahasa Indonesia – Aksara Lampung dengan mengenalkan perbendaharaan kosakata dalam bahasa Indonesia dan bahasa Lampung beserta Aksara Lampung pada masyarakat umum. Aplikasi penerjemah bahasa Indonesia – Aksara Lampung dibuat dengan
menggunakan metode binary search dan parsing tree. Metode parsing tree digunakan untujk memecah kalimat menjadi kata-kata serta menggabungkan kata- kata menjadi kalimat, sedangkan binary search digunakan untuk melakukan proses pencarian kosakata berdasarkan nilai index dari masing masing kosakata pada aplikasi penerjemahan. Hasil penelitian ini menunjukkan bahwa aplikasi ini dapat menerjemahkan bahasa Indonesia – Aksara Lampung dalam bentuk kalimat tunggal yang diinputkan kedalam aplikasi penerjemahan, serta dapat menampilkan pemecehan kalimat menjadi kata beserta arti dari kata tersebut. Dari penelitian ini adalah aplikasi penerjemah bahasa Indonesia – Aksara Lampung dapat menerjemahkan kalimat tunggal dalam bahasa Indonesia ke bahasa Lampung dan disertai Aksara Lampung serta aplikasi ini juga dapat menjadi sarana pemahaman dan pelestarian suatu bahasa untuk masyarakat.
2.1.5 Tinjauan Terhadap Literatur 05
Penelitian yang dilakukan oleh Indriani, Gabriel dan Sumanto (2021) dengan judul “Implementasi penerjemah bahasa tetun – Indonesia (Timor Leste Tetun) Berbasis Web”. Latar belakang penelitian ini adalah bahasa tetun yang merupakan bahasa yang berasal dari daerah pulau Timor, Timor Leste yang dalam penerjemahannya belum banyak tersedia kamus ataupun aplikasi penerjemah tentang bahasa ini, sehingga menyulitkan mereka yang ingin belajar tentang bahasa tetuan, ataupun yang sekedar hanya ingin mencari tau saja, oleh sebab itulah penulis berupaya untuk ikut membantu menyediakan tempat belajar secara online agar dapat diakses dimana saja dan kapan saja. Tujuan dari penelitian ini adalah pengembangan aplikasi penerjemah bahasa Tetun – bahasa Indonesia (Timor Leste Tetun) berbasis Web. Penelitian ini menggunakan bahasa pemrograman PHP dan
MySQL sebagai database penyimpanan kosakata bahasa Tetun dan bahasa Indonesia. Pendekatan yang digunakan dalam penelitian ini adalah Metode SDLC yang terdiri atas banyak tahapan seperti perencanaan aplikasi, tinjauan aplikasi, perancangan aplikasi, pengoperasian dan pemeliharaan. Hasil penelitian pada aplikasi penerjemah bahasa Tetun – Indonesia ini mempermudah pengguna dalam memperoeh pengetahuan kosakata khususnya bahasa Tetun – Indonesia.
2.2 Landasan Teori
Terdapat beberapa teori dalam penelitian ini yang akan penulis jelaskan sebagai berikut:
2.2.1 Kamus
Menurut Kamus Besar Bahasa Indonesia, Kamus memiliki makna sebagai buku acuan yang memuat kata dan ungkapan, biasanya disusun menurut abjad berikut keterangan tentang makna, pemakaian, atau terjemahan, serta memuat kumpulan istilah atau nama yang disusun menurut abjad beserta penjelasan tentang makna dan pemakaiannya. Kata kamus diadopsi dari qāmus dalam bahasa Arab yang berasal dari bahasa Yunani okeanos, yang berarti ‘lautan’. Adapun terasaurus adalah buku yang memuat daftar kata atau ungkapan yang bertalian makna. Kata terasaurus diambil dari thērasauros dalam bahasa Yunani yang berarti ‘gudang’.
Baik kamus maupun thesaurus diibaratkan seperti laut atau gudang tempat menyimpan atau menampung khazanah kosakata dalam suatu bahasa. Keduanya menjadi potret ‘kekayaan’ daya ungkap dalam suatu bahasa (Dan dan Bumn, tanpa tanggal)
2.2.2 Bahasa Batak
Sibarani (2015) menyatakan Bahasa Batak Toba adalah salah satu bahasa daerah yang ada di daerah Sumatera Utara yang dipakai dan dipelihara oleh penuturnya yaitu masyarakat Batak Toba atau disebut dengan etnis Batak Toba.
Daerah penutur bahasa Batak Toba secara geografis berada di bagian tengah wilayah Provinsi Sumatera Utara yakni di punggung Bukit Barisan yang terletak 120 - 24 lintang utara dan 9810 - 9035 bujur timur, yang bersuhu sekitar 17- 29 dengan rata-rata kelembapan udara sekitar 85,04% ini, mempunyai luas wilayah 10.605,3 km2 atau 1.060.530 ha termasuk perairan Danau Toba seluas 1.102,6 km2 atau 110.260 ha. Bahasa Batak Toba sebagai bahasa daerah terus menerus dipelihara oleh masyarakatnya, hal ini terbukti bahasa Batak Toba masih dipakai oleh penuturnya sebagai alat komunikasi sehari-hari baik di daerah penutur maupun didaerah lain diluar wilayahnya.
2.2.3 Karakteristik Bahasa Batak Toba
Bahasa Batak Toba memilki stuktur tata bahasa yang sama dengan Bahasa Indonesia, didalamnya terdapat subjek, predikat, objek, keterangan, dan lain-lain.
Kalimat bahasa Batak Toba juga serupa dengan kalimat bahasa Indonesia, ada kalimat tunggal, kalimat majemuk, kalimat Tanya, kalimat perintah, kalimat berita, kalimat sempurna dan lainnya (Sihombing, 2011). Stuktur kalimat bahasa Batak Toba secara tulisan secara bentuk, umumnya terdiri dari:
Subjek (S) + Predikat (P) + Objek (O) + Kata Keterangan (K) = SPOK Pada bagian ini disajikan berbagai kalimat dalam bahasa Batak Toba berikut terjemahannya dalam bahasa Indonesia:
a. Kalimat tunggal
Contoh dalam bahasa Batak ‘Ibana Nunga Ro’ yang artinya ‘Dia sudah datang’.
b. Kalimat Majemuk
Contoh dalam bahasa Batak ‘Nangpe au marsahit, tongtong do au lao tu sikkola’ yang artinya ‘walaupun aku sakit, tetapnya aku pergi ke sekolah’.
c. Kalimat Perintah
Contoh dalam bahasa Batak ‘Bahen jo tes manis’ yang artinya ‘Buatkan teh manis’.
d. Kalimat Tanya
Contoh dalam bahasa Batak ‘Nunga mangan ho?’ yang artinya ‘Kamu sudah makan?’.
e. Kalimat Berita
Contoh dalam bahasa Batak ‘Ulang taon si Dina do sadarion’ yang artinya ‘hari ini ulang tahun dina’
f. Kalimat Sempurna
Contoh dalam bahasa Batak ‘Lagi Margitar di jabu do si Andi’ yang artinya ‘Andi sedang bermain gitar di rumah’
2.2.4 Penerjemahan
Setiap pakar memilki versi yang berbeda-beda tentang definisi penerjemahan. Berikut definisi penerjemahan dari para ahli:
a. Daniels & Crystal (1992) penerjemahan adalah istilah netral yang digunakan untuk semua jenis tugas dimana makna ungkapan dalam
satu bahasa diubah kedalam makna ungkapan bahasa yang lain, apakah media mediumnya lisan, tulisan, ataupun tanda. Dalam batasan ini adalah makna ungkapan yang menjadi tekanan utama dalam pengalihan bahasa, sedangkan media bahasa tulis maupun lisan bahkan tanda atau isyarat sekalipun tidak menjadi masalah.
b. Gutknecht & Gutknecht, n.d dalam Aronof dan Miller juga mengatakan bahwa istilah penerjemahan umumnya mengacu kepada materi tertulis, tetapi ia juga istilah payung untuk semua tugas dimana unsur-unsur teks satu bahasa (bahasa sumber, BSu) dilebur (molded) ke dalam bahasa yang lain (bahasa sasaran, BSa), apakah mediumnya tertulis, lisan, atau tanda.
c. Newmark, P. (1976) mengatakan bahwa penerjemahan merupakan keterampilan yang terdiri atas upaya mengganti pesan atau pernyataan tertulis dalam satu bahasa dengan pesan atau pernyataan yang sama dalam bahasa lain.
d. Catford (1965) mendefinisikan penerjemahan sebagai penggantian materi teks dalam satu bahasa (bahasa sumber) dengan padanan materi teks dalam bahasa lain (bahasa sasaran).
Berdasarkan uraian dari pendapat ahli diatas, penerjemahan dapat disebut sebagai proses penulisan atau ungkapan ulang sebuah pesan dari bahasa asal ke dalam bentuk bahasa tujuan atau sasaran tanpa mengurangi makna yang terdapat pada bahasa asal.
2.2.5 Database
Database merupakan himpunan kelompok data/kumpulan data yang saling berhubungan secara logis dan deskripsinya, yang disimpan secara bersama sedemikian rupa dan dirancang untuk memenuhi kebutuhan informasi organisasi.
Prinsip utamanya adalah pengaturan data/arsip, sedangkan tujuan utamnya adalah kemudahan dan kecepatan dalam pengambilan arsip, efisiensi ruang penyimpanan, mengurangi/menghilangkan redudansi data, dan keakuratan (Badriyah, 2008).
Ada beberapa istilah umum yang sering dipakai pada database, yaitu sebagai berikut:
a. Field, yaitu satu set kecil kata-kata atau deretan angka.
b. Record, yaitu kumpulan dari field yang berelasi secara logis.
c. File, yaitu kumpulan dari record yang berelasi secara logis.
d. Entity, yaitu orang, tempat, benda, atau kejadian yang berkaitan dengan informasi yang disimpan.
e. Attribute, yaitu setiap karakteristik yang menjelaskan suatu entity.
f. Primary Key, yaitu sebuah field yang nilainya unik yang tidak sama antara satu record dengan record yang lain.
g. Foreign Key, yaitu sebuah field yang nilainya berguna untuk menghubungkan Primary Key yang berbeda pada table yang berbeda.
2.2.6 Bahasa Pemrograman Python
Bahasa pemrograman python adalah interpreted high-level programming language for general-purpose programming. Terjemahan bebasnya, Python adalah bahasa pemrograman tingkat tinggi (high-level programming language), berjalan dengan aplikasi interpreted, dan bisa dipakai untuk berbagai jenis tujuan (general
purpose). Bahasa pemrograman Python dirilis pertama kali oleh Guide van Rossum di tahun 1991, yang sudah dikembangkan sejak tahun 1989. Python menggunakan metode pemrosesan interpreted, yaitu kode program akan diproses baris per baris langsung dari kode program (tidak butuh proses compile), ini mirip seperti bahasa script PHP dan Javascript. Python banyak digunakan untuk membuat berbagai macam program seperti program CLI, Program GUI (Desktop), Aplikasi Mobile, Web, IoT, Game, Program untuk Hacking, dsb. Python juga dikenal dengan bahasa pemrograman yang mudah dipelajari, karena stuktur sintaksnya rapi dan mudah dipahami (Anwar, 2019).
2.2.7 Django
Django merupakan sebuah salah satu kerangka kerja atau framework di bahasa pemrograman Python untuk membuat aplikasi web secara full-stack. Django merupakan kerangka kerja tingkat tinggi yang berjalan secara cepat dan memilki design pragmatis yang bersih. Django dibuat pada tahun 2003 oleh Simon Wilson dan Adrian Holovaty. Nama Django sendiri diambil oleh gitaris kebangsaan Belgia dan Prancis yaitu Django Reinhardt (Reinert Yosua Rumagit, S.Kom., 2019).
Kelebihan Django sebagai Web Framework adalah sebagai berikut:
1. Django memiliki template, libraries, dan API yang dirancang untuk bekerja sama untuk bertumbuh dan konektivitas
2. Django cocok dengan segala proyek dari proyek kecil hingga proyek besar
3. Django menggunakan bahasa python yang merupakan salah satu bahasa pemrograman yang paling popular.
4. Django memiki lebih banyak fitur dibandingkan dengan framework lainnya. Django memuat segala sesuatu yang dibutuhkan untuk membangun sebuah aplikasi.
2.2.8 Visual Studio Code.
Visual Studio Code merupakan sebuah teks editor multiplatform buatan Microsoft. Visual Studio Code pertama kali diperkenalkan di tanggal 29 April 2015 oleh Microsoft di konferensi Build 2015. VS Code tersedia untuk Windows, Linux, serta MAC OS. Teks Editor ini mendukung banyak bahasa pemrograman seperti JavaScript, TypeScript, dan Node.js, serta bahasa pemrograman lainnya dengan bantuan plugin yang dapat dipasang di Visual Studio Code seperti C++, C#, Python, Go, PHP, dll. VS Code bersifat open source. VS Code menyediakan Intellisense, Git Integration, Debugging, dan fitur Ekstensi. Fitur-fiturnya akan terus bertambah seiring dengan perkembangan versi Visual Studio Code. Perkembangan versi Visual Studio Code dilakukan setiap bulan (A. Yudi Permana, 2019).
2.2.9 Mesin Penerjemah
Mesin penerjemah atau machine translation merupakan aplikasi terkomputerisasi yang mengautomatisasi proses penerjemah dari satu bahasa ke bahasa lainnya (R.Nair dan Peter S., 2012). Mesin penerjemah dirasa sangat penting mengingat mudah dan cepatnya akses informasi. Pada prinsipnya, penerjemahan dari suatu bahasa sumber ke dalam bahasa sasaran mengikuti paradigma yang sesuai dengan paradigma segitiga Vauquois. Paradigma Segitiga Vauquois dapat dilihat pada gambar 2.1.
Gambar 2.1 Paradigma Segitiga Vauquios Berikut bagian bagian pada paradigma Segitiga Vauquios:
a. Direct Machine Translation, Pada level ini atau level pertama bahasa sumber diterjemahkan kata per kata ke dalam bahasa sasaran. Teknik ini dikenal sebagai pendekatan terjemahan langsung (Direct Translation).
Umumnya pendekatan ini menggunakan kamus dwibahasa untuk menentukan kadidat hasil terjemahan.
b. Syntactic dan Semantic Transfer, atau pendekatan terjemahan berbasis transfer. Pertama tama mengurai kalimat bahasa sumber untuk menentukan stukturnya, menerapkan aturan untuk mentransfer stuktur yang dihasilkan ke struktur penguraian bahasa target berdasarkan pengetahuan tentang perbedaan antara bahasa dan kemudian menghasilkan kalimat bahasa target dari transformasi ini. Untuk bahasa yang penggunaan tata bahasa yang mudah dapat digunakan hanya transfer sintaksis dimana struktur sumber yang diuraikan ditransfer ke struktur parde target berdasarkan penataan ulang sintaksis, namun apabila tata bahasa yang diterjemahkan kompleks menggunakan transfer semantic, dimana struktur sumber perlu ditransfer sesuai dengan makna dan peran semantiknya dalam kalimat sasaran.
c. Interlingua , yaitu pendekatan terjemahan antarbahasa. Pertama-tama menganalisis kalimat sumber, merepresentasikannya sebagai interlingua , dan kemudian menghasilkan bahasa target dari interlingua ini. Interlingua adalah representasi independen bahasa, yang dapat didasarkan pada skema representasi apapun. Ketersediaan data dalam jumlah besar, dan aplikasi pemrosesan yang lebih cepat mengubah dunia mesin terjemahan dari pendekatan klasik dan era Vauquois menjadi lebih cepat dan efisien
2.2.10 Direct Machine Translation
Penerjemahan sebuah kalimat secara langsung dilakukan dengan pemrosesan satu per satu kata yang terdalam dalam kalimat dari bahasa sumber menuju bahasa tujuan dengan menggunakan bantuan kamus dwibahasa. Dalam proses penerjemahan secara langsung, mesin penerjemah tidak mengamati stuktur kalimat bahasa sumber melainkan hanya melakukan pra-pemrosesan dan analisis morfologi yang dangkal guna menjadikan kalimat tersebut menjadi sebuah kata- kata. Daftar kata-kata yang dihasilkan dari bahasa sumber akan dilakukan pencocokkan satu per satu dengan menggunakan kamus dwi bahasa. Daftar padanan kata-kata. Dari bahasa sumber menuju bahasa target, yang menemui kecocokan dengan kamus dwi bahasa akan dikumpulkan kembali guna dilakukan penyusunan ulang sesuai tata susunan bahasa target. Langkah yang terakhir adalah pembangkitan hasil terjemahan secara langsung secara morfologi untuk mendapatkan susunan kalimat yang sesuai dengan bahasa tujuan (Daniel Jurafsky , 2021).
Gambar 2.2 Direct Machine Translation 2.2.11 Flowchart
Flowchart merupakan penggambaran secara grafik dari langkah-langkah dan urut-urutan prosedur dari suatu program. Flowchart menolong analisis dan programmer untuk memecahkan masalah kedalam segmen-segmen yang lebih kecil dan menolong dalam menganalisis alternative-alternatif lain dalam pengoperasian (Muhsinin, 2018). Bagan Flowchart umumnya terdiri dari simbol-simbol Flowchart seperti bentuk bangunan dua dimensi. Simbol nantinya akan dimasukkan ke dalam sebuah diagram yang detail dan ringkas. Simbol-simbol flowchart yang biasanya
diapakai adalah simbol-simbol flowchart standar yang dikeluarkan oleh ANSI dan ISO. Simbol-simbol ini dapat dilihat pada gambar 2.3 berikut ini:
Gambar 2.3 Simbol dalam Flowchart
Arti dari masing-masing symbol Flowchart pada gambar 2.3 adalah sebagai berikut :
1. Proses, yaitu merepresentasikan proses
2. On-Page Connector, yaitu keluar atau masuk dari bagian lain flowchart khususnya halaman yang sama
3. Predefined Process, yaitu rincian operasi berada di tempat lain.
4. Keputusan, yaitu keputusan dalam program atau pengecekan kondisi 5. Input/Output, yaitu merepresentasikan input data atau output data yang
diproses atau informasi.
6. Terminal Points, yaitu awal atau akhir flowchart
7. Off-Page Connector, yaitu penghubung proses pada lembar atau halaman yang berbeda.
8. Preparation, yaitu pemberian harga awal 9. Dokumen, yaitu Input atau Output yang dicetak 10. Anak Panah, yaitu merepresentasikan alur kerja
2.2.12 MySQL
MySQL merupakan sebuah perangkat lunak atau software aplikasi manajemen basis data SQL atau DBMS Multithread dan multi user. MySQL sebenarnya merupakan turunan dari salah satu konsep utama dalam database untuk pemilihan atau seleksi dan pemasukan data yang memungkinkan pengoperasian data dikerjakan secara mudah dan otomatis. MySQL diciptakan oleh Michael
“Monty” Widenius pada tahun 1979, seorang programmer computer asal Swedia yang mengembangkan sebuah aplikasi database sederhana yang dinamakan UNIREG yang menggunakan koneksi low-level ISAM database engine dengan indexing. Kelebihan MySQL adalah MySQL gratis, stabil dalam pengoperasiannya, mempunyai keamanan yang cukup baik, dan sangat flexible dengan berbagai macam program (Amin, 2018). Mysql memiliki beberapa fitur serta kapabilitas yaitu :
a. Unjuk kerja yang tinggi dalam memproses query sederhana, dalam arti dapat memproses lebih banyak SQL per satuan waktu.
b. Memilki lebih banyak tipe data seperti : signed/unsigned integer yang memiliki panjang data sebesar 1,2,3,4 dan 8 byte, FLOAT, DOUBLE, CHAR, VARCHAR, TEXT, VLOV, DATE, TIME, DATETIME, TIMESTAMP, YEAR, SET, dan tipe ENUM.
c. Mendukung field yang dijadikan index, dengan maksimal 32 index dalam satu table.
d. MySQL memiliki beberapa lapisan keamanan, seperti subnetmask, nama host, dan izin akses user dengan aplikasi perijinan yang mendetail serta sandi atau password terenkripsi.
e. Multi-User, MySQL dapat digunakan oleh beberapa pengguna dalam waktu yang bersamaan tanpa mengalami masalah atau konflik.
f. Command and Function, MySQL memiliki fungsi dan operator secara penuh yang mendukung perintah select dan where dalam query.
g. Stuktur tabel, MySQL memiliki stuktur tabel yang lebih fleksibel dalam menangani ALTER TABEL dibandingkan DBMS lainnya.
h. Mendukung penuh terhadap kalimat SQL GROUP BY dan ORDER BY.
Mendukung terhadap fungsi penuh ( COUNT(), DISTINCT(), AVG(), STD(), SUM(), MAX(), dan MIN() ).
2.2.13 Xampp
Kurniyawan (2019) menjabarkan beberapa pendapat para ahli sebagai berikut:
a. Aryanto (2016), “Xampp merupakan sebuah aplikasi perangkat lunak pemrograman dan database yang didalamnya terdapat berbagai macam aplikasi pemrograman seperti : Apache, HTTP, MySQL, database, bahasa pemrograman PHP dan Perl”.
b. Iqbal (2019), “Xampp merupakan sebuah software web server apache yang didalamnya sudah tersedia database server MySQL dan support PHP programming.
Berdasarkan pengertian diatas dapat disimpulkan bahwa Xampp adalah sebuah aplikasi perangkat lunak yang didalamnya sudah tersedia database server MySQL dan support PHP programming. Terdapat bagian-bagian penting dari Xampp, antara lain:
a. HTdocs, yaitu sebuah folder yang digunakan untuk menyimpan berkas seperti PHP, HTML, script yang berguna dalam sebuah halaman Website.
b. PhpMyadmin, yaitu sebuah tempat yang digunakan untuk mengelola database MySQL yang ada didalam computer atau laptop. Agar dapat mengaksesnya harus memasukkan alamat http://localhost/phpmyadmin pada browser internet.
c. Control Panel, merupakan sebuah layanan yang digunakan untuk mengelola Xampp baik mengontrol start atau stop dan juga layanan lainnya secara online baik dalam hosting atau VPS.
2.2.14 Web
Web atau Website adalah kumpulan halaman yang berisi informasi tertentu dan dapat diakses dengan mudah oleh siapapun, kapanpun, dan dimanapun melalui internet (Wijayanti, 2021). Website pertama kali dibuat oleh Tim Berners-Lee pada akhir 1980-an dalam project World Wide Web (W3). Terdapat 5 unsur vital yang terdapat pada Website, yaitu :
a. Domain, yaitu alamat sebuah Website.
b. Hosting, yaitu server tempat dimana semua file website disimpan serta dapat diakses dan dikelola melalui internet.
c. Konten, yaitu informasi atau isi dari Website tersebut.
d. Bahasa Pemrograman (Kode), yaitu bahasa pemrograman yang membuat atau membangun website tersebut.
e. Design Tampilan, yaitu riasan yang mempercantik atau memperindah isi dari konten website tersebut.
Secara umum, ada dua jenis website berdasarkan sifatnya, yaitu website statis dan dinamis. Jika informasi yang disediakan tetap atau tidak berubah disebut website statis. Sebaliknya, jika informasi dalam website selalu berubah-ubah disebut website dinamis.
2.2.15 BLEU
BLEU (Bilingual Evaluation Understudy) merupakan algoritma yang berfungsi mengevaluasi kualitas dari sebuah mesin penerjemah yang telah diterjemahkan oleh mesin dari satu bahasa alami ke bahasa lain. Poinnya ialah semakin dekat terjemahan mesin dengan terjemahan manusia maka akan semakin baik. Nilai BLEU dihasilkan dari perkalian brevity penalty dengan rata-rata geometri dari modified precision score. Semakin tinggi nilai BLEU, maka semakin akurat dengan rujukan. Nilai BLEU sendiri berada pada rentang 0 sampai 1. Suatu terjemahan akan mencapai nilai 1 jika terjemahan tersebut identik dengan terjemahan rujukan. Oleh karena itu, meskipun dengan penerjemahan oleh manusia tidak mungkin menghasilkan nilai 1. Sangat penting untuk diketahui bahwa semakin banyak terjemahan rujukan perkalimatnya, maka akan semakin tinggi nilainya. Untuk menghasilkan nilai BLEU yang tinggi, panjang kalimat hasil terjemahan harus mendekati penjang dari kalimat referensi dan kalimat hasil terjemahan harus memiliki kata dan urutan yang sama dengan kalimat referensi (Mulyana, Sujaini dan Pratiwi, 2018). Rumus untuk mencari nilai BLEU dapat dilihat pada gambar 2.4.
Gambar 2.4 Rumus BLEU
Keterangan :
BP : Brevity Penalty
wn : 1/N (standar nilai N untuk BLEU adalah 4), dengan nilai default 0.25 pn : jumlah n-gram hasil terjemahan yang sesuai dengan rujukan dibagi jumlah
n-gram hasil terjemahan
Untuk mendapatkan nilai BLEU score terlebih dahulu mencari nilai BP. BP atau Brevity Penalty dapat dicari dengan rumus yang dapat dillihat pada gambar 2.5.
Gambar 2.5 Rumus mencari nilai Brevity Penalty Keterangan :
c : candidate, jumlah kata dari hasil terjemahan otomatis (terjemahan mesin) r : reference, jumlah kata rujukan (terjemahan manusia)
Brevity penalty berguna untuk mengatasi terjemahan yang terlalu pendek, yang hanya terdiri dari 3 kata. Nilai 1 didapat apabila panjang kalimat candidate ( c ) lebih besar dari kalimat reference ( r ). Dengan Brevity Penalty kita akan melihat bahwa kalimat candidat dengan skor tinggi akan cocok dengan terjemahan referensi dalam hal panjang kalimat, pilihan kata, dan urutan kata.
Untuk mencari nilai dari modified precision score atau Pn dapat dicari dengan rumus yang dapat dilihat pada gambar 2.6.
Gambar 2.6 Rumus Mencari Nilai Pn Keterangan :
Pn : modified precission score
Pn dicari dengan membagi jumlah (counts) pada kalimat candidate dengan panjang kalimat dari kandidat. Pn atau modified precision score berguna terhadap dua aspek dari terjemahan yaitu kecukupan (adequacy) dan kelancaran (fluency).
BLEU score yang telah didapatkan nilainya akan di lihat apakah rentang nilai dari score yang telah dihasilkan. Rentang nilai tersebut akan menjelaskan bagaimana kualitas dari mesin penerjemah yang dikembangkan. Tabel rentang nilai BLEU score dapat dilihat pada table 2.1 dan digambarkan pada gambar 2.7.
Tabel 2.1 BLEU Score
Gambar 2.7 Rentang BLEU Score (Clouds, 2022)
BLEU Score Interpretasi
<10 Hampir tidak berguna
10 – 19 Sulit untuk mengerti intinya
20 – 29 Maksudnya dapat dimengerti namun susunan kalimatnya sangat kacau
30 – 40 Terjemahan yang dapat dimengerti 40 - 50 Terjemahan yang memiliki kualitas tinggi 50 - 60 Kualitas sangat tinggi, memadai, dan lancar
>60 Melebihi terjemahan manusia