PEMISAHAN KATA DAN PENERJEMAHAN DOKUMEN BAHASA BATAK TOBA KEDALAM BAHASA INDONESIA MENGGUNAKAN ALGORITMA BREADTH FIRST SEARCH (BFS) SKRIPSI

(1)

SKRIPSI

CHINTYA DWI HEVLIMA SIANIPAR 131402027

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2018

(2)

PEMISAHAN KATA DAN PENERJEMAHAN DOKUMEN BAHASA BATAK TOBA KEDALAM BAHASA INDONESIA MENGGUNAKAN ALGORITMA

BREADTH FIRST SEARCH (BFS)

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

CHINTYA DWI HEVLIMA SIANIPAR 131402027

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2018

(3)

(4)

(5)

Tepujilah Allah Bapa, Anak dan Roh Kudus, karena kasih-Nya penulis dapat menyelesaikan skripsi ini, sebagai syarat untuk memperoleh gelar Sarjana Komputer pada Program Studi S1 Teknologi Informasi Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.

Ucapan terima kasih penulis sampaikan kepada:

1 Bapak Prof. Runtung Sitepu, SH., M.Hum selaku Rektor Universitas Sumatera Utara.

2 Bapak Prof. Dr. Drs. Opim Salim Sitompul, M.Sc. selaku Dekan Fasilkom-TI Universitas Sumatera Utara.

3 Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc., selaku Ketua Program Studi S1 Teknologi Informasi Universitas Sumatera Utara.

4 Ibu Sarah Purnamawati, ST., MSc., selaku Sekretaris Program Studi S1 Teknologi Informasi Universitas Sumatera Utara.

5 Bapak Muhammad Anggia Muchtar, ST., MM.IT., selaku Dosen Pembimbing I yang telah memberikan project skripsi, bimbingan dan saran kepada penulis.

6 Bapak Muhammad Fadly Syahputra, B.Sc, M.Sc,IT., selaku Dosen Pembimbing II yang selalu memberi saran dan bimbingan kepada penulis.

7 Bapak Dedy Arisandi, ST., M.KOM., selaku Dosen Pembanding I yang telah memberikan kritik dan saran untuk penyempurnaan skripsi ini.

8 Bapak Indra Aulia, S.TI., M.KOM., selaku Dosen Pembanding II yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.

9 Kedua orangtua, Bapak dan mama yang selalu mendukung dan mengingatkan saya untuk menyelesaikan skripsi ini tepat waktu.

10 Ma Tua Merida Simanjuntak, S.Pd yang selalu mendukung dan menyemangati dengan sepenuh hati.

11 Abang David Romoza Heryandipura Sianipar, S.T., dan adik Tricrist Estomihi Natado Sianipar Amd., yang selalu mendukung saya dalam menyelesaikan skripsi

(6)

v

12 R. Ramda Lewi Sidabalok, Amd., yang selalu mendukung dan membantu untuk menyelesaikan skripsi.

13 Keluarga Haholongan, Hengky Wijaya, S.Kom., Afin Zaky S.Kom., Fadhil Ramadhan S.Kom., Rifandi Indrayudha Prawira S.Kom., Odysius Budhistiani Anwar S.Kom., Elsa Trida Sawitri S.Kom., Inu Wulandari S.Kom., Khadija Rina S.Kom., Regania Pascha Raschy S.Kom., Arfan S.Kom., Enno Putri Syah Alami S.Kom., dan Suci Dwi Nur, S.Kom. yang menampung segala hal cerita baik senang, bahagia, sedih, memberikan nasehat selama kuliah dan sebagai saudara yang berbeda orangtua.

14 Teman-teman Teknologi Informasi USU 2013 khususnya Kom A

15 Semua pihak yang terlibat langsung ataupun tidak langsung yang tidak dapat penulis ucapkan satu persatu yang telah membantu penyelesaian skripsi ini.

Tuhan Yesus memberkati.

Medan, 25 Juli 2018 Penulis

(7)

Naskah batak toba selama ini masih tidak mengenal spasi melainkan naskah batak toba selama ini ditulis bersambung tanpa spasi dengan demikian hanya pakar saja yang mampu membaca tulisan tersebut. Oleh karena itu diperlukan sebuah sistem yang dapat melakukan pemisahan kata dan penerjemahan dokumen bahasa batak Toba kedalam bahasa Indonesia. Sistem ini dapat dibangun dengan menerapkan algoritma Breadth First Search (BFS). Naskah batak toba ditulis kembali oleh penulis kedalam dokumen word dengan ekstensi .docx yang akan digunakan sebagai dokumen input untuk proses pemisahan kata dan penerjemahan dokumen bahasa batak toba.

Selanjutnya proses pemisahan kata dan penerjemahan dokumen menggunakan algoritma BFS dilakukan agar memudahkan pengalihbahasaan dari batak Toba ke bahasa Indonesia. Berdasarkan hasil pengujian sistem pada penelitian ini, kelengkapan data pada kamus sangat mempengaruhi tingkat keberhasilan proses pemisahan kata &

penerjemahan dokumen. Penerapan algoritma BFS mampu memisahkan kata dan menerjemahkan dokumen bahasa batak toba kedalam bahasa Indonesia dengan akurasi 87.88 % dan akurasi penerjemahan 30.15 %.

Kata kunci : Naskah batak Toba, Pemisahan Kata, Penerjemahan, Breadth First Search (BFS).

(8)

vii

SEPARATION OF WORDS AND TRANSLATION OF THE BATAK TOBA LANGUAGE DOCUMENTS INTO INDONESIAN USING BREADTH FIRST

SEARCH (BFS) ALGORITHM

ABSTRACT

Batak Toba script so far still does not recognize spaces in the toba batak script as long as it is written continuously without spaces so that only experts can read the text.

Therefore we need a system that can separate words and languages from the Toba batak laguage to Indonesian. This system can be built by applying the Breadth First Search (BFS) algorithm. The toba batak script is written back into the document with the .docx extension which is used as a document for the process of separating and translation from the Toba batak language. Furthermore, the word process and use using BFS is done to transfered from Toba Batak to Indonesian. Based on the current data, the completeness of the data in the dictionary greatly affects the level of word success & translation. The application of BFS is capable of separating and translating Batak Toba language documents into Indonesian with the accuracy result of word separation 87.88 % and translation accuracy 30.15 %.

Keyword : Batak Toba script, Word Separation, Translation, Breadth First Search (BFS).

(9)

Hal.

PERSETUJUAN ii

PERNYATAAN iii

UCAPAN TERIMA KASIH iv

ABSTRAK vi

ABSTRACT vii

DAFTAR ISI viii

DAFTAR TABEL x

DAFTAR GAMBAR xi

BAB 1 PENDAHULUAN

1.1 Latar Belakang 1

1.2 Rumusan Masalah 4

1.3 Batasan Masalah 4

1.4 Tujuan Penelitian 4

1.5 Manfaat Penelitian 5

1.6 Metodologi Penelitian 5

1.7 Sistematika Penulisan 6

BAB 2 LANDASAN TEORI

2.1 Blind Search 8

2.2 Breadth First Search (BFS) 8

2.3 Penelitian Terdahulu 12

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

3.1 Data Yang Digunakan 17

3.2 Analisis Sistem 19

3.2.1. Arsitektur Umum 19

3.2.1.1. Input 20

(10)

ix

3.2.1.3. Process 21

3.2.1.4. Output 31

3.2.2. Use Case Diagram 32

3.2.3. Activoty Diagram 32

3.2.4. Flowchart 35

3.3 Rancangan Antarmuka Sistem 37

3.3.1. Rancangan Halaman Translate 37

3.3.2. Rancangan Halaman About 38

3.3.3. Rancangan Help 39

BAB 4 IMPLEMENTASI DAN PENGUJIAN

4.1 Implementasi Sistem 40

4.1.1. Spesifikasi Perangkat Keras yang digunakan 40 4.1.2. Spesifikasi Perangkat Lunak yang digunakan 41

4.2 Implementasi Perancangan Antarmuka 41

4.2.1. Halaman Help 41

4.2.2. Halaman Translate 41

4.2.3. Halaman About 42

4.3 Prosedur Operasional 43

4.4 Pengujian Sistem 50

BAB 5 KESIMPULAN DAN SARAN

5.1 Kesimpulan 57

5.2 Saran 58

DAFTAR PUSTAKA 59

LAMPIRAN 61

(11)

Hal.

Tabel 2.1. Imbuhan Bahasa Batak Toba 12

Tabel 2.2. Penelitian Terdahulu 14

Tabel 3.1. Hasil dan Transkripsi Naskah BahasaBatak Toba 18 Tabel 4.1. Perbandingan Kata Oleh Sistem Dengan Data Dari Buku 51

Tabel 4.2.Hasil Pengujian Spasi 52

Tabel 4.3.Perbandingan Kata Oleh Sistem Dengan Data Dari Buku 54

Tabel 4.4.Hasil Pengujian Terjemahan 55

Tabel Perbandingan Hasil Spasi Dengan Data Buku 61 Tabel Perbandingan Hasil Terjemahan Dengan Data Buku 77

(12)

xi

DAFTAR GAMBAR

Hal.

Gambar 2.1. Breadth First Search Tree 9

Gambar 3.1. Arsitektur Umum 20

Gambar 3.2. Use Case Diagram 32

Gambar 3.3. Activity Diagram About 33

Gambar 3.4. Activity Diagram Translate 34

Gambar 3.5. Activity Diagram Help 35

Gambar 3.6. Flowchart 36

Gambar 3.7. Rancangan Halaman Translate 37

Gambar 3.8. Rancangan Halaman About 38

Gambar 3.9. Rancangan Halaman Help 39

Gambar 4.1. Halaman Help 41

Gambar 4.2. Halaman Translate 42

Gambar 4.3. Halaman About 43

Gambar 4.4. Choose File 43

Gambar 4.5. Pilih File 44

Gambar 4.6. Pilih Space 44

Gambar 4.7. Menampilkan Hasil Space 45

Gambar 4.8. Pilih Save File Space 45

Gambar 4.9. Berhasil Menyimpan 46

Gambar 4.10. Direktori Penyimpanan 46

Gambar 4.11. Hasil Output Space 47

Gambar 4.12. Pilih Translate 47

Gambar 4.13. Hasil Translate 48

Gambar 4.14. Pilih Save File 48

Gambar 4.15. Berhasil Menyimpan 49

(13)

(14)

BAB I

PENDAHULUAN

1.1. Latar Belakang

Indonesia merupakan negara kepulauan dimana antara pulau yang satu dengan pulau yang lain dipisahkan oleh beberapa batas alam, seperti selat, sungai, dan gunung.

Batas-batas alam tersebut secara langsung akan mengelompokkan berbagai komunitas masyarakat dengan corak budaya yang khas (Nana, 2015). Indonesia memiliki keberagaman budaya dan tidak dapat dipungkiri keberadaannya. Dalam konteks pemahaman masyarakat majemuk, selain kebudayaan kelompok suku bangsa, masyarakat Indonesia juga terdiri dari berbagai kebudayaan daerah bersifat kewilayahan yang merupakan pertemuan dari berbagai kebudayaan kelompok suku bangsa yang ada di daerah tersebut. Setiap suku memiliki budaya dan tutur Bahasa yang berbeda-beda. Salah satunya adalah suku Batak, suku Batak termasuk sebagai kelompok suku dengan populasi bahasa daerah terbanyak di Indonesia.

Suku Batak adalah rumpun suku-suku yang mendiami sebagian besar wilayah Sumatera Utara. Namun sering sekali orang menganggap penyebutan Batak hanya pada suku Toba padahal Batak tidak diwakili oleh suku Toba. Suku Batak terdiri dari beberapa subsuku, yaitu Toba, Simalungun, Karo, Pakpak-Dairi , Angkola- Mandailing, dan Angkola dan tiap etnis batak tersebut memiliki Bahasa yang berbeda- beda (kozok,2009). Kelima suku Batak tersebut memiliki banyak persamaan pada Bahasa yang digunakan. Para ahli Bahasa membedakan kelima Bahasa tersebut menjadi dua cabang Bahasa Batak yang memiliki perbedaan cukup besar sehingga kecil kemungkinan terjadi komunikasi antar kedua kelompok tersebut (kozok,2009).

Secara garis besar, dialek Bahasa Batak dibagi menjadi dua yaitu Bahasa Toba, Angkola, Mandailing merupakan rumpun selatan, sedangkan Bahasa Karo, Pak-Pak, Dairi merupakan rumpun utara. Dialek Batak Simalungun berbeda dengan dialek utara

(15)

secara historis, Bahasa Simalungun merupakan cabang dari rumpun selatan. Oleh karena itu, kadang tidak memungkinkan adanya komunikasi antara kedua kelompok tersebut.

Saat ini sudah ada penelitian untuk membaca pustaha Batak atau naskah kuno yang pada umumnya ditulis dengan menggunakan huruf aksara Batak, kemudian ditransliterasi dengan tujuan untuk dapat membaca naskah tersebut. Naskah yang ditulis menggunakan huruf aksara Batak dan tidak memiliki spasi membuat masyarakat kesulitan untuk membacanya sehingga dokumen naskah kuno Bahasa Batak yang didapat belum memiliki spasi. Masyarakat akan kesulitan bagaimana jika ingin membaca dan mengetahui isi dari arti naskah tersebut dan tidak mengerti Bahasa Batak karena dokumen yang belum memiki spasi. Oleh karena itu, penulis melakukan pemisahan kata pada dokumen yang tidak berspasi kemudian dilakukan pemisahan kata dengan meletakkan spasi pada dokumen Bahasa Batak tersebut dan akan diterjemahkan kedalam Bahasa Indonesia menggunakan algoritma Breadth First Search ( BFS).

Terjemahan merupakan proses menyalin atau memindahkan suatu bahasa ke bahasa lain atau sering disebut mengalihbahasakan. Split text merupakan proses untuk memecahkan suatu kalimat. Algoritma BFS melakukan pencarian secara melebar yang mengunjungi simpul secara preorder yaitu mengunjungi suatu simpul kemudian mengunjungi semua simpul yang bertetangga dengan simpul tersebut terlebih dahulu.

Algoritma ini memerlukan sebuah antrian q untuk menyimpan simpul yang telah dikunjungi. Simpul-simpul ini diperlukan sebagai acuan untuk mengunjungi simpul- simpul yang bertetanggaan dengannya. Algoritma ini membutuhkan table Boolean untuk menyimpan simpul yang telah dikunjungi sehingga tidak ada simpul yang dikunjungi lebih dari satu kali. Algoritma BFS melakukan proses searching pada semua node yang berada pada level atau hirarki yang sama terlebih dahulu sebelum melanjutkan proses searching pada node di level berikutnya (Ucha, 2015).

Sebelumnya sudah dilakukan penelitian pada tahun oleh Cici Wulandari pada tahun 2015, yaitu Implementasi Metode Breadth First Search (BFS) Untuk Text

(16)

3

Predicitive pada Kamus Bahasa Indonesia-Jepang. Dengan menerapkan metode BFS yang dapat memprediksi kata-kata apa yang akan digunakan atau dicari oleh pengguna, sehingga dengan mengetik beberapa karakter dari kata awal yang dicari prediksi tersebut akan muncul sesuai dengan kosa kata yang ada pada database sistem. Dalam pencarian kosa kata pada kamus Bahasa Indonesia-Jepang dapat menerapkan metode BFS untuk text predictive pencarian kosa kata kamus. Pencarian kosa kata berdasarkan pada enam pilihan kategori kosa kata, yaitu kata kerja, kata sifat, kata benda, anggota keluarga, nama tempat dan profesi.

Penelitian selanjutnya dilakukan oleh Arfan Rahmat pada tahun 2017 dengan judul Transliterasi Manuskrip Aksara Batak Digital Dengan Metode Finite State Automata (FSA) menggunakan metode Finite State Automata (FSA) jenis Deterministic Finite Automata (DFA). Manuskrip aksara Batak digital dengan ekstensi .docx digunakan sebagai masukan untuk proses transliterasi aksara Batak. Selanjutnya proses parsing dokumen dilakukan agar memudahkan pengenalan dengan FSA dan dikonversi menjadi aksara Latin untuk ditampilkan sebagai hasil transliterasi. Penerapan FSA mampu mengenali dan mentransliterasi manuskrip aksara Batak digital dengan akurasi 96.8%.

Pada tahun 2017 penelitian juga dilakukan oleh Doddy Teguh Yuwono dengan melakukan penelitian Perbandingan Algoritma Breadth First Search dan Depth First Search sebagai Focused Crawler. Penelitian ini menerapkan Algoritma Breadth First Search (BFS) dan Depth First Search (DFS) serta didukung dengan Naive Bayes Classifier (NBC) untuk menilai perbandingan dari kedua algoritma pencarian tersebut, diharapkan dengan kombinasi ini menghasilkan klasifikasi tinggi dan maksimal.

Pada penelitian ini penulis akan membuat sebuah sistem yang akan melakukan Pemisahan Kata Dan Penerjemahan Dokumen Bahasa Batak Toba Dengan Menggunakan Algoritma Breadth First Search (BFS). Penulis akan melakukan pemisahan kata pada naskah batak Toba yang belum berspasi dan akan menulis kembali naskah tersebut kedalam dokumen dengan ekstensi .docx. Selanjutnya dokumen input Bahasa Batak Toba akan diberi spasi dan dapat diterjemahkan ke

(17)

dalam Bahasa Indonesia agar pengguna dapat membaca dan mengetahui isi yang ada pada dokumen Bahasa Batak Toba. Berdasarkan penjelasan diatas, penulis mengajukan tugas akhir yang berjudul “Pemisahan Kata Dan Penerjemahan Dokumen Bahasa Batak Toba Dengan Menggunakan Algoritma Breadth First Search (BFS)"

1.2. Rumusan Masalah

Naskah kuno peninggalan sejarah kebudayaan batak toba memiliki banyak informasi dan sejarah batak. Minimnya ahli yang dapat menerjemahkan dokumen bahasa batak toba yang diperoleh dari dokumen asli, kemudian di transliterasikan sehingga diperoleh hasil dokumen bahasa batak toba yang tidak berspasi membuat proses penerjemahan dokumen memerlurkan waktu. Maka dari itu diperlukan suatu sistem yang dapat membantu pekerjaan para ahli dalam menerjemahkan dokumen bahasa batak khususnya yang tidak berspasi.

1.3. Batasan Masalah

Berdasarkan rumusan masalah diatas, Adapun batasan masalah dari penelitian ini adalah :

1. Dokumen input dan output ekstensi .docx.

2. Input berupa dokumen teks bahasa batak toba tanpa spasi.

3. Penelitian ini hanya menerjemahkan dokumen berdasarkan kamus.

4. Penelitian ini tidak membahas makna kalimat.

5. Aplikasi hanya berbasis Desktop.

1.4. Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk mengimplementasikan algoritma Breadth First Search ( BFS) dalam proses pemisahan kata pada dokumen Bahasa Batak Toba yang

(18)

5

belum memiliki spasi kemudian dokumen akan diterjemahkan ke dalam Bahasa Indonesia.

1.5. Manfaat Penelitian

Adapun manfaat dari penelitian ini yaitu :

a) Memudahkan pengguna untuk memisahkan kata-kata pada dokumen naskah yang tidak berspasi

b) Memudahkan pengguna untuk menerjemahkan dokumen teks Bahasa Batak Toba ke dalam Bahasa Indonesia

c) Data hasil terjemahan ini dapat dikembangkan untuk melakukan penelitian selanjutnya dan penelitian ini dapat menjadi referensi untuk penelitian selanjutnya.

1.6. Metode Penelitian

Adapun tahapan - tahapan yang akan dilakukan pada penelitian ini adalah : a) Studi Literatur

Pada tahapan ini dilakukan pengumpulan dan mempelajari informasi yang diperoleh dari buku, skripsi, jurnal, dan berbagai sumber informasi lainnya.

Informasi yang berkaitan dengan penelitian tersebut seperti Bahasa Batak Toba, Kamus Batak Toba-Indonesia, Tata Bahasa Batak Toba, Algoritma Breadth First Search (BFS), translation, sentence splitting, word splitting b) Analisis Permasalahan

Tahap selanjutnya yaitu menganalisis permasalahan dari informasi yang didapat pada tahapan sebelumnya agar didapatkan metode yang tepat untuk mengatasi masalah dalam penelitian ini. Kemudian melakukan perancangan sistem yang sesuai dari hasil analisis permasalahan.

(19)

c) Perancangan

Pada tahap ini dilakukan perancangan arsitektur, permodelan sistem dan perancangan antarmuka. Proses ini dilakukan berdasarkan hasil analisis dari studi literatur yang telah didapatkan.

d) Pengujian

Pada tahap ini dilakukan pengujian terhadap aplikasi yang telah dibangun untuk menterjemahkan dokumen teks Bahasa Batak Toba ke dalam Bahasa Indonesia.

e) Dokumentasi dan Penyusunan Laporan

Pada tahap ini dilakukan dokumentasi dan penyusunan laporan hasil analisis dan implementasi Breadth First Search (BFS) dalam penyelesaian masalah terjemahan dokumen teks Bahasa Batak Toba ke dalam Bahasa Indonesia.

1.7. Sistematika Penulisan

Sistematika penulisan dari skripsi ini terdiri dari lima (5) bagian utama sebagai berikut.

Bab 1 : Pendahuluan

Bab ini berisi latar belakang dari penelitian, rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian, dan sistematika penulisan.

Bab 2 : Landasan Teori

Bab ini berisi teori-teori yang diperlukan untuk memahami permasalahan yang dibahas pada penelitian ini. Teori-teori yang berhubungan dengan terjemahan, Algoritma Breadth First Search (BFS), Tipologi Bahasa Batak Toba akan dibahas pada bab ini.

(20)

7

Bab 3 : Analisis dan Perancangan

Bab ini berisi analisis arsitektur umum, tiap langkah pre-processing yang dilakukan, flowchart, serta penerapan Breadth First Search (BFS) untuk proses terjemahan dokumen teks Bahasa Batak Toba ke dalam Bahasa Indonesia.

Bab 4 : Implementasi dan Pengujian

Bab ini berisi pembahasan tentang implementasi dari perancangan yang telah dijabarkan pada Bab 3. Selain itu, hasil yang didapatkan dari pengujian yang dilakukan terhadap implementasi yang dilakukan juga dijabarkan pada bab ini.

Bab 5 : Kesimpulan dan Saran

Bab ini berisi ringkasan serta kesimpulan dari rancangan yang telah dibahas pada Bab 3, serta hasil penelitian yang dijabarkan pada Bab 4. Bagian akhir dari bab ini memuat saran-saran yang diajukan untuk pengembangan penelitian selanjutnya

(21)

2.1 Blind Search

Istilah blind atau buta digunakan karena memang tidak ada informasi awal yang digunakan dalam proses pencarian dan tidak memiliki apakah hasil yang ditemukan lebih baik daripada yang lainnya, sehingga kita tidak mengetahui apakah hasil dari eksplorasi tersebut bermanfaat secara maksimal atau tidak. Pencarian Blind Search terdiri atas pencarian melebar pertama (Breadth First Search) dan pencarian mendalam pertama (Depth First Search).

2.2 Breadth First Search (BFS)

BFS ( Breadth First Search) merupakan metode pencarian secara melebar dan termasuk ke dalam pencarian buta (Blind Search). Algoritma Breadth First Search (BFS) melakukan pencarian secara melebar yang mengunjungi simpul secara preorder yaitu mengunjungi suatu simpul kemudian mengunjungi semua simpul yang bertetangga dengan simpul tersebut terlebih dahulu. Selanjutnya, simpul yang belum dikunjungi dan bertetangga dengan simpul-simpul yang tadi dikunjungi, demikian seterusnya. Jika graf berbentuk pohon berakar, maka semua simpul pada aras d dikunjungi lebih dahulu sebelum simpul-simpul pada aras d+1. Algoritma ini memerlukan sebuah antrian q untuk menyimpan simpul yang telah dikunjungi.

Simpul-simpul ini diperlukan sebagai acuan untuk mengunjungi simpul-simpul yang bertetanggaan dengannya. Tiap simpul yang telah dikunjungi masuk ke dalam antrian hanya satu kali. Algoritma ini juga membutuhkan table Boolean untuk menyimpan simpul yang dikunjungi lebih dari satu kali. Breadth First Search (BFS) melakukan proses searching pada semua node yang berada pada level atau hirarki yang sama terlebih dahulu sebelum melanjutkan proses searching pada node di level berikutnya.

Adapun keuntungan menggunakan algoritma Bread First Search yaitu tidak akan

(22)

9

menemukan jalan buntu, tidak ada satu solusi, maka BFS akan menemukannya. Dan jika ada lebih dari satu solusi, maka solusi minimum akan ditemukan. Dalam algoritma BFS, simpul anak yang telah di kujungi di simpan dalam suatu antrian.

Antrian ini digunakan untuk mengacu simpul-simpul yang bertetangga dengannya yang akan dikunjungi kemudian sesuai urutan pengantrian. Langkah yang pertama dilakukan yaitu memasukkan simpul ujung (akar) ke dalam antrian. Ambil simpul dari awal antrian, lalu cek apakah simpul merupakan solusi, jika simpul meruapakan solusi maka pencarian selesai dan hasil dikembalikan. Jika simpul bukan solusi, masukkan seluruh simpul yang bertetangga dengan simpul anak ke dalam antrian. Jika antrian kosong dan setiap simpul sudah di cek, pencarian selesai dan mengembalikan hasil solusi tidak di temukan. Keuntungan dari algoritma ini yaitu tidak akan menemui jalan buntu dan jika ada suatu solusi, maka BFS akan menemukannya, dan jika di dapat lebih dari satu solusi, maka solusi minimum akan di temukan.

Gambar 2.1. Breadth First Search(BFS) Tree a) Aksara Batak

Paleografi adalah ilmu tentang tulisan-tulisan kuno. Di banyak masyarakat yang mengenal tulisan terdapat naskah-naskah kuno yang umurnya dapat mencapai ratusan atau bahkan ribuan tahun. Aksara Batak termasuk keluarga

(23)

tulisan India. Aksara India yang tertua adalah aksara Brahmi yang menurunkan dua kelompok tulisan yakni India Utara dan India Selatan. Surat Batak terdiri atas dua perangkat huruf yang masing-masing disebut ina ni surat dan anak ni surat. Aksara Batak dan Aksara lainnya berinduk pada Aksara India.

b) Transliterasi

Dalam Webster’s Now 20^th Century Dictionary, transliterasi diambil dari kata kerja “transliterate” yang dapat diartikan sebagai penulisan dan pengucapan karakter huruf asing dalam bentuk lambang yang mempunyai bunyi yang sama. Sedangkan menurut Kamus Besar Bahasa Indonesia transliterasi diartikan sebagai penyalinan dengan penggantian huruf abjad satu ke abjad yang lain. Dalam prosesnya, transliterasi hanya mengubah abjad, apabila dokumen aksara yang di inputkan tidak memiliki spasi maka hasil dari transliterasi akan sama seperti dokumen sebelum ditranliterasikan yang tidak memiliki spasi tetapi karakter yang digunakan sudah berbeda.

c) Terjemahan

Menurut T.Sugimoto dalam ordudari (2008), menegaskan bahwa secara sederhana, terjemahan adalah pertukaran antara satu Bahasa ke Bahasa lainnya dengan tetap mempertahankan makna dan ide dari Bahasa sumber. Tetapi jika mengenai terjemahan budaya, kita harus terlebih dahulu mengetahui latar belakang dan memperhatikan zaman pada saat budaya tersebut muncul. Selain itu menurut Newmark (1981:7) terjemahan adalah suatu keahlian yang meliputi usaha mengganti pesan atau pernyataan tertulis dalam suatu Bahasa dengan pesan atau pernyataan yang sama dalam Bahasa lain.x

d) Bahasa Batak Toba

Bahasa Batak Toba adalah salah satu Bahasa daerah yang terutama dipertuturkan di daerah sekitar Danau Toba dan sekitarnya, meliputi Samosir, Humbang Hasundutan, Tapanuli Utara, dan Toba Samosir, Sumatera Utara, Indonesia. Bahasa Batak Toba termasuk dalam rumpun Bahasa Autronesia, dan merupakan bagian dari kelompok Bahasa-bahasa Batak. Dalam kenyataan

(24)

11

dapat peroleh gambaran bahwa jumlah dialek yang terdapat dalam Bahasa Batak Toba cukup beragam. Peranan dan kedudukan Bahasa bagi orang Batak Toba sangatlah komunikatif terutama dalam Bahasa pergaulan sehari-hari dan upacara adat, maksudnya di dalam pembicaraan sehari-hari atau pembicaraan upacara adat sesama orang Batak, suasana kekeluargaan akan sangat terasa jika mereka menggunakan Bahasa Batak, sesuai dengan prinsip “Dalihan Natolu”.

Bahasa Batak toba dalam kesehariannya sangat funsional. Pemakaiannya meliputi lingkungan yang sangat luas, hampir di semua tempat dan situasi.

Penggunaan Bahasa dalam pergaulan sehari-hari tidak kaku seperti pada saat pemakaian Bahasa dalam upacara adat istiadat. Kaku dalam arti, banyak yang pintar berbicara Bahasa Batak Toba namun belum tentu dapat berbicara pada forum upacara adat.

Penggunaan Bahasa Batak umumnya pada Batak Toba, akan terlihat keindahan penyajian Bahasa tersebut, unsur-unsur sastranya akan lebih menonjol, setiap perkataan selalu diselingi dengan umpama (pepatah) danumpasa (pantun), dan disajikan penuh dengan tata kerama (Dalihan Natolu).

e) Tata Bahasa Batak Toba

Kata dalam bahasa Batak Toba dilekati 5 imbuhan yang berbeda, yaitu awalan, sisipan, akhiran, kata ganti milik dan partikel (Sinaga, 2002). Daftar imbuhan yang dapat ditambahkan pada kata bahasa Batak Toba dapat dilihat pada Tabel 2.1.

Tabel 2.1. Imbuhan Bahasa Batak Toba (Sinaga, 2002)

Imbuhan Morfem Contoh

Awalan ma-, mar-, pa-, pan-,pam- ,par-, di-, tar-, ha-, hu-, tu-, um-, hina-, si-,

mamukka, marmanuk, pamukka, parmanuk, dipukka, tarpukka, habiar, humarsik, tumatangis,

(25)

umbege, pasisoban, hinauli, sibirong

Sisipan -in-, -um-, -ar-, -al- tinogu, jumadi, harungkut, halaput

Akhiran -hon, -an, -i, -on taluhon, punguan, allangi, ulaon

Kata ganti milik -hu, -na, -mu, -ta, -m, -nami, -nasida

donganhu, donganmu, donganna, donganta, horbom, horbonami, horbonasida

Partikel do, ma, pe adongdo, adongma, adongpe

2.3 Penelitian Terdahulu

Pada tahun 2015 oleh S.Abirami, Dr.J.Suguna melakukan penelitian An Efficient shortest path approach using breadth first search algorithm with SMC protocol for privacy preserving record linkage. Pada penelitian ini menggunakan algoritma breadth first search dengan SMC protocol untuk menjaga privasi hubungan rekaman.

Algoritma Breadth first search digunakan untuk mengindentifikasi calon pasangan rekaman yang telah mengalami transformasi anonimasi dan juga menemukan jalur terpendek. Pasangan yang cocok bisa diimplementasikan oleh Secure Multiparty Computational (SMC) berdasarkan protocol yang melalukan homomorfik perhitungan jarak.

Pada tahun 2015 juga dilakukan penelitian oleh Cici Wulandari dengan mengimplementasikan Metode Breadth First Search (BFS) Untuk Text Predicitive pada Kamus Bahasa Indonesia-Jepang. Dengan menerapkan metode BFS yang dapat memprediksi kata-kata apa yang akan digunakan atau dicari oleh pengguna, sehingga dengan mengetik beberapa karakter dari kata awal yang dicari prediksi tersebut akan muncul sesuai dengan kosa kata yang ada pada database sistem. Dalam pencarian kosa kata pada kamus Bahasa Indonesia-Jepang dapat menerapkan metode BFS untuk text predictive pencarian kosa kata kamus. Pencarian kosa kata berdasarkan pada

(26)

13

enam pilihan kategori kosa kata, yaitu kata kerja, kata sifat, kata benda, anggota keluarga, nama tempat dan profesi.

Penelitian selanjutnya dilakukan oleh Arfan Rahmat pada tahun 2017 dengan judul Transliterasi Manuskrip Aksara Batak Digital Dengan Metode Finite State Automata (FSA) menggunakan metode Finite State Automata (FSA) jenis Deterministic Finite Automata (DFA). Manuskrip aksara Batak digital dengan ekstensi .docx digunakan sebagai masukan untuk proses transliterasi aksara Batak. Selanjutnya proses parsing dokumen dilakukan agar memudahkan pengenalan dengan FSA dan dikonversi menjadi aksara Latin untuk ditampilkan sebagai hasil transliterasi. Penerapan FSA mampu mengenali dan mentransliterasi manuskrip aksara Batak digital dengan akurasi 96.8%.

Pada tahun 2017 penelitian juga dilakukan oleh Doddy Teguh Yuwono dengan melakukan penelitian Perbandingan Algoritma Breadth First Search dan Depth First Search sebagai Focused Crawler. Penelitian ini menerapkan Algoritma Breadth First Search (BFS) dan Depth First Search (DFS) serta didukung dengan Naive Bayes Classifier (NBC) untuk menilai perbandingan dari kedua algoritma pencarian tersebut, diharapkan dengan kombinasi ini menghasilkan klasifikasi tinggi dan maksimal.

Selanjutnya, pada tahun 2017 Tuti Simanjuntak juga melakukan penelitian Implementasi algoritma porter stemmer untuk mendapatkan kata dasar dalam dokumen bahasa batak Toba dengan metode dua tingkat morfologi. Pada penelitian ini, stemming digunakan untuk imbuhan bahasa Batak Toba. Metode stemmer ini menggunakan kamus kata dasar dan setiap langkah-langkah dalam proses stemmer ini akan selalu melakukan pengecekan kamus kata dasar. Dari hasil pengujian pada 20 dokumen bahasa Batak Toba, algoritma porter stemmer dengan dua tingkat morfologi dapat menghasilkan tingkat akurasi 87,503 %.

(27)

No Peneliti/ Tahun Judul Penelitian Keterangan 1 S.Abirami,

Dr.J.Suguna (2015)

An Efficient shortest path approach using breadth first search algorithm with SMC protocol for privacy preserving record linkage

Pada penelitian ini menggunakan algoritma breadth first search dengan SMC protocol untuk menjaga privasi hubungan rekaman.

2 Cici Wulandari.

(2015)

Implementasi Metode Breadth First Search (BFS) Untuk Text Predictive pada Kamus Bahasa Indonesia- Jepang.

Dalam pencarian kosa kata pada kamus Bahasa Indonesia-Jepang dapat menerapkan metode BFS untuk text predictive pencarian kosa kata kamus.

Pencarian kosa kata berdasarkan pada enam pilihan kategori kosa kata, yaitu kata kerja, kata sifat, kata benda, anggota keluarga, nama tempat dan profesi

(28)

15

3 Arfan Rahmat (2017)

Transliterasi Manuskrip Aksara Batak Digital Dengan Metode Finite State Automata (FSA)

Metode Finite State Automata (FSA) jenis Deterministic Finite Automata (DFA). Penerapan FSA mampu mengenali dan mentransliterasi manuskrip aksara Batak digital dengan akurasi 96.8%.

4 Doddy

Teguh Yuwono (2017)

Perbandingan Algoritma Breadth First Search dan Depth First Search sebagai Focused Crawler

Penelitian menerapkan Algoritma Breadth First Search (BFS) dan Depth First Search (DFS) serta didukung dengan Naive Bayes Classifier (NBC) untuk menilai perbandingan dari kedua algoritma pencarian tersebut, diharapkan dengan kombinasi ini menghasilkan klasifikasi tinggi dan maksimal.

5 Tuti

Simanjuntak (2017)

Implementasi algoritma porter stemmer untuk mendapatkan kata dasar dalam dokumen bahasa batak Toba dengan metode dua tingkat morfologi

Pada penelitian ini, stemming digunakan untuk imbuhan bahasa Batak Toba. Metode stemmer ini menggunakan kamus kata dasar dan setiap langkah- langkah dalam proses stemmer ini akan selalu melakukan pengecekan kamus kata dasar. Dari hasil

(29)

pengujian pada 20 dokumen bahasa Batak Toba, algoritma porter stemmer dengan dua tingkat

morfologi dapat

menghasilkan tingkat akurasi 87,503 %.

(30)

BAB 3

ANALISIS DAN PERANCANGAN SISTEM

Pada bab ini akan membahas tentang analisis dan perancangan sistem terhadap data dengan menggunakan algoritma Breadth First Search (BFS) untuk mencari solusi dalam memisahkan kata pada dokumen bahasa Batak Toba menjadi yang tidak berspasi dan menerjemahkan kedalam bahasa Indonesia. Pada tahap perancangan sistem akan dibahas mengenai perancangan flowchart sistem serta tampilan antarmuka sistem.

3.1 Data yang digunakan

Data yang digunakan dalam penelitian ini adalah dokumen bahasa Batak Toba dengan ekstensi .docx. Dokumen ini diperoleh dari buku “Transliterasi dan Terjemahan Naskah Batak Toba” yang ditulis oleh Drs.Nelson Lumbantoruan,M.Hum di Badan Perpustakaan, Arsip, dan Dokumentasi Provinsi Sumatera Utara dan naskah tersebut diketik ulang ke dalam Microsoft word. Naskah asli Batak Toba yang digunakan dalam penelitian ini disimpan di Museum Bremen, Jerman dengan nomor kode 36841.

Buku Tata Bahasa Batak Toba (Sinaga,2002) serta sumber lainnya diperoleh dari Pusat Dokumentasi Kebudayaan Batak Universitas Nommensen. Sedangkan kamus kata dasar yang digunakan bersumber dari Kamus Batak Indonesia oleh J.P Sarumpaet, M.A. (1994) dan buku Tata Bahasa batak Toba oleh Mgr. Dr. Anicetus B. Sinaga OFMCap.

Beberapa naskah yang digunakan pada penelitian ini dapat diilihat pada Tabel 3.1

(31)

Tabel 3.1. Contoh Hasil Transliterasi dan Transkripsi Naskah Bahasa Batak Toba

Halaman Transliterasi Transkripsi

1

2

Dokumen Naskah Bahasa Batak Toba yang lebih lengkap dapat dilihat pada Lampiran 1.

(32)

19

3.2 Analisis Sistem

Sistem ini dibangun untuk menyelesaikan permasalahan tentang pemisahan kata pada dokumen bahasa Batak Toba yang tidak berspasi dan kemudian menerjemahkannya menjadi bahasa Indonesia. Sebelumnya, sistem untuk memisahkan kata dalam dokumen tidak berspasi ini belum pernah dilakukan. Pada penelitian ini penulis menggunakan algoritma Breadth First Search (BFS) untuk melakukan pemisahan kata secara otomatis dengan mencocokkan kata pada kamus data bahasa Batak Toba kemudian di terjemahkan ke dalam Bahasa Indonesia.

3.2.1 Arsitektur Umum

Metode yang diajukan peneliti untuk pemisahan kata pada dokumen bahasa Batak Toba ini terdiri dari beberapa tahap. Tahap-tahap ini yaitu pengumpulan dokumen bahasa Batak Toba yang digunakan sebagai data pengujian; docx reader yaitu untuk membaca dokumen terlebih dahulu sebelum sistem memproses ke tahap proses pemisahan kata dan pencocokan kata dalam kamus bahasa Batak Toba.

Adapun arsitektur umum pada sistem pemisahan kata dalam dokumen bahasa Batak Simalungun yang tidak berspasi dan menerjemahkan dokumen tersebut menjadi dokumen bahasa Indonesia pada penelitian ini dapat dilihat pada Gambar 3.1.

(33)

Gambar 3.1. Arsitektur Umum

Arsitektur umum pada penelitian ini terdiri dari beberapa tahapan, yaitu:

3.2.1.1. Input

Input sebagai proses awal dalam proses sistem pemisahan kata dalam dokumen dan menerjemahkan menjadi bahasa Indonesia. Dokumen teks berbahasa Batak Toba dengan ekstensi file .docx dimasukkan untuk selanjutnya akan diolah oleh sistem.

(34)

21

3.2.1.2.Preprocessing

Pada tahap ini dilakukan proses membaca dokumen yang telah di input serta dalam tahap ini dilakukan proses pengubahan bentuk data yang belum terstruktur menjadi data yang terstruktur sesuai dengan kebutuhan pada sistem.

1. Docx Reader

Pada saat user memasukkan dokumen teks bahasa batak Toba pada sistem, maka sistem akan menampilkan isi dokumen tersebut. Docx Reader merupakan class yang terdapat dalam pemrograman java, digunakan untuk menampilkan dokumen input dengan bantuan library apache poi.

3.2.1.3.Process

Dari tahapan preprocessing maka di peroleh hasil berupa tampilan isi dari dokumen input yang dimasukkan ke sistem kemudian akan ditampilkan pada sistem. Setelah dokumen yang dipilih sudah benar dan terstruktur, maka tahapan selanjutnya yaitu proses menerjemahkan dokumen.

1. Pencarian dan Pencocokan Kata

Dalam proses ini dilakukan pencarian kata dalam kamus dengan menggunakan algoritma Breadth First Search(BFS). Proses ini dilakukan dengan beberapa tahap, yaitu :

a) Melakukan pengecekan karakter pada data input

Menghitung semua karakter dari data input yang kemudian akan di cocokkan pada kamus sesuai dengan jumlah karakter pada data input.

Contoh :

Unangtapasogorohana Jumlah karakter : 19 Karakter akhir : a Karakter awal : u

(35)

b) Pengecekan per huruf dimulai dari karakter akhir

Pada tahap ini proses dilakukan dengan pengecekan per karakter huruf yang dimulai dari karakter akhir pada dokumen input

Contoh:

Input : Unangtapasogorohana Jumlah karakter : 19 Karakter akhir : a Karakter awal : u

Pengecekan dimulai dari karakter akhir yaitu a sampai karakter awal yaitu u.

2. Menyimpan karakter paling kanan

Jika kata didalam kamus dengan jumlah karakter yang sama tidak ditemui pada data input maka sistem akan mengambil 1 karakter paling kanan dan proses akan berulang seperti yang pertama hingga menemukan kata yang cocok.

Contoh : Cek karakter 1

Input : Unangtapasogorohana Proses : Unangtapasogorohana

sistem akan mencari kata kedalam kamus dan melakukan pencocokan pada data input dengan ciri memiliki jumlah karakter 19, huruf akhir a dan awal u. Jika tidak ada kata yang sesuai maka sistem akan menyimpan karakter paling kanan yaitu a, dan proses diulang kembali tanpa menyimpan karakter yang sudah disimpan.

(36)

23

Cek karakter 2

Input : Unangtapasogorohan Proses : Unangtapasogorohan

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 18, huruf akhir n dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter a.

Cek karakter 3

Input : Unangtapasogoroha Proses : Unangtapasogoroha

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 17, huruf akhir a dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter a.

Cek karakter 4

Input : Unangtapasogoroh Proses : Unangtapasogoroh

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 16, huruf akhir h dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter h.

Cek karakter 5

Input : Unangtapasogoro Proses : Unangtapasogoro

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 15, huruf akhir o dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter o.

(37)

Cek karakter 6

Input : Unangtapasogor Proses : Unangtapasogor

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 14, huruf akhir r dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter r.

Cek karakter 7

Input : Unangtapasogo Proses : Unangtapasogo

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 13, huruf akhir o dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter o.

Cek karakter 8

Input : Unangtapasog Proses : Unangtapasog

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 12, huruf akhir g dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter g.

Cek karakter 9

Input : Unangtapaso Proses : Unangtapaso

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 11, huruf akhir o dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter o

(38)

25

Cek karakter 10

Input : Unangtapas Proses : Unangtapas

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 10, huruf akhir s dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter s

Cek karakter 11 Input : Unangtapa Proses : Unangtapa

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 9, huruf akhir a dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter a

Cek karakter 12 Input : Unangtap Proses : Unangtap

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 8, huruf akhir p dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter u.

Cek karakter 13 Input : Unangta Proses : Unangta

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 7, huruf akhir a dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter u.

(39)

Cek karakter 14 Input : Unangt Proses : Unangt

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 6, huruf akhir t dan awal u. Karena tidak ada yang cocok maka sistem akan menyimpan karakter t.

Cek karakter 15 Input : Unang Proses : Unang

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 5, huruf akhir g dan huruf awal u. Jika terdapat kata yang cocok sistem akan menyimpan kata tersebut dan mengulangi proses pencarian.

Cek karakter 14

Input : tapasogorohana Proses : tapasogorohana

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 14, huruf akhir a dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter a.

Cek karakter 15

Input : tapasogorohan Proses : tapasogorohan

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 13, huruf akhir n dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter n.

(40)

27

Cek karakter 16

Input : tapasogoroha Proses : tapasogoroha

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 12, huruf akhir a dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter a.

Cek karakter 17

Input : tapasogoroh Proses : tapasogoroh

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 11, huruf akhir h dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter h.

Cek karakter 18 Input : tapasogoro Proses : tapasogoro

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 10, huruf akhir o dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter o.

Cek karakter 19 Input : tapasogor Proses : tapasogor

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 9, huruf akhir r dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter r.

Cek karakter 20 Input : tapasogo Proses : tapasogo

(41)

Cek karakter 21 Input : tapasog Proses : tapasog

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 7, huruf akhir g dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter g.

Cek karakter 22 Input : tapaso Proses : tapaso

Cek karakter 23 Input : tapas Proses : tapas

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 5, huruf akhir s dan huruf awal t. Karena tidak ada yang cocok maka sistem akan menyimpan karakter s.

Cek karakter 24 Input : tapa Proses : tapa

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 4, huruf akhir a dan huruf awal t. Karena terdapat kata yang cocok sistem akan menyimpan kata tersebut dan mengulangi proses pencarian.

Cek karakter 25

Input : sogorohana Proses : sogorohana

(42)

29

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 10, huruf akhir a dan huruf awal s. Karena tidak ada yang cocok maka sistem akan menyimpan karakter a.

Cek karakter 26 Input : sogorohan Proses : sogorohan

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 9, huruf akhir n dan huruf awal s. Karena tidak ada yang cocok maka sistem akan menyimpan karakter n.

Cek karakter 27 Input : sogoroha Proses : sogoroha

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 8, huruf akhir a dan huruf awal s. Karena tidak ada yang cocok maka sistem akan menyimpan karakter a.

Cek karakter 28 Input : sogoroh Proses : sogoroh

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 7, huruf akhir h dan huruf awal s. Karena tidak ada yang cocok maka sistem akan menyimpan karakter h.

Cek karakter 29 Input : sogoro Proses : sogoro

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 6, huruf akhir o dan huruf awal s. Karena tidak ada yang cocok maka sistem akan menyimpan karakter o.

Cek karakter 30 Input : sogor Proses : sogor

(43)

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 5, huruf akhir r dan huruf awal s. Karena tidak ada yang cocok maka sistem akan menyimpan karakter r.

Cek karakter 31 Input : sogo Proses : sogo

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 4, huruf akhir o dan huruf awal s. Karena terdapat kata yang cocok sistem akan menyimpan kata tersebut dan mengulangi proses pencarian.

Cek karakter 32 Input : rohana Proses : rohana

sistem akan melakukan pencocokan kedalam kamus pada data input dengan ciri jumlah karakter 6, huruf akhir a dan huruf awal r. Karena terdapat kata yang cocok sistem akan menyimpan kata tersebut dan mengulangi proses pencarian. . Setelah semua karakter diperiksa dan ditemukan maka pencarian akan berhenti dan dilanjutkan pada proses pemberian spasi.

3. Pemberian spasi

Setelah semua karakter pada data input dicocokkan kedalam kamus dan menghasilkan sejumlah kata yang pada proses sebelumnya telah disimpan, maka kemudian diletakkan spasi di antara kata-kata tersebut.

Contoh :

Ada di kamus : unang Ada di kamus : tapa

(44)

31

Ada di kamus : sogo Ada di kamus : rohana

Output : unang tapa sogo rohana

4. Terjemah

Selanjutnya, data akan diberikan spasi dan proses akan dilanjutkan pada terjemahan. Pada saat proses terjemah sistem akan menerjemahkan kata sesuai artikata yang ada di dalam kamus, pada proses terjemahan ini tidak diartikan ke dalam pembahasan makna kalimat. Maka jika terdapat nama daerah, nama orang dan kata yang tidak ada di dalam kamus maka pada proses pencarian dan pencocokkan kata, sistem akan melakukan pengecekan kata yang hanya ada didalam kamus.

Contoh kata yang tidak ada di dalam kamus : 1) Nama orang

Input : Adongmanajolonamargoarsijonaha Spasi : Adongma na jolo na ma r goar si j on aha Terjemah : Adalah yang dulu yang lah r nama si j ini apa 2) Nama Kota

Input : Borasharanggaoltartabo Spasi : Boras ha ra nggaol tar tabo

Terjemah : Beras ha barangkali nggaol paling enak

3.2.1.4.Output

Hasil dari beberapa tahapan diatas yakni menghasilkan output sesuai dengan dokumen input. Adapun hasilnya berupa dokumen teks Bahasa Batak Toba berupa file berekstensi .docx yang sudah menjadi dokumen teks Bahasa Indonesia dan akan di simpan pada komputer pengguna.

(45)

3.2.2 Use Case Diagram

Use case diagram adalah sebuah gambaran dari sebuah actor yang berinteraksi dengan sistem yang ada. Diantara bagian bagian yang ada pada sistem tersebut dapat memperkenalkan suatu sistem yang akan dibangun. Use case diagram dapat juga menjelaskan berjalannya sistem terhadap orang yang melihat di luar sistem. Use case diagram dari aplikasi yang dibangun dapat dilihat pada gambar 3.2.

Gambar 3.2. Use Case Diagram 3.2.3. Activity Diagram

Menurut (Satzinger, et al. 2012) Activity diagram merupakan sebuah activity diagram yang menggambarkan berbagai aktivitas pengguna atau sistem, orang yang melakukan setiap aktivitas, dan alur kegiatan ini secara berurutan. Berikut adalah 3activity diagram dari sistem terjemahan dokumen Bahasa Batak Toba, yaitu:

1. Activity Diagram About

Activity Diagram about ini menampilkan alur proses menu About. Apabila user menjalankan aplikasi dan mengklik button About pada menu, maka sistem akan menampilkan halaman About yang berisi informasi mengenai aplikasi. Diagram aktivitas About dapat dilihat pada Gambar 3.3.

(46)

33

Gambar 3.3. Activity Diagram About

2. Activity Diagram Translate

Activity Diagram Translate merupakan aktivitas yang menjelaskan alur proses terjemahan pada menu translate. Pada saat user mengklik tombol choose file pada menu translate maka akan menampilkan nama file input untuk dipilih, kemudian file input akan dibaca oleh sistem. Selanjutnya,klik tombol space maka akan menampilkan isi dokumen input yang sudah diberi spasi dan jika klik tombol translate maka akan menampilkan hasil dari terjemahan dokumen yang telah diberi spasi. Kemudian klik tombol save file jika user ingin menyimpan hasil dari data yang telah diinput tersebut.

Diagram Activity Translate dapat dilihat pada Gambar 3.4.

(47)

Gambar 3.4. Activity Diagram Translate 3. Activity Diagram Help

Activity Diagram Help akan menampilkan alur proses dari menu help. Jika user memilih tombol Help pada menu bar maka sistem akan menampilkan halaman Help yang berisikan panduan untuk menggunakan aplikasi ini.

Diagram aktivitas Help dapat dilihat pada Gambar 3.5.

(48)

35

Gambar 3.5. Activity Diagram Help

3.2.4. Flowchart

Flowchart adalah bagan yang menunjukkan alur kerja dalam suatu sistem atau prosedur sistem secara logika. Flowchart digunakan untuk menggambarkan rangkaian proses atau prosedur suatu sistem agar mudah dipahami berdasarkan urutan langkah dari suatu proses ke proses lainnya. Flowchart sistem transliterasi batak toba dapat dilihat pada gambar 3.6.

(49)

Gambar 3.6. flowchart

Adapun penjelasan tahapan-tahapan diagram alir flowchart dari gambar 3.7. adalah sebagai berikut :

1. User akan memulai menjalankan aplikasi.

2. Selanjutnya user akan memberikan input file dokumen naskah batak dengan ekstensi .docx

(50)

37

3. Sistem akan mengecek apakah file input benar atau tidak jika sudah benar dan akan menampilkan dokumen.

4. Selanjutnya sistem akan membaca dan menampilkan isi dari file dokumen input

5. Kemudian sistem akan memberikan spasi pada file yang telah diinput

6. Sistem akan menerjemahkan naskah batak yang sudah berspasi ke dalam bahasa Indonesia

7. Kemudian sistem akan menampilkan hasil terjemahan.

Setelah proses selesai, user dapat menyimpan hasil proses spasi dan terjemahan tersebut menjadi sebuah file dokumen.

3.3. Perancangan Antarmuka Sistem 3.3.1. Rancangan Halaman Translate

Gambar 3.7. Rancangan Halaman Translate

(51)

Keterangan:

1 : Button Menu

2 : Text Area Bahasa Batak, menampilkan bahasa batak yang dipilih user 3 : Text Area, menampilkan bahasa batak setelah diberi spasi oleh sistem 4 : Choose File, menampilkan halaman untuk memilih file dokumen dari komputer pengguna yang akan diberi spasi dan diterjemahkan.

5 : Text Area, menampilkan nama file yang telah di pilih 6 : Button Space, untuk memulai proses pemberian spasi

7 : Button Save File, untuk menyimpan file yang telah di beri spasi

8 : Button Translate, untuk memulai proses penerjemahan yang telah diberi spasi

9 : Text Area, menampilkan teks bahasa Indonesia hasil translate 10 : Button Save File, untuk menyimpan file yang telah di terjemahkan

3.3.2. Rancangan Halaman About

(52)

39

Gambar 3.8. Rancangan Halaman About

3.3.3. Rancangan Halaman Help

Gambar 3.9. Rancangan Halaman Help

(53)

Pada bab ini akan dijelaskan tentang proses pengimplementasian algoritma Breadth First Search (BFS) dengan untuk mencari solusi dalam memisahkan kata pada dokumen bahasa Batak Toba menjadi yang tidak berspasi dan menerjemahkan kedalam bahasa Indonesia., sesuai perancangan sistem yang telah dilakukan di Bab 3 serta melakukan pengujian sistem yang telah dibangun.

4.1. Impelementasi Sistem

Dalam tahap implementasi sistem, perancangan sistem yang telah dilakukan pada Bab 3 yaitu mulai dari pre-processing,proses, serta algoritma dan metode yang digunakan akan diimplementasikan kedalam sistem dengan menggunakan bahasa pemrogramman Java.

4.1.1 Spesifikasi Perangkat Keras yang digunakan

Spesifikasi perangkat keras yang digunakan untuk membangun sistem ini adalah sebagai berikut:

1. Prosesor Intel® CoreTM i3-4005U CPU @ 1,70GHz (4 CPUs),

~1.7GHz

2. Kapasitas hardisk 500 GB.

3. Memori RAM yang digunakan 4.00 GB 4. Mouse dan keyboard

(54)

41

4.1.2 Spesifikasi Perangkat Lunak yang digunakan

Spesifikasi perangkat lunak yang digunakan untuk membangun sistem ini adalah sebagai berikut:

1. Sistem operasi Microsoft Windows 10 Enterpise 64 bit 2. NetBeans IDE 8.2

3. Java: 1.8.0_05

4. Libraries poi-3.17-beta 1untuk input dan simpan dokumen 4.2 Implementasi perancangan antarmuka

Implementasi perancangan antarmuka berdasarkan perancangan antarmuka sistem yang telah dibahas pada Bab 3 adalah sebagai berikut :

4.2.1 Halaman help

Halaman help adalah halaman yang berisi cara menggunakan aplikasi pemisahan kata dan penerjemahan dokumen bahasa Batak Toba kedalam Bahasa Indonesia.Tampilan halaman help dapat dilihat pada gambar 4.1

Gambar 4.1. Halaman Help 4.2.2 Halaman translate

Halaman translate adalah halaman untuk menjalankan sistem pemisahan kata dan penerjemahan dokumen bahasa Batak Toba. Tampilan halaman translate dapat dilihat pada gambar 4.2.

(55)

Gambar 4.2. Gambar Translate

4.2.3 Halaman about

Halaman about adalah halaman yang berisi tentang informasi aplikasi pemisahan kata dan penerjemahan dokumen bahasa Batak Toba.Tampilan halaman about dapat dilihat pada gambar 4.3.

(56)

43

Gambar 4.3. Gambar About 4.3 Prosedur Operasional

Aplikasi Pemisahan Kata dan Penerjemahan Dokumen Bahasa Batak Toba akan menampilkan menu halaman translate pada saat aplikasi dijalankan.

Aplikasi ini memiliki 3 pilihan menu yaitu menu help, menu translate, dan menu about. Prosedur operasional yang harus dilakukan oleh pengguna dapat dilihat pada Gambar 4.4

Gambar 4.4. Choose File

(57)

Pada halaman translate, pengguna dapat memilih button choose file untuk memilih dokumen yang akan di input.

Gambar 4.5. pilih file

Pemilihan file dokumen bahasa Batak Toba dapat dilakukan setelah pengguna

memilih button choose file, Setelah itu pilih dokumen yang akan diberi spasi dan klik open seperti pada Gambar 4.5

Gambar 4.6. Pilih Space

(58)

45

Pengguna dapat memilih button space untuk menampilkan hasil dari pemberian spasi pada dokumen bahasa Batak Toba yang sudah dipilih. Pemilihan button space dapat dilihat pada Gambar 4.6

Gambar 4.7. Menampilkan Hasil Space Hasil dokumen yang sudah diberi spasi dapat dilihat pada Gambar 4.7

Gambar 4.8. Pilih Save File Space

(59)

Pengguna juga dapat menyimpan hasil dari dokumen yang sudah diberi spasi dengan memilih button save file. Pemilihan button save file dapat dilihat pada Gambar 4.8

Gambar 4.9. Berhasil Menyimpan

Setelah pengguna menyimpan file dengan memilih button save file, maka akan

menampilkan notifikasi berhasil menyimpan hasil spasi. Notifikasi berhasil tersimpan dapat dilihat pada Gambar 4.9

Gambar 4.10. Direktori Penyimpanan

Pengguna dapat melihat hasil pemberian spasi yang sudah disimpan dengan membuka direktori penyimpanan file pada computer pengguna. Direktori penyimpanan file dapat dilihat pada Gambar 4.10

(60)

47

Gambar 4.11. Hasil Output Space

Pengguna dapat membuka isi file yang berhasil disimpan pada direktori penyimpanan.

Isi file yang telah disimpan dapat dilihat pada Gambar 4.11

Gambar 4.12. Pilih Translate

Pengguna juga dapat menerjemahkan dokumen dari hasil yang sudah diberi spasi dari bahasa Batak Toba menjadi bahasa Indonesia dengan memilih button translate.

Pemilihan button translate dapat dilihat pada Gambar 4.12

(61)

Gambar 4.13. Hasil Translate

Hasil dokumen yang sudah di translate dapat dilihat pada Gambar 4.13

Gambar 4.14. Pilih Save File

(62)

49

Pengguna juga dapat menyimpan dokumen hasil translate dengan memilih button translate seperti pada Gambar 4.14

Gambar 4.15. Berhasil Menyimpan

Setelah memilih button save file maka akan menampilkan notifikasi berhasil menyimpan hasil terjemahan. Notifikasi berhasil menyimpan dapat dilihat pada Gambar 4.15

Gambar 4.16. Direktori Penyimpanan

Pengguna dapat melihat hasil translate yang sudah disimpan dengan membuka

direktori penyimpanan file pada computer pengguna. Direktori penyimpanan file dapat dilihat pada Gambar 4.16

(63)

Gambar 4.17. Hasil Output Translate

Pengguna dapat membuka isi file yang berhasil disimpan pada direktori penyimpanan.

Isi file yang telah disimpan dapat dilihat pada Gambar 4.17

4.4 Pengujian Sistem

Pengujian sistem dilakukan untuk mengetahui apakah sistem yang telah dibangun berfungsi dengan baik serta berjalan sesuai dengan yang diinginkan. Pengujian ini akan memaparkan seberapa besar tingkat akurasi dari penerapan algoritma Breadh First Search (BFS) yang diterapkan pada sistem pemisahan kata dan penerjemahan dokumen bahasa Batak Toba kedalam bahasa Indonesia. Hasil pengujian pada sistem ini menggunakan rumus sebagai berikut :

1. Akurasi Pemisahan kata

Untuk menghitung tingkat akurasi pemberian spasi digunakan rumus sebagai berikut:

Banyak Kata yang cocok

Akurasi = x 100 % Banyak Kata dokumen input

(64)

51

Pengujian serta perbandingan sistem pemisahan kata dalam dokumen bahasa Batak Toba dapat dilihat pada Tabel 4.1

Tabel 4.1. Perbandingan Kata Oleh Sistem Dengan Data Dari Buku NO Hasil Pemberian Spasi

Oleh Sistem

Data Dari Buku Keterangan 1 ahu debata ni pati-pati

porbuat ni datu portandang dormata di natorop si paturun parulian ahu raja parsanggulan ni aji naga on so ni oli rajahonma di pormiahanna da rajahon di simboraan di datu nami ahu debata ni dorma buat ma datu portandang pangori

panguntu ahu

panarubarrita pamasu- masu ni tuan sorba banua ma ra sibor i ho na [huy] au [m]

Ahu debata ni pati- pati porbuat ni datu portandang dormata di na torop si paturun parulian. Ahu raja parsanggulan ni aji naga on so ni oli

rajahonma di

pormiahanna, da rajahon di simboraan di datu nami.

Ahu Debata ni dorma buat ma datu portandang pangori panguntu. Ahu panarubarrita

pamasu-masu ni Tuan Sorba Banua mara si borihon ahu ya um.

Data perbandingan : Buku Transliterasi dan Tejemahan Naskah Batak Toba

Data : Doc .docx Failed :

1) ma ra sibor i ho na huy au m = mara siborihon ahu ya um

53

Akurasi = X 100 % 60

Akurasi = 88,33%

(65)

NO Hasil Pemberian Spasi Oleh Sistem

Data Dari Buku Keterangan 2 ahu deba tani si [n] da

dorma pangarak pargolang-golangon panarubari debata sipaturun parulian samisara ahu da rajahonma i di si pangarak ni si [n] da dorma porma buat ni datu portandang da rajahon ma i di simbora asa da bahen ma tu pormiahanta inon di simbora diba datu

Ahu debata ni sinda dorma pangarak porgolang-golangon panarubari debata sipaturun parulian samisara.

Ahu da rajahon ma i di si pangarak ni sinda dorma porma buat ni datu

portandang da rajahon ma i di simbora asa da bahen ma tu pormiahanta inon di simbora diba datu.

Data perbandingan : Buku Transliterasi dan Tejemahan Naskah Batak Toba

Data : Doc 3.docx Failed :

1) si n da = sinda 2) si n da = sinda

41

Akurasi = X 100 % 47

Akurasi = 87,23 %

Tabel 4.2. Hasil Pengujian Spasi Dokumen Inputan Jumlah

Data Input

Jumlah Kata Yang Cocok

Jumlah Kata Error

Akurasi (%)

Dokumen 1.docx 78 62 16 79.48 %

Dokumen 2.docx 60 53 7 88.33 %

Dokumen 3.docx 47 41 6 87.23 %

Dokumen 4.docx 43 40 3 93.02 %

Dokumen 5.docx 75 53 22 70.66 %

Dokumen 6.docx 79 60 19 75.94 %

Dokumen 7.docx 98 82 11 88.17 %

Dokumen 8.docx 47 35 18 74.46 %

Dokumen 9.docx 64 58 6 90.62 %

Dokumen 10.docx 84 76 8 90.47 %

Dokumen 11.docx 49 46 3 93.87 %

Dokumen 12.docx 86 79 7 91.86 %

Dokumen 13.docx 83 78 5 93.97 %

Dokumen 14.docx 107 79 28 73.83 %

Dokumen 15.docx 96 72 24 75.00 %

(66)

53

Dokumen Inputan Jumlah Data Input

Jumlah Kata Yang Cocok

Jumlah Kata Error

Akurasi (%)

Dokumen 17.docx 263 255 8 96.95 %

Dokumen 18.docx 253 215 38 84.98 %

Dokumen 19.docx 262 259 3 98.88 %

Dokumen 20.docx 291 272 19 93.47 %

Akurasi Rata-Rata 87.88 %

Keterangan:

Tingkat akurasi pada setiap dokumen bebeda-beda, apabila ditemukan sebeuah kata menjadi terpecah dikarenakan sebelum kata tersebut terdapat kata yang tidak ada di kamus, jadi sistem kemblai melakukan pengecekan paada kata sebelumnya.Contoh kata yang tidak ada di kamus nama daerah, nama orang, kata yang tidak memiliki arti.

2. Akurasi Penerjemahan

Untuk menghitung tingkat akurasi penerjemahan digunakan rumus sebagai berikut:

Jumlah Kata yang cocok

Akurasi = x 100 % Jumlah Kata dokumen output

Pengujian serta perbandingan sistem pemisahan kata dalam dokumen bahasa Batak Toba dapat dilihat pada Tabel 4.1