• Tidak ada hasil yang ditemukan

PENCARIAN KATA DAN IDENTIFIKASI BAHASA PADA DOKUMEN BAHASA BATAK TANPA SPASI MENGGUNAKAN ALGORITMA UNIFORM COST SEARCH (UCS) SKRIPSI

N/A
N/A
Protected

Academic year: 2022

Membagikan "PENCARIAN KATA DAN IDENTIFIKASI BAHASA PADA DOKUMEN BAHASA BATAK TANPA SPASI MENGGUNAKAN ALGORITMA UNIFORM COST SEARCH (UCS) SKRIPSI"

Copied!
67
0
0

Teks penuh

(1)

Universitas Sumatera Utara

PENCARIAN KATA DAN IDENTIFIKASI BAHASA PADA DOKUMEN BAHASA BATAK TANPA SPASI MENGGUNAKAN ALGORITMA

UNIFORM COST SEARCH (UCS)

SKRIPSI

ADI SYAPUTRA LUBIS 131402123

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2018

(2)

Universitas Sumatera Utara PENCARIAN KATA DAN IDENTIFIKASI BAHASA PADA DOKUMEN

BAHASA BATAK TANPA SPASI MENGGUNAKAN ALGORITMA UNIFORM COST SEARCH (UCS)

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

ADI SYAPUTRA LUBIS 131402123

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2018

(3)

Universitas Sumatera Utara

(4)

Universitas Sumatera Utara

(5)

Universitas Sumatera Utara UCAPAN TERIMA KASIH

Puji dan syukur kehadirat Allah SWT, berkat rahmat dan izin-Nya penulis dapat menyelesaikan penulisan skripsi ini, sebagai syarat untuk memperoleh gelar Sarjana Komputer pada Program Studi S1 Teknologi Informasi Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.

Ucapan terima kasih penulis sampaikan kepada :

1. Bapak Prof. Runtung Sitepu, SH., M.Hum selaku Rektor Universitas Sumatera Utara.

2. Bapak Prof. Dr. Opim Salim Sitompul selaku Dekan Fasilkom-TI USU.

3. Bapak Romi Fadillah Rahmat B.Comp.Sc., M.Sc selaku Ketua Program Studi S1 Teknologi Informasi Universitas Sumatera Utara dan juga sebagai Dosen Pembimbing II yang telah memberikan bimbingan dan saran kepada penulis.

4. Bapak Muhammad Anggia Muchtar, ST., MM.IT selaku Dosen Pembimbing I yang telah memberikan bimbingan dan saran kepada penulis.

5. Ibu Sarah Purnamawati, ST., MSc. selaku Dosen Pembanding I yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.

6. Bapak Ivan Jaya, S.Si., M.Kom. selaku Dosen Pembanding II yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.

7. Ayahanda Iskandar Lubis dan Ibunda Maliana yang selalu memberikan doa dan nasehat yang tiada putusnya kepada penulis.

8. Regania Pasca Rachssy (S.Kom.) yang memberikan bantuan dan arahan kepada penulis sehingga bisa menyelesaikan skripsi ini tepat waktu.

9. Elsa Trida Sawitri, Chintya Dwi Hevlima Sianipar, teman seperjuangan skripsi aksara Batak yang memberikan dukungan dan bantuan kepada penulis.

10. Semua pihak yang terlibat secara langsung maupun tidak langsung yang tidak dapat penulis ucapkan satu persatu yang telah membantu penyelesaian skripsi ini.

(6)

Universitas Sumatera Utara

Penulis

(7)

Universitas Sumatera Utara ABSTRAK

Proses penerjemahan dokumen bahasa Batak selama ini masih dilakukan secara manual oleh ahli dan memakan waktu yang lama dikarenakan bahasa Batak dalam tulisan latin yang akan di terjemah tidak menggunakan spasi dan untuk beberapa bahasa batak seperti bahasa Angkola-Mandailing, Simalungun dan Toba terdapat banyak kata yang sama sehingga membingungkan para ahli untuk mengidentifikasi bahasa batak apa yang akan diterjemah. Agar memudahkan para ahli untuk menerjemahkan dokumen, penulis meneliti algoritma yang cocok untuk memisahkan kata pada dokumen yang tidak berspasi, disini penulis menggunakan algoritma Uniform Cost Search (UCS). Dokumen bahasa Batak dengan ekstensi .txt digunakan sebagai data input untuk proses penerjemahan dokumen bahasa Batak tanpa spasi. Selanjutnya proses pencarian kata dilakukan untuk mengidentifikasi bahasa Batak yang digunakan pada dokumen input.

Kemudian kumpulan kata yang didapat akan di proses menggunakan algoritma UCS untuk mendapatkan urutan kata yang tepat sehingga penambahan spasi bisa dilakukan pada setiap kata. Penerapan algoritma UCS untuk menemukan urutan kata yang tepat pada dokumen bahasa Batak tanpa spasi mampu menghasilkan akurasi sebesar 89%.

Kata kunci : Bahasa Batak Angkola-Mandailing, Bahasa Batak Simalungun, Bahasa Batak Toba, uninform search, blind search, Uniform Cost Search (UCS).

(8)

Universitas Sumatera Utara for a long time because Batak language in Latin writing that will be translated does not use spaces and for some batak languages. clean for linguists for what will be translated. In order to make it easier for experts to translate documents, the authors find algorithms that are not related, using the Uniform Cost Search algorithm (UCS). Batak language with the extension .txt as data input for the translation process "Batak without spaces". Then the word search process was carried out to identify the Batak language that was entered in the document. Then the existing set of words will be processed using the UCS algorithm to get the right words. Spatial data can be done on each word. The UCS algorithm application to find the right keywords in the Batak language document without spaces resulting in 89%.

Keywords : Angkola-Mandailing language, Simalungun language, Toba language, uninform search, blind search, Uniform Cost Search (UCS).

(9)

Universitas Sumatera Utara DAFTAR ISI

Hal.

PERSETUJUAN Error! Bookmark not defined.

PERNYATAAN Error! Bookmark not defined.

UCAPAN TERIMA KASIH 5

ABSTRAK 7

ABSTRACT 8

DAFTAR ISI 9

DAFTAR TABEL 10

DAFTAR GAMBAR 11

BAB 1 PENDAHULUAN

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Batasan Masalah 3

1.4 Tujuan Penelitian 3

1.5 Manfaat Penelitian 4

1.6 Metodologi Penelitian 4

1.7 Sistematika Penulisan 5

BAB 2 LANDASAN TEORI 2.1 Uninformed search 7

2.2 Uniform Cost Search (UCS) 7

2.3 Bahasa Batak 8

2.4 Graph 9

2.5 Tree 10

2.6 Penelitian Terdahulu 11

BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Data Yang Digunakan 13

(10)

Universitas Sumatera Utara

3.3 Rancangan Antarmuka Sistem 29

3.3.6. Rancangan Halaman Utama 29

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 4.1 Spesifikasi Perangkat Keras dan Perangkat Lunak 31

4.1.1. Kebutuhan Perangkat Keras 31

4.1.2. Kebutuhan Perangkat Lunak 31

4.2 Implementasi Tampilan Antarmuka 32

4.3 Implementasi Data 32

4.4 Prosedur Operasional 35

4.5 Pengujian Sistem 42

BAB 5 KESIMPULAN DAN SARAN 5.1 Kesimpulan 46

5.2 Saran 47

DAFTAR PUSTAKA 48

DAFTAR TABEL Hal. Tabel 2.1. Penelitian terdahulu 12

Tabel 3.1. Contoh dokumen bahasa Batak yang digunakan 14

Tabel 4.1. Rangkuman data dokumen bahasa Batak 33

Tabel 4.2. Perbandingan hasil sistem dengan data pakar 43

Tabel 4.3. Hasil pengujian semua data 44

(11)

Universitas Sumatera Utara DAFTAR GAMBAR

Hal.

Gambar 2.1. Uniform Cost Search (UCS) 8

Gambar 3.1. Arsitektur umum 17

Gambar 3.2. UCS Tree 18

Gambar 3.3. UCS Pengecekan 1 19

Gambar 3.4. UCS Pengecekan 3 20

Gambar 3.5. Pengecekan 5 20

Gambar 3.6. Pengecekan 10 22

Gambar 3.7. Result 23

Gambar 3.8. Activity Diagram 26

Gambar 3.9. Alur proses pada sistem 28

Gambar 3.10. Rancangan halaman utama 29

Gambar 4.1. Halaman utama 32

Gambar 4.2. Browse file 36

Gambar 4.3. pilih file .txt 36

Gambar 4.4. Read file .txt 37

Gambar 4.5. man2.txt 37

Gambar 4.6. Browse file pakar 38

Gambar 4.7. Pilih file output_man2.txt 38

Gambar 4.8. Cari spasi 39

Gambar 4.9. Hasil penambahan spasi 39

Gambar 4.10. Pencarian kata degan tree 40

Gambar 4.11. Hasil akurasi 41

Gambar 4.12. Hasil identifikasi Bahasa 41

Gambar 4.13. Proses terjemah 42

Gambar 4.14. Hasil terjemah 42

Gambar 4.15. Hasil pengujian system 43

(12)
(13)

BAB I PENDAHULUAN

1.1. Latar belakang

Indonesia merupakan salah satu negara kepulauan yang memiliki beragam suku, etnis dan budaya. Setiap etnis memiliki Bahasa masing-masing untuk saling berinteraksi, salah satu suku yang memiliki bermacam etnis yaitu suku Batak.

Diawal masa penjajahan belanda istilah batak masih sering digunakan untuk merujuk pada kelompok etnis, namun saat ini istilah batak lebih sering digunakan untuk mencerminkan identitas etnis toba dikarenakan mereka lebih sering menyebut dirinya sebagai Batak (Kozok,2009).

Suku Batak memiliki lima etnis yaitu Toba, Angkola-Mandailing, Simalungun, Karo dan Pakpak-Dairi. Kelima etnis tersebut memiliki Bahasa sehari-hari yang berbeda dan ada beberapa kesamaan pada tiap-tiap bahasa.

Menurut Kozok dalam bukunya yang berjudul Surat Batak, para ahli membedakan Bahasa batak menjadi dua cabang Bahasa-bahasa batak yang memiliki perbedaan yang cukup besar sehingga tidak memungkinkan terjadinya komunikasi pada kelompok etnis tersebut. Bahasa Angkola-Mandailing dan Toba membentuk rumpun selatan sedangkan Bahasa Pakpak-Dairi dan Karo membentuk rumpun utara. Untuk Bahasa simalungun diyakini sebagai kelompok ketiga yang merupakan cabang dari rumpun selatan yang berpisah dari cabang batak selatan (Adelaar,1981). Pada penelitian ini penulis menggunakan Bahasa Angkola-Mandailing, Toba dan simalungun sebagai objek penelitian.

Suku batak merupakan salah satu suku yang dikenal jarang menulis, atau menuangkan sastranya kedalam tulisan. Suku batak hanya menggunakan tulisannya dalam tiga tujuan yaitu untuk ilmu kedukunan (hadatuon), surat menyurat dan ratapan (hanya Karo, Simalungun dan Angkola-Mandailing) (Kozok, 2009). Sastra Batak pada zaman dahulu hanya ditulis oleh dukun (datu),

(14)

Universitas Sumatera Utara karena hanya dukun lah yang mengerti, dan sastra Batak ditulis menggunakan aksara batak dan ditulis tanpa menggunakan spasi. Pustaha Bahasa Batak yang dapat ditemukan di museum dan koleksi beberapa ahli umumnya menggunakan aksara batak, atau disebut juga dengan Surat (Aksara) Batak.

Untuk mengetahui isi dari pustaha tersebut, perlu beberapa proses panjang hingga kita dapat membaca dan memahaminya. Pustaha yang didapat pada umumnya berupa buku atau selembar kertas yang ditulis menggunakan aksara batak, kemudian harus ditransliterasi (alih aksara) oleh ahli yang mengerti cara membaca aksara batak kemudian di terjemah. Dari proses tersebut, terdapat satu permasalahan yang kompleks, yaitu pada saat proses transliterasi dan akan di terjemahkan. Terdapat satu masalah yang membuat proses tersebut memakan waktu yang lama, dikarenakan Bahasa batak dalam tulisan latin yang akan di terjemah tidak menggunakan spasi. Jadi hanya beberapa ahli saja yang mampu membaca dan kemudian menerjemahkannya. Agar memudahkan para ahli untuk menerjemahkan dokumen, penulis meneliti algoritma yang cocok untuk memisahkan kata pada dokumen yang tidak berspasi, disini penulis menggunakan algoritma Uniform Cost Search (UCS).

Uniform Cost Search (UCS) adalah algoritma search tree (graph) terbaik untuk masalah pencarian yang tidak melibatkan penggunaan heuristik dengan kata lain algoritma ini termasuk ke dalam kategori pencarian buta (blind search).

Algoritma ini memulai pencarian dari root node, kemudian dilanjutkan ke node- node selanjutnya. Dimana node tersebut dipilih yang memilki harga (cost) yang paling optimal dari root node. Algoritma ini merupakan modifikasi dari Bread First Search (BFS).

Penelitian yang dilakukan oleh Aine et al menganalisi tentang penggunaan algoritma BFS yang diterapkan pada algoritma UCS. Selanjutnya penelitian yang dilakukan oleh Pathak et al pada tahun 2018 membandingkan beberapa algoritma pencarian yang termasuk ke dalam pencarian heuristic dan non heuristic pada kasus pathfinding. Hasil dari penelitian tersebut

(15)

3

Universitas Sumatera Utara menyimpulkan bahwa algoritma UCS merupakan algoritma terbaik pada pencarian non heuristic karena proses pencarian yang tidak berurut membuat ruang pencarian lebih optimal sehingga pencarian akan lebih cepat.

Berdasarkan uraian diatas maka dalam penelitian ini penulis akan menerapkan algoritma Uniform Cost Search (UCS) untuk melakukan pemisahan kata dan deteksi bahasa pada dokumen Bahasa Batak Angkola-Mandailing, Toba dan Simalungun yang tidak berspasi.

1.2. Rumusan Masalah

Lamanya proses penerjemahan sebuah pustaha Batak yang dilakukan oleh para ahli dikarenakan struktur penulisan Bahasa batak yang tidak menggunakan spasi.

Selain itu banyaknya penggunaan kata yang sama pada sebuah dokumen Batak khususnya Batak Angkola-Mandailing, Simalungun dan Toba juga menyulitkan para ahli dalam mengidentifikasi bahasa batak apa yang digunakan dalam dokumen tersebut. Maka dari itu diperlukan suatu sistem yang dapat membantu user untuk memisahkan kata dan mendeteksi Bahasa Batak yang digunakan dalam dokumen.

1.3. Batasan Masalah

Berdasarkan rumusan masalah diatas, adapun batasan masalah dari penelitian ini adalah :

a) Dokumen input menggunakan file .txt

b) Input berupa dokumen teks Bahasa Batak Angkola-Mandailing, Toba dan Simalungun tanpa spasi

c) Hasil terjemahan tidak membahas tentang makna kalimat.

1.4. Tujuan Penelitian

Tujuan dari penelitian ini untuk memisahkan kata pada dokumen yang tidak berspasi dengan menggunakan algoritma Uniform Cost Search dan mendeteksi

(16)

Universitas Sumatera Utara Bahasa dari file Input, diantaranya Bahasa Batak Angkola-Mandailing, Toba dan Simalungun.

1.5. Manfaat Penelitian

Adapun manfaat dari penelitian ini yaitu :

a) Membantu user dalam mengidentifikasi Bahasa Batak yang digunakan pada dokumen.

b) Memudahkan user dalam menerjemahkan dokumen yang tidak berspasi c) Data hasil terjemah dapat dikembangkan untuk membuat penelitian

selanjutnya

d) Sebagai referensi pada penelitian selanjutnya.

1.6. Metode Penelitian

Adapun tahapan - tahapan yang akan dilakukan pada penelitian ini adalah : a) Studi Literatur

Pada tahapan ini dilakukan pengumpulan dan mempelajari informasi yang diperoleh dari buku, skripi, jurnal, dan berbagai sumber informasi lainnya.

Informasi yang berkaitan dengan penelitian tersebut seperti Bahasa Batak Angkola-Mandailing, Bahasa Batak Simalungun, Bahasa Batak Toba, kamus Angkola-Mandailing, kamus Simalungun, kamus Toba, graph, tree. blind search, heuristic search, Uniform Cost Search (UCS), Breadth First Search (BFS), Depth First Search (DFS).

b) Analisis Permasalahan

Tahap selanjutnya yaitu menganalisis permasalahn dari informasi yang didapat pada tahapan sebelumnya agar didapatkan metode yang tepat untuk mengatasi masalah dalam penelitian ini. Kemudian melakukan perancangan sistem yang sesuai dari hasil analisis permasalahan.

(17)

5

Universitas Sumatera Utara c) Perancangan

Pada tahap ini dilakukan perancangan arsitektur, permodelan sistem dan perancangan antarmuka. Proses ini dilakukan berdasarkan hasil analisis dari studi literatur yang telah didapatkan.

d) Pengujian

Pada tahap ini dilakukan pengujian terhadap aplikasi yang telah dibangun untuk pemisahan kata dan deteksi dokumen teks Bahasa Batak yang akan diterjemahkan ke dalam Bahasa Indonesia.

e) Dokumentasi dan Penyusunan Laporan

Pada tahap ini dilakukan dokumentasi dan penyusunan laporan hasil analisis dan implementasi Uniform Cost Search (UCS) dalam penyelesaian masalah pemisahan kata dan deteksi Bahasa Batak yang akan diterjemahkan ke dalam Bahasa Indonesia.

1.7. Sistematika Penulisan

Sistematika penulisan dari skripsi ini terdiri dari lima (5) bagian utama sebagai berikut:

Bab 1 : Pendahuluan

Bab ini berisi latar belakang dari penelitian, rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian, dan sistematika penulisan.

Bab 2 : Landasan Teori

Bab ini berisi teori-teori yang diperlukan untuk memahami permasalahan yang dibahas pada penelitian ini. Teori-teori yang berhubungan dengan terjemahan, Bahasa Batak Angkola-Mandailing, Bahasa Batak Simalungun, Bahasa Batak Toba, kamus Angkola-Mandailing, kamus Simalungun, kamus Toba, graph, tree. blind search, heuristic search, Uniform Cost Search (UCS), Breadth First Search (BFS), Depth First Search (DFS) akan dibahas pada bab ini.

(18)

Universitas Sumatera Utara

Bab 3 : Analisis dan Perancangan

Bab ini berisi analisis arsitektur umum, tiap langkah pre-processing yang dilakukan, flowchart, serta penerapan Uniform Cost Search (UCS) untuk proses pemisahan kata dan deteksi Bahasa Batak yang akan di terjemahkan ke dalam Bahasa Indonesia.

Bab 4 : Implementasi dan Pengujian

Bab ini berisi pembahasan tentang implementasi dari perancangan yang telah dijabarkan pada Bab 3. Selain itu, hasil yang didapatkan dari pengujian yang dilakukan terhadap implementasi yang dilakukan juga dijabarkan pada bab ini.

Bab 5 : Kesimpulan dan Saran

Bab ini berisi ringkasan serta kesimpulan dari rancangan yang telah dibahas pada Bab 3, serta hasil penelitian yang dijabarkan pada Bab 4. Bagian akhir dari bab ini memuat saran-saran yang diajukan untuk pengembangan penelitian selanjutnya.

(19)

BAB 2

LANDASAN TEORI

2.1. Uninformed Search

Uninformed Search juga sering disebut dengan istilah Blind Search. Istilah tersebut menggambarkan bahwa teknik pencarian ini tidak memiliki informasi tambahan mengenai kondisi diluar dari yang disediakan oleh definisi masalah.

Yang dilakukan oleh algoritma ini adalah melakukan generate dari successor dan membedakan goal state dari non-goal state. Pencarian dilakukan

berdasarkan pada urutan mana saja node yang hendak di-expand. Jika solusi sudah ketemu, maka pencarian akan dihentikan. Jika dibuat skemanya, pencarian buta hanya mengenal tiga bagian, [masalah]-[pencarian]-[solusi].

Blind search tidak mempunyai atribut atau informasi tambahan. Algoritma yang termasuk Blind search yaitu :

a. Breath First Search (BFS) b. Depth First Search (DFS) c. Uniform Cost Search (UCS) d. Depth-Limited Search (DLS) e. Interative-Deeping Search (IDS) f. Bi-directional Search (BDS)

2.2. Uniform Cost Search

Uniform Cost Search adalah algoritma Seach Tree (graph) yang digunakan untuk menyelesaikan beberapa persoalan . Algoritma ini memulai pencarian dari root node, kemudian dilanjutkan ke node-node selanjutnya. Dimana node tersebut dipilih yang memilki harga (cost) terkecil dari root node. Algoritma ini merupakan modifikasi dari Bread First Search (BFS). Dalam implementasi algoritma ini ,

(20)

Universitas Sumatera Utara melibatkan semua node yang berhubungan dengan root node, dan meletakannya dalam priority queue untuk mencapai node tujuan. Dimana node – node yang dipilih merupakan node yang berharga terkecil.

Gambar 2.1. Uniform Cost Search (UCS)

Seperti tampak pada gambar, initial state terletak pada node start, kemudian untuk mencapai node berikutnya, algoritma ini memilih jalur yang memilki harga terkecil diantara dua node di depannya. Begitu seterusnya, dilakukan pengecekan node yang memilki harga terkecil hingga sampai pada goal state.

2.3. Bahasa Batak

Sebagian besar sastra Batak tidak pernah ditulis. Cerita-cerita rakyat dalam bentuk fabel, mitos dan legenda, umpama dan umpasa, torhan- torhanan, turiturian, huling-hulingan – semua itu tidak pernah ditulis, tetapi diturunkan secara lisan dari generasi ke generasi. Walaupun orang Batak sudah berabadabad memiliki tulisan tersendiri, mereka tidak pernah menggunakan sistem tulisannya untuk tujuan sehari-hari. Membuat catatan, mengeluarkan dokumen-dokumen, mencatat utang-piutang atau pengeluaran rumah-tangga, mencatat silsilah marganya – semuanya ini tidak pernah dilakukan dengan

(21)

9

Universitas Sumatera Utara menggunakan pena melainkan secara lisan saja. Orang Batak menggunakan tulisannya hanya untuk tiga tujuan:

1. Ilmu kedukunan 2. Surat-menyurat

3. Ratapan (hanya di Karo, Simalungun, dan Angkola-Mandailing)

Kelima suku Batak memiliki bahasa yang satu sama lain mempunyai banyak persamaan. Namun demikian, para ahli bahasa membedakan sedikitnya dua cabang bahasa-bahasa Batak yang perbedaannya begitu besar sehingga tidak memungkinkan adanya komunikasi antara kedua kelompok tersebut. Bahasa Angkola, Mandailing, dan Toba membentuk rumpun selatan, sedangkan bahasa Karo dan Pakpak-Dairi termasuk rumpun utara. Bahasa Simalungun sering digolongkan sebagai kelompok ketiga yang berdiri di antara rumpun utara dan rumpun selatan, namun menurut ahli bahasa Adelaar (1981) secara historis bahasa Simalungun merupakan cabang dari rumpun selatan yang berpisah dari cabang Batak Selatan sebelum bahasa Toba dan bahasa AngkolaMandailing terbentuk.

2.4. Graph

Graf adalah sebuah representasi abstrak dari himpunan objek yang saling terhubung. Objek atau simpul-simpul dalam graf disebut sebagai vertex, sedangkan garis yang menghubungkan simpul-simpul yang ada di dalam graf disebut sebagai edge. Menurut arahnya, graf dibedakan menjadi dua, yaitu directed graph dan undirected graph. Directed graph atau graf berarah adalah graf dimana semua edge yang ada di dalamnya mempunyai arah atau menunjuk kepada vertex yang lain, sedangkan undirected graph adalah graf dimana semua edge yang ada di dalamnya tidak mempunyai arah. Kedua jenis graf ini bisa muncul dalam satu graf sekaligus, yang kemudian disebut sebagai 'mixed graph'.

Untuk menggunakan graf ke dalam bahasa yang dimengerti oleh komputer, kita

(22)

Universitas Sumatera Utara perlu mencari representasi yang paling tepat dari graf. Berikut salah satu cara untuk merepresentasikan graf di komputer:

a. Graf tidak berarah (undirected graph)

Untuk graf tidak berarah, apabila ada hubungan dari sebuah node ke node lain, maka ada hubungan juga dari node lain ke node tersebut. Misalkan terdapat edge tidak berarah dari A ke B, maka edge tersebut direpresentasikan sebagai edge berarah dari A ke B sekaligus edge berarah dari B ke A. Berikut contoh representasi hubungan antara Dahlan dan teman-temannya.

b. Graf berarah (directed graph)

Untuk graf yang berarah, representasinya tidak dibuat seperti graf yang tidak berarah. Untuk jenis yang berarah ini, edge hanya dibuat satu arah saja.

2.5. Tree

Tree merupakan salah satu bentuk struktur data tidak linear yang

menggambarkan hubungan yang bersifat hirarkis (hubungan one to many) antara elemen-elemen. Tree bisa didefinisikan sebagai kumpulan simpul/node dengan satu elemen khusus yang disebut Root dan node lainnya terbagi menjadi himpunan-himpunan yang saling tak berhubungan satu sama lainnya (disebut subtree). Untuk jelasnya, di bawah akan diuraikan istilah-istilah umum dalam tree :

a. Prodecessor : Node yang berada diatas node tertentu.

b. Successor : Node yang berada di bawah node tertentu.

c. Ancestor : Seluruh node yang terletak sebelum node tertentu dan terletak pada jalur yang sama.

d. Descendant : Seluruh node yang terletak sesudah node tertentu dan terletak pada jalur yang sama.

(23)

11

Universitas Sumatera Utara e. Parent : Predecssor satu level di atas suatu node.

f. Child : Successor satu level di bawah suatu node.

g. Sibling : Node-node yang memiliki parent yang sama dengan suatu node.

h. Subtree : Bagian dari tree yang berupa suatu node beserta

descendantnya dan memiliki semua karakteristik dari tree tersebut.

i. Size : Banyaknya node dalam suatu tree.

j. Height : Banyaknya tingkatan/level dalam suatu tree.

k. Root : Satu-satunya node khusus dalam tree yang tak punya predecssor.

l. Leaf : Node-node dalam tree yang tak memiliki seccessor.

m. Degree : Banyaknya child yang dimiliki suatu node.

2.6. Penelitian Terdahulu

Penelitian yang dilakukan oleh Pathak et al pada tahun 2018 membandingkan beberapa algoritma pencarian yang termasuk ke dalam pencarian heuristic dan non heuristic pada kasus pathfinding. Hasil dari penelitian tersebut menyimpulkan bahwa algoritma UCS merupakan algoritma terbaik pada pencarian non heuristic karena proses pencarian yang tidak berurut membuat ruang pencarian lebih optimal sehingga pencarian akan lebih cepat.

(24)

Universitas Sumatera Utara

Tabel 2.1. Penelitian terdahulu No Judul

Penelitian

Peneliti Tahun Keterangan

1 Comparative Analysis of Search Algorithms

Maharshi J.

Pathak, et al

2018 algoritma UCS merupakan algoritma terbaik pada pencarian non heuristic karena proses pencarian yang tidak berurut membuat ruang pencarian lebih optimal sehingga pencarian akan lebih cepat

2 An Analysis of

BreadthFirst Beam

Search using Uniform Cost Trees

Sandip Aine , P.P.Chakrabarti

2013 menganalisi tentang penggunaan algoritma BFS yang diterapkan pada

algoritma UCS

(25)

BAB 3

ANALISIS DAN PERANCANGAN SISTEM

Bab ini akan membahas tentang implementasi algoritma yang digunakan untuk mengatasi masalah pencarian kata pada dokumen Bahasa Batak yang tidak berspasi. Adapun dua tahap yang akan dibahas pada bab ini, yaitu tahap analisis dan tahap perancangan sistem. Pada tahap analisis akan dilakukan analisa terhadap data yang digunakan untuk diproses dan dianalisis terhadap teknik maupun metode yang digunakan pada setiap langkah pemrosesan data. Pada tahap perancangan sistem akan dibahas mengenai perancangan tampilan antarmuka sistem.

3.1. Data Yang Digunakan

Pada penelitian ini penulis menggunakan tiga Bahasa Batak yaitu AngkolaMandailing, Simalungun dan Toba. Data input yang digunakan berupa file dokumen berekstensi .txt yang diperoleh dari buku “TRANSLITERASI DAN TERJEMAHAN NASKAH BATAK ANGKOLA”, “TRANSLITERASI DAN

TERJEMAHAN NASKAH BATAK SIMALUNGUN” dan

“TRANSLITERASI DAN TERJEMAHAN NASKAH BATAK TOBA” yang ditulis oleh Drs. Nelson Lumbantoruan, M.Hum. Lalu data input kedua untuk

Batak Angkola-Mandailing yang menggunakan tanda baca diambil dari buku

“HALILIAN : TURI-TURIAN NI HALAK SIPIROK BONGGO-BONGGO”

yang ditulis oleh Bapak Abdurrahman Ritonga. Kemudian beberapa naskah dalam buku tersebut di ketik ulang dan disimpan dengan ekstensi .txt.

Data kamus Angkola-Mandailing diperoleh dari buku “KAMUS INDONESIA - ANGKOLA” yang ditulis oleh Syahron Lubis, Syahruddin Lubis dan Mariahati J. Naibaho, data kamus Simalungun diperoleh dari buku

(26)

Universitas Sumatera Utara

“KAMUS BAHASA SIMALUNGUN-INDONESIA EDISI KEDUA” yang ditulis oleh Anharuddin Hutasuhut, Zufri Hidayat, Chairani Nasution, Sri Asrianti, Juliana dan Nurelide, data kamus Toba diperoleh dari buku “KAMUS BAHASA BATAK TOBA - INDONESIA” yang ditulis oleh Anggur P.

Tambunan.

Dalam penulisan bahasa Batak, dahulu dokumen ditulis menggunakan aksara Batak. Setelah melewati proses transliterasi (alih aksara) diperoleh naskah Bahasa Batak menggunakan huruf latin dan tanpa spasi. Maka naskah tersebut yang kemudian digunakan sebagai data input. Beberapa naskah yang digunakan pada penelitian ini dapat diilihat pada tabel 3.1.

(27)

15

Universitas Sumatera Utara Tabel 3.1. Contoh dokumen bahasa Batak yang digunakan

Bahasa Dokumen tanpa spasi Dokumen dengan spasi Mandailing Jabonarsanganadengganjadi

nitampulhontuhayunapirlain gsongonIanggougamoangko nnidugadojadibegumasaIma pandugaannaiahamuhalaksil amsipatnahubotosudemaha mumaninggalhonugamomun uharanibegumaIimatandana nadaposrohamunutusianggo hamihalakkaristenhumsaotih andohalahinamarbalikiadeba madungmulakmangokusalan ajatorophamipemadungsude mangulahisilamjabonarolom atutusongonImasomalmunu mudahisarmudanadaadongdi parmaraansilamhamutapimu damarsaeparbegusangamang alapdatuhamujatoroparophu dibaennahurangajardopeha midibaennasongonIjabonart utudonanidokmitapihuamba ngmadungngolngolanhamup ainteajardibaenlaingIdohube gehobar

Jabonar sanga na denggan jadi ni tampulhon tu hayu na pir laing songon I anggo ugamo angkon ni duga do jadi begu masa I ma pandugaanna ia hamu halak silam sipat na huboto sude ma hamu maninggalhon ugamo munu harani begu ma I ima tandana nada pos rohamunu tu si anggo hami halak karisten hum saotihan do halahi na marbalik ia deba madung mulak mangoku salana jatorop hami pe madung sude mangulahi silam jabonar olo ma tutu songon I ma somal munu muda hisar muda nada adong di parmaraan silam hamu tapi muda marsae parbegu sanga mangalap datu hamu jatorop arophu dibaen na hurang ajar dope hami dibaen na songon I jabonar tutu do na ni dok mi tapi huambang madung ngolngolan hamu painte ajar dibaen laing I do hubege hobar

(28)

Universitas Sumatera Utara Tabel 3.1. Contoh dokumen bahasa Batak yang digunakan (lanjutan)

Bahasa Dokumen tanpa spasi Dokumen

dengan spasi Mandailin

g

Diidaialantenaiias,marlindak nomasongonnabarudibasu.A langalangrohaniamasukHara nadiidaiapatdapardaparniak otor.“Polamahesiariadiau”,n ingrohania,“Dibotoiadoibah alaknaburju”“Botipejopdoro haniadiharorokku”.Dilaplap koniadohotmakkurpiskurpis konpalakpaknipatniaiTulapn adibaensiangoniNapayakdig injangnitanggaiAtcoulangpa lanakotortupatnialahomakku ling“Assalamualaikum”Tor usmangalakkatubagasan.“W aalaikumsalam”,ninnamang alussianbagasan.“Bo!,masuk

madaho,ulangpolamaralangalangko.Humhitadodiso n“Pa la,sumbayangmojoloatcoma

nganhita”NinganakboruIbia manaramasajo.

Diida ia lantena i ias, marlindak noma songon na baru dibasu.

Alang - alang roha nia masuk Harana diida ia pat dapar- dapar nia kotor.

“Pola mahe siar ia di au”, ning roha nia, “Diboto ia do iba halak na burju” “Botipe jop do roha nia di harorokku”. Dilap - lapkon ia dohot makkurpis - kurpiskon

palakpak ni pat nia i Tu lap na dibaen sian goni Na payak di ginjang ni tangga i Atco ulang pala na kotor tu pat nia laho makkuling

“Assalamualaiku

m” Torus

mangalakka tu bagasan.

“Waalaikum salam”, ninna mangalus sian bagasan. “Bo !, masuk mada ho, ulang pola maralang-

alangko. Hum hita

(29)

17

Universitas Sumatera Utara do di son “Pala, sumbayang mo jolo atco mangan hita” Ning anakboru I biama na rama sajo.

Simalu- ngun

Garobungbisaraompunihor boinonJahaporbuhithutalim barusohaiananhutainonJah apangaseumesojadihitadapo tanumelamasahitadapotanJ ahamortomubayumateheladi longlongantaborunahapilin aJahanurunnamatedihuttina asingnamatenaJahaporjadit ambalikjadaditanningondito pakrabuitopakrabusigursaa

sahitamorayandarohasapoh ulpusuhhorboinon

Garobung bisara ompu ni horbo inon. Jaha porbuhit huta limbaru so haianan huta inon. Jaha pangase ume so jadi hita dapotan ume lama sa hita dapotan. Jaha mortomu bayu mate hela di longlonganta boruna hapilina.

Jaha nurun na mate dihutti na asing na matena.

Jaha porjadi tambalik jada di

(30)

Universitas Sumatera Utara tanningon ditopak rabu itopak rabu si gursa asa hita morayan daroh asa pohul pusuh horbo inon

...

Tabel 3.1. Contoh dokumen bahasa Batak yang digunakan (lanjutan) File Dokumen tanpa spasi Dokumen dengan spasi Toba sautmanasidamanjuhutihula

huladiadatnagok.hodomamb irongibohinamarhiteaong?h odomandaeigoarnihutaondih utasada.parjahatdomandang gurijabumnabodari.bolanna mamastapianaknidebadoula onna.holannamanuratikarejo m,lalapndangmangan.ibana manangkulisabana.ndanglup aibanamangararaisisilonnaas auli.ibanamarajapanungkuna nnasaimanuturipanghataion.

ulaononmanadigoarimangul oasitondimiboruasamardian gkaabara.

Sautma nasida manjuhuti hulahula di adat na gok. Ho do mambirongi bohina marhite agong? Ho do mandaei goar ni huta on di huta sada. Parjahatdo mandangguri jabum nabodari.

Bolan na mamastapi anak ni deba do ulaonna. Holan na manurati karejom, lalap ndang mangan.

Mansohot ibana manangkuli sabana. Ndang lupa ibana mangararai sisilonna asa uli.Ibanama raja panungkunan

na sai manuturi

panghataion.Ulaon on ma na digoari manguloasi tondi mi boru asa mardiangka abara.

(31)

19

Universitas Sumatera Utara 3.2. Analisis Sistem

Sistem ini dibangun untuk menyelesaikan permasalahan pencarian kata pada dokumen tidak berspasi yang selama ini dilakukan secara manual karena data yang diperoleh merupakan data hasil transliterasi yang bersumber dari naskah kuno. Sistem akan melakukan pencarian kata pada file dokumen Bahasa Batak dan identifikasi bahasa secara otomatis yang kemudian akan di terjemahkan ke dalam Bahasa Indonesia.

Algoritma yang diajukan untuk proses pencarian kata pada dokumen yang tidak berspasi ini merupakan algoritma Uniform Cost Search (UCS).

3.2.1. Arsitektur Umum

Adapun arsitektur umum pada sistem pencarian kata dan deteksi bahasa Batak pada penelitian ini dapat dilihat pada gambar 3.1.

Gambar 3.1. Arsitektur umum

(32)

Universitas Sumatera Utara 3.2.1.1. Input

Proses awal yang dilakukan yaitu memasukkan file dokumen teks Bahasa Batak tanpa spasi berekstensi .txt. File di masukkan kemudian di olah oleh sistem.

3.2.1.2. Preprocessing

Pada tahap ini dilakukan pembacaan dokumen input kemudian dokumen akan di pecah menjadi kumpulan kata. Kata-kata tersebut merupakan kata yang ada didalam dokumen input sehingga pada proses pencarian kata hanya membutuhkan waktu yang sedikit.

3.2.1.3. Process

Setelah tahapan preprocessing selesai maka dilanjutkan pada tahapan pencarian kata, identifikasi bahasa dan penerjemahan dokumen.

A. Pencarian kata dan identifikasi bahasa

Dari tahapan preprocessing diperoleh hasil berupa kumpulan kata yang ada pada dokumen input. Hasil tersebut dibagi dua sehingga menghasilkan dua kumpulan kata. Pada kumpulan kata pertama akan dilakukan proses pencarian kata dengan menggunakan algoritma Uniform Cost Search (UCS). Pencarian kata dilakukan pada semua kamus bahasa Batak. Contoh pencarian kata menggunakan UCS tree dapat dilihat pada gambar 3.2.

Pada gambar berikut diberikan sebuah contoh tree yang terbentuk dari data input “onmasurat” yang nantinya akan menghasilkan output “on ma surat”.

(33)

21

Universitas Sumatera Utara Gambar 3.2. UCS Tree

Pada gambar diatas tahapan pertama yang dilakukan yaitu mencari cost (nilai) terpanjang yang di dapat dengan cara menjumlahkan banyaknya karakter pada sebuah kata sehingga didapat cost terbesar yang menandakan bahwa pencarian kata terhadap data input tidak memiliki sisa.

Tahapan-tahapan yang dilakukan pada proses pencarian kata ialah :

1. Cek kumpulan kata yang didapat pada tahap preprocessing dengan dokumen input. Pada kasus diatas kata yang dihasilkan dari preprocessing adalah

“on”,”ma”, ”ra”,”masu”,”sura”,”urat”,”surat”. Kemudian kumpulan kata yang sudah di dapat dicocokkan satu per satu ke dalam data input.

2. Menerapkan algoritma Uniform Cost Search (UCS) dengan cara memberikan cost (nilai) untuk setiap node pada tree sesuai dengan jumlah karakter kata pada node. Untuk menghitung total cost, maka jumlah karakter kata pada node akan ditambahkan dengan cost sebelumya.

Contoh : Pengecekan 1

Input : onmasurat Cek : on

(34)

Universitas Sumatera Utara Kata pertama pada kumpulan kata yaitu “on” memiliki panjang karakter

sama dengan dua, kemudian dua karakter awal pada data input akan dicek apakah sama atau tidak, jika sama maka kata “on” akan dijadikan sebagai node pada tree. Jika tidak sama maka pengecekan akan dilanjutkan pada kata selanjutnya dalam kumpulan kata.

Gambar 3.3. UCS Pengecekan 1 Pengecekan 2

Input : masurat Cek : on

Kata pertama pada kumpulan kata yaitu “on” tidak sama dengan dua karakter awal pada input.

Pengecekan 3 Input : masurat Cek : ma

Kata kedua pada kumpulan kata yaitu “ma” sama dengan dua karakter awal pada data input, maka kata “ma” akan dijadikan sebagai node pada

tree.

(35)

23

Universitas Sumatera Utara Gambar 3.4. UCS Pengecekan 3

Pengecekan 4 Input : masurat Cek : ra

Kata pertama pada kumpulan kata yaitu “ra” tidak sama dengan dua karakter awal pada input. Pengecekan 5

Input : masurat Cek : masu

Kata keempat pada kumpulan kata yaitu “masu” sama dengan empat karakter awal pada data input, maka kata “masu” akan dijadikan sebagai

node pada tree.

Gambar 3.5. Pengecekan 5 Pengecekan 6

Input : surat Cek : on

Kata pertama pada kumpulan kata yaitu “on” tidak sama dengan dua karakter awal pada input.

Pengecekan 7 Input : surat Cek : ma

Kata kedua pada kumpulan kata yaitu “ma” tidak sama dengan dua karakter awal pada input.

(36)

Universitas Sumatera Utara Pengecekan 8

Input : surat Cek : ra

Kata ketiga pada kumpulan kata yaitu “ra” tidak sama dengan dua karakter awal pada input.

Pengecekan 9 Input : surat Cek : masu

Kata keempat pada kumpulan kata yaitu “masu” tidak sama dengan empat karakter pada input.

awal

Pengecekan 10 Input : surat Cek : sura

Kata kelima pada kumpulan kata yaitu “sura” sama dengan dua karakter awal pada data input, maka kata “sura” akan dijadikan sebagai node pada tree.

Gambar 3.6. Pengecekan 10

(37)

25

Universitas Sumatera Utara Pengecekan 11

Input : surat Cek : urat

Kata keenam pada kumpulan kata yaitu “urat” tidak sama dengan empat karakter awal pada input.

Pengecekan 12 Input : surat Cek : surat

Kata ketujuh pada kumpulan kata yaitu “surat” sama dengan lima karakter awal pada data input, maka kata “surat” akan dijadikan sebagai node pada tree.

Gambar 3.7. Result

Karena input sudah tidak memiliki sisa, maka pencarian kata selesai. path (jalur) yang akan diambil adalah path yang paling pendek dengan cost terbesar yaitu 2 – 4 – 9.

Setelah urutan kata pada setiap kamus bahasa batak ditemukan kemudian dilanjutkan dengan proses identifikasi bahasa. Sistem akan mengidentifikasi bahasa yang digunakan pada dokumen tersebut dengan

(38)

Universitas Sumatera Utara cara membandingkan semua hasil pencarian kata. Pada kasus ini terdapat

tiga kamus yang digunakan yaitu kamus bahasa Mandailing, Toba dan Simalungun. Apabila perbandingan dari ketiga hasil tersebut cukup signifikan maka nilai akurasi tertinggilah yang akan teridentifikasi sebagai bahasa yang digunakan pada dokumen dan Apabila perbandingannya tidak terlalu jauh sesuai kriteria yang telah ditentukan maka akan dilakukan proses identifikasi ulang menggunakan kedua kumpulan kata. Hasil identifikasi bahasa yang diperoleh nantinya adalah hasil pencarian kata yang memiliki akurasi paling tinggi. Setelah didapat urutan kata yang tepat sesuai dengan hasil identifikasi, maka kemudian ditambahkan spasi di antara susunan kata tersebut.

Susunan kata : “on”,”ma”,”surat”.

Output : on ma surat B. Terjemah

Setelah proses penambahan spasi dilakukan maka proses selanjutnya adalah penerjemahan dokumen. Pada proses terjemah ini sistem hanya akan menerjemah kata sesuai dengan arti yang ada di dalam kamus, dalam artian proses terjemah ini tidak membahas tentang makna kalimat. Apabila terdapat kata yang tidak ada didalam kamus seperti nama daerah, nama orang ataupun kesalahan penulisan dalam dokumen maka pada proses pencarian dan pencocokkan kata, sistem akan mendapati kata yang hanya terdapat didalam kamus saja.

Contoh kata yang tidak ada di dalam kamus : 1) Nama kota

Input : pajumpangmahalahidisidimpuan Spasi : pajumpang ma halahi di si di an

Terjemahan aplikasi : berjumpalah mereka pada si pada sana Terjemahan buku : berjumpalah mereka di Padang Sidimpuan

(39)

27

Universitas Sumatera Utara 2) Nama orang

Input : Jabonarjobdorohangkumidaho Spasi : bona job do rohangku mida ho

Terjemahan aplikasi : awal senang lah hatiku melihat kamu Terjemah buku : Jabonar senang hatiku melihatmu

3.2.1.4. Output

File dokumen Bahasa Batak yang telah melalui proses di atas akan menghasilkan sebuah file dokumen yang telah ditambahkan spasi dan juga sudah di terjemahkan ke dalam bahasa Indonesia. Hasil yang diperoleh berupa file berekstensi .txt.

3.2.2. Activity Diagram

Activity diagram menggambarkan tentang aktifitas yang terjadi pada system dari pertama sampai akhir, diagram ini menunjukkan langkah – langkah dalam proses kerja sistem yang kita buat. Sebagai contoh, langkah – langkah memasak air. Tetapi kita akan menjelaskannya dengan bentuk grafik.

Struktur diagram ini juga mirip dengan flowchart. Adapun beberapa fungsi dari activity diagram ialah:

a. Menggambarkan proses bisnis dan urutan aktivitas dalam sebuah proses b. Memperlihatkan urutan aktifitas proses pada sistem

c. Activity diagram dibuat berdasarkan sebuah atau beberapa use case pada use case diagram

3.2.3.1. Activity Diagram Halaman Utama

Pada activity diagram Halaman utama akan menampilkan alur dari proses pencarian kata yang dimulai saat user mengklik button choose file. Kemudian akan muncul nama file yang telah dipilih, ketika user mengklik button read

(40)

Universitas Sumatera Utara file maka sistem akan menampilkan isi dari dokumen tersebut. Kemudian

terdapat button add spasces yang apabila di klik maka sistem akan mengidentifikasi bahasa yang digunakan pada dokumen input dan juga menampilkan tree dari kumpulan kata yang ada pada dokumen input. Setelah itu sistem akan menambahkan spasi pada dokumen input. Proses selanjutnya user memilih file untuk dijadikan sebagai perbandingan dalam pencarian akurasi dan sistem akan menampilkan hasil akurasi dokumen input. Proses terakhir yang dilakukan yaitu user mengklik button terjemah kemudian sistem akan menerjemahkan dokumen input yang telah diberi spasi. Diagram aktivitas Translate dapat dilihat pada gambar 3.8.

(41)

29

Universitas Sumatera Utara

Gambar 3.8. Activity Diagram

Gambar 3.5. Activity Diagram

(42)

Universitas Sumatera Utara 3.2.3. Flowchart

Proses pengujian pada sistem terdiri dari beberapa langkah diantaranya yaitu : 1. Masukkan dokumen bahasa batak berupa file .txt

2. Kemudian akan sistem akan mengidentifikasi apakah file input berupa .txt atau bukan. Jika file berekstensi .txt maka sistem akan menampilkan isi dari file .txt input, jika bukan .txt maka user harus memasukkan dokumen lain yang berekstensi .txt

3. Kemudian sistem akan mencari kata apa saja yang terdapat didokumen input dengan mencocokkannya kedalam kamus.

4. Setelah itu, sistem akan menerapkan algoritma Uniform Cost Search (UCS) untuk mencari urutan kata yang tepat sesuai bahasa batak yang digunakan pada setiap kamus bahasa Batak.

5. Setelah urutan kata didapat, maka sistem akan mengidentifikasi bahasa apa yang digunakan oleh dokumen input dengan cara menghitung akurasi pada masing-masing urutan kata bahasa batak. Kemudian akan ditambahkan spasi pada setiap kata yang bertujuan untuk memudahkan pembaca dalam memahami bahasa batak yang sebelumnya tanpa spasi.

6. Kemudian sistem akan menghitung akurasi dari dari urutan kata yang didapat dengan cara membandingkan hasil pemberian spasi oleh sistem dengan hasil pemberian spasi yang dilakukan oleh ahli.

7. Langkah terakhir yang dilakukan oleh sistem yaitu menerjemahkan hasil pemberian spasi ke dalam bahasa Indonesia dengan cara mencari kecocokan kata pada kamus yang mengandung terjemahan bahasa Indonesia untuk setiap kata yang ada pada hasil sebelumnya.

Adapun alur proses yang dilakukan oleh sistem bisa dilihat pada gambar 3.9.

(43)

31

Universitas Sumatera Utara Gambar 3.9. Alur proses pada sistem

(44)

Universitas Sumatera Utara

3.3. Perancangan Antarmuka Sistem 3.3.1. Rancangan Halaman Utama

Sistem ini hanya memiliki satu halaman yaitu halaman utama. Ketika user menjalankan aplikasi maka halaman pertama yang akan muncul yaitu halaman utama. Halaman ini berisikan proses untuk mencari kata, mengidentifikasi bahasa Batak yang akan menjadi dokumen input,menambahkan spasi pada dokumen input, menghitung akurasi dan menerjemahkan dokumen hasil penambahan spasi. Rancangan halaman ini dapat dilihat pada gambar 3.10.

Gambar 3.10. Rancangan halaman utama

Keterangan :

1. Button choose file : Menampilkan halaman untuk memilih file dokumen yang akan di input dari perangkat user.

2. Text field : Menampilkan nama file yang akan di read.

3. Button browse : mencari file .txt pada komputer untuk dijadikan sebagai input.

(45)

33

Universitas Sumatera Utara 4. Text area : menampilkan isi dari file input.

5. Button cari spasi : melakukan proses pencarian kata pada file input kemudian menambahkan spasi.

6. Text area : menampilkan hasil dari penambahan spasi.

7. Button terjemah : melakukan proses terjemah ke dalam bahasa Indonesia pada data yang sudah ditambahkan spasi.

8. Text area : menampilkan hasil dari terjemahan .

9. Axes : menampilkan tree dari kumpulan kata pada data input.

10. Button browse : mencari file .txt data input dengan spasi pada komputer untuk dibandingkan dengan hasil penambahan spasi pada proses cari spasi.

11. Text field : Menampilkan nama file dari data input yang sudah berspasi.

12. Text field : menampilkan hasil akurasi dalam persen (%). 13. Text field : menampilkan hasil dari identifikasi bahasa batak yang

digunakan pada dokumen input.

(46)

BAB 4

IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini berisi pembahasan tentang implementasi dari perancangan yang telah dijelaskan pada Bab 3. Dalam penelitian ini, tahap preprocessing, proses, dan seluruh metode yang digunakan akan diimplementasikan ke dalam sistem menggunakan matlab sesuai dengan perancangan yang telah dilakukan. Selain itu, prosedur operasional dari aplikasi yang dirancang, tahapan pengujian yang dilakukan, serta hasil yang didapat dari setiap pengujian akan dijelaskan pada bab ini.

4.1 Spesifikasi Perangkat Keras dan Perangkat Lunak yang digunakan Adapun spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk membangun sistem akan dijelaskan pada bagian ini.

4.1.1. Kebutuhan Perangkat Keras

Spesifikasi perangkat keras yang digunakan untuk membangun sistem adalah sebagai berikut:

1. Prosessor Intel(R) Core(TM) i3-4005U CPU @ 1.70GHz 2. Kapasitas harddisk 500GB

3. Memory (RAM) 4 GB 4. Mouse dan Keyboard 4.1.2. Kebutuhan Perangkat Lunak

Spesifikasi perangkat lunak yang digunakan untuk membangun sistem adalah sebagai berikut:

1. Sistem operasi Windows 10 pro 64-bit 2. Matlab R201

(47)

35

Universitas Sumatera Utara 4.2. Implementasi Tampilan Antarmuka

Pada saat aplikasi pertama kali di jalankan maka halaman pertama yang muncul adalah halaman utama, halaman ini memuat semua proses yang terdapat didalam aplikasi.

Gambar 4.1. Halaman utama

4.3. Implementasi Data

Data yang dimasukkan ke dalam sistem adalah data dengan format .txt yang bersumber dari dari buku “TRANSLITERASI DAN TERJEMAHAN

NASKAH BATAK ANGKOLA”, “TRANSLITERASI DAN TERJEMAHAN NASKAH BATAK SIMALUNGUN” dan “TRANSLITERASI DAN

TERJEMAHAN NASKAH BATAK TOBA” yang ditulis oleh Drs. Nelson Lumbantoruan. Rangkuman data dapat dilihat pada table 4.1.

(48)

Universitas Sumatera Utara Tabel 4.1. Rangkuman data dokumen bahasa Batak

File Dokumen tanpa spasi Dokumen dengan spasi Man1.txt Jabonarsanganadengganjadinita

mpulhontuhayunapirlaingsongon Ianggougamoangkonnidugadoja dibegumasaImapandugaannaiaha muhalaksilamsipatnahubotosude mahamumaninggalhonugamomu nuharanibegumaIimatandananad aposrohamunutusianggohamihal akkaristenhumsaotihandohalahin amarbalikiadebamadungmulakm angokusalanajatorophamipemad ungsudemangulahisilamjabonaro lomatutusongonImasomalmunu mudahisarmudanadaadongdipar maraansilamhamutapimudamars aeparbegusangamangalapdatuha mujatoroparophudibaennahurang ajardopehamidibaennasongonIja bonartutudonanidokmitapihuam bangmadungngolngolanhamupai nteajardibaenlaingIdohubegehob arnihalaknaduapulutaonsadamus esian

dialaknadapotajarIjatoroptaiadon gdogurunamiangkamalimdohotb aleodungIdibotohodohitabnamin amargoaralquran

Jabonar sanga na denggan jadi ni tampulhon tu hayu na pir laing songon I anggo ugamo angkon ni duga do jadi begu masa I ma pandugaanna ia hamu halak silam sipat na huboto sude ma hamu maninggalhon ugamo munu harani begu ma I ima tandana nada pos rohamunu tu si anggo hami halak karisten hum saotihan do halahi na marbalik ia deba madung mulak mangoku salana jatorop hami pe madung sude mangulahi silam jabonar olo ma tutu songon I ma somal munu muda hisar muda nada adong di parmaraan silam hamu tapi muda marsae parbegu sanga mangalap datu hamu jatorop arophu dibaen na hurang ajar dope hami dibaen na songon I jabonar tutu do na ni dok mi tapi huambang madung ngolngolan hamu painte ajar dibaen laing I do hubege hobar ni halak na dua pulu taon sada muse sian dia lakna dapot ajar I jatorop tai adong do guru nami angka malim dohot baleo dung I diboto ho do hitab na mi na margoar alquran

(49)

37

Universitas Sumatera Utara Tabel 4.1. Rangkuman data dokumen bahasa Batak (lanjutan)

File Dokumen tanpa spasi Dokumen

dengan spasi Man2.

txt

Diidaialantenaiias,marlindakno

masongonnabarudibasu.AlangalangrohaniamasukHaranad iida iapatdapardaparniakotor.“Polamahesiaria

diau”,ningrohania,“Dibotoiadoi bahalaknaburju”“Botipejopdor

ohaniadiharorokku”.Dilaplapkoniadohotmakkurpiskurpisk onpalakpaknipatniaiTul apnadibaensiangoniNapayakdi ginjangnitanggaiAtcoulangpala

nakotortupatnialahomakkuling“

Assalamualaikum”Torusmanga lakkatubagasan.“Waalaikumsal am”,ninnamangalussianbagasa n.“Bo!,masukmadaho,ulangpol

amaralangalangko.Humhitadodison“Pala, sumbayangmojoloatcomanganh

ita”NinganakboruIbiamanaram asajo.

Diida ia lantena i ias, marlindak noma songon

na baru

dibasu. Alang - alang roha nia masuk Harana diida ia pat dapar- dapar nia kotor. “Pola mahe siar ia di au”, ning roha nia,

“Diboto ia do iba halak na burju”

“Botipe jop do roha nia di harorokku”.

Dilap -

lapkon ia dohot

makkurpis - kurpiskon palakpak ni pat nia i Tu lap na dibaen sian goni Na payak di ginjang ni tangga i Atco ulang pala na kotor tu pat nia laho makkuling

“Assalamuala

(50)

Universitas Sumatera Utara ikum” Torus mangalakka tu bagasan.

“Waalaikum salam”, ninna mangalus sian bagasan.

“Bo !, masuk mada ho, ulang pola maralang- alangko. Hum hita do di son

“Pala, sumbayang mo jolo atco mangan hita”

Ning

anakboru I biama na rama sajo.

Sim1.

txt

Garobungbisaraompunihorboi nonJahaporbuhithutalimbaruso haiananhutainonJahapangaseu mesojadihitadapotanumelamas ahitadapotanJahamortomubay umateheladilonglongantaborun ahapilinaJahanurunnamatedih uttinaasingnamatenaJahaporja ditambalikjadaditanningondito pakrabuitopakrabusigursaasah

itamorayandarohasapohulpusu hhorboinon

Garobung bisara ompu ni horbo inon.

Jaha porbuhit huta limbaru so haianan huta inon.

Jaha pangase ume so jadi hita dapotan ume lama sa hita dapotan.

Jaha mortomu bayu mate

hela di

longlonganta boruna hapilina.

Jaha nurun

(51)

39

Universitas Sumatera Utara

na mate

dihutti na asing na matena. Jaha porjadi tambalik jada di tanningon ditopak rabu itopak rabu si gursa asa hita morayan daroh asa pohul pusuh horbo inon

...

Tabel 4.1. Rangkuman data dokumen bahasa Batak (lanjutan) File Dokumen tanpa spasi Dokumen dengan spasi Tob5.txt sautmanasidamanjuhutihulahula

diadatnagok.hodomambirongibo hinamarhiteaong?hodomandaeig oarnihutaondihutasada.parjahatd omandanggurijabumnabodari.bo lannamamastapianaknidebadoula onna.holannamanuratikarejom,la lapndangmangan.ibanamanangk ulisabana.ndanglupaibanamanga raraisisilonnaasauli.ibanamaraja panungkunannasaimanuturipang hataion.ulaononmanadigoariman guloasitondimiboruasamardiang kaabara.

Sautma nasida manjuhuti hulahula di adat na gok. Ho do mambirongi bohina marhite agong? Ho do mandaei goar ni huta on di huta sada. Parjahatdo mandangguri jabum nabodari.

Bolan na mamastapi anak ni deba do ulaonna. Holan na manurati karejom, lalap ndang mangan.

Mansohot ibana manangkuli sabana. Ndang lupa ibana mangararai sisilonna asa uli.Ibanama raja panungkunan

na sai manuturi

panghataion.Ulaon on ma na digoari manguloasi tondi mi boru asa mardiangka abara.

(52)

Universitas Sumatera Utara 4.4. Prosedur Operasional

Ketika aplikasi di jalankan halaman pertama yang akan muncul yaitu halaman utama yang dapat dilihat pada gambar 4.1. Pada halaman ini pengguna langsung dapat berinteraksi dengan sistem untuk melakukan berbagai proses.

Ketika pengguna sudah berada di halaman utama maka pengguna bisa langsung menerjemahkan teks. Langkah pertama yang harus dilakukan pengguna yaitu dengan mengklik button browse yang dapat dilihat pada gambar 4.2.

Setelah tombol browse ditekan, maka sistem akan meminta user untuk

memasukkan data .txt yang akan digunakan sebagai input seperti yang terlihat pada gambar 4.3.

Gambar 4.2. Browse file

(53)

41

Universitas Sumatera Utara Gambar 4.3. pilih file .txt

Pada gambar 4.3. penulis mengambil contoh file .txt yaitu man2.txt kemudian klik button open maka akan muncul nama file yang sudah dipilih dan sistem secara otomatis membaca isi dari dokumen input seperti yang terlihat pada gambar 4.4.

Gambar 4.4. Read file .txt

(54)

Universitas Sumatera Utara

Dokumen input yang digunakan yaitu dokumen bahasa batak Mandailing, Simalungun dan Toba yang belum memiliki spasi seperti yang terlihat pada gambar 4.5.

Gambar 4.5. man2.txt

Setelah dilakukan input dokumen, selanjutnya dilakukan input file dari pakar yang digunakan sebagai acuan untuk menentukan akurasi dengan membandingkannya dengan file input dengan cara pilih file data akurasi yang diperoleh dari pakar seperti terlihat pada gambar 4.6.

file yang akan dipilih harus sesuai dengan dokumen input agar tidak terjadi kesalahan dalam perhitungan akurasi. File yang digunakan untuk mengecek akurasi pada dokumen input man2.txt adalah output_man2.txt. pilih file output_man2.txt.

Gambar 4.6. Browse file pakar

(55)

43

Universitas Sumatera Utara Gambar 4.7. Pilih file output_man2.txt

Setelah itu pengguna dapat mengklik button cari spasi untuk melakukan beberapa proses pada sistem diantaranya pencarian kata dengan menggunakan algoritma Uniform Cost Search (UCS), identifikasi bahasa berdasarkan akurasi yang diperoleh pada setiap urutan kata dan menambahkan spasi pada dokumen.

Hasil dari proses tersebut dapat dilihat pada gambar 4.8.

(56)

Universitas Sumatera Utara Gambar 4.8. Cari spasi

Hasil dari penambahan spasi pada proses cari spasi bisa dilihat dengan jelas pada gambar 4.9.

Gambar 4.9. Hasil penambahan spasi

Kemudian sistem juga akan menampilkan tree dari proses pencarian kata untuk mendapatkan urutan kata yang tepat, bisa dilihat pada gambar 4.10. Tree pada aplikasi ini merupakan penerapan dari algoritma Uniform Cost Search(UCS).

Dimana tree terdiri dari banyak node seperti yang terlihat pada gambar 4.10.

yaitu titik merah dan titik biru. Titk - titik ini merupakan implementasi dari urutan kata pada dokumen yang tidak memiliki spasi. Dengan menggunakan

(57)

45

Universitas Sumatera Utara algoritma UCS sistem bisa mencari path (jalur) yang tepat dalam mencari urutan kata yang paling baik. Titk merah merupakan urutan kata yang dipilih karena memiliki cost (nilai) yang paling besar yang memungkinkan kumpulan kata pada dokumen input tidak memiliki sisa. Titik biru merupakan node yang salah atau node buntu. Jika path buntu maka algoritma UCS akan mencari node lain yang memungkinkan untuk mendapatkan path yang lebih panjang agar semua kata yang ada pada dokumen input bisa ditelusuri tanpa meninggalkan sisa.

Gambar 4.10. Pencarian kata degan tree Setelah

memilih file data akurasi sebelumnya, maka sistem melakukan perhitungan akurasi dari penambahan spasi dengan cara menghitung banyaknya jumlah kata yang sama pada dokumen hasil penambahan spasi oleh sistem dengan hasil dari pakar. akurasi diperoleh dari persamaan 4.1.

Jumlah kata yang cocok pada data input

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = x 100%

Jumlah semua kata pada data input

(58)

Universitas Sumatera Utara Dengan menggunakan data input yaitu man2.txt dan data pakar output_man.txt, maka diperoleh akurasi sebesar 88.23 %, seperti yang terlihat pada gambar 4.11.

Selain itu, sistem juga akan menampilkan hasil dari identifikasi bahasa berdasarkan akurasi yang diperoleh pada setiap kamus bahasa batak. Hasil indentifikasi bahasa bisa dilihat pada gambar 4.12.

Tahapan terakhir pada aplikasi ini yaitu proses terjemahan dengan mengklik tombol terjemah maka sistem akan menerjemahkan dokumen hasil penambahan spasi ke dalam bahasa Indonesia yang dapat dilihat pada gambar 4.13.

Gambar 4.11. Hasil akurasi

Gambar 4.12. Hasil identifikasi bahasa

(59)

47

Universitas Sumatera Utara Gambar 4.13. Proses terjemah

Hasil dari penerjemahan dokumen bisa dilihat dengan jelas pada gambar 4.14.

Proses penerjemahan dokumen dilakukan hanya dengan cara mencari arti dari setiap kata yang ada pada dokumen hasil cari spasi secara berurut. Oleh karena itu pada proses terjemahan ini belum menggunakan makna kalimat.

Gambar 4.14. Hasil terjemah

4.5. Pengujian sistem

Pengujian sistem dilakukan untuk mengetahui seberapa besar akurasi sistem dan apakah kinerja sistem sudah sesuai dengan yang di inginkan. Pada tahap ini akan

(60)

Universitas Sumatera Utara dilakukan pengujian terhadap data dan sistem. Data hasil pengujian yang diperoleh dari sistem dapat dilihat pada gambar 4.15.

Gambar 4.15. Hasil pengujian sistem

Pengujian serta perbandingan data hasil dari sistem dengan data dari pakar dapat dilihat pada Tabel 4.2. yang merupakan data dengan akurasi tertinggi pada kamus mandailing sehingga kamus yang digunakan adalah kamus bahasa Mandailing.

Tabel 4.2. Perbandingan hasil sistem dengan data pakar Data Hasil pemberian

spasi Oleh Sistem

Data dari pakar Keterangan (Kata yang beda) Man2.txt bona job do Jabonar job do 1. bona = jabonar

(61)

49

Universitas Sumatera Utara rohangku mida ho

ale anggi dibaen madung sai honos nada marsipaidaan hita satorop olo ma tutu angkang lobi arophu dua ta on dung huida hona parpudi di dolok an biado anggi

rohangku mida ho ale anggi dibaen madung sai honos nada marsipaidaan hita satorop olo ma tutu angkang lobi arophu dua taon dung huida ho na parpudi di dolok an biado anggi

2. ta on = taon 3. hona = ho na

Berdasarkan tabel 4.2 dapat dilihat bahwa data hasil pengujian oleh sistem pada data Man2.txt yang menghasilkan akurasi tertinggi. Untuk menghitung akurasi dapat menggunakan persamaan 4.1 sebagai berikut :

Jumlah kata yang cocok pada data input

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = x 100%

Jumlah kata pada data input 𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = x 100%

𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 88.23%

Berikut merupakan hasil keseluruhan data yang diuji pada sistem yang dirangkum dalam table 4.3.

(62)

Universitas Sumatera Utara Tabel 4.3. Hasil pengujian semua data

No Nama File Hasil Identifikasi Akurasi (%) 1 Man1.txt Bahasa

mandailing

88,67

2 Man2.txt Bahasa mandailing

88,23

Tabel 4.3. Hasil pengujian semua data (lanjutan)

No Nama File Hasil Identifikasi Akurasi (%)

3 Man3.txt Bahasa

mandailing

92,76

4 Man4.txt Bahasa

mandailing

92,21

5 Man5.txt Bahasa

mandailing

89,14

6 Tob1.txt Bahasa Toba 91,28

7 Tob2.txt Bahasa Toba 84,44

8 Tob3.txt Bahasa Toba 89,91

9 Tob4.txt Bahasa Toba 87,92

10 Tob5.txt Bahasa Toba 97,6

11 Sim1.txt Bahasa

simalungun

84,61

12 Sim2.txt Bahasa toba 65,23

13 Sim3.txt Bahasa

simalungun

87,98

Gambar

Tabel 2.1. Penelitian terdahulu   No   Judul
Gambar 3.6. Pengecekan 10
Gambar 3.8. Activity Diagram
Gambar 3.10. Rancangan halaman utama
+5

Referensi

Dokumen terkait

Alhamdulillah untuk melandasi tugas dan kewajiban baik pengurus maupun anggotanya maka dibuatlah Anggaran Dasar dan Anggaran Rumah Tangga Paguyuban yang telah dibahas

Dalam memulai suatu perjalanan mengejar goal, individu dengan harapan kuat menganggap hal-hal yang menunggu di depan merupakan sebuah tantangan, dan hal ini mereka

Mengisi format wajib sesuai dengan indikator yang ditetapkan di dalam Kotrak Kinerja Rektor. Capaian UB terhadap Kontrak Kinerja Rektor UB Tahun Anggaran 2014 adalah cerminan

Tugas akhir ini merupakan bagian dari kurikulum yang harus diselesaikan untuk memenuhi persyaratan menyelesaikan pendidikan Sarjana Strata Satu (S-1) di Departemen

Berdasarkan hasil penelitian yang telah dilakukan dan uraian pembahasan, maka diperoleh kesim- pulan sebagai berikut:Proses pem- belajaran dengan model pembelajar- an

1.1.1 Mampu mangaplikasikan keahlian ber basis ilmu Teknik Fisika: yang mer upakan per paduan (blended) antar a kemampuan fisika dan matematika yang kuat dengan dasar – dasar

Dalam Tugas Akhir ini akan menganalisis hasil pengukuran RSCP dan Ec/No dengan menggunakan Model Propagasi indoor COST-231 dan ITU-R yang digunakan untuk

kegiatan Posyandu dan perlu jadwal yang teratur dalam. pelaksanaan