Implementasi Global Tresholding Metode Otsu dan Tesseract Engine dengan Algoritma Horspool untuk Menerjemahkan Kata Berbahasa Jepang Jenis Katakana

(1)

vii

ABSTRAK

Bahasa Jepang merupakan salah satu bahasa yang paling sering digunakan di dunia yaitu pada urutan kesembilan, sehingga dibutuhkan pengetahuan mengenai bahasa dan tulisan Jepang. Masih banyaknya masyarakat yang belum mengetahui tentang bahasa Jepang baik penulisan, arti maupun penyebutan sehingga dibuat sistem yang bisa menerjemahkan dari aksara Jepang ke bahasa Indonesia dengan menerapkan Image Process dan OCR Tesseract yang kemudian dikombinasikan dengan algoritma String Matching Horspool. OCR diperlukan untuk mengenali teks yang terdapat dalam sebuah gambar. Gambar inputan mengalami proses segmentasi untuk mendapatkan citra biner dengan Treshold Metode OTSU setelah itu dicocokan dengan data latih aksara Jepang yang sudah tersedia. Image Processing dilakukan untuk menambah akurasi ketepatan pengenalan OCR Tesseract.String yang didapat kemudian diterjemahkan secara online, dan dilakukan proses string matching dengan data yang terdapat dalam database. Algoritma Horspool menyimpan informasi pencarian untuk melakukan pergeseran yang lebih jauh karena pencocokan string dilakukan dari kanan ke kiri sehingga waktu pencarian lebih pendek. Hasil yang didapat dari aplikasi ini menampilkan keseluruhan string yang berhasil dikenali dan pattern yang cocok dengan string yang berhasil dikenali.

Kata Kunci_{: Image Processing, Metode OCR, OCR Tesseract, Algoritma Horspool,}

Pengenalan Kata dari Image

(2)

viii

ABSTRACT

Japanese is one of the most commonly used languages in the world in the ninth order, requiring knowledge of Japanese language and writing. There are still many people who do not know about the Japanese language either writing, meaning and mentioning that made a system that can translate from Japanese script to the Indonesian language by applying Image Process and OCR Tesseract which then combined with String Matching Horspool algorithm. OCR is required to recognize the text contained in an image. The input image experiencing segmentation process to get a binary image with the OTSU Treshold Method after which it is matched with Japanese script tracking data already available. Image Processing is done to increase accuracy of the accuracy of the introduction of OCR Tesseract. The obtained string is then translated online, and a string matching process is done with the data contained in the database. The Horspool algorithm stores search information to make further shifts because string matching is done from right to left so that search time is shorter. The results obtained from this app show the entire string that was recognized and the pattern matching the string that was successfully recognized.

Keywords : Image Processing, OCR Method, OCR Tesseract, Horspool Algorithm,

Word Recognition from Image