vi
ABSTRAK
Informasi yang ada pada sebuah kemasan produk makanan tidak dapat dicari secara instan. Hal ini menyulitkan konsumen yang hanya ingin mengetahui informasi yang ada pada kemasan makanan tersebut. Diperlukan suatu metode bagaimana mengambil citra teks kemasan makanan dan perangkat langsung mengenali teks yang ada pada produk tersebut. Optical Character Recognition merupakan cabang dari konsep artificial intelligence dari bidang pengolahan citra, dimana suatu citra yang berisikan teks dapat dikonversi menjadi editable text. Sebelum citra teks kemasan dapat dikenali menggunakan metode Tesseract OCR, perlu dilakukan tahap pre-processing yaitu implementasi algoritma Thresholding Adaptif yang bertujuan untuk memisahkan antara citra teks dengan citra background dalam bentuk citra biner. Kemudian Tesseract OCR mengenali setiap teks yang ada pada citra dengan tahapan metode yang dilalui yaitu feature extraction, segmentasi per kata, dan word recognition. Penelitian ini difokuskan untuk mengembangkan aplikasi pengenalan citra teks kemasan makanan berbasis Android. Citra teks yang dikenali terdiri dari 10 citra melalui kamera dan 20 citra lainnya melalui galeri unduhan dari internet dengan kategori font yaitu Serif dan Sans Serif. Dari pengujian yang telah dilakukan, diperoleh tingkat akurasi terbaik mencapai 100% pada citra uji melalui kamera dengan kategori font Serif dan 94.56% pada citra uji melalui galeri dengan kategori font Sans Serif.
Kata Kunci : Kemasan Makanan, Optical Character Recognition, Thresholding Adaptif, Tesseract, Pre-processing.
vii
IMPLEMENTATION OF ADAPTIVE THRESHOLDING ALGORITHM AND TESSERACT OCR FOR DETECTING FOOD PACKAGING
TEXT-IMAGE BASED ON ANDROID
ABSTRACT
The information written on a food packaging cannot be searched instantly. It will be difficult for customers who just want to find out some information from the food packaging. A proposed method is required on how to capture the text-image of the food packaging and directly recognize the text contained on the product. Optical Character Recognition is a branch of artificial intelligence concepts from the field of image processing, where it converts text-image into an editable text. In order to identify the food packaging texts using Tesseract OCR, a pre-processing approach is needed to separate the text image from the background image in the form of a binary image using Adaptive Thresholding algorithm. Then Tesseract OCR will try to recognize every text contained in the image using several methods i.e. feature extraction, text segmentation, and word recognition. This research is focused on developing a food packaging text image recognition based on Android application. The images that must be identified will consist of 10 text images using the camera and 20 other text images using the gallery function downloaded from the internet. The font category are Serif and Sans Serif. The final result after the test has been conducted, it is found that text images taken from camera has the best accuracy of 100% with Serif font categories while the text images from the gallery has the accuracy of 94.56% with Sans Serif font categories.
Keywords : Food Packaging, Optical Character Recognition, Thresholding Adaptif, Tesseract, Pre-processing.