ANALISIS DAN IMPLEMENTASI OPTICAL CHARACTER RECOGNITION MENGGUNAKAN MODIFIED
DIRECTION FEATURE DAN LEAST SQUARES SUPPORT VECTOR MACHINE
Gilang Rachman Perdana1, Deni Saepudin2, Adiwijaya3 1,2,3Prodi S1 Ilmu Komputasi, Fakultas Informatika Universitas Telkom 1[email protected], 2[email protected], 3[email protected]
Abstrak
Pattern recognition merupakan salah satu teknologi yang hingga saat ini terus mengalami perkembangan.
Manfaatnya yang sangat besar bagi kehidupan manusia mendorong peneliti terus mengembangkan kinerja dan akurasi sistem dengan mencoba dan mengimplementasikan banyak pilihan metode algoritma. Salah satu teknik pengenalan pola yang banyak dikenali orang adalah Optical Character Recognition (OCR).OCR merupakan sistem pengenalan pola karakter dengan input-an berupa citra baik secara
off-line (hasil scan atau foto) maupun secara on-off-line (hasil guratan secara real-time). Pada dasarnya OCR
terdiri dari tiga proses utama yaitu preproses, ekstraksi fitur/ciri, dan klasifikasi. Dalam penelitian ini, pada tahap preproses akan dilakukan pengolahan citra digital agar citra masukan lebih efisien untuk diolah pada tahap selanjutnya. Sedangkan untuk tahap ekstraksi ciri akan digunakan metode Modified
Direction Feature (MDF) dan metode Least Squares Support Vector Machine (LS-SVM) sebagai
pengklasifikasi. MDF merupakan kombinasi dari metode Direction Feature (DF) dan Transition Feature (TF) yaitu dengan mengambil dan menghitung nilai ciri berdasarkan stroke karakter dari berbagai arah sehingga ciri karakter bersifat unik dan menjadi salah satu metode yang memiliki kinerja baik dalam proses ekstraksi ciri. Setelah ciri karakter didapat, maka akan diklasifikasikan oleh metode LS-SVM yang merupakan variant dari SVM standar. Jika SVM dikarakteristik oleh permasalahan konveks
quadratic programming dengan pembatas berupa pertidaksamaan, maka LS-SVM sebaliknya,
dikarakteristik dengan menggunakan pembatas yang hanya berupa persamaan. Sehingga solusi dari LS-SVM ini dihasilkan dengan menyelesaikan persamaan tersebut. Penelititan ini menghasilkan akurasi 84,61% untuk data uppercase, 90,48% untuk data lowercase, 86,36% untuk data digit, dan 68,37% untuk data total (gabungan data uppercase, lowercase, dan digit).
Kata kunci : Pattern recognition, Optical Character Recognition (OCR), Ekstraksi ciri, Modified Direction
Feature (MDF), Least Squares Support Vector Machine (LS-SVM).
1. Pendahuluan
Inovasi teknologi yang terus berkembang telah menjadikan manusia terus berkreasi menciptakan hal yang baru maupun memperbaiki kreasi sebelumnya. Teknologi saat ini telah banyak memberikan kemudahan bagi kehidupan manusia, salah satu teknologi yang hingga saat ini masih memiliki banyak ruang untuk dikaji dan dikembangkan dalam penelitian adalah teknologi pengenalan pola atau pattern recognition. Sistem pengenalan pola yang dimaksud seperti pengenalan suara, tanda tangan, sidik jari, hingga pengenalan karakter tulisan. Salah satu teknik pengenalan pola yang banyak dikembangkan dalam penelitian dan bahkan diadaptasikan pada perangkat cerdas seperti smartphone dan PDA adalah pengenalan tulisan yang biasa dikenal sebagai teknik Optical Character Recognition (OCR).
OCR merupakan sistem pengenalan tulisan dengan masukan berupa karakter secara off-line (citra karakter hasil scan atau foto) maupun secara on-line (citra karakter hasil guratan secara realtime). Telah banyak sistem OCR dikembangkan, namun hasil akurasi pengenalan pola yang diberikan masih menjadi masalah yang menarik untuk dikembangkan. Selain itu, gaya menulis manusia yang berbeda satu dengan lainnya menjadikan OCR sebagai salah satu kajian penelitian yang tidak mudah [2].
Setiap tahapan proses pada sistem OCR memiliki banyak pilihan algoritma dalam pengimplementasiannya. Secara umum, pengenalan karakter pada dasarnya terdiri dari tiga tahapan utama yaitu preproses citra masukan, ekstraksi ciri, dan pengklasifikasian karakter [6]. Metode ekstraksi ciri yang akan digunakan adalah Modified Direction Feature (MDF) yang merupakan kombinasi dari metode ekstraksi Direction Feature (DF) dan Transitional Feature (TF) [3]. Kemudian, metode klasifikasi yang digunakan adalah metode Least Squares Support Vector Machine (LS-SVM) yang merupakan modifikasi dari standar SVM. Jika SVM harus menyelesaikan permasalahan konveks quadratic
programming dengan pembatas berupa pertidaksamaan, maka LS-SVM menyelesaikan permasalahan dengan pembatas berupa persamaan [1].
Saat ini telah banyak para ahli yang meneliti dan menulis buku-buku yang berkaitan dengan pengenalan pola pada karakter. Penggunaannya yang bermanfaat mendorong para peneliti terus mencari dan menggunakan metode yang paling baik untuk sistem OCR, seperti penelitian yang dilakukan oleh [3] dan [5].
Tujuan dari penelitian ini adalah :
a. Merancang dan menganalisis parameter-parameter MDF dan LS-SVM dalam implementasinya mengenali pola karakter.
b. Menganalisis kinerja akurasi sistem dalam pengenalan karakter menggunakan MDF dan LS-SVM. 19. Distribusi Data
yang digunakan sebagai masukan sistem adalah citra karakter tulisan tangan yang didapat dari berbagai sumber, diantaranya :
a. Formulir isian permohonan pembuatan KTP warga lokal Kec. Kadipaten di Tasikmalaya, Jawa Barat. Data ini merupakan data otentik dari warga yang hendak membuat Kartu Tanda Penduduk yang didapatkan dari salah satu mahasiswa Pasca Sarjana Institut Teknologi Telkom sebagai data dalam pengerjaan tesisnya dengan topik yang sama (OCR).
b. Formulir isian buatan data identitas warga lokal Kecamatan Bojongsoang Kab. Bandung. c. Formulir isian buatan data identitas mahasiswa di kampus Institut Teknologi Telkom.
d. Beberapa jenis True Type Font sebagai data tambahan, yang terdiri dari jenis karakter calibri, times new roman, dan comic sans. Jenis karakter ini dianggap memiliki bentuk dan gestur normal seperti tulisan pada umumnya.
Tabel 2.1 berikut adalah distribusi ketersediaan data:
Tabel 2.1 Distribusi Ketersediaan Data Total Perkarakter
Data terdiri dari 65 kelas berbeda dengan jumlah data citra yang berbeda-beda. Untuk keperluan penggunaan data dalam pelatihan dan pengujian sistem, maka dilakukan pengambilan data secara acak dengan jumlah yang sama setiap jenis karakter. Proses sampling acak sederhana dilakukan untuk
mengambil sejumlah citra karakter yang ketersediaannya melebihi jumlah data yang dibutuhkan yaitu 20
Kara kter A B C D E F G H I J K L M Juml ah 1 47 46 2 0 5 2 50 2 3 3 0 4 1 6 6 2 0 36 3 7 4 5 Kara kter N O P Q R S T U V W X Y Z Juml ah 6 6 26 2 0 20 5 4 4 7 5 6 5 0 2 0 2 0 20 3 6 4 0 Kara kter a a b c d e f g h i j k l Juml ah 2 2 2 0 2 0 2 7 3 1 2 0 2 0 2 6 4 7 2 0 28 2 0 3 0 Kara kter m n o p q r s t u v w x y Juml ah 4 5 40 2 0 20 25 2 0 2 0 3 2 2 0 2 0 2 0 2 1 2 0 Kara kter z 0 1 2 3 4 5 6 7 8 9 Juml ah 2 0 2 0 8 8 1 01 54 4 3 3 6 2 0 4 4 3 6 25 5 1 5 9
A. Modified Direction Feature (MDF)
Modified Direction Feature (MDF) merupakan metode ekstraksi ciri yang menggabungkan metode Transition Feature (TF) dan Direction Feature (DF), sehingga pada hasil ekstraksi didasarkan pada nilai transisi dan juga ditentukan oleh nilai label arah yang terdapat pada pixel foreground citra karakter. Secara umum, metode MDF ini lebih baik dalam hal ekstraksi fitur daripada metode DF dan TF yang dilakukan secara tersendiri [3].
B. Least Squares Support Vector Machine (LS-SVM)
LS-SVM merupakan salah satu dari modifikasi SVM konvensional. Jika SVM dikarakteristik oleh permasalahan quadratic programming dengan pembatas berupa pertidaksamaan, maka LS-SVM sebaliknya, diformulasikan dengan menggunakan pembatas berupa persamaan[18]. Sehingga solusi LS-SVM dihasilkan dengan menyelesaikan persamaan linear. Hal yang berbeda dengan penyelesaian LS-SVM yang solusinya didapatkan melalui penyelesaian quadratic programming. Saat ini, LS-SVM
banyak dilakukan pada klasifikasi dan estimasi. Apabila pada SVM di-training dengan meminimalkan : ‖𝑤‖ ∑
i (3.1)maka pada LS-SVM diberikan formulasi untuk meminimalkan : ‖𝑤‖ ∑ (3.2) Subject to: 𝑤 𝑏 ,i=1,2 l (3.3)
Untuk menyelesaikan permasalahan dapat digunakan Lagrange multiplier sebagai berikut : ‖𝑤‖ ∑ ∑ [ 𝑤 𝑏 ] (3.3)
Dengan adalah Lagrange multiplier dan adalah error variable menggantikan nama variable slack pada SVM konvensional. kondisi optimal dicapai dengan menurunkan persamaan (3.1) terhadap w, b, dan didapatkan : 𝑤 ∑ ∑ ( 𝑤 𝑏)
Adapun solusi untuk persamaan diatas dapat direpresentasikan sebagai berikut [18] :
[ ] [ 𝑤 𝑏 ] = [←] [ ] Y=[ ] , ⃗⃑=[1;...;1] e=[ ] , [ ] 20. Pengujian Sistem
Gambar 4.1 Diagram Alir Sistem OCR Menggunakan MDF dan LS-SVM
Langkah proses secara singkat berdasarkan gambar 3-1 dilakukan mengikuti tahapan berikut : a. Menyiapkan data citra masukan yang akan diolah dalam tahap preproses.
b. Tahap preproses, yaitu mengolah citra masukan sedemikian rupa agar pengolahan citra lebih efisien dalam hal komputasi dan membuang informasi citra yang tidak diperlukan dalam proses ekstraksi ciri.
c. Tahap ekstraksi ciri, yaitu pengambilan karakteristik dari citra masukan hasil dari tahap preproses. d. Tahap klasifikasi, dalam pelaksanaanya dilakukan proses pelatihan dan pengujian data hasil ekstraksi
ciri agar menghasilkan model classifier yang akan digunakan sebagai pengklasifikasi data uji.
e. Setelah data melewati tahap klasifikasi, maka akan ditampilkan hasilnya dalam bentuk karakter hasil klasifikasi baik karakter yang terklasifikasikan dengan benar atau salah.
A. Proses Ekstraksi Ciri MDF
Pada proses ekstraksi ciri MDF yang menjadi tujuan utama adalah mendapatkan vektor ciri yang menjadikannya sebagai identitas unik yang dimiliki setiap jenis karakter. Vektor ciri ini merupakan gabungan dari matrik LT dan DT yang diambil dari berbagai arah. Gambar 4.2 berikut adalah diagram alir sistem MDF : Character image-preprocess ed Matrix changing (from binary into
direction value) Image with direction value Makes LT & DT matrix from 4 directions 4 LT matrix and 4 DT matrix Normalization Feature Vector Normalised matrix
Joint all matrix
Gambar 4.2 Tahapan Proses Ekstraksi ciri Menggunakan MDF
Proses terakhir yang dalam sistem OCR ini adalah mengklasifikasikan data agar terklasifikasikan dengan benar. Untuk dapat mengklasifikasikannya, sistem perlu memiliki knowledge sebagai penentu dan bertindak sebagai acuan dalam sistem pengklasifikasian. Knowledge yang dimaksud dalam hal ini adalah model hasil learning metode classifier LS-SVM yang didapat pada proses training, model inilah yang akan menjadi panduan dasar untuk proses pengujian. Baik tidaknya model classifier yang didapat selain bergantung pada kehandalan vektor ciri yang dihasilkan proses sebelumnya tetapi juga bergantung pada inisisalisasi parameter LS-SVM seperti trik kernel yang dilakukan. Gambar 4.3 berikut merupakan diagram alir proses klasifikasi LS-SVM :
Feature Vector as Input Data Formulate Problem Collect Training Data Preprocess Trainning Data (opt.) Select Parameter For LSSVM Input Trainning Data (Preprocessed – opt.) Train LSSVM (Generate Optimal Hyperplane) Postprocessing Trainning output (opt.) Collect Test Data
Preprocess Test Data (opt.)
Input Preprocessed Test Data into Trained
LSSVM Receive Test Output from LSSVM Optimal ? NO OUTPUT Process YES Gambar 4.3 Proses Klasifikasi LS-SVM
21. Hasil Pengujian
Pada proses pengujian sistem telah diujicobakan beberapa nilai parameter MDF dan LS-SVM sehingga hasil akurasi yang didapat berbeda-beda. Gambar 5.1 berikut adalah grafik nilai akurasi terbaik untuk semua case-sensitive :
Gambar 5.1 Akurasi Terbaik Pengujian Sistem 22. Kesimpulan dan Saran
Hasil pengujian sistem OCR yang dibangun menyatakan bahwa normalisasi ukuran citra masukan, jumlah transisi, dan normalisasi ciri sangat berpengaruh pada hasil akurasi sistem yang dihasilkan, karena
Total Uppercase Lowercase Numeric
Terbaik 68,37 84,61 90,48 86,36 0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00 A k ura si (% )
nilai parameter yang diberikan pada preproses dan ekstraksi ciri ini akan mempengaruhi jumlah dan nilai vektor ciri untuk digunakan pada proses klasifikasi. Vektor ciri karakter inilah yang akan membawa informasi penting dari ciri masing-masing karakter apakah sudah terwakilkan secara unik atau belum. Begitu pula penggunaan kernel dan strategi multi-kelas pada proses klasifikasi berpengaruh pada hasil akurasi yang didapat, karena knowledge hasil learning system akan mempengaruhi data masukan terklasifikasikan dengan benar atau tidak. Akurasi terbaik yang dihasilkan adalah sebesar 68.37% untuk data Total (gabungan Uppercase, Lowercase, dan Digit) dengan menggunakan parameter ukuran citra [180x120], normalisasi ciri lebar dan panjang (10,10), Radial Basis Function Kernel (RBF), dan strategi multi-kelas One-against-One. Sedangkan skurasi terbaik selain penggunaan data total adalah sebesar 84.61% untuk data Uppercase, akurasi 90.48% untuk data Lowercase, dan akurasi 86.36% untuk data Digit saja.
Beberapa saran yang diajukan untuk memperbaiki sistem kedepannya adalah sebagai berikut : a. Persiapan citra pada preprocessing bisa diperbaiki lagi untuk menghasilkan kualitas citra yang lebih
baik dan siap untuk diekstrak cirinya seperti penanganan kasus posisi tulisan yang tidak benar. b. Mengekplorasi lebih banyak dan lebih baik lagi kombinasi parameter pada proses ekstraksi ciri dan
klasifikasi yang memungkinkan dihasilkannya akurasi lebih baik daripada penelitian ini.
c. Adanya penanganan khusus untuk kasus citra yang memiliki bentuk serupa seperti huruf o, c, dan huruf lainnya yang memiliki bentuk serupa baik pada Uppercase Lowercase, atau digit agar sistem lebih akurat dalam mengklasifikasikan karakter.
d. Apabila sistem OCR perkarakter sudah lebih optimal bisa dikembangkan untuk rekognisi per-kata hingga per-paragraf sehingga aplikasinya lebih bermanfaat.
e. Sistem OCR dapat dikembangkan lebih baik dan aplikatif seperti aplikasi text-to-speech dll.
Daftar Pustaka
[1] Mathias M.Adankon, Mohamed Cheriet. 2009. Model selection for the ls-svm. Application to handwriting recognition. Pattern Recognition 42 : 3264 – 3270.
[2] Georgios Vamvakas , Basilis Gatos, Stavros J. Perantonis .2010.Handwritten character recognition through two-stage foreground sub-sampling. Pattern Recognition 43 (2010) 2807–2816.
[3] Blumenstein, M., Liu, X. Y., Brijesh Verma, B.2006. An Investigation of the Modified Direction Feature for Cursive Character Recognition.
[4] Blumenstein, M., Liu, X. Y., & Verma, B.2004. An Investigation of the Modified Direction Feature for Cursive Character Recognition.International Joint Conference on Neural Networks, Budapest, Hungary, pp. 2983-2987.
[5] Sulistiyo, M.D., Saepudin, D., Adiwijaya, Optical character recognition using modified direction feature and nested multi layer perceptrons network Proceeding - IEEE International Conference On Computational Intelligence and Cybernetics, CyberneticsCom 2012 , pp. 30-34.
[6] Cheng-Lin Liu, Kazuki Nakashima, Hiroshi Sako, Hiromichi Fujisawa. 2004. Handwritten digit
recognition : investigation of normalization and feature extraction techniques. Pattern Recognition 37 :
265 – 279.
[7] Darma Putra. 2010. Pengolahan Citra Digital, ANDI Yogyakarta. .
[8] Blumenstein, M., Liu, X. Y., & Verma, B. 2004.A Modified Direction Feature for Cursive Character Recognition.
[9] Johan Suykens, Carlos Alzate. 2010. Support vector machines and kernel methods : new approaches in unsupervised learning, Tutorial WCCI 2010 Barcelona.
[10] Anto Satriyo, Arif Budi Witarto, Dwi Handoko. 2003. Support Vector Machine-Teori dan Aplikasinya dalam Bioinformatika. Copyright IlmuKomputer.Com
[11] Jonathan Milgram, Mohamed Cheriet, Robert Sabourin. 2006.“One Against One” or “One Against All”: Which One is Better for Handwriting Recognition with SVMs? .
[12] Jieping Ye,Tao Xiong. 2007. SVM versus Least Squares SVM.
[13] Budi Santosa , Tutorial Support Vector Machine. Institut Teknologi Sebelas Maret, Surabaya.
[17] Tony Van Gestel, Johan A.K. Suykens.2004. Benchmarking Least Squares Support Vector Machine Classifiers. Machine Learning, 54, 5–32, 2004
[18] [19]
J.A.K Suykens, J. Vandewalle. 1999. Least Squares Support Vector Machine Classifier.Neural Processing Letters 9 : 293-300.
Adiwijaya, 2014, Aplikasi Matriks dan Ruang Vektor, Graha Ilmu
[20] Cristianini, Nello dan John S. Taylor. 2000. An Introduction to Support vector machines and Other Kernel-based learning Methods, Cambridge University Press.