i UNIVERSITAS KRISTEN MARANATHA PENGENALAN HURUF TULISAN TANGAN BERBASIS CIRI SKELETON
DAN STATISTIK MENGGUNAKAN JARINGAN SARAF TIRUAN
Disusun oleh :
Mario Herryn Tambunan (1022056)
Jurusan Teknik Elektro, Fakultas Teknik, Universitas Kristen Maranatha Jl. Prof. Drg. Suria Sumantri, MPH. No. 65, Bandung, Jawa Barat, Indonesia
e-mail : tambunan.mario.herryn@gmail.com
ABSTRAK
Pengenalan tulisan tangan semakin diperlukan pada zaman yang sudah serba modern seperti sekarang. Banyak dokumen penting yang masih ditulis dengan tulisan tangan dan penyimpanannya masih dalam bentuk analog, akan lebih efisien apabila penyimpanan dokumen dokumen tersebut dalam data digital. Ekstraksi ciri merupakan bagian dari teknik pengenalan pola yang bertujuan untuk mengambil atau mengekstraksi nilai-nilai unik dari suatu objek yang membedakannya dari objek lainnya, maka penggunaan ekstraksi ciri sangatlah penting pada pengenalan pola.
Pada Tugas Akhir ini dirancang dan direalisasikan pengenalan tulisan tangan menggunakan ekstraksi ciri skeleton dan statistik. Setelah ciri tiap huruf telah diambil lalu akan dilatihkan dan di ujikan menggunakan Jaringan Saraf Tiruan dengan algoritma pelatihan Backpropagation agar didapatkan pola setiap huruf lalu akan di uji hasil pengenalannya.
Hasil percobaan menunjukkan penggunaan ekstraksi ciri ini dapat mengenali pola huruf dengan benar, namun masih muncul beberapa kesalahan dalam pengenalan pada huruf yang mirip dalam bentuknya. Secara keseluruhan akurasi pengenalan pola huruf yang didapatkan adalah 75%. Kemampuan JST dalam mengenali pola huruf mencapai hasil yang cukup baik walaupun belum maksimal.
ii
LETTER HANDWRITTEN RECOGNITION USING NEURAL NETWORK BASED ON SKELETON AND STATISTICAL FEATURE EXTRACTION
Composed by :
Mario Herryn Tambunan (1022056)
Electrical Engineering Department, Faculty of Engineering, Maranatha Christian University, Jl. Prof. drg. Suria Sumantri, MPH, No. 65th, Bandung,
Indonesia.
e-mail : tambunan.mario.herryn@gmail.com
ABSTRACT
Handwriting recognition increasingly necessary in the modern era. Many important documents are still handwritten and storage is still in analog form, would be more efficient if the document storage in digital data. Feature extraction is part of a pattern recognition technique that aims to take or extract the unique values of an object that distinguish it from other objects, then the use of feature extraction is very important in pattern recognition.
On this final project designed and realized a handwriting recognition process using skeleton and statistical feature extraction. After the feature of each letter has been taken and it will be trained and tested using Neural Network with Backpropagation training algorithm in order to obtain the pattern of each letter and then will be tested the handwriting recognition.
The results showed the use of this feature extraction can recognize patterns of letters correctly, but still appear some errors in the recognition to the letters that are similar in shape. Overall accuracy of pattern recognition obtained was 75%. ANN ability to recognize patterns of letters achieve good results although not maximal.
vi
2. 3. 1. Neuron Manusia ... 17
2. 3. 2. Arsitektur Jaringan ... 19
2. 3. 3. Pelatihan ... 20
2. 3. 4. Fungsi Aktivasi ... 21
2. 3. 5. Bias ... 23
2. 3. 6. Error ... 23
2. 3. 7. Backpropagation ... 24
2. 3. 7. 1. Pemilihan Bobot Awal ... 24
2. 3. 7. 2. Jumlah Lapisan Unit Tersembunyi ... 24
2. 3. 7. 3. Pelatihan Backpropagation ... 25
2. 3. 7. 4. Delta-Bar-Delta ... 28
2. 4. Database IAM ... 30
BAB 3 PERANCANGAN PERANGKAT LUNAK 3. 1. Diagram Blok Pengenalan Tulisan Tangan... 31
3. 2. Diagram Alir Sistem Pengenalan Tulisan Tangan ... 33
3. 2. 1. Diagram Alir Pengenalan Preprocessing... 34
3. 2. 2. Diagram Alir Pengenalan Ekstraksi Ciri... 35
3. 2. 2. 1. Diagram Alir Area ... 35
3. 2. 2. 2. Diagram Alir Lebar Citra ... 36
3. 2. 2. 3. Diagram Alir Tinggi Citra ... 37
3. 2. 2. 4. Diagram Alir Rasio ... 38
3. 2. 2. 5. Diagram Alir Kuadran ... 39
3. 2. 2. 6. Diagram Alir Koordinat Pusat Massa ... 40
3. 2. 2. 7. Diagram Alir NCM ... 41
3. 2. 2. 8. Diagram Alir NCOM ... 42
3. 2. 2. 9. Diagram Alir Menghitung Branch point & End Point 43 3. 2. 2. 10. Diagram Alir Menghitung Loop ... 44
vii
BAB 4 DATA PENGAMATAN DAN ANALISIS
4. 1. Pengujian Tahap 1 : Pengenalan Tulisan Tangan Untuk
Pemilihan Algoritma Thinning ... 46
4. 2. Pengujian Tahap 2: Pengujian Pengenalan Tulisan
Tangan ... 53
4. 2. 2. Pengujian yang Menggunakan Data Orang yang
Sama Dengan Data Latih ... 54
4. 2. 2. Pengujian yang Menggunakan Data Orang yang
Tidak Sama Dengan Data Latih... 59
4. 3. Analisis Hasil Percobaan Secara Keseluruhan ... 61
BAB 5 SIMPULAN DAN SARAN
5. 1. Simpulan ... 66
5. 2. Saran ... 66
DAFTAR PUSTAKA ... 67
LAMPIRAN A LISTING PROGRAM
LAMPIRAN B IAM HANDWRITING DATABASE
viii
DAFTAR TABEL
Halaman
Tabel 2.1 Ekstraksi ciri Statistik ... 14
Tabel 2.2 Ekstraksi ciri Skeleton ... 15
Tabel 2.3 Perbandingan Jaringan Saraf Manusia dan JST ... 18
Tabel 3.1 Contoh Normalisasi Ciri ... 44
Tabel 4.1 Target JST ... 46
Tabel 4.2 Thinning Zhang-Suen Menggunakan Form 1 ... 47
Tabel 4.3 Thinning Zhang-Suen Menggunakan Form 2 ... 49
Tabel 4.4 2 Thinning Stentiford Menggunakan Form 1 ... 50
Tabel 4.5 Thinning Stentiford Menggunakan Form 2 ... 52
Tabel 4.6 Hasil Pengujian yang Menggunakan Data Orang yang Sama Dengan Data Latih ... 55
Tabel 4.7 Hasil Pengujian yang Menggunakan Data Orang yang Tidak Sama Dengan Data Latih ... 59
Tabel 4.8 Akurasi Pengujian yang Menggunakan Data Orang yang Sama Dengan Data Latih ... 61
Tabel 4.9 Akurasi Pengujian yang Menggunakan Data Orang yang Tidak Sama Dengan Data Latih ... 61
Tabel 4.10 Akurasi Hasil Pengenalan Tiap Huruf ... 62
Tabel 4.12 Perbandingan Ekstraksi ciri Antara huruf “n” dengan “h” , dan huruf ”i” dan “l” ... 63
ix
DAFTAR GAMBAR
Halaman
Gambar 2.1 Derajat keabuan dan contoh citra grayscale ... 6
Gambar 2.2 Kombinasi warna RGB dan CMYK... 6
Gambar 2.3 4 Neighbors vertikal dan horizontal dari p ... 7
Gambar 2.4 4 Neighbors diagonal dari p ... 7
Gambar 2.5 8 Neighbors dari p ... 8
Gambar 2.6 Hasil sebelum cleaning (a) dan sesudah cleaning (b) ... 9
Gambar 2.7 Contoh normalisasi dengan penempatan bentuk asli ke template .. 10
Gambar 2.8 Nilai ketetanggaan dari algoritma thinning Zhang-Suen ... 11
Gambar 2.9 Hasil penghapusan piksel dengan thinning Zhang-Suen... 12
Gambar 2.10 Template pada Stentiford thinning ... 12
Gambar 2.11 Contoh Klasifikasi Piksel ... 15
Gambar 2.12 Proses menghitung connected component... 16
Gambar 2.13 Jaringan Saraf Manusia ... 17
Gambar 2.14 Struktur Jaringan Saraf Tiruan ... 18
Gambar 2.15 JST lapisan tunggal ... 19
Gambar 2.16 JST lapisan jamak... 19
Gambar 2.17 Fungsi Aktivasi Threshold ... 21
Gambar 2.18 Fungsi Aktivasi Identitas ... 22
Gambar 2.19 Fungsi aktivasi sigmoid ... 22
x
Gambar 2.21 Arsitektur jaringan backpropagation ... 25
Gambar 2.22 Contoh IAM handwriting Database ... 30
Gambar 3.1 Diagram Blok Cara Kerja Pengenalan Tulisan Tangan ... 31
Gambar 3.2 Hasil preprocessing ... 32
Gambar 3.3 Diagram Alir Proses Pengenalan Tulisan Tangan... 33
Gambar 3.4 Diagram Alir Preprocessing ... 34
Gambar 3.5 Diagram Alir Ekstraksi Ciri ... 35
Gambar 3.6 Diagram Alir Area ... 36
Gambar 3.7 Diagram Alir Lebar Citra ... 37
Gambar 3.8 Diagram Alir Tinggi Citra ... 38
Gambar 3.9 Diagram Alir Rasio ... 38
Gambar 3.10 Diagram Alir Kuadran ... 39
Gambar 3.11 Diagram Alir Koordinat Pusat Massa ... 40
Gambar 3.12 Diagram Alir NCM ... 41
Gambar 3.13 Diagram Alir NCOM ... 43
Gambar 3.14 Diagram Alir Menghitung Branch Point & End Point ... 43
Gambar 3.15 Diagram Alir Menghitung loop ... 44
Gambar 3.16 Arsitektur pelatihan JST yang digunakan ... 45
BAB I PENDAHULUAN
1 UNIVERSITAS KRISTEN MARANATHA
BAB I
PENDAHULUAN
1. 1. Latar Belakang
Pengenalan tulisan tangan semakin diperlukan pada zaman yang sudah
serba modern seperti sekarang. Banyak dokumen penting yang masih ditulis
dengan tulisan tangan dan penyimpanannya masih dalam bentuk analog, akan
lebih efisien apabila penyimpanan dokumen dokumen tersebut dalam data digital.
Dalam proses penyimpanannya menjadi data digital citra tulisan tangan
akan diubah menjadi data tulisan. Dalam proses konversinya dibutuhkan suatu
sistem yang dapat membantu untuk mengenali tulisan tangan. Untuk pengenalan
suatu tulisan tangan, penggunaan ekstraksi ciri sangat penting. Ekstraksi ciri
merupakan bagian dari teknik pengenalan pola yang bertujuan untuk mengambil
atau mengekstraksi nilai-nilai unik dari suatu objek yang membedakannya dari
objek lainnya[9]. Ekstraksi ciri dalam pengenalan tulisan tangan dapat dibagi
menjadi berbagai metoda seperti contohnya statistic features, configuration
features, skeleton features, boundary features, eliptic fourier descriptors,
directional features, dan masih banyak metoda lain [2].
Maka pada Tugas Akhir ini akan dibuat sebuah sistem yang dapat
membantu pengenalan pola tulisan tangan dengan menggunakan ekstraksi ciri
skeleton features dan statistik features yang akan di validasi menggunakan JST
(Jaringan Saraf Tiruan).
IAM Handwriting Database yang menjadi masukan dari simulasi
pengenalan tulisan tangan pada Tugas Akhir ini memiliki banyak bentuk tulisan
tangan yang berbeda - beda yang dipindai pada resolusi 300dpi dan disimpan
sebagai gambar PNG dengan 256 gray level [20]. Database ini terdiri dari kalimat
Bahasa Inggris yang berdasarkan atas Lancaster-Oslo/Bergen (LOB) corpus
BAB I PENDAHULUAN 2
UNIVERSITAS KRISTEN MARANATHA 1970)[18].
1. 2. Rumusan Masalah
Hal – hal yang menjadi permasalahan dalam Tugas Akhir ini adalah :
a. Bagaimana merancang sistem pengenalan tulisan tangan berbasis
ekstraksi ciri skeleton dan statistik ?
b. Bagaimana hasil pengenalan tulisan tangan berbasis ekstraksi ciri skeleton
dan statistik ?
1. 3. Tujuan
Tujuan dari Tugas Akhir ini adalah :
a. Merancang dan merealisasikan sistem pengenalan tulisan tangan berbasis
ekstraksi ciri skeleton dan statistik.
b. Menganalisa hasil pengenalan tulisan tangan berbasis ekstraksi ciri
skeleton dan statistik.
1.4. Batasan Masalah
Dalam penyusunan Tugas Akhir ini ada beberapa batasan yang
ditetapkan yaitu :
a. Masukan dari proses pengenalan tulisan tangan berupa citra huruf yang
telah disegmentasi dari “a” sampai “z”, Huruf yang digunakan hanya huruf kecil saja, dan tergantung pada ketersediaan huruf yang ada pada
tiap form.
b. Data pelatihan dan data uji akan diambil dari 7 orang (setiap orang
menuliskan 1 form) yang berbeda. Citra huruf yang diambil berjumlah 342 citra, dengan 202 citra huruf untuk pelatihan dan 140 citra huruf untuk
pengujian.
c. Tulisan yang diambil dari Database IAM dipilih secara subyektif dengan
BAB I PENDAHULUAN 3
UNIVERSITAS KRISTEN MARANATHA (kemiringan terhadap sumbu x) dengan ukuran dan bentuk yang
bervariasi.
d. Tulisan terpisah tiap hurufnya ( bukan tulisan bersambung/cursive)
1.5. Sistematika Penulisan
Laporan Tugas Akhir ini disusun dengan sistematika sebagai berikut :
BAB I : Pendahuluan
Bab ini menjelaskan mengenai latar belakang masalah, rumusan
masalah, tujuan dan sistematika penulisan dari Tugas Akhir ini.
BAB II : Landasan Teori
Bab ini menjelaskan tentang teori-teori penunjang tentang
pengolahan citra digital, Optical Character Recognition, dan
Jaringan Syaraf Tiruan.
BAB III : Perancangan Perangkat Lunak
Bab ini berisi algoritma dan diagram alir pembuatan program
pengenalan tulisan tangan secara keseluruhan.
BAB IV : Data Pengamatan dan Analisis
Bab ini berisi data pengamatan yang diperoleh dari hasil uji coba
dan juga analisis terhadap kebenaran dan akurasi hasil data. BAB V : Simpulan dan Saran
Bab ini berisi simpulan dan saran yang diambil setelah data
pengamatan telah di analisis yang bertujuan untuk melakukan
BAB V SIMPULAN DAN SARAN
66 UNIVERSITAS KRISTEN MARANATHA
BAB V
SIMPULAN DAN SARAN
Bab ini berisi simpulan berdasarkan hasil penelitian dan analisis data dari
Tugas Akhir ini serta saran untuk pengembangan “Pengenalan Huruf Tulisan
Tangan Berbasis Ciri Skeleton dan Statistik Menggunakan Jaringan Saraf Tiruan”.
5. 1. Simpulan
Dari data hasil uji coba dan analisis yang dilakukan terkait dengan
pelaksanaan Tugas Akhir, dapat diambil simpulan :
1. Proses pengenalan tulisan tangan dapat menghasilkan akurasi secara
keseluruhan sebesar 75%.
2. Thinning dengan algoritma Stentiford lebih baik akurasi pengenalannya jika
dibandingkan dengan algoritma thinning Zhang-Suen.
3. Dalam pengenalan pola tulisan tangan masih sering tertukar dalam pengenalan
beberapa huruf, huruf “n” dan “h” maupun huruf “i” dan “l” dan beberapa
huruf lainnya masih sering tertukar.
4. Sulit mendapatkan akurasi yang baik jika huruf tulisan tangan tidak di latihkan
lalu dimasukkan dalam data uji. Tiap tiap orang memiliki karakter tulisan
tangan nya masing masing.
5. 2. Saran
1. Untuk selanjutnya mungkin dapat digunakan ekstraksi ciri yang lebih tahan
terhadap variasi tulisan tangan manusia. Seperti boundary features, eliptic
fourier descriptors, directional features, dan masih banyak ciri lainnya.
2. Untuk selanjutnya mungkin dapat menggunakan algoritma thinning yang lain
BAB V KESIMPULAN DAN SARAN
67 UNIVERSITAS KRISTEN MARANATHA
DAFTAR PUSTAKA
[1] Abandah, G. dan Jamour, F. 2010 . Recognizing Handwritten Arabic Script
Through Efficient Skeleton-Based Grapheme Segmentation Algorithm
[2] Abandah, G. dan Khedher , M. 2009. Analysis of Handwritten Arabic Letters
Using Selected Feature Extraction Techniques
[3] Abandah , G. dan Malas, T. 2010. Feature Selection for Recognizing
Handwritten Arabic Letters. Dirasat Eng
[4] Fausett Laurene. Fundamentals of Neural Networks. Prentice Hall
[5] Gonzales, R.C. dan Woods, R. E. 2002. Digital Image Processing. Prentice
Hall : New Jersey
[6] Gonzalez, R.C., Woods, R.E., dan Eddins, S.L. 2004. Digital Image
Processing Using MATLAB. Prentice Hall : Upper Saddle River. New Jersey
[7] Jain, K. Anil., Mao, Jianchang. dan Mohiuddin, K. M. 1996. Artificial Neural
Network: A Tutorial. IEEE
[8] Kong, T. Y. dan Rosenfeld, A. 1996. Topological Algorithms for Digital
Image Processing. Elsevier Science B. V. Amsterdam.Netherlands
[9] Mark,S.Nixon. dan Alberto, S. Aguado. 2002. Feature Extraction and Image
Processing. Newnes. Oxford. Great Britain
[10] Mohamed,Cheriet., Nawwaf, Kharma., Cheng-Lin, Liu. dan Ching, Y. Suen.
2007. Character Recognition Systems: A Guide for Students and Practioners.
John Wiley & Sons Inc. HobBERHASILn. New Jersey
[11] N, Otsu. 1979. A Threshold Selection Method from Gray-Level Histograms.
IEEE
[12] Phukan, Abhishek. dan Borah, Mrinaljit. A Survey Paper on the Feature
Extraction Module of Offline Handwriting Character Recognition
[13] Prokop, R. J. dan Reeves, A. P. 1992. A Survey of Moment-Based Techniques
for Unoccluded Object Representation and Recognition.
[14] S, Haykin. 1994. Neural Networks: A Comprehensive Foundation.
MacMillan College Publishing Co. New York
[15] Siang, J.J. 2005. Jaringan Syaraf Tiruan & Pemrogrammannya
BAB V KESIMPULAN DAN SARAN 68
UNIVERSITAS KRISTEN MARANATHA [16] Stentiford, F. W. M. dan Mortimer, R. G. 1983. Some new Heuristics for
Thinning Binary Handprinted Characters for OCR. IEEE.
[17] Zhang,T.Y. dan Suen, C. Y. 1984. A Fast Parallel Algorithm for Thinning
Digital Patterns. Communication of the ACM
[18] http://en.wikipedia.org/wiki/Lancaster-Oslo-Bergen_Corpus, diakses :
Juli 2015
[19]
http://intranet.mcad.edu/kb/should-i-work-rgb-or-cmyk-color-management-mcad, diakses : Juli 2015
[20]