APPLICATION OF HANDWRITING CHARACTER
CLASSIFICATION USING CHARACTER EXTRACTION BASED ON
CHAIN CODE AND SEGMENT PATTERN
Ulva Choyriyanie, Nuryuliani
Undergraduate Program, Faculty of Industrial Engineering, 2010 Gunadarma University
http://www.gunadarma.ac.id
Keywords: Chain Code, Character Extraction, Classification, Segment Pattern.
ABSTRACT
Classification of handwritten characters is one of the stages of handwriting character recognition process that begins with data collection, segmentation, and classification to match. In this study, the authors focus on the classification stage. The classification of handwritten characters in this study using the method of feature extraction and pattern-based chain code segments. Classification process begins with the filtering process to input characters prior to segmentation. Then the character is grouped into 7 clusters based on the pattern of the first segment of each character. In the segments of each character do the coding chain code and patterns that can be matched with existing data in the database. This application is able to perform the classification of the 26 character reference and the accuracy of this program is 100 percent. This application can be exploited further for handwritten character recognition process and can be developed again to help the learning process in character recognition for the kids.
APLIKASI PENGKLASIFIKASIAN KARAKTER TULISAN TANGAN MENGGUNAKAN EKSTRAKSI CIRI
BERBASIS CHAIN CODE DAN POLA SEGMEN 1) Ulva Choyriyanie 2) Nuryuliani 1) e-mail : amethyst_gerrard@yahoo.co.id 2) e-mail : nryulia@staff.gunadarma.ac.id Jurusan Teknologi Informatika Universitas Gunadarma Jl Margonda 100
ABSTRAK
Pengklasifikasian karakter tulisan tangan adalah salah satu tahap dari proses pengenalan karakter tulisan tangan yang diawali dengan pengambilan data, segmentasi, klasifikasi sampai pencocokan. Pada penelitian ini, penulis fokus pada tahap klasifikasi. Pengklasifikasian karakter tulisan tangan pada penelitian ini menggunakan metode ekstraksi ciri berbasis chain code dan pola segmen. Proses klasifikasi diawali dengan melakukan proses filterisasi terhadap karakter input sebelum dilakukan segmentasi. Kemudian karakter dikelompokan menjadi 7 cluster berdasarkan pola segmen pertama tiap karakter. Pada hasil segmen dari tiap karakter dilakukan pengkodean chain code dan polanya sehingga bisa dicocokan dengan data yang ada dalam database. Aplikasi ini mampu melakukan klasifikasi dari 26 karakter acuan dan keakuratan dari program ini adalah 100 persen.
Aplikasi ini dapat dimanfaatkan lebih lanjut untuk proses pengenalan karakter tulisan tangan dan dapat dikembangkan lagi untuk membantu proses pembelajaran dalam pengenalan karakter bagi anak-anak.
Kata Kunci : Chain Code, Ekstraksi Ciri, Karakter, Pengklasifikasian, Pola Segmen.
PENDAHULUAN LATAR BELAKANG
Tulisan tangan adalah salah satu media komunikasi selain komunikasi secara verbal. Tulisan tangan adalah media untuk
menyimpan informasi yang dapat
mengidentifikasikan sifat, perkembangan
jiwa, dan tingkat kesehatan seseorang serta
dapat digunakan untuk keperluan
pembelajaran.
Menulis sudah diperkenalkan kepada anak sejak masuk ke jenjang TK atau SD. Untuk mengetahui tingkat kemahiran anak dalam menulis, dapat diukur berdasarkan A-PDF Watermark DEMO: Purchase from www.A-PDF.com to remove the watermark
standar yang telah ditentukan. Jika seseorang melakukan penulisan dengan mengikuti standar penulisan yang telah ditentukan secara sempurna, maka semua bentuk penulisan akan sama untuk setiap huruf.
Dengan berkembangnya teknologi, pengenalan tulisan tangan dapat dilakukan menggunakan komputer sebagai alat bantu untuk mengolah data masukan. Data masukan berupa karakter tulisan tangan yang diambil melalui media tambahan yaitu
digitizer sebagai alat input. Sistem
pengenalan tulisan tangan diawali dengan proses pengambilan data, tahap selanjutnya adalah segmentasi, klasifikasi sampai proses pengenalan. Penelitian ini fokus pada tahap klasifikasi karakter dalam pengenalan tulisan tangan. Proses klasifikasi karakter dapat dilakukan berdasarkan ekstraksi ciri berbasis chain code dan pola segmen. Berdasarkan kondisi tersebut, dibuatlah sebuah “Aplikasi Pengklasifikasian Karakter Tulisan Tangan Menggunakan Ekstraksi Ciri Berbasis Chain Code dan Pola Segmen”.
BATASAN MASALAH
Pada penulisan skripsi kali ini
penulis membatasi masalah dalam
pembuatan aplikasi pengklasifikasian karakter tulisan tangan dari orang dewasa
yang telah mahir dalam menulis
menggunakan ekstraksi ciri berbasis chain code dan pola segmen. Huruf yang akan diklasifikasi berupa huruf kecil dan tegak bersambung.
METODE PENELITIAN
SEGMENTASI TULISAN TANGAN
Segmentasi tulisan tangan ditujukan
untuk lebih mempermudah proses
pengenalan tulisan tangan. Dari 26 karakter tulisan tangan huruf latin terdapat 25 jenis segmen acuan. Contoh segmentasi standar pada beberapa karakter yang dilakukan secara manual berdasarkan pendapat sejumlah peneliti (Vinter, Paindavoine, in Suryarini 2009) dapat dilihat pada gambar 1.
Gambar 1 Contoh segmentasi pada karakter a,c,e,f,i,o dan u [Vinter, 2005] [Paindovoine, 2008]
Setiap karakter terdiri dari beberapa segmen atau stroke. Stroke adalah proses dari alat tulis diletakkan pada media tulis sampai diangkat kembali. Proses tersebut
berlangsung secara berurutan sehingga membentuk sebuah karakter. Sehingga setiap karakter akan selesai terbentuk sebelum karakter lainnya dibentuk, karena setiap karakter terbentuk dari beberapa stroke yang berhubungan.
CHAIN CODE (KODE FREEMAN)
Algoritma Kode Rantai Freeman (Freeman Chain Code) pertama kali di perkenalkan oleh Freeman pada tahun 1974. Tujuan dari Kode Freeman adalah untuk memberitahukan representasi batasan dari
suatu obyek. Kode rantai Freeman
merupakan algoritma sederhana tetapi memiliki kinerja yang tinggi. Kode rantai didasarkan pada kenyataan bahwa titik berurutan pada kurva kontinyu yang saling berdekatan satu sama lain, dan bahwa masing–masing titik data secara berurutan berbatasan dengan salah satu dari delapan titik–titik yang mengelilingi titik data tersebut.
Kode rantai digunakan untuk
merepresentasikan batas tepi dengan urutan garis lurus yang terhubung dengan ukuran dan arah tertentu. Biasanya, kode rantai direpresentasikan dengan 4 arah atau 8 arah mata angin. Arah dari suatu mata angin dikodekan dengan menggunakan skema penomoran seperti terlihat di gambar 2
untuk 8 arah mata angin dan gambar 3 untuk 4 arah mata angin.
Gambar 2. Skema 8 arah mata angin
Gambar 3. Skema 4 arah mata angin
Kode rantai suatu batas tepi tergantung pada penentuan titik awal. Kode
dapat dinormalisasikan dengan
memperlakukan titik awal sebagai suatu urutan arah dalam bentuk numerik yang membentuk lingkaran dan mendefinisikan titik awal sedemikian rupa sehingga menghasilkan suatu bentuk besaran integer yang minimum. Untuk pengkodean arah kode rantai, dapat digunakan kelipatan sudut 45 untuk 8 arah atau 90 untuk 4 arah. Kode rantai ini digunakan untuk mengkodekan ciri setiap segmen yang terbentuk dari hasil segmentasi.
KLASIFIKASI KARAKTER
Untuk mempermudah dan
mempercepat akses serta proses pencocokan maka perlu dilakukan klasifikasi karakter berdasakan pada pola segmen. Hal ini dilakukan karena terdapat beberapa segmen dalam sejumlah karakter yang memiliki pola yang sama. Klasifikasi dilakukan dengan cara mengelompokan semua karakter yang memiliki kesamaan ciri dan pola mulai pada segmen pertama. Selanjutnya, kelompok karakter ini dipecah menjadi sub-klas berdasarkan kesamaan ciri dan pola segmen kedua. Hal yang sama dilakukan untuk segmen ketiga dan demikian seterusnya. Dengan demikian akan terbentuk klas dan sub-klas dalam urutan pohon hirarki [Nuryuliani, 2009] seperti yang ditunjukan oleh gambar 4.
Gambar 4. Pohon clustering karakter berdasarkan bentuk segmen
[Nuryuliani, 2009]
Untuk memudahkan proses
pengenalan tulisan tangan, maka dilakukan klasifikasi karakter dengan membuat
pengelompokan berdasarkan bentuk segmen pertama setiap karakter. Untuk lebih jelasnya dapat dilihat pada tabel 1.
Tabel 1. Pengelompokan karakter berdasarkan bentuk segmen pertama
[Nuryuliani, 2009]
PEMBAHASAN Metodologi Penelitian
Secara umum, skema dari metode klasifikasi karakter tulisan tangan terbagi atas dua proses, yakni proses pembentukan basis data karakter acuan dan proses pengklasifikasian. Pada dasarnya program klasifikasi karakter tulisan tangan merupakan bagian dari sistem pengenalan tulisan tangan yang diawali dengan proses pengambilan data, segmentasi, klasifikasi
sampai pengenalan. Skema proses
pengenalan karakter tulisan tangan dapat dilihat pada Gambar 5.
Gambar 5. Skema proses pengenalan karakter
Alur Aplikasi Program
Alur aplikasi pengklasifikasian karakter tulisan tangan dapat dilihat pada gambar 6.
Gambar 6. Alur aplikasi program
Pengkodean Chain Code
Karakter yang sudah di segmentasi dikodekan kedalam chain code dan pola segmen agar dapat dicocokan kedalam
database untuk memeriksa kesesuaian.
Database chain code berisi probabilitas kemunculan tiap segmen dalam setiap kode chain code. Data dalam database berupa batas bawah dan batas atas dari nilai probabilitas kemunculan dari setiap segmen. Misalnya untuk segmen satu, karakter yang terbentuk dari segmen satu akan diurut dari yang terkecil sampai tertinggi. Data terkecil akan menjadi batas bawah begitu juga sebaliknya untuk batas atas. Hal ini juga berlaku untuk 26 segmen yang lain. Sehingga database chain code berisi 52 nilai yang terbentuk dari 26 kode segmen dan setiap segmen memiliki batas bawah maupun batas atas. Untuk lebih jelasnya dapat dilihat pada tabel 2.
Tabel 2. Daftar probabilitas dari segmen 1
Keterangan :
: nilai batas bawah. : nilai batas atas.
Pengklasifikasian Pola
Berdasarkan penelitian sebelumnya [Nuryuliani,2009], pola segmen dari karakter diklasifikasikan menjadi 7 cluster berdasarkan pola segmen pertama dari setiap karakter, kemudian seterusnya sampai huruf dikenali.
Data untuk jenis segmen dapat dilihat pada tabel 3.
Tabel 3. Jumlah segmen dari 26 huruf alfabet yang baru
Pencocokan
Pada sub-bab ini akan dijelaskan proses pencocokan kode segmen dari pola
segmen setiap karakter dalam
pengklasifikasian karakter.
Aplikasi yang dibuat digunakan untuk melakukan seleksi pola pada segmen pertama pertama tiap karakter. Segmen pertama tiap karakter diseleksi untuk menentukan kluster dari karakter. Setelah ditentukan klusternya, nilai dikirim ke
function baca segmen untuk melakukan seleksi segmen berikutnya sehingga huruf input dapat diklasifikasi dan dikenali.
Perancangan GUI
Tampilan GUI pada aplikasi ini disesuaikan dengan kebutuhan program. Tampilan program menggunakan 6 tombol, 2 axis dan 2 static text. Tampilan GUI dari aplikasi pengklasifikasian dapat dilihat pada gambar 7.
Gambar 7. Tampilan GUI dari aplikasi
Tombol-tombol yang digunakan pada aplikasi, antara lain :
1. Tombol open merupakan tombol untuk mengambil file huruf berekstensi .dat dan menampilkannya.
2. Tombol filter merupakan tombol untuk proses filterisasi kemudian menampilkan hasil filternya.
3. Tombol segmentasi merupakan tombol untuk proses segmentasi kemudian menampilkan setiap segmen hasil segmentasi.
4. Tombol next merupakan tombol untuk menampilkan segmen berikutnya dari huruf hasil segmentasi.
5. Tombol back merupakan tombol untuk menampilkan segmen sebelumnya dari huruf hasil segmentasi
6. Tombol exit merupakan tombol untuk keluar atau mengakhiri program.
Selain tombol-tombol, rancangan gui dari program ini juga memerlukan dua buah axes dan 2 buat static text, antara lain : Axes 1 digunakan untuk menampilkan
karakter input
Axes 2 digunakan untuk menampilkan hasil filter dan hasil segmentasi karakter. Text 1 merupakan tulisan klasifikasi
segmen
Text 2 merupakan text berisi keterangan hasil klasifikasi dari setiap segmen.
KESIMPULAN DAN SARAN KESIMPULAN
Proses klasifikasi karakter tulisan tangan ini menggunakan metode ekstraksi ciri berbasis chain code dan pola segmen. Karakter input difilter terlebih dahulu
sebelum dilakukan segmentasi. Kemudian karakter dikelompokan menjadi 7 cluster berdasarkan segmen pertama tiap karakter [Dr. Nuryuliani, 2009]. Pada hasil segmen dari tiap karakter dilakukan pengkodean chain code dan polanya sehingga bisa dicocokan dengan data yang ada dalam database. Aplikasi ini mampu melakukan klasifikasi dari 26 karakter acuan dan keakuratan dari program ini adalah 100 persen. Aplikasi pengklasifikasian karakter tulisan tangan merupakan bagian dari sistem pengenalan karakter tulisan tangan yang diawali tahap pengambilan data, segmentasi, klasifikasi sampai pencocokan. Karena itu, aplikasi ini kedepannya dapat dijadikan referensi dalam sistem pengenalan tulisan tangan dalam tahap pencocokan.
SARAN
Untuk masa kedepan diharapkan aplikasi klasifikasi ini dapat dilanjutkan ke tahap pengenalan tulisan tangan sehingga dapat dimanfaatkan untuk membantu proses pembelajaran. Dan untuk meningkatkan tingkat akurasi pengenalan, sebaiknya lebih memperkaya database dengan jumlah referensi yang lebih banyak.
DAFTAR PUSTAKA
[1] Brian R. Hunt,Ronald L. Lipsman, Jonathan M. Rosenberg, Kevin R. Coombes, John E. Osborn, Garrett J.
Stuck. A Guide to MATLAB for
Beginners and Experienced Users
Second Edition.
[2] Freeman, Herbert, 1974. Computer Processing of Line-Drawing Images. Computing Survey, Vol. 6, No. 1, March 1974.
[3] MathWorks, The, Inc, 2010. Matlab Getting Started Guide.
[4] Nuryuliani, 2009. Klasifikasi
Pengenalan Tulisan Tangan
Menggunakan Ekstraksi Ciri Berbasis
Chain Code Dan Pola Segmen.
Disertasi. Universitas Gunadarma. [5] Nuryuliani, Lulu C. Munggaran,
Sarifuddin Madenda, dan Michel Paindavoine, 2009. Pendekatan Kode
Rantai Sebagai Dasar Pengenalan
Karakter.
[6] Pujiriyanto ,Andry, 2004. Cepat Mahir Matlab.
[7] Suryarini, Widodo, 2009. Metode Segmentasi Karakter Tulisan Tangan
On-Line Menggunakan Karakteristik
Perubahan Nilai Koordinat Y. Disertasi. Universitas Gunadarma.
[8] Tappert, C. C., C.Y. Sun dan Y. Wakahara, 1990. The State Of The Art In
On-Line Handwritting Recognition.
IEEE Transaction on Pattern and Machine Intelligence. Vol 17, No. 8, August.