PENGARUH KOMPLEKSITAS EKSTRAKSI CIRI PADA
SISTEM PENGENALAN TULISAN TANGAN DINAMIS
(Influence of Feature Extraction Complexity in Online
Handwriting Recognition)
Abdul Fadlil
Program Studi Teknik Elektro, Universitas Ahmad Dahlan,
Kampus III UAD Jl. Prof. Dr. Soepomo, Janturan, Umbulharjo, Yogyakarta Telp 0274-379418, 381523, Fax 0274- 381523
Email: fadlil@lycos.com
Abstrak
Strategi penting dalam sistem pengenalan tulisan tangan dinamis pada dasarnya terdiri 2 bagian yaitu metode ekstraksi ciri dan teknik klasifikasi. Telah dilakukan pengujian secara eksperimen menggunakan metode ekstraksi ciri sederhana berupa arah coretan tulisan dan dibandingkan menggunakan metode ekstraksi ciri yang lebih kompleks berupa kondisi pena naik/turun, posisi, arah, kurva, dan citra tulisan tangan. Sistem ini berbasis jaringan saraf tiruan dengan algoritma propagasi balik sebagai teknik klasifikasi. Hasil-hasil eksperimen menunjukkan bahwa sistem mampu mengenali tulisan tangan dari ketelitian 83,9% menggunakan metode ekstraksi ciri sederhana dan meningkat menjadi 97,3% menggunakan metode ekstraksi ciri yang lebih kompleks.
Kata kunci: pengenalan tulisan tangan, ekstraksi ciri, jaringan saraf tiruan.
Abstract
Basically, the important strategies in online handwriting recognition system are feature extraction method and classification thecnique. An experimental study comparation using simple features and complex features has been done. The simple features as stroke direction and the complex features are: flag pen up/down, position, direction, curvatures and bitmap image writing. This system based on neural network with backpropagation algorithm for classification technique. The results of our experiments show that the system could be more accurate from 83.9% for simple featurs to be 97.3% for complex features.
Keywords: Handwriting recognition, feature extraction, artificial neural network
1. PENDAHULUAN
Penelitian dalam bidang pengenalan tulisan tangan telah dilakukan sejak puluhan tahun yang lalu, namun usaha-usaha untuk mendapat tingkat akurasi pengenalan tulisan tangan yang lebih baik masih terus dilakukan oleh para peneliti seiring dengan kemajuan teknologi pen elektronis dan aplikasinya [1,2]. Pada dasarnya ada 2 bagian penting yang mempengaruhi akurasi pengenalan yaitu metode ekstraksi ciri dan teknik klasifikasi.
Pada makalah ini akan dibahas satu bagian penting yang turut mempengaruhi tingkat akurasi suatu sistem pengenalan tulisan tangan yaitu metode ekstraksi ciri. Pembahasan didasarkan atas hasil studi eksperimental penggunaan metode ekstraksi ciri sederhana dibandingkan dengan penggunaan metode ekstraksi ciri yang lebih kompleks. Eksperimen-eksperimen dilakukan dengan menggunakan paket 1 ekstraksi ciri berupa arah coretan dan paket 2 ekstraksi ciri berupa kondisi pena, posisi, arah, kurva, dan citra tulisan. Sedangkan teknik klasifikasi keduanya menggunakan metode Jaringan Saraf Tiruan (JST). Pengenalan tulisan yang dikaji dalam penelitian ini berupa tulisan angka. Data yang digunakan dalam penelitian ini diambil dari sebagian data standart internasional IRONOFF untuk proses pelatihan jaringan saraf tiruan serta proses pengujiannya.
Pada seksi berikutnya dari tulisan ini, akan dijelaskan tentang metodologi penelitian yang dilakukan. Hasil dan pembahasan akan disajikan pada seksi 3, sedangkan seksi terakhir merupakan kesimpulan dari tulisan ini.
2. METODOLOGI PENELITIAN
Secara umum sistem pengenalan tulisan tangan dapat ditunjukkan pada Gambar 1.
Gambar 1. Blok diagram sistem pengenalan tulisan tangan
Gambar di atas menunjukkan blok diagram sistem pengenalan tulisan yang meliputi akuisisi data, normalisasi ukuran & resampling, ekstraksi ciri, pengklasifikasi JST, dan hasil pemroses akhir.
2.1 Akuisisi data, Normalisasi ukuran & Resamplimg
Proses awal dari pengenalan tulisan adalah akuisisi data yang berfungsi mengambil informasi-informasi penting dari piranti masukan tablet. Data berupa koordinat x,y dari titik-titik ‘tinta’ sesuai dengan gerakan pena elektronis yang membentuk huruf atau simbol-simbol.
Proses normalisasi digunakan untuk mengurangi pengaruh dari perbedaan-perbedaan tulisan tangan dan untuk menyederhanakan bentuk algoritma pengenalan. Proses normalisasai ini biasanya dilakukan dengan normalisasi ukuran dan resampling [3]. Normalisasi ukuran berfungsi untuk mengubah ukuran tulisan yang ditulis dalam bentuk ukuran yang berbeda-beda menjadi tulisan berukuran sama. Normalisasi ukuran dilakukan dengan mengubah skala koordinat baru untuk kedua sumbu vertikal dan horisontal:
W
x
x
x
x
x
o i i min max min−
−
=
...(1)H
y
y
y
y
y
o i i min max min−
−
=
...(2) dengan,(
o)
i o iy
x
,
= titik-titik koordinat “tinta” asli(
x
i,
y
i)
= titik-titik koordinat baru setelah proses transformasi{ }
o i i x xmin =min{ }
o i i x xmax = max{ }
o i iy
y
min=
min
{ }
o i i y ymax =max W = lebar tulisan H = tinggi tulisanResampling berfungsi mengubah jarak antar titik-titik koordinat dan jumlah titik menjadi seragam menggunakan algoritma interpolasi linier. Umumnya data asli hasil akuisisi data diperoleh koordinat titik-titik ‘tinta’ dengan jumlah yang tidak sama serta jarak antar titik yang
tidak sama pula, sebagaimana ditunjukkan pada Gambar 2. Interval jarak ΔS masing-masing titik dapat ditentukan dengan membagi jarak total dari tulisan:
∑
− = = 1 1 n i i d L ...(3)(
) (
)
2 1 2 1 + + + − − = i i i i i x x y y d ...(4) 1 n L S = Δ ...(5) dengan,di = jarak antar titik-titik “tinta”
n = jumlah titik data tulisan asli
n1 = jumlah titik yang dikehendaki setelah proses resampling
Gambar 2. Contoh tulisan (a) data asli dan (b) setelah normalisasi ukuran dan resampling
2.2 Ekstraksi ciri
Ekstraksi ciri berfungsi untuk menajamkan perbedaan-perbedaan pola sehingga akan sangat memudahkan dalam pemisahan antar klas pada proses klasifikasi. Ekstraksi ciri merupakan tahap yang sangat penting dan sulit dalam teknik klasifikasi pola, bahkan seringkali tingkat keberhasilan dari sistem pengenalan pola selalu dikaitkan dengan metode ekstraksi ciri yang digunakan. Pada penelitian dilakukan pengkajian secara eksperimen atas 2 paket ekstraksi ciri untuk mengetahui pengaruhnya terhadap tingkat akurasi pengenalan.
2.2.1 Ekstraksi ciri paket 1
Pada paket 1 ini, ekstraksi ciri didasarkan atas arah coretan tulisan yang diekstraksi menjadi nilai besaran 0 sampai dengan 7 sebagaimana terlihat pada bagian kode arah pada Gambar 3. Arah vektor (Δx, Δy) yang dinyatakan dengan nilai (0,1), (1,1), (1,0), (1,-1), (0, -1), (-1, -1), (-1, 0), dan (-1, 1) berturut-turut merupakan representasi dari nilai 0,1,2,...,7 pada kode arah. Nilai-nilai arah vektor sebagai hasil ekstraksi ciri ini selanjutnya akan digunakan sebagai nilai masukan pada modul pengklasifikasi JST.
Gambar 3. Kode arah
2.2.2 Ekstraksi ciri paket 2
Ekstraksi ciri untuk paket 2, terdiri dari kondisi pena, posisi, arah, kurva, dan citra tulisan. Kondisi pena diekstraksi dengan nilai 1 saat pena menyentuh tablet dan 0 pena tidak menyentuh tablet (diangkat). Arah coretan ditentukan dengan satu pendekatan:
ds
dx
dandy
ds
, dengan ds = dx2 +dy2 .) ( ) ( ) ( cos n s n x n Δ Δ = θ ...(6) ) ( ) ( ) ( sin n s n y n Δ Δ = θ ...(7)
Gambar 4. Estimasi arah tulisan Kurva coretan merupakan turunan kedua 2 2
ds
x
d
and 2 2ds
y
d
dan kurva local dilakukan dengan pendekatan sudut antara kedua segmen arah sebagaimana ditunjukkan pada Gambar 5. Sudut ini juga dinyatakan dengan sinus dan cosinus-nya sebagai berikut:(
( 1) ( 1))
cos ) ( cosφ n = θ n+ −θ n− ...(8)(
( 1) ( 1))
sin ) ( sinφ n = θ n+ −θ n− ...(9)Gambar 5. Estimasi kurva tulisan
Keseluruhan ekstraksi ciri yang telah dinormalisasi antara 0 dan +1 adalah sebagai berikut: otherwise f if pen is down 0 1 0 ⎩ ⎨ ⎧ = ...(10) min max min 1
x
x
x
x
f
−
−
=
...(11) min max min 2y
y
y
y
f
−
−
=
...(12)(
cos
1
/
2
3=
θ
+
)
f
...(13)(
sin 1 /2 4 =θ
+)
f ...(14)(
cos 1 /2 5 =φ
+)
f ...(15)(
sin 1)
/2 6 =φ
+ f ...(16)Citra tulisan merupakan bitmap koordinat-koordinat titik tulisan yang dibagi dalam 10 baris dan 10 kolom. Dengan demikian keseluruhan ekstraksi ciri sebanyak 450 buah sebagai pola masukan sistem JST.
Gambar 6. Contoh ekstraksi ciri angka ‘2’
2.3 Pengklasifikasi JST
Pada penelitian ini, teknik pengklasifikasi pola masukan menggunakan jaringan saraf tiruan perseptron multi lapis dengan 1 lapis tersembunyi, sebagaimana ditunjukkan pada Gambar 7.
Gambar 7. Arsitektur JST k
y
, , dan berturut-turut adalah nilai-nilai keluaran dari lapis keluaran, lapis tersembunyi, dan lapis masukan. adalah bobot-bobot antara lapis keluaran dan lapis tersembunyi, dan adalah bobot-bobot antara lapis tersembunyi dan lapis masukan. Algoritma pelatihan menggunakan propagasi balik [4]. Sistem JST ini mampu mengklasifikasi tulisan angka sebanyak 10 buah, yang berarti semua pola masukan yang dilatihkan pada sistem JST ini akan diklasifikasikan menjadi 10 klas. Hasil pengenalan dapat ditentukan berdasarkan nilai maksimum dari nilai-nilai keluaran JST berikut :j
z
x
i jkw
ijv
m
k
y
k
k k≤
≤
=
arg
max
,
1
*
...(17)3. HASIL DAN PEMBAHASAN
Sistem berbasis JST telah dilatih dan dilakukan pengujian menggunakan sebagian data kategori tulisan angka dari database standart internasional IRONOFF [5]. Dalam penelitian ini sistem JST telah dilatihkan dengan sebanyak 3.060 sampel dan dilakukan pengujian (testing)
dengan 1.150 sampel. Jumlah neuron pada lapis masukan ditentukan 100 neuron untuk paket 1 dan 450 neuron untuk paket 2. Jumlah neuron pada lapis tersembunyi adalah 100 neuron. Hasil-hasil eksperimen ditunjukkan pada Tabel 1.
Tabel 1. Hasil-hasil eksperimen
Ekstraksi ciri # Data latihan # Data uji Akurasi (%)
Paket 1 3.060 1.150 83,9
Paket 2 3.059 1.150 97,3
4. SIMPULAN
Sistem pengenalan tulisan tangan dinamis berbasis jaringan saraf tiruan menunjukkan tingkat akurasi yang berarti dengan menggunakan ekstraksi ciri yang lebih kompleks. Hasil-hasil eksperimen dari pengujian sistem menggunakan sebagian data dari IRONOFF menunjukkan kenaikan akurasi dari 83,9% untuk ekstraksi ciri dengan paket 1 menjadi 97,3% untuk ekstraksi ciri paket 2 yang lebih kompleks.
Pada penelitian selanjutnya, sistem yang telah dibuat ini masih dimungkinkan untuk ditingkatkan lagi unjuk kerja atau akurasi pengenalannya, misalnya dengan menggunakan teknik ekstraksi ciri atau teknik klasifikasi yang lain.
DAFTAR PUSTAKA
[1] R. Plamondon, and S. N. Srihari, ”On-line and Off-line Handwriting Recognition : A Comprehensive Survey” IEEE Transactions on Pattern Analysis and Machine
Intelligence, vol. 22, no.1, pp. 63-81, Jan 2000.
[2] C.C. Tappert, C. Y. Suen, and T. Wakahara, “The State of the Art in On-Line Handwriting Recognition” IEEE Trans. Pattern Analysis ad Machine Intelligence, vol.
12, no.8, pp. 787-808, Aug. 1990.
[3] Raph G., “Run-On Recognition in an On-line Handwriting Recognition System” Report, University of Karlsruhe, Germany, June 1997.
[4] Fauset L., “Fundamentals of Neural Networks”, Prentice Hall Inc., USA, 291-296, 1994. [5] C. Viard-Gaudin, P. M. Lallican, S. Knerr, and P. Binter, “The IRESTE On/Off