ARAB DENGAN MENGGUNAKAN JARINGAN SYARAF TIRUAN LVQ (LEARNING VECTOR QUANTIZATION)
Alfan Zahriyono¹, Ahmad Suryan. .², Mahmud Dwi Suliiyo³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
Abstrak
Perkembangan teknologi ICT di zaman sekarang terus berkembang, salah satu teknologi yang digunakan dalam aplikasi kehidupan manusia adalah Optical Character Recognition. Teknologi ini mampu untuk mengenali tulisan tangan manusia yang dapat dibaca oleh komputer. Aplikasi ini dapat diterapkan kedalam pengenalan tulisan huruf dan angka. Salah satunya adalah penulisan huruf hijaiyyah dan angka arab. Huruf dan angka arab memiliki perbedaan dengan penulisan bahasa lain. Hal ini dapat dilihat dari tingkat kesulitan dan tata cara penulisannya. Komputer dapat mengenali suatu pola tulisan tangan manusia dalam bentuk gambar, maka dibutuhkan suatu metode yang mampu untuk mengklasifikasikan pola tersebut. Metode yang cocok untuk melakukan klasifikasi data salah satunya adalah Jaringan syaraf tiruan Learning Vector Quantization (LVQ)[13].
Pada tugas akhir ini akan dibuat suatu sistem yang mampu membaca inputan gambar berupa karakter huruf dan angka arab menggunakan haar wavelet dan jaringan syaraf tiruan LVQ. Metode haar wavelet digunakan sebagai ekstraksi ciri yang mampu mengurangi ukuran piksel suatu citra menjadi seperempat bagian dari citra awal. Algoritma LVQ digunakan sebagai klasifikasi data.
Hasil dari pengujian yang dilakukan dengan mengkombinasikan haar wavelet dan LVQ maka diperoleh tingkat akurasi kebenaran untuk angka arab sebesar 94% dan huruf hijaiyyah sebesar 79.76% untuk data yang menggunakan pulpen dan 65.47% menggunakan spidol.
Kata Kunci : Pengenalan pola, Haar Wavelet, LVQ
Abstract
Development of ICT in today's technology continues to evolve, one of the technologies used in the application of human life is Optical Character Recognition. This technology is able to recognize human handwriting that can be read by a computer. This application can be implemented into the introduction of writing letters and numbers. One of them is writing letters and arabic numerals hijaiyyah. Arabic letters and numbers have a difference with latin writing. It can be seen from the level of difficulty and procedure writing.
The computer can recognize a pattern of human handwriting in the form of images is required a method that is able to classify the pattern. The method is suitable to perform the data
classification is one of artificial neural networks Learning Vector Quantization (LVQ)[13]. At the end of this task will be a system capable of reading the input images of characters and Arabic numbers using haar wavelet and neural network LVQ. Haar wavelet method is used as a preprocessing that is able to reduce the size of the pixels of an image into a quarter part of the first image. LVQ algorithm is used for data classification.
Results of tests performed by combining the haar wavelet and LVQ truth of the obtained level of accuracy for 94% arabic numerals and letters hijaiyyah of 79.76% for the data using a pen and 65.47% using the markers.
Keywords : Pattern Recognition, Haar Wavelet, LVQ
Powered by TCPDF (www.tcpdf.org)
1
1.
Pendahuluan
1.1
Latar belakang
Optical Character Recognition (OCR) merupakan kemampuan khusus untuk membaca file gambar ke dalam teks biasa. Data gambar tersebut awalnya ditulis dengan menggunakan kertas yang kemudian diubah menjadi image dengan format
.jpeg menggunakan mesin scanner agar file yang telah menjadi .jpeg tersebut dapat diolah oleh komputer. Cara kerja manusia dengan komputer untuk mengenali suatu objek tentu sangat berbeda, oleh karena itu proses untuk bisa dikenali oleh komputer butuh beberapa tahap.
Kita ketahui bahwasanya tulisan tangan antara orang yang satu dengan yang lainnya memiliki gaya tulisan yang berbeda. Untuk bisa mengenali berbagai macam pola dengan berbagai macam gaya tulisan tangan manusia, maka metode yang dibutuhkan salah satunya adalah Jaringan Syaraf Tiruan (JST), karena metode ini dirancang mirip dengan cara kerja sistem syaraf pada otak manusia[9]. Salah satu bagian dari JST (Jaringan Syaraf Tiruan) adalah konsep MLP (Multi Layer Perceptron), konsep ini berdasarkan arsitekturnya yang terdiri dari input layer, hidden layer dan output dapat menyelesaikan permasalahan yang cukup kompleks. JST telah banyak digunakan dalam berbagai aplikasi kehidupan, seperti pembacaan pada plat kendaraan mobil dan motor, meteran listrik, pengenalan pada bidang biometrik, pengenalan pada wajah manusia dan lain-lain. Salah satu kegunaan konsep ini adalah mampu digunakan untuk mengenali berbagai macam pola tulisan tangan berupa karakter huruf atau angka seperti pengenalan angka dan huruf arab. Kita ketahui bahwa tulisan arab memiliki karakteristik yang unik jika dibandingkan dengan penulisan bahasa lainnya. Kebanyakan orang lebih sulit untuk menulis tulisan arab. Hal ini lah yang menyebabkan tidak semua orang bisa menulis tulisan arab. Sehingga diperlukan adanya suatu sistem pengenalan pola angka dan huruf arab agar bisa dipelajari oleh orang-orang terutama umat muslim.
Sistem JST yang akan dibangun yaitu bagaimana sistem tersebut bisa mengenali angka Arab dan huruf Hijaiyyah dengan berbagai macam gaya tulisan manusia. Istilah yang digunakan untuk pembelajaran pada sistem adalah proses
learning dengan tujuan sistem dibekali berbagai macam tulisan tangan dengan gaya tulisan yang berbeda sehingga bisa mengenali satu pola dengan berbagai macam gaya tulisan tangan.
Metode JST yang dapat digunakan untuk mengenali karater angka arab dan huruf hijaiyyah salah satunya adalah JST LVQ (Learning Vector Quantization) dimana metode ini memang khusus digunakan sebagai klasifikasi data [13]dan ekstraksi ciri yang dapat digunakan adalah metode Haar Wavelet yang mampu mengurangi jumlah pixel pada citra sehingga hasil dari Haar Wavelet akan digunakan sebagai masukan metode LVQ.
2
1.2
Perumusan masalah
Beberapa masalah yang terdapat dalam membangun sistem adalah sebagai berikut:
1. Bagaimana mengimplementasikan metode haar wavelet sebagai ekstraksi ciri.
2. Bagaimana mengimplementasikan metode JST LVQ pada tahap pengklasifikasian data huruf hijaiyyah dan karakter angka arab.
3. Bagaimana mengukur dan menganalisis keakuratan performansi sistem dalam mengklasifikasikan huruf hijaiyyah dan karakter angka arab.
1.3
Batasan Masalah
Batasan masalah pada tugas akhir ini adalah sebagai berikut:
1. Studi kasus yang digunakan pada tugas akhir ini yaitu image pada karakter angka arab ٠.١.٢.٣.٤.٥.٦.٧.٨.٩ dan pengambilan data melalui tulisan tangan. Sampel tulisan tangan diambil sebanyak 26 (dua puluh enam) orang. Sehingga untuk jumlah data angka arab sendiri ada 260 data dan penulisan menggunakan spidol berwarna hitam dan kertas A4. 2. Untuk data huruf hijaiyyah menggunakan kertas putih dan kertas sedikit berwarna dengan media penulisan menggunakan spidol dan pulpen berwarna hitam.
3. Jumlah huruf Hijaiyyah sebanyak 28 huruf.
4. Jumlah data untuk huruf hijaiyyah adalah 868 diambil dari 31 sampel tulisan tangan yang berbeda.
5. Latar belakang pada huruf hijaiyyah dibagi dua yaitu, putih dan sedikit berwarna.
6. Penulisan huruf hijaiyyah menggunakan pulpen dan spidol.
7. Penulisan huruf hijaiyyah yang tidak disertai harakat dan penulisan huruf tidak bersambung.
8. Gambar yang digunakan berukuran 150x150 px.
9. Proses ekstraksi ciri menggunakan haar wavelet yang terdapat dalam
library matlab.
1.4
Tujuan
Tujuan yang ingin dicapai dalam tugas akhir ini adalah sebagai berikut: 1. Mengimplementasikan metode haar wavelet sebagai ekstraksi ciri. 2. Mengimplementasikan metode JST-LVQ untuk pengenalan huruf
hijaiyyah dan karakter angka arab.
3. Menganalisis pengaruh parameter yang terdapat di haar wavelet dan LVQ terhadap akurasi sistem.
4. Mengukur tingkat akurasi kebenaran pada proses learning dalam mengenali huruf hijaiyyah dan angka arab.
5. Mengetahui hasil akurasi yang diperoleh huruf hijaiyyah dan karakter angka arab.
3
1.5
Metodologi Penyelesaian Masalah
1. Studi Literatur
Mencari dan mengumpulkan data dengan membaca dan mempelajari dari buku, jurnal dan sumber lainnya yang berhubungan dengan masalah ini, yaitu implementasi pembacaan huruf hijaiyyah dan angka arab dengan menggunakan Jaringan Syaraf Tiruan LVQ dan menggunakan metode haar wavelet sebagai metode untuk mendapatkan hasil ekstraksi ciri.
2. Pengumpulan Data
Pengumpulan data dilakukan dengan mengambil sampel tulisan tangan sebanyak 31 orang untuk huruf hijaiyyah dan 26 orang untuk angka arab. Data tersebut diperoleh dengan menggunakan kertas A4 dan kertas sedikit berwarna dan spidol dan pulpen sebagai media penulisan data. Kemudian data tersebut dipindahkan ke dalam bentuk .jpeg
dengan cara men-scan data tersebut dengan mesin scanner. 3. Perancangan Sistem
Merancang metode haar wavelet dan arsitektur jaringan algoritma LVQ untuk implementasi pembacaan huruf hijaiyyah dan angka arab. 4. Implementasi
Mengimplementasikan rancangan yang telah dibuat dengan menggunakan aplikasi matlab.
5. Analisis Hasil Implementasi
Menganalisis tingkat akurasi yang diperoleh sistem dengan cara merubah parameter-parameter yang ada di dalam metode haar wavelet
dan LVQ.
6. Laporan Tugas Akhir
Pembuatan dokumentasi berupa laporan tugas akhir.
Powered by TCPDF (www.tcpdf.org)
30
5.
Kesimpulan dan Saran
5.1
Kesimpulan
Berdasarkan hasil analisis dan pengujian yang dilakukan maka dapat disimpulkan:
1. Metode Haar Warvelet dan JST LVQ dapat digunakan untuk mengenali karakter angka arab dan huruf hijaiyyah.
2. Level dekomposisi pada haar warvelet yang cocok digunakan sebagai masukan neuron input LVQ adalah level 2.
3. Akurasi yang didapat untuk angka arab dan huruf hijaiyyah berbeda, dikarenakan jumlah data untuk data latih dan validasi, jumlah pola yang dikenali, jumlah kemiripan pola pada karakter dan parameter LVQ yang digunakan berbeda.
4. Akurasi kebenaran yang didapat untuk angka arab sebesar 94%, huruf hijaiyyah type 1 (menggunakan pulpen) 79.76% dan type 2(menggunakan spidol) 65.47%
5.2
Saran
Saran Penulis adalah sebagai berikut:
1. Memilih preprocessing yang baik atau bisa juga ditambahkan. Salah satunya adalah perbaikan pada kualitas data, bisa berupa teknik pengambilan data yang baik, penghilangan noise pada kertas.
2. Pemilihan ekstraksi ciri lainnya, seperti Daubecchies dan coiflet.
Powered by TCPDF (www.tcpdf.org)
31
Daftar Pustaka
[1] Aburas, Abdurazzag., Rehiel, Salem. 2007. Off-Line Omni-Style Handwriting Arabic Character Recognition System Based on Wavelet Compression. Malaysia.
[2] Bullinaria, John. 2007. Learning Vector Quantization (LVQ).
[3] Gavlasova, Andrea., Prochazka, Ales., Mudrova, Martina. Wavelet Based Image Segmentation. Praha: Institute of Chemical Technology. [4] Hermanto, I Gede. Analisis Dan Implementasi Pengenalan Huruf Bali
Menggunakan Modified Direction Feature Dan Jaringan Syaraf Tiruan. Bandung: Institut Teknologi Telkom.
[5] Kusumadewi, Sri. 2004. Membangun Jaringan Syaraf Tiruan Menggunakan MATLAB dan EXCELLINK. Yogyakarta : Graha Ilmu. [6]
[7]
Pfeifer , Rolf., Damian, Dana., Fuchslin, Rudolf. Neural Networks.
Prakosa, Teguh. Implementasi Dan Analisis Handwriting Character Recognition Menggunakan Ekstraksi Ciri Titik, Normalized Countour Analysis, dan Backpropagation. Bandung: IT Telkom.
[8] Rakhmanullah, Afif. 2010. Autentifikasi Pengenalan Pola Tanda Tangan Manual Menggunakan Jaringan Syaraf Tiruan LVQ (Learning Vector Quantization) dan Tanda Tangan Digital Menggunakan Algoritma RSA (Riset Shamir Adleman).Malang: UIN Maulana Malik Ibrahim.
[9] Siang, Jong Jek. 2009. Jaringan Syaraf Tiruan & Pemrogramannya menggunakan Matlab.Yogyakarta: Andi.
[10] Sihombing, Togu. Pengenalan Huruf Tulisan Tangan Menggunakan Jaringan Syaraf Tiruan Metode LVQ (Learning Vector Quantization).
[11] Suslianto, Rizky. 2011. Identifikasi Pembuat Tulisan Tangan Menggunakan Haar Wavelet dan Algoritma Propagasi Balik Levenberg Marquardt. Bandung: IT Telkom.
[12] Sutarno. Analisis Perbandingan Transformasi Wavelet pada Pengenalan Citra Wajah. Sriwijaya: Fakultas Ilmu Komputer Sriwijaya.
[13] Suyanto.2008. Soft Computing Membangun Mesin Ber-IQ Tinggi.Bandung : Informatika.
[14] Wibowo, Kukuh Haryo. 2011. Pembangunan Sistem Otomisasi Pembacaan Meter Listrik Berbasis Pengolahan Citra, Liniear Discriminant Analysis (LDA) dan Learning Vector Quantization.
Bandung: Institut Teknologi Telkom.
Powered by TCPDF (www.tcpdf.org)