ABSTRAK
Aksara Batak Karo merupakan salah satu budaya Indonesia yang layak
dilestarikan. Dalam pengenalan suatu obyek dibutuhkan proses pembelajaran, yang
didapatkan melalui ciri-ciri dan pengalaman dalam mengamati obyek ynag serupa
yang telah didapatnya. Salah satu metode yang bisa digunakan untuk mengenali
pola tersebut adalah Jaringan Syaraf Tiruan Back Propagation.
Dalam Back Propagation, dibentuklah sebuah jaringan syaraf tiruan dengan
struktur layer input, layer tersembunyi, dan layer output. Pada pelatihan jaringan
tersebut layer tersembunyi mempunyai fungsi aktivasi yang berpengaruh pada
pembelajaran dari alat tersebut. Ketika pengujian hal yang dilakukan hampir mirip
dengan training hanya saja sudah ada target yang dipersiapkan. Jika dari data uji
yang diolah ada yang menemui hasil target maka digolongkan sebagai aksara yang
sama dengan target tersebut.
Tujuan dari penelitian ini adalah mengetahui kemampuan penggunakan
metode Back Propagation dalam pengenalan pola aksara batak karo dan
mengetahui berapa besar prosentase keakuratan penggunaan metode Back
Propagation dalam pengenalan pola Aksara Batak Karo.
Pada penelitian ini digunakan pencirian menghitung piksel hitam (Intencity
of Character) dan menghitung arah menggunakan masking diagonal kiri, diagonal
kanan, vertikal, dan horizontal (Mark Direction). Hasil yang diperoleh dalam
penelitian ini adalah ketika menggunakan kombinasi ciri 8 ada 151 data benar dan
tepat oleh alat uji back propagation. Tingkat akurasi tertinggi sebesar 90%.
Jaringan yang digunakan menggunakan 2 lapisan tersembunyi dan 1 lapisan
keluaran, dengan jumlah neuron 20 layer 1, 35 layer 2, dan lapisan keluaran 21.
Dari hasil yang diperoleh dalam penelitian maka penelitian ini dinyatakan berhasil
membuktikan bahwa metode back propagation mampu mengenali tulisan tangan
aksara batak karo karena sudah mencapai tingkat kebehasilan akurasi diatas 85%.
Kata Kunci: Pengenalan Pola, Mark Direction, Intencity Of Character, Jaringan
ABSTRACT
Batak Karo Character is one of Indonesia culture that need to be preserved.
Recognizing an object takes a learning process, which is obtained through the
characteristics and experience in observing a similar object that has been earned.
One of methods that can be used to recognize these patterns is a neural network
back propagation.
In Back Propagation, a neural network formed with the structure of the input
layer, hidden layer and output layer. On the training of the network, hidden layer
has an activation function which affects the learning of these tools. During testing,
it perfomed almost similar to training. Only the targets were prepared. If the test
data processed met the target results then it would be classified as the same
character with the target.
The purpose of this research is to know the ability of Back Propagation
method in characters batak karo pattern recognition and to find out how much
percentage of accuracy using Back Propagation method in Batak Karo characters
pattern recognition.
This study used the characterization of calculating a black pixel (Intencity of
Character) and calculating the direction by applying masking diagonal left, right
diagonal, vertical, horizontal (Mark Direction). There were 151 data correct by back
propagation test aquipment after applying feature combination 8. The highest
accuracy rate was 90%. The back propagation used two layer, with the number of
neurons in 20 hidden layer 1, 35 hidden layer 2 and in output layer was 21. From
the results, this study revealed succeeded in proving that the back propagation
method was able to recognize Batak Karo characters because it achivied a success
rate of accuracy above 85%.
i
PENGENALAN POLA AKSARA BATAK KARO MENGGUNAKAN METODE BACK PROPAGATION HALAMAN JUDUL
SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Oleh:
APRILLIA RINJANI PUTRI 125314044
PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA YOGYAKARTA
ii
PATTERN RECOGNATION OF BATAK KARO CHARACTER USING BACK PROPAGATION METHOD
TITLE PAGE
A THESIS
Presented as Partial Fulfillment of Requirements to Obtain Sarjana Komputer Degree
in Informatics Engineering Department
By:
Aprillia Rinjani Putri 125314044
INFORMATICS ENGINEERING STUDY PROGRAM INFORMATICS ENGINEERING DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY
iii
SKRIPSI HALAMAN PENGESAHAN
PENGENALAN POLA AKSARA BATAK KARO MENGGUNAKAN METODE BACK PROPAGATION
Dipersiapkan dan ditulis oleh : APRILLIA RINJANI PUTRI
NIM : 125314044
Telah dipertahankan di depan Panitia Penguji Pada tanggal 12 Januari 2017
dan dinyatakan memenuhi syarat
Susunan Panitia Penguji
Nama Lengkap Tanda Tangan
Ketua : Dr. Anastasia Rita Widiarti, M. Kom. ……….. Sekretaris : Eko Hari Parmadi, S.Si., M.Kom. ………..
Anggota :Dr. C. Kuntoro Adi, SJ., M.A., M.Sc. ...
Yogyakarta, ..... …………. 2017 Fakultas Sains dan Teknologi
Universitas Sanata Dharma
iv
MOTTO
“Sesuatu yangbelum dikerjakan, seringkali tampak mustahil; kita baru yakin
kalau kita telah berhasil melakukannya dengan baik. ”
v
MOTTO
“Sesuatu yangbelum dikerjakan, seringkali tampak mustahil; kita baru yakin
kalau kita telah berhasil melakukannya dengan baik. ”
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa di dalam skripsi yang saya
tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah
viii
ABSTRAK
Aksara Batak Karo merupakan salah satu budaya Indonesia yang layak
dilestarikan. Dalam pengenalan suatu obyek dibutuhkan proses pembelajaran,
yang didapatkan melalui ciri-ciri dan pengalaman dalam mengamati obyek ynag
serupa yang telah didapatnya. Salah satu metode yang bisa digunakan untuk
mengenali pola tersebut adalah Jaringan Syaraf Tiruan Back Propagation.
Dalam Back Propagation, dibentuklah sebuah jaringan syaraf tiruan dengan
struktur layer input, layer tersembunyi, dan layer output. Pada pelatihan jaringan
tersebut layer tersembunyi mempunyai fungsi aktivasi yang berpengaruh pada
pembelajaran dari alat tersebut. Ketika pengujian hal yang dilakukan hampir mirip
dengan training hanya saja sudah ada target yang dipersiapkan. Jika dari data uji
yang diolah ada yang menemui hasil target maka digolongkan sebagai aksara
yang sama dengan target tersebut.
Tujuan dari penelitian ini adalah mengetahui kemampuan penggunakan
metode Back Propagation dalam pengenalan pola aksara batak karo dan
mengetahui berapa besar prosentase keakuratan penggunaan metode Back
Propagation dalam pengenalan pola Aksara Batak Karo.
Pada penelitian ini digunakan pencirian menghitung piksel hitam (Intencity
of Character) dan menghitung arah menggunakan masking diagonal kiri, diagonal
kanan, vertikal, dan horizontal (Mark Direction). Hasil yang diperoleh dalam
penelitian ini adalah ketika menggunakan kombinasi ciri 8 ada 151 data benar dan
tepat oleh alat uji back propagation. Tingkat akurasi tertinggi sebesar 90%.
Jaringan yang digunakan menggunakan 2 lapisan tersembunyi dan 1 lapisan
keluaran, dengan jumlah neuron 20 layer 1, 35 layer 2, dan lapisan keluaran 21.
Dari hasil yang diperoleh dalam penelitian maka penelitian ini dinyatakan berhasil
membuktikan bahwa metode back propagation mampu mengenali tulisan tangan
aksara batak karo karena sudah mencapai tingkat kebehasilan akurasi diatas 85%.
Kata Kunci: Pengenalan Pola, Mark Direction, Intencity Of Character, Jaringan
ix
ABSTRACT
Batak Karo Character is one of Indonesia culture that need to be preserved.
Recognizing an object takes a learning process, which is obtained through the
characteristics and experience in observing a similar object that has been earned.
One of methods that can be used to recognize these patterns is a neural network
back propagation.
In Back Propagation, a neural network formed with the structure of the input
layer, hidden layer and output layer. On the training of the network, hidden layer
has an activation function which affects the learning of these tools. During testing,
it perfomed almost similar to training. Only the targets were prepared. If the test
data processed met the target results then it would be classified as the same
character with the target.
The purpose of this research is to know the ability of Back Propagation
method in characters batak karo pattern recognition and to find out how much
percentage of accuracy using Back Propagation method in Batak Karo characters
pattern recognition.
This study used the characterization of calculating a black pixel (Intencity of
Character) and calculating the direction by applying masking diagonal left, right
diagonal, vertical, horizontal (Mark Direction). There were 151 data correct by
back propagation test aquipment after applying feature combination 8. The
highest accuracy rate was 90%. The back propagation used two layer, with the
number of neurons in 20 hidden layer 1, 35 hidden layer 2 and in output layer was
21. From the results, this study revealed succeeded in proving that the back
propagation method was able to recognize Batak Karo characters because it
achivied a success rate of accuracy above 85%.
x
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa, sehingga
penulis dapat menyelesaikan tugas akhir dengan judul “Pengenalan Pola Tulisan Tangan Aksara Batak Karo menggunakan Metode Back Propagation”. Tugas akhir ini merupakan salah satu mata kuliah wajib dan sebagai syarat akademik
untuk memperoleh gelar sarjana komputer program studi Teknik Informatika
Universitas Sanata Dharma Yogyakarta.
Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada
pihak-pihak yang telah membantu penulis baik selama penelitian maupun saat
mengerjakan tugas akhir ini. Ucapan terima kasih sebesar-besarnya penulis
sampaikan kepada:
1. Tuhan Yang Maha Esa, yang telah memberikan pertolongan dan kekuatan
dalam proses pembuatan tugas akhir.
2. Yayasan Perkumpulan Dharma Putri yang telah memberikan beasiswa
Ikatan Dinas
3. Orang tua M.M Yayuk Turliani dan Sr.Frida Sri Suliyani SPM, kakak
Aprillius Fanda, adik Febrina Putri Dewi, serta seluruh keluarga yang telah
memberikan dukungan spiritual dan material.
4. Dr. Cyprianus Kuntoro Adi, SJ., M.A., M.Sc. selaku dosen pembimbing
tugas akhir, atas bimbingan, waktu dan saran yang telah diberikan kepada
penulis.
5. Iwan Binanto S.Si, M.Cs selaku dosen pembimbing akademik, atas
bimbingan, kritik dan saran yang telah diberikan kepada penulis.
6. Dr. Anastasia Rita Widiarti M.Kom selaku ketua program studi Teknik
Informatika, atas bimbingan, kritik dan saran yang telah diberikan kepada
penulis.
7. Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D. selaku Dekan Fakultas Sains dan
Teknologi, atas bimbingan, kritik dan saran yang telah diberikan kepada
xi
8. Seluruh dosen Teknik Informatika atas ilmu yang telah diberikan semasa
kuliah dan sangat membantu penulis dalam mengerjakan tugas akhir.
9. Teman-teman Teknik Mesin, Yuni, Zhena atas bantuannya terhadap penulis
dalam mengumpulkan data untuk penelitian ini serta membantu memberi
informasi yang dibutuhkan dalam penelitian ini.
10. Trio Majalengka (Eva, Okta, Lia) yang selalu memberikan support dalam
menyelesaikan penelitian ini.
11. Teman Selo (Raisa, Agata, Siska, Toni, Feliks Eko, Yunus, Tata, Arel,
Ningrum) yang saling memberi dukungan, semangat ketika jenuh dan malas
dalam mengerjakan tugas akhir ini.
12. Teman-teman Teknik Informatika 2012 Sanata Dharma, terima kasih atas
semangat dan perjuangan selama 4 tahun bersama yang telah kalian berikan
kepada satu sama lain.
13. Teman-teman komputasi Ekli, Yosep Dio, Echo yang telah membantu
penulis dalam mengerjakan tugas akhir.
14. Anak Bimbingan Romo Kun (Wigha, Nita, Okta, Riya, Bondan, Dhesa,dll)
yang berjuang bersama dalam menyelesaikan tugas akhir.
15. Semua pihak yang tidak dapat disebutkan satu per satu yang telah
membantu penulis dalam pengerjaan tugas akhir ini.
Penulis menyadari masih banyak kekurangan yang terdapat dalam laporan
tugas akhir ini. Saran dan kritik sangat diharapkan untuk hasil yang lebih baik di
masa mendatang.Akhir kata, penulis berharap tulisan ini dapat berguna bagi
perkembangan ilmu pengetahuan dan wawasan pembaca.
Penulis,
xii
DAFTAR ISI
1
HALAMAN JUDUL ... i
HALAMAN PENGESAHAN ………..iv
MOTTO ... v
PERNYATAAN KEASLIAN KARYA ... vii
LEMBAR PERPUSTAKAAN ……….…..vii
ABSTRAK ………..viii
KATA PENGANTAR ... x
DAFTAR ISI ... xi
DAFTAR TABEL ... xiv
DAFTAR GAMBAR ... xv
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 2
1.3 Tujuan ... 3
1.4 Batasan Masalah ... 3
1.5 Sistematika Penulisan ... 4
BAB II LANDASAN TEORI ... 5
2.1 Sejarah Aksara Batak ... 5
2.2 Jaringan Syaraf Tiruan ... 8
2.2.1 Jaringan Syaraf Tiruan Propagasi Balik / Back Propagation ... 10
2.3 Pengenalan Pola ... 16
2.4 Penipisan Citra (Thining) ... 16
2.5 Ekstraksi Ciri Mark Direction dan Intencity of Character ... 17
BAB III METODOLOGI PENELITIAN ... 21
3.1 Data ... 21
3.2 Perancangan Sistem ... 22
3.2.1 Prepossesing ... 23
3.2.2 Pelatihan dan Pengujian Arsitektur JST ... 26
xiii
3.3 Kebutuhan Sistem ... 31
3.4 Perancangan Antarmuka Sistem ... 32
BAB IV IMPLEMENTASI DAN ANALISIS HASIL ... 34
4.1 Implementasi Sistem ... 34
4.1.1 Visualisasi Proses Ekstraksi Ciri ... 34
4.2 Analisis Hasil Penelitian ... 40
4.2.1 Pengujian Variasi Arsitektur Jaringan ... 40
4.2.2 Implementasi User Interface………...…..55
4.2.3 Pengujian Data Tunggal ... 62
BAB V PENUTUP ... 67
5.1 Kesimpulan ... 67
5.2 Saran ... 67
DAFTAR PUSTAKA ... 68
xiv
DAFTAR TABEL
Tabel 1.1 Tabel Penelitian ...2
Tabel 3.1 Jumlah Data Input (Kombinasi Feature) ...23
Tabel 3.2 4-Fold Cross Validation...24
Tabel 4.1 Jumlah Data Input Arsitektur Jaringan ……….36
Tabel 4.2 Hasil Akurasi seluruh percobaan ………..38
Tabel 4.3 Hasil Akurasi Feature 1 Hidden Layer 1 ………..39
Tabel 4.4 Hasil Akurasi Feature 1, Hidden Layer 2 ……….40
Tabel 4.5 Hasil Akurasi Feature 2, Hidden Layer 1 ……….41
Tabel 4.6 Hasil Akurasi Feature 2, Hidden Layer 2 ……….42
Tabel 4.7 Hasil Akurasi Feature 3, Hidden Layer 1 ……….43
Tabel 4.8 Hasil Akurasi Feature 3, Hidden Layer 2 ……….44
Tabel 4.9 Hasil Akurasi Feature 4, Hidden Layer 1 ……….45
Tabel 4.10 Hasil Akurasi Feature 4, Hidden Layer 2 ………...46
Tabel 4.11 Hasil Akurasi Feature 5, Hidden Layer 1 ………...47
Tabel 4.12 Hasil Akurasi Feature 5, Hidden Layer 2 ………...48
Tabel 4.13 Hasil Akurasi Feature 6, Hidden Layer 1 ………...49
Tabel 4.14 Hasil Akurasi Feature 6, Hidden Layer 2 ………...50
Tabel 4.15 Hasil Akurasi Feature 7, Hidden Layer 1 ………...51
Tabel 4.16 Hasil Akurasi Feature 7, Hidden Layer 2 ………...52
Tabel 4.17 Hasil Akurasi Feature 8, Hidden Layer 1 ………...53
Tabel 4.18 Hasil Akurasi Feature 8, Hidden Layer 2 ………...54
xv
DAFTAR GAMBAR
Gambar 2.1 Silsilah Aksara ...6
Gambar 2.2 Persamaan Surat Batak, Surat Ulu, Surat Incung ...7
Gambar 2.3 Ilustrasi Jaringan Lapis Tunggal ...9
Gambar 2.4 Ilustrasi Jaringan Lapis Majemuk...10
Gambar 2.5 Ilustrasi Arsitektur Back Propagation ...11
Gambar 2.6 Fungsi aktivasi... ...11
Gambar 2.23 Struktur Elemen Tanda Arah ...17
Gambar 3.1Kolom Isi Responden... ...18
Gambar 3.2 Aksara Karo Tulisan Tangan... ...19
Gambar 3.3Diagram Blok Sistem... ...20
Gambar 3.4Citra keabuan menjadi Hitam Putih ...21
Gambar 3.5Citra Setelah Thining... ...21
Gambar 3.6 Citra di bagi menjadi 9 segmen.. ...22
Gambar 3.7Arsitektur JST 1 Hidden Layer ...25
Gambar 3.8Arsitektur JST 2 Hidden Layer...25
Gambar 3.9Proses Pengenalan dan Uji Data Tunggal ...28
Gambar 3.10Tampilan Antarmuka Sistem... ...29
Gambar 3.11 Tampilan Antarmuka Sistem...29
Gambar 4.1 Hasil Baca File aksara .jpg ... ………...31
Gambar 4.2 Citra keabuan menjadi Hitam Putih ...32
Gambar 4.3Ukuran Citra ditemukan... ...32
Gambar 4.4 Citra Setelah Thining... ...33
Gambar 4.5 Citra di bagi menjadi 9 segmen... ...34
Gambar 4.6Ciri 1 dari BA KARO………... ...34
Gambar 4.7Ciri 2 dari BA KARO………... ...34
Gambar 4.8Ciri 3 dari BA KARO………... ...35
Gambar 4.9Ciri 4 dari BA KARO………... ...35
Gambar 4.10 Ciri 5 dari BA KARO ………... ...35
xvi
Gambar 4.12 Ciri 7 dari BA KARO ………... ...35
Gambar 4.13 Ciri 8 dari BA KARO ………... ...35
Gambar 4.14 Grafik Perubahan Akurasi seluruh percobaan ……….39
Gambar 4.15 Grafik Perubahan Akurasi Ciri 1, Hidden Layer 1 ………..40
Gambar 4.16 Grafik Perubahan Akurasi Ciri 1, Hidden Layer 2 ………..41
Gambar 4.17 Grafik Perubahan Akurasi Ciri 2, Hidden Layer 1 ………..42
Gambar 4.18 Grafik Perubahan Akurasi Ciri 2, Hidden Layer 2 ………..43
Gambar 4.19 Grafik Perubahan Akurasi Ciri 3, Hidden Layer 1 ………..44
Gambar 4.20 Grafik Perubahan Akurasi Ciri 3, Hidden Layer 2 ………..44
Gambar 4.21 Grafik Perubahan Akurasi Ciri 4, Hidden Layer 1 ………..45
Gambar 4.22 Grafik Perubahan Akurasi Ciri 4, Hidden Layer 2 ………..46
Gambar 4.23 Grafik Perubahan Akurasi Ciri 5, Hidden Layer 1 ……….……….47
Gambar 4.24 Grafik Perubahan Akurasi Ciri 5, Hidden Layer 2 ………..48
Gambar 4.25 Grafik Perubahan Akurasi Ciri 6, Hidden Layer 1 ………..49
Gambar 4.26 Grafik Perubahan Akurasi Ciri 6, Hidden Layer 2 ………..50
Gambar 4.27 Grafik Perubahan Akurasi Ciri 7, Hidden Layer 1 ………..51
Gambar 4.28 Grafik Perubahan Akurasi Ciri 7, Hidden Layer 2 ………..52
Gambar 4.29 Grafik Perubahan Akurasi Ciri 8, Hidden Layer 1 ………..53
Gambar 4.30 Grafik Perubahan Akurasi Ciri 8, Hidden Layer 2 ………..54
Gambar 4.31Tampilan Pelatihan dan Pengujian ………...55
Gambar 4.32 Tampilan Proses Pelatihan Arsitektur JST 1 Hidden Layer ………56
Gambar 4.33 Tampilan Proses Pelatihan Arsitektur JST 2 Hidden Layer ………57
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Indonesia sebagai Negara kepulauan memiliki warisan kekayaan
budaya yang beragam, dimana salah satunya terwujud dalam aksara atau
tulisan asli daerah yang termasuk dalam aksara Nusantara. Sebagai bagian
dari aksara Nusantara, aksara Batak Karo yang merupakan rumpun dari
aksara Batak ini perlu mendapat perhatian khusus karena terancam punah
akibat keterbatasan data dan informasi (Kertasari dkk, 2009; Kozok,2009).
Penyebab keterbatasan tersebut yaitu dulu sastra diturunkan hanya secara
lisan, aksara Batak tidak digunakan untuk tujuan sehari-hari, melainkan
salah satunya digunakan untuk menulis naskah pustaka yang sebagian
besar berisi ilmu kedukunan dan mulai tahun 1852 dimusnahkan. Bentuk
aksara Batak dipengaruhi oleh varian aksara yang mulai akhir abad ke-19
diangkat untuk mencetak buku-buku yang bersifat keagamaan dan
pendidikan, sehingga apa yang dianggap sebagai aksara baku sekarang
sering merupakan hasil penyimpangan. Aksara Batak menjadi kebanggaan
masyarakat Batak sebagai prestasi nenek moyangnya yang mampu
menciptakan tulisan sendiri (Kozok, 2009). Tetapi di sisi lain, aksara
Batak sangat minim dimengerti ataupun dikenal oleh masyaakat, bahkan
sebagian besar masyarakat Batak sendiri tidak mengetahui adanya aksara
Batak.
Diperlukan sistem komputer yang mampu melakukan mengenali pola
aksara batak. Sebagai pemecahan atas permasalahan tersebut, dilakukan
penelitian untuk membangun sistem pengenalan pola aksara Batak Karo
secara otomatis. Beberapa penelitian mengenai pengenalan pola aksara
Tabel 1.1 Tabel Penelitian
No Penelitian Peneliti / Tahun
Penelitian
2 Pengenalan Tulisan Tangan
Aksara Batak Toba menggunakan
Backpropagation
Sitinjak, 2012 94,07%
3 Pengenalan Tulisan Tangan
Aksara Batak Toba menggunakan
Jaringan Syaraf Tiruan berbasis
Multilayer Perceptron
Rio, 2011 96,02%
Berdasarkan penelitian yang telah dilakukan oleh peneliti
sebelumnya, maka penulis melakukan penelitian mengenai pengenalan pola
aksara Batak Karo menggunakan metode jaringan syaraf tiruan Back
Propagation. Metode Back Propagation dipilih sebagai penyelesaian karena
merupakan salah satu metode JST yang sering dan tepat digunakan untuk
pengenalan pola temasuk tulisan tangan dengan menawarkan kelengkapan
serta akurasi dalam proses pengenalan tulisan tangan.
1.2 Rumusan Masalah
Berdasarkan permasalahan yang diuraikan pada latar belakang diatas,
maka diperoleh rumusan masalah dari penelitian ini yaitu:
1. Bagaimana metodeJaringan Syaraf Tiruan Back Propagation mampu
untuk mengenalipola tulisan tangan aksara Batak Karo?
2. Berapakah akurasi yang dapat dihasilkan oleh metode Jaringan Syaraf
Hasil ekstraksi ciri menggunakan Mark Direction dan Intencity of
Character diharapkan mampu untuk menunjukkan perbedaan antar karakter
masing-masing ciri, yang dapat mempermudah metode Jaringan Syaraf
Tiruan Back Propagation dalam melakukan pengenalan untuk setiap aksara
1.3 Tujuan
Tujuan dari penelitian ini adalah membuat aplikasi yang mampu:
1. Mengenali pola tulisan tangan aksara Batak Karo menggunakan metode
Jaringan Syaraf Tiruan Back Propagation.
2. Memudahkan para pengguna untuk memahami dasar aksara Batak Karo
Aplikasi ini kiranya akan sangat berguna dikemudian hari untuk
membantu masyarakat asli Batak Karo untuk lebih belajar dengan
mengenali aksara, karena sesungguhnya orang Batak sendiri tidak tahu dan
mengerti aksara Batak Karo.
1.4 Batasan Masalah
Untuk membahas topik yang lebih terarah dan terfokus pada tujuan
yang akan dicapai, maka batasan masalahnya adalah sebagai berikut :
1. Pola aksara yang diteliti adalah pola aksara batak karo
2. Data citra aksara Batak Karo diambil dari 8 orang tulisan tangan
dimana input untuk sistem diperoleh dari hasil scanner kemudian
diproses dan dikenali oleh sistem.
3. Citra yang akan diproses berukuran 600 x 600 pixel dengan format
.jpg, .jpeg
4. Sistem hanya untuk mengenali 21 karakter aksara Batak Karo.
5. Sistem tidak mengenali karakter aksara Batak Karo dengan diakritik
1.5 Sistematika Penulisan
Sistematika penulisan tugas akhir ini dibagi menjadi beberapa bab
dengan susunan sebagai berikut :
BAB I : PENDAHULUAN
Pada bab ini dijelaskan mengenai latar belakang masalah yang
mendorong dibangunnya sistem, rumusan masalah, tujuan dibangunnya
sistem, batasan masalah dalam dibangunnya sistem, dan sistematika
penulisan yang digunakan dalam menyelesaikan penelitian tugas akhir ini.
BAB II : LANDASAN TEORI
Pada bab ini akan diuraikan mengenai teori – teori dasar serta metode yang digunakan dalam pembangunan sistem pada penelitian ini beserta
dengan teori – teori pendukung lainnya. Teori tersebut antara lain mengenai Sejarah Aksara Batak, teori Pengenalan Poladan metode Jaringan Saraf
Tiruan khususnya model Back Propagation untuk proses pengenalan
polayang akan digunakan dalam perancangan sistem.
BAB III : METODOLOGI PENELITIAN
Pada bab ini akan dibahas mengenai analisa dan perancangan hal – hal atau komponen – komponen yang akan digunakan untuk melakukan penelitian, serta perancangan sistem secara lengkap.
BAB IV : IMPLEMENTASI DAN ANALISA HASIL
Pada bab ini akan dijelaskan mengenai implementasi sistem, sarana
yang dibutuhkan, penerapan rancangan yang telah dibuat dalam suatu
program, cara pengoperasian sistem, hasil implementasi, serta analisis dan
evaluasi dari hasil implementasi.
BAB V : PENUTUP
Pada bab ini akan digambarkan kesimpulan dari seluruh penelitian dan
2
BAB II
LANDASAN TEORI
Bab ini berisi penjabaran mengenai teori – teori yang mendukung dalam penelitian ini. Teori – teori yang digunakan dalam penelitian ini yaitu Teori tersebut antara lain mengenai Sejarah Aksara Batak, teori Pengenalan
Pola, Penipisan Citra (Thining), Ekstraksi Ciri, dan metode Jaringan Saraf
Tiruan khususnya model Back Propagation untuk proses pengenalan pola
yang akan digunakan dalam perancangan sistem.
2.1 Sejarah Aksara Batak
Paleografi adalah ilmu tentang tulisan-tulisan kuno. Banyak masyarakat
yang mengenal tulisan terdapat naskah-naskah kuno yang umurnya dapat
mencapai ratusan atau bahkan ribuan tahun. Aksara yang terdapat pada
naskah-naskah kuno pada umumnya berbeda dengan aksara yang terdapat
dalam naskah yang lebih baru. Dengan cara memperbandingkan
aksara-akasara yang terdapat dalam naskah-naskah lama, dapat menyusun semacam
silsilah aksara. Sebagian besar sistem tulisan yang ada di Afrika, Eropa, dan
Asia berasal dari satu sumber, yakni aksara Semit Kuno yang menjadi nenek
moyang tulisan-tulisan Asia (Arab, Ibrani dan India) maupun Eropa (Latin,
Yunani dsb.)
Aksara Batak termasuk keluarga tulisan India. Aksara India yang tertua
adalah aksara Brahmi yang menurunkan dua kelompok tulisan yakni India
Utara dan India Selatan. Aksara Nagari dan Palawa masing-masing berasal
dari kelompok utara dan selatan dan kedua-duanya pernah dipakai di
berbagai tempat di Asia Tenggara, termasuk Indonesia. Yang paling
berpengaruh adalah aksara Palawa. Semua tulisan asli Indonesia berinduk
Gambar 2.1 Silsilah Aksara (Kozok, 2009)
Aksara Nusantara asli dapat dibagi atas lima kelompok :
1. Aksara Hanacaraka (Jawa, Sunda, Bali)
2. Surat Ulu (kerinci, rejang, lampung, lembak, pasemah dan
serawi)
3. Surat batak (angkola-maindling, toba, simalungun, pakpak
dairi, karo)
4. Aksara Sulawesi (bugis, makasar dan bima)
5. Aksara Filipina (bisaya, tagalog, tagbanwa, mangyan)
Aksara Batak diklasifikasikan sebagai abugida, yaitu paduan antara
silabogram seperti aksara batak dan aksara nusantara lainnya.
Di antara aksara-aksara Nusantara yang paling dekat dengan aksara
Batak adalah aksara Kerinci (surat incung), aksara Lebong, Lembak,
Lin-tang, Pasemah, Rejang, Serawai (surat ulu), serta aksara Lampung. Sama
dengan daerah Batak, daerah-daerah tersebut juga agak terpencil di daerah
pegunungan sehingga kurang terpengaruh oleh pengaruh-pengaruh asing
yang dibawa dari seberang lautan dan secara lambat merembet dari pesisir
ke pedalaman. Salah satu pengaruh budaya asing adalah masuknya agama
Islam. Serentak dengan penyebaran agama Islam bersebar pula tulisan
hilang sama sekali. Karena daerah-daerah yang disebut di atas berada di
pedalaman dan agak terpencil, maka pengaruh Islam baru dirasakan pada
abad ke-19 sehingga aksara asli masih dapat bertahan sampai pada abad
ke-20. Besar kemungkinan bahwa aksara Minangkabau dan Melayu juga
pernah ada, tetapi kemudian digantikan oleh tulisan Arab-Melayu
se-hingga hilang tak berbekas.Aksara-aksara surat ulu di Sumatra bagian
selatan banyak memiliki persamaan dengan huruf Batak. Huruf Ka, Ga,
dan Ha hampir sama bentuknya, dan juga huruf Da masih banyak
menunjukkan persamaan.
Gambar 2.2 Persamaan Surat Batak, Surat Ulu, dan Surat Incung
Aksara-aksara tersebut juga memperkenalkan sebuah hal yang baru
yakni aksara-aksara yang didahului bunyi sengau. Batak (Karo) memiliki
dua huruf tambahan yakni Mba dan Nda, aksara Kerinci dan Rencong
menambahkan dua lagi yakni Ngga dan Nja. Aksara Bugis juga
mem-punyai empat aksara yang bersengau ialah Ngka, Mpa, Nra, dan Nca.
Perlu dicatat bahwa gejala tersebut tidak ada pada aksara Batak selain
Karo, dan juga tidak ada di Lampung, Makasar, dan Filipina.
Tulisanaksara Karo, adalah kumpulan
tanda-tanda(karakter/simbol-simbol) untuk menyatakan sesuatu, yang pemakaiannya dimengerti dan
disepakati, yakni oleh masyarakat Karo itu sendiri. Tulisan Karo
merupakan milik dari masyarakat(etnis) Karo atau dengan kata lain,
tulisan yang tumbuh dan berkembang dimasyarakat(etnis) Karo serta
tersebar luas, dipergunakan, dan diajarkan(awalnya dengan bahasa
pesisir timur di Sumatera(Oostkust van Sumatera) bagian utara dan
dataran tinggi Karo yang terbentang luas diatas pegunungan Bukit Barisan.
2.2 Jaringan Syaraf Tiruan
Jaringan Syaraf Tiruan adalah sistem pemrosesan informasi yang
memiliki karakteristik mirip dengan jaringan syaraf biologis (Siang, 2005).
Jaringan Syaraf Tiruan dibentuk sebagai generalisasi model
matematika dari jaringan syaraf biologis, dengan asumsi bahwa :
1. Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron).
2. Sinyal dikirimkan diantara neuron-neuron melalui
penghubung-penghubung.
3. Penghubung antar neuron memiliki bobot yang akan memperkuat atau
memperlemah sinyal.
4. Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi
(biasanya bukan fungsi linier) yang dikenakan pada jumlahan input
yang diterima. Besarnya output ini selanjutnya dibandingkan dengan
suatu batas ambang.
Jaringan Syaraf Tiruan ditentukan oleh 3 hal:
1. Pola hubungan antar neuron (arsitekstur jaringan).
2. Metode untuk menentukan bobot penghubung.
3. Fungsi aktivasi.
Arsitekstur Jaringan merupakan salah satu hal penting dalam Jaringan
Syaraf Tiruan. Berikut ini beberapa arsitektur jaringan yang sering
digunakan dalam Jaringan Syaraf Tiruan:
1. Jaringan Lapis Tunggal
Dalam jaringan ini, sekumpulan input neuron dihubungkan
langsung dengan sekumpulan output-nya. Dalam jaringan lapis tunggal,
bobot satu unit keluaran tidak mempengaruhi bobot unit keluaran
Gambar 2.3Ilustrasi Arsitektur Jaringan Lapis Tunggal (Siang, 2005)
Pada gambar 2.3 terdapat n unit input , , … , dan m buah
unit output(� , � , … , � ). Kemudian ( , , … , ) menyatakan
bobot hubungan antara unit ke-i dalam input dengan unit ke-j dalam
output. Selama proses pelatihan, bobot-bobot tersebut akan
dimodifikasi untuk memperoleh keakuratan hasil yang maksimal.
2. Jaringan Lapis Majemuk
Jaringan lapis majemuk merupakan perluasan dari jaringan lapis
tunggal. Dalam jaringan lapis majemuk, selain unit input dan output,
ada pula unit lain, yang berada diantara unit input dan output (sering
disebut lapis tersembunyi). Dalam jaringan ini dimungkinkan ada
beberapa lapis tersembunyi. Unit dalam satu layar tidak saling
Gambar 2.4 Ilustrasi Arsitektur Jaringan Lapis Majemuk (Siang, 2005)
Pada gambar 2.4 terdapat n buah unit input , , … , dan
mbuah unit output (� , � , … , � ), sebuah lapis tersembunyi yang terdiri
dari p buah unit ( , … , ). Jaringan ini dapat menyelesaikan masalah
yang lebih kompleks.
2.2.1 Jaringan Syaraf Tiruan Propagasi Balik / Back Propagation
Jaringan Syaraf Tiruan BackPropagation pada umumnya
membandingkan perhitungan keluaran Jaringan Syaraf Tiruan dengan target
keluaran dan menghitung nilai error untuk setiap unit jaringan.
BackPropagation adalah salah satu algoritma yang menggunakan metode
terawasi (supervised learning), dan termasuk jaringan MLP (Multi Layer
Perceptron) / Jaringan Lapis Majemuk.Metode ini merupakan salah satu
metode yang sangat baik dalam menangani masalah pengenalan pola-pola
kompleks. Di dalam jaringan ini, setiap unit yang berada di lapisan input
berhubungan dengan setiap unit yang ada di lapisan tersembunyi.
Sedangkan setiap unit di lapisan tersembunyi berhubungan dengan setiap
unit di lapisan output.
Dalam pola pelatihannya, jaringan ini akan diberi input-an yang
akan diteruskan ke dalam layar tersembunyi dan menuju hingga output.
Ketika hasil keluaran ternyata tidak sesuai dengan harapan maka keluaran
hingga menuju input. Tahap selanjutnya adalah dengan melakukan
perubahan bobot. Iterasi ini terus dilakukan hingga ditemukan penyelesaian
yang optimal (Siang, 2005).
1. Arsitektur Back Propagation
Gambar 2.5 Ilustrasi Arsitektur Back Propagation (Siang, 2005)
Gambar 2.5 merupakan arsitektur jaringan syaraf tiruan back
propagation dengan n buah input ditambah sebuah bias, sebuah lapis
tersembunyi yang terdiri dari p unit ditambah sebuah bias, dan sebuah
lapis unit keluaran.
2. Fungsi Aktivasi
Dalam jaringan syaraf tiruan back propagation, fungsi
aktivasi yang dipakai harus memenuhi beberapa syarat, yaitu :
kontinu, terdeferensial dengan mudah dan merupakan fungsi yang
tidak turun. Salah satu fungsi yang memenuhi ketiga syarat tersebut
sehingga sering dipakai adalah fungsi sigmoidbiner yang memiliki
range(0,1).
= + −� dengan turunan ′ = ( − ) (2.6)
Fungsi lain yang sering dipakai adalah sigmoid bipolardengan
= + −�− dengan turunan ′ =( + � )( − � ) (2.7)
Fungsi sigmoid memiliki nilai maksimum = 1. Maka untuk
pola yang targetnya > 1, pola masukkan dan keluaran harus terlebih
dahulu ditransformasi sehingga semua polanya memiliki range yang
sama seperti fungsi sigmoid yang dipakai. Alternatif lain adalah
menggunakan fungsi aktivasi sigmoid hanya pada lapis yang bukan
lapis keluaran. Pada lapis keluaran, fungsi aktivasi yang dipakai
adalah fungsi identitas : = .
3. Proses Pelatihan Back Propagation
Proses Pelatihan Jaringan Syaraf Tiruan Back Propagation
terdiri dari 3 proses yaitu propagasi maju, propagasi mundur,
perubahan bobot. Ketiga proses tersebut diulang-ulang sampai kondisi
penghentian terpenuhi. Umumnya penghentian yang dipakai adalah
iterasi dan error. Iterasi akan dihentikan jika iterasi melebihi iterasi
yang ditentukan. Atau jika error sudah lebih kecil dari yang
ditentukan.
1. Propagasi Maju
Selama propagasi maju, sinyal masukkan =
dipropagasikan ke lapis tersembunyi menggunakan fungsi
aktivasi yang ditentukan. Keluaran dari setiap unit lapis
tersembunyi (= ) tersebut selanjutnya dipropagasikan maju
lagi ke lapis tersembunyi di atasnya. Demikian seterusnya
hingga mendapatkan luaran jaringan = .
Berikutnya, luaran jaringan = dibandingkan dengan
target yang harus dicapai = . Selisih − adalah error
yang terjadi. Jika nilai error lebih kecil dari yang telah
ditentukan, maka iterasi dihentikan, jika tidak, maka bobot
2. Propagasi Mundur
Berdasarkan error − , dihitung faktor � =
, , … , yang dipakai untuk mendistribusikan error di unit ke semua unit tersembunyi yang terhubung langsung dengan .
� juga dipakai untuk mengubah bobot garis yang berhubungan langsung dengan unit luaran.
Dengan cara yang sama, dihitung faktor � di setiap unitlapis
tersembunyi sebagai dasar perubahan bobot semua garis yang
berasal dari unit tersembunyi di bawahnya. Demikian seterusnya
hingga semua faktor � di unit tersembunyi yang berhubungan
langsung dengan unit masukkan dihitung.
3. Perbaikan Bobot
Setelah semua faktor � dihitung, bobot semua garis
dimodifikasi bersamaan. Perubahan bobot suatu garis didasarkan
atas faktor �neuron di lapis atasnya.
Algoritma pelatihan untuk jaringan dengan satu layar
tersembunyi (dengan fungsi aktifasi sigmoid biner) adalah sebagai
berikut (Siang, 2005) :
Langkah 0: Inisialisasi semua bobot dengan bilangan acak kecil.
Langkah 1: jika kondisi penghentian belum terpenuhi maka lakukan
langkah 2-9.
Langkah 2: untuk setiap pasang data pelatihan, lakukan langkah 3-8
Fase I : Propagasi Maju
Langkah 3: tiap unit masukan menerima sinyal kemudian
meneruskan ke unit tersembunyi di atasnya.
Langkah 4: hitung semua keluaran di unit tersembunyi (j = 1, 2,
… , p)
_ = + ∑= (2.8)
Langkah 5: hitung semua keluaran di unit tersembunyi (k = 1, 2,
… , m).
_ = + ∑ = (2.10)
= _ (2.11)
Fase II : Propagasi Mundur
Langkah 6: hitung faktor � unit keluaran berdasarkan error setiap
unit keluaran (k = 1, 2, … , m).
� = − − (2.12)
Hitung suku perubahan bobot dengan laju percepatan
∆ = � ; = , , … , ; = , , … , (2.13) Langkah 7: hitung faktor � unit tersembunyi berdasarkan errordi
setiap unit tersembunyi = = , , … ,
�_ = ∑ = � (2.14)
� = �_ ( − ) (2.15)
Hitung suku perubahan bobot
∆ = � ; = , , … , ; = , , … , (2.16)
Fase III : Perubahan Bobot
Langkah 8: Hitung semua perubahan bobot
Perubahan bobot garis yang menuju ke unit keluaran:
� = + ∆ ( = , , … , ; = , , … , ) (2.17)
Perubahan bobot garis yang menuju ke unit tersembunyi:
� = + ∆ ( = , , … , ; = , , … , ) (2.18)
Langkah 9: bandingkan kondisi penghentian
Jaringan Syaraf Tiruan Back Propagation memiliki kelemahan
tentang berapa epoch yang harus dilalui untuk memperoleh hasil
yang diinginkan.
Faktor-faktor penting dari Jaringan Syaraf Tiruan Back
Propagation agar jaringan bekerja dengan maksimal adalah:
Nguyen dan widrow (1990) mengusulkan cara membuat
inisialisasi bobot dan bias ke unit tersembunyi sehingga
menghasilkan iterasi yang lebih cepat.
Misal:
n = jumlah unit masukan
p = jumlah unit tersembunyi
= factor skala = .7 √�
Algoritma inisialisasi:
Langkah 1: Inisisalisasi semua bobot ( ) dengan
bilangan acak dalam interval [-0.5, 0.5].
Langkah 2: hitung ‖ ‖ = √ + + ⋯ + (2.20)
Langkah 3: bobot yang dipakai sebagai inisialisasi = =
�
‖ ‖ (2.21)
Langkah 4: bias yang dipakai sebagai inisialisasi = =
bilangan acak antara – dan .
2. Jumlah Unit Tersembunyi
Jaringan dengan sebuah lapis tersembunyi sudah cukup
bagi Jaringan Syaraf Tiruan Back Propagation untuk mengenali
sembarang kelas antara masukan dan target dengan tingkat
ketelitian yang ditentukan.
Jika jaringan memiliki lebih dari 1 lapis tersembunyi maka
algoritma pelatihan perlu direvisi. Dalam Fase I, keluaran harus
dihitung untuk tiap lapis, dimulai dari lapis tersembunyi paling
bawah. Kemudian dalam fase II, faktor � perlu dihitung untuk
tiap lapis tersembunyi, dimulai dari lapis keluaran.
3. Jumlah Pola Pelatihan
Jumlah pola pelatihan ditentukan oleh banyaknya bobot
dan tingkat akurasi yang diinginkan.
2.3 Pengenalan Pola
Pengenalan pola adalah suatu ilmu untuk mengklasifikasikan atau
menggambarkan sesuatu berdasarkan pengukuran kuantitatif ciri atau sifat
utama dari suatu obyek, sedangkan pola adalah suatu entitas yang terdefinisi
dan dapat diidentifikasi serta diberi nama. Pengenalan pola dapat dilakukan
sebagai tindakan untuk mengolah data mentah dan membuatsuatu aksi
berdasar kategori dari pola data tersebut.
Pada dasarnya pengenalan pola terdiri dari 3 langkah utama yaitu
preprosessing, ekstraksi ciri dan pengenalan. Preprosessing merupakan
langkah untuk memfokuskan obyek data yang akan dikenali dengan obyek
lain yang tidak digunakan. Dalam hal pemrosesan awal yang dilakukan
terhadap obyek adalah dengan pengubaha citra digital menjadi citra biner.
Citra biner adalah citra digital yang hanya memiliki dua kemungkinan nilai
piksel yaitu hitam dan putih. Ekstraksi ciri dilakukan unuk menyederhanakan
data dengan melakukan pengukuran fitur tertentu sehingga informasi dasar
dari data tersebut dapat terlihat. Proses berikutnya adalah pengenalan yaitu
tindakan untuk mengelompokan data menjadi pola sesuai target. Dalam
melakukan proses pengenalan dipilih ekstraksi ciri yang optimal untuk
menghasilkan hasil terbaik dalam tahap pengenalan.
2.4 Penipisan Citra (Thining)
Penipisan (thinning) adalah operasi pemrosesan citra biner yang dalam
hal ini objek (region) direduksi menjadi rangka yang menghampiri garis
sumbu objek. Tujuan penipisan adalah mengurangi bagian yang tidak perlu
(redundant) sehingga hanya dihasilkan informasi yang esensial saja. Proses
Thining hanya dikenai pada citra yang telah dibinarisasi, dan kemudian
menghasilkan citra biner lain sebagai output-nya. Proses thining dilakukan
dengan memeriksa tiap piksel yang bertetangga dengan piksel obyek. Untuk
melakukan pengecekan setiap piksel obyek dapat dilakukan dengan
menggunakan mask atau elemen penstruktur. Proses thining pada suatu citra
yang memiliki ketebalan tertentu bias membuat citra tersebut menjadi lebih
2.5 Ekstraksi Ciri Mark Direction dan Intencity of Character
Intensitas karakter (intensity of character) dan tanda arah (mark
direction). Intensitas karakter adalah pencirian citra dengan cara
menghitung berapa jumlah piksel yang bernilai 0 (berwarna hitam). Jadi
intesitas karakter digunakan untuk menghitung nilai piksel hitam pada
sebuah citra. Tanda arah adalah pencirian citra dengan cara menghitung
banyaknya piksel yang memiliki tetanggga yang berarah horisontal, vertikal,
diagonal ke kiri, dan diagonal ke kanan. Jadi tanda arah digunakan untuk
menghitung berapa banyak piksel yang memenuhi masking horisontal,
vertikal, diagonal kiri, dan diagonal kanan pada sebuah citra. Pada
penelitian ini intensitas karakter dan tanda arah digunakan pada setiap
segmen dari citra yang telah dibagi menjadi 9 segmen (3 x 3 segmen).
Gambar 2.23 Struktur Elemen Tanda Arah (Surinta, 2010)
Berikut adalah algoritma untuk ekstraksi ciri:
1. Algoritma Divide
a. Mulai
b. Membaca citra tipis pada preprocessing
c. Menghitung banyak garis dan kolom pada citra tipis yang
telah dibaca
d. Membagi 3 baris matriks citra yang ada r3=rows/
e. Membagi 3 kolom matriks citra yang ada c3=columns/3
f. Membuat citra baru bernama im1 dari baris 1 sampai r3 dan
dari kolom 1 sampai c3
g. Membuat citra baru bernama im2 dari baris 1 sampai r3 dan
h. Membuat citra baru bernama im3 dari baris 1 sampai r3 dan
dari kolom 2xc3+1 sampai akhir dari kolom
i. Membuat citra baru bernama im4 dari baris r3+1 sampai
2xr3 dan kolom 1 sampai c3
j. Membuat citra baru bernama im5 dari baris r3+1 sampai
2xr3 dan dari kolom c3+1 sampai 2xc3
k. Membuat citra baru bernama im6 berukuran dari baris r3+1
sampai 2xr3 dan dari kolom 2xc3+1 sampai akhir dari
kolom
l. Membuat citra baru bernama im7 dari baris 2xr3+1 sampai
akhir dari baris dan dari kolom 1 sampai c3
m.Membuat citra baru bernama im7 dari baris 2xr3+1 sampai
akhir dari baris dan dari kolom c3+1 sampai 2xc3
n. Membuat citra baru bernama im9 dari baris 2xr3+1 sampai
akhir dari baris dan dari kolom 2xc3+1 sampai akhir dari
kolom
o. Menyediakan keluaran berupa citra baru im1, im2, im3,
im4, im5, im6, im7, im8, im9
p. Selesai
2. Algoritma Mark Direction i) Mulai
ii) Mendapatkan jumlah kolom dan baris dari matriks citra
iii)Membuat counter vert=0, horz=0, dig1=0, dig2=0
iv)Untuk i=1 sampai kolom lakukan langkah e), jika sudah
memenuhi sampai kolom lakukan langkah o)
v) Untuk j=1 sampai baris lakukan langkah f), jika sudah
memenuhi sampai baris lakukan langkah d)
vi)Jika newimage (I,j)sama dengan 0 lakukan langkah g), i),
vii) Jika newimage (I,j) + new image (i-1,j) + newimage
(i+1,j) sama dengan 0 lakukan langkah h)
viii)Jika newimage (I-1,j-1) + newimage (I-1,j+1) + newimage
( I,j+1) + newimage (I+1,j-) + newimage (i+1,j+1) sama
dengan 6, maka tambahkan counter vert=vert+1
ix)Jika newimage (I,j) + newimage(I,j-1) + newimage (I,j+1)
sama dengan 0 lakukan langkah j)
x) Jika newimage (i-1,j-1) + newimage (i-1,j) + newimage
(i+1,j-1) + newimage (i+1,j) + newimage (i+1,j+1) sama
dengan 6, maka tambahkan counter horz=horz+1
xi)Jika newimage (I,j) + newimage (i-1,j-1) + newimage
(i+1,j+1) sama dengan 0 lakukan langkah l)
xii) Jika newimage (i-1,j) + newimage(i-1,j+1) + newimage
(I,j-1) + newimage (I,j+1) + newimage (i+1,j-1) +
newimage (i+1,j) sama dengan 6, maka tambahkan counter
dig1=dig1+1
xiii) Jika newimage (I,j) + newimage (i-1,j+1) + newimage
(i+1,j-1) sama dengan 0 lakukan langkah n)
xiv) Jika newimage (i-1,j-1) + newimage (i-1,j) + newimage
(I,j-1) + newimage (I,j+1) + newimage (i+1,j) + newimage
(i+1,j+1) sama dengan 6, maka tambahkan counter
dig2=dig2+1
xv) Selesai
3. Algoritma Intencity of Character (IoC)
a. Mulai
b. Mendapatkan jumlah kolom dan baris dari matriks citra
c. Membuat counter dan di inisialisasi dengan angka 0
d. Untuk i=1 sampai kolom lakukan langkah e), jika sudah
e. Untuk j=1 sampai baris lakukan langkah f), jika sudah
memenuhi sampai baris lakukan langkah d)
f. Jika newimage (I,j) sama dengan 0 tambahkan nilai
counter sebanyak 1
21
BAB III
METODOLOGI PENELITIAN
Bab ini berisi penjelasan danproses pengolahan data yang akan digunakan
dalam penelitian ini, serta perancangan sistem yang meliputi proses ekstraksi ciri,
pelatihan dan pengujian arsitektur JST, lalu pengenalandan uji data,rincian
kebutuhan sistem danjuga perancangan antarmuka sistem.
3.1 Data
Dalam pengenalan pola aksara Batak Karo ini digunakan 21 huruf
aksara tulisan tangan Batak Karo yang dimiliki oleh 8 orang yang berbeda.
Data yang diperoleh sebelumnya dengan mengisi kolom yang telah
disediakan.
7,2 cm
2,7 cm
Gambar 3.1 Kolom Isi Responden
Setiap tipe tulisan tangan terdiri dari 168 gambar yang akan dijadikan
sebagai data. Tipe tulisan tangan yang akan digunakan dalam pengenalan
Gambar 3.2 aksara Karo Tulisan Tangan
3.2 Perancangan Sistem
Sub bab ini berisi tentang perancangan sistem dari aplikasi yang akan
dibuat.Proses dimulai dari preprossesing, ekstraksi ciri data aksara,
kemudian data hasil ekstraksi ciri masuk kedalam pelatihan arsitektur JST
dengan parameter-parameter yang telah ditentukan, sehingga diperoleh
model jaringan yang menghasilkan akurasi terbaik, kemudian dilakukan uji
pada sebuah data aksara baru yang juga telah diekstraksi ciri dan dilakukan
klasifikasi menggunakan modeljaringan yang telah diperoleh.
Pada proses ekstraksi cirri data sebelum pelatihan arsitektur jaringan
dan pengujian data,digunakan fitur Mark Direction dan Intencity of
data dalam pengujian digunakan metode Jaringan Syaraf Tiruan Back
Propagation. Berikut ini gambaran sistem secara keseluruhan:
Data
Preprocessing
JST Back Propagation
Ekstraksi Ciri Data Uji
Kombinasi Ciri Optimal
Pengenalan
Hasil Pengenalan
Gambar 3.3Diagram Blok Sistem
3.2.1 Prepossesing
Dalam proses preprosessing ini meliputi beberapa tahap yaitu:
1. Mengubah Citra Warna.
Dalam pemrosesan ini dimaksudkan untuk mengubah Citra
Warna (RGB), dilanjutkan dari citra keabuan mengubah menjadi
Gambar 3.4 citra keabuan diubah (RGB) menjadi citra hitam
putih (IM2BW)
2. Pengubahan Ukuran (Resize Citra)
Dalam proses resize citra dilakukan secara otomatis yakni,
membaca seluruh citra gambar dan kemudian secara otomatis
menemukan citra terpanjang dan terlebar, setelah ditemukan maka
ukuran tersebut dijadikan sebagai referensi untuk resize gambar.
Dari referensi yang ditemukan ukuran citra pada aksara ini 245 x
1350, namun itu membuat ukuran gambar tidak proposional,
maka ukuran di resize menjadi 600 x 600.
3. Penipisan Citra
Pada proses ini penipisan citra (Thining) menggunakan
fungsi Rosenfeld(Widiarti, 2011). Thining dilakukan untuk
mengubah ukuran ketebalan citra menjadi kecil.
4. Ekstraksi Ciri
Pada penelitian ini ekstraksi ciri menggunakan algoritma
Mark Direction dan Intencity of Character (IoC)(Nugroho,
2016). MarkDirectionyaitu menghitung banyaknya piksel yang
memiliki tetangga berarah horizontal, vertical, diagonal ke kiri,
dan diagonal ke kanan. MarkDirection ini digunakan untuk
menghitung banyaknya piksel yang memenuhi masking
horizontal, vertical, diagonal kiri, dan diagonal kanan,
sedangkan Intencity of Character itu sendiri digunakan untuk
menghitung nilai piksel 0 (berwarna hitam) pada citra. Dalam
melakukan proses ekstraksi ciri dilakukan dengan beberapa
tahap, meliputi:
a. Membagi citra menjadi 9 segmen (3x3 segmen)
b. Mencirikan citra pada tiap segmen menggunakan Mark
Direction untuk menghitung berapa yang memenuhi
masking horizontal (horz), vertical (vert), diagonal ke
kiri (dig1), diagonal ke kanan (dig2).
c. Mencirikan citra pada tiap segmen menggunakan
Intencity of Character untuk menghitung nilai piksel
hitam (black).
Untuk memperoleh jaringan yang optimal terlebih dahulu kita
mengetahui ekstraksi ciri yang optimal pula. Dalam hal ini penelitian
melakukan kombinasi ciri (feature) untuk dapat meghasilkan ekstraksi
ciri yang memberikan hasil akurasi terbaik.
3.2.2 Pelatihan dan Pengujian Arsitektur JST
Dalam penelitian ini, proses pengenalan pola aksara Batak Karo
dilakukan dengan mengklasifikasikan feature yang telah ditentukan.
Metode yang digunakan dalam prosespengenalanadalah metode
Jaringan Syaraf Tiruan Back Propagation. Metode pengenalan ini
dipilih karena kemampuannya untuk menghasilkan decision
boundaries yang kompleks pada fitur-fitur yang ada. Hasil ini dapat
dilihat dengan nilai keakuratan yang dihasilkan dari pengujian sampel
diluar kumpulan sampel yang digunakan pada saat pelatihan.
Metode pembagian data pelatihan dan pengujian arsitektur JST
yang digunakan adalah 4-Fold Cross Validation. Metode ini dipakai
karena menggunakan data yang berbeda untuk proses pelatihan dan
pengujiannya, sehingga dapat diketahui dengan benar akurasi sistem
yang telah dibuat. Hasil ekstraksi ciri dan label data, akan digunakan
sebagai input-an dalam proses pelatihan dan pengujian arsitektur JST.
Hasil dari proses ini adalah model jaringan dengan akurasi terbaik,
yang akan digunakan dalam proses pengenalan.
Pada proses awal sesuai dengan metode K-Fold Cross
Validation, data yang berjumlah 168 dibagi menjadi 4 bagian.Dari 4
bagian tersebut akan dilakukan 4 kali percobaan dalam proses
pelatihan dan pengujian arsitektur JST. Berikut ini tabel penggunaan
Tabel 3.14-Fold Cross Validation
Percobaan Training Testing
1 1,2 3,4
2 1,3 2,4
3 1,4 2,3
4 3,4 1,2
Ada 2 jenis arsitektur jaringan syaraf tiruan yang digunakan
untuk proses pelatihan dan pengujian, yaitu arsitektur dengan satu
hidden layer dan dua hidden layer.
1. Arsitektur Jaringan Syaraf Tiruan 1 Hidden Layer
Diambil contoh dengan ciri 8 maka jumlah data input sebanyak
45 atribut, kemudian digunakan 1 hidden layer, dengan jumlah
neuron pada hidden layer 1 sebanyak j, dan jumlah output
sebanyak 21.
Gambar 3.7Arsitektur JST 1 Hidden Layer
X1
X2
X3
X45
Z1
Z2
Z3
Zj
Y1
Y2
Y3
Y21
Vij
Wij
2. Arsitektur Jaringan Syaraf Tiruan 2 Hidden Layer
Diambil contoh dengan ciri 8 maka jumlah data input sebanyak
45 atribut, kemudian digunakan 2 hidden layer, dengan jumlah
neuron pada hidden layer 2sebanyak j, dan jumlah output
sebanyak 21.
Gambar 3.8Arsitektur JST 2 Hidden Layer
Berikut ini rincian parameter dalam arsitektur jaringan syaraf
tiruan:
1. Lapisan jaringan terdiri dari 4 lapis, yaitu satu lapis masukan
(input), 2 lapis tersembunyi (hidden layer) dan satu lapis keluaran
(output).
2. Untuk input dimana (Xi) adalah jaringan terdiri dari 1 – ineuron, dimana i merupakan jumlah total data hasil ekstraksi ciri yang telah
ditentukan. Berikut tabel jumlah data yang digunakan:
X1
Hidden Layer 1 Hidden Layer 2
Tabel 3.2Jumlah Data Input Arsitektur Jaringan
(Kombinasi Feature)
Feature Kombinasi Feature Jumlah Data
Feature
1 [Black] 9
2 [dig1] 9
3 [dig2] 9
4 [Black + dig1] 9 + 9 =18
5 [Black + dig2] 9 + 9 = 18
6 [horz + vert] 9 + 9 = 18
7 [dig1 + dig2] 9 + 9 = 18
8 [Black + dig1 + dig2, +
horz + vert]
9 + 18 + 18=
45
3. Untuk mendapatkan arsitektur jaringan yang optimal, digunakan 2
jenis arsitektur jaringan yaitu dengan 1 hidden layer dan 2 hidden
layer, dimana lapisan tersembunyi pertama dan kedua memiliki
jumlah neuron yang bervariasi mulai dari 10,15,… dilanjutkan dengan kelipatan 5 hingga 45. Namun apabila pada neuron 45
nilai akurasi masih tinggi, maka dilanjutkan dengan kelipatan 5
selanjutnya hingga hasil akurasinya turun. Contoh: 10,15,20,…45
4. Fungsi aktivasi yang digunakan adalah sigmoid biner (logsig).
5. Fungsi pelatihan yang digunakan adalah trainrp.
6. Batas iterasi/epoch adalah 500.
7. Nilai laju pemahaman (=learning rate) adalah 0, 2.
8. Jumlah neuron pada lapisan keluaran (output) adalah 21, sesuai
dengan jumlah target aksara
9. Memiliki 21neuron output yang merupakan target keluaran
jaringan diantaranya, target 1: BA (1,0,0….0), target 2: TA
Dalam pengujianarsitektur JST, dilakukan beberapa kali
percobaan untuk mendapatkan model jaringan terbaik berdasarkan
akurasi hasil yang tertinggi. Percobaan dilakukan dengan mengambil
sejumlah data hasil ekstraksi ciri berdasarkan kombinasi ciri yang ada
pada tabel 3.2 sebagai data masukan. Untuk setiap kombinasi ciri,
dilakukan percobaan lagi dengan mengubah-ubah jumlah lapisan
tersembunyi, yaitu satu lapisan tersembunyi dan 2 lapisan
tersembunyi. Pada satu lapisan tersembunyi, jumlah neuron divariasi
mulai dari 10, 15 hingga 45 dengan penambahan jumlah kelipatan 5,
contohnya 10,15,20….,45.Dari percobaan tersebut diperoleh jumlah neuron dengan akurasi tertinggi. Jumlah neuron dengan akurasi
tertinggi di lapisan tersembunyi ke-1 kemudian digunakan dalam 2
lapisan tersembunyi. Jumlah neuron di lapisan tersembunyi ke-2
divariasi sama seperti di lapisan tersembunyi ke-1 hingga memperoleh
akurasi tertingginya. Dari semua percobaan tersebut akan diperoleh
model jaringan terbaik berdasarkan akurasi yang tertinggi.
3.2.3 Uji Data Tunggal
Model jaringan yang telah didapat dari proses pelatihan dan
pengujian arsitektur JST akan digunakan dalam proses pengenalandari
data masukan data baru untuk diuji.
Proses dimulai dari memasukan data aksara baru untuk diuji,
kemudian dilakukan kombinasi ekstraksi ciri pada data tersebut dan
diambil sejumlah data sesuai jumlah pilihan ciri terbaik yang telah
diperoleh. Hasil ekstraksi ciri tersebut disimulasikan kedalam model
jaringan terbaik yang telah diperoleh, sehingga mendapatkan nilai
keluaran sesuai target keluaran yang telah ditentukan, untuk
menunjukkan hasil pengenalan pola. Berikut ini gambaran proses
Data Uji Ekstraksi Ciri Model Jaringan Hasil Pengenalan
Gambar 3.9 Proses Pengenalan dan Uji Data Tunggal
3.2.3.1Perhitungan Akurasi
Karena menggunakan metode 4 – Fold dalam pembagian data,
maka dilakukan percobaan 4 kali percobaan training dan testing. Hasil
dari percobaan berupa confusion matrix. Confusion Matrix
menunjukkan data yang dikenali sesuai kelompok data ciri. Contoh
Confusion Matrix dapat dilihat dalam tabel sebagai berikut:
Dari confusion matrix dihitung besar akurasi. Perhitungan
akurasi dilakukan untuk melihat jaringan syaraf tiruan yang optimal
BackPropagation dalam mengenali sistem pola tulisan tangan aksara
Batak Karo.
Akurasi = � ℎ
� ℎ ℎ %
Data Benar = Jumlah angka pada diagonal matrik
Seluruh data = total data yang digunakan untuk training / testing
3.3 Kebutuhan Sistem
Aplikasi ini membutuhkan perangkat keras dan lunak dalam proses
perancangannya sehingga mendapatkan hasil yang maksimal.
1. Kebutuhan Perangkat
Aplikasi ini membutuhkan perangkat keras dan lunak dengan :
1. Scanner
2. Microsoft Windows 7
3. Matlab R2012b
Spesifikasi tersebut dipilih agar aplikasi berjalan dengan maksimal.
Scaner digunakan untuk menyecan data aksara dikarenakan tidak
ada data berupa cetak. Microsoft Windows 7 digunakan sebagai sistem
operasi agar kedua perangkat lunak lainnya dapat berjalan. Matlab R2012b
3.4 Perancangan Antarmuka Sistem
Gambar 3.10 Tampilan Antarmuka Sistem
Pada gambar 3.10 merupakan tampilan antarmuka sistem yang terdiri
dari 1 menu sesuai dengan fungsi dari sistem yang akan dibuat. Menu mulai
digunakan sebagai langkah awal pertama dalam menjalankan sistem.
Pada gambar 3.11 merupakan tampilan antarmuka sistem yang terdiri
dari 2 panel sesuai dengan fungsi dari sistem yang akan dibuat. Berikut ini
rincian untuk setiap panel tersebut:
1. Pelatihan
Panel ini termasuk dalam data kombinasi ekstraksi ciri. Pada
panel ini terdapat beberapa komponen diantaranya:
a. Button Group - berfungsi untuk memilih data kombinasi ciri
b. Edit Text Hidden Layer 1 – berfungsi untuk memasukan jumlah
neuron pada lapisan tersembunyi ke-1.
c. Edit Text Hidden Layer 2 - berfungsi untuk memasukan jumlah
neuron pada lapisan tersembunyi ke-2.
d. Edit Text Epoch – berfungsi untuk memasukan batas jumlah iterasi/epoch dalam proses pelatihan arsitektur jaringan, dengan
nilai default yaitu 500.
e. Tombol Proses – berfungsi untuk menjalankan proses pelatihan arsitektur jaringan.
f. Text Akurasi – berfungsi untuk menampilkan hasil perhitungan akurasi sistem (%).
2. Pengujian
Panel ini berisi komponen yang dapat berfungsi untuk mengambil
data uji, kemudian melakukan pengenalan data berdasarkan model
jaringan yang telah diperoleh dan menampilkan hasil huruf aksara.
a. Edit Text Direktori file – berfungsi untuk menampilkan alamat direktori dari data yang akan diuji.
b. Tombol Proses Kenal – berfungsi untuk membuka jendela pencarian direktori data aksara yang akan diuji.
c. Axes Citra – berfungsi untuk menampikan citra aksara yang diuji d. Text Hasil kenal – berfungsi untuk menampilkan hasil pengenalan
data aksara yang diuji.
34
3
BAB IV
IMPLEMENTASI DAN ANALISIS HASIL
Bab ini dibahas mengenai hasil penelitian dan analisis hasil penelitian dari
implementasi sistem yang telah dibuat. Hasil penelitian berupa perbandingan
akurasi yang diperoleh dari percobaan metode Back Propagation berdasarkan
jumla hidden layer serta jumlah node pada setiap hidden layer yang digunakan.
Pada bab ini juga dibahas mengenai user interface yang dibangun berdasar
algoritma yang telah dirancang.
4.1 Implementasi Sistem
Dalam subbab ini akan ditunjukkan visualisasi proses ekstraksi ciri
dan tampilan antarmuka dari aplikasi yang telah dibuat. Aplikasi ini dibuat
menggunakan bahasa pemrograman Matlab.
4.1.1 Visualisasi Proses Ekstraksi Ciri
Berikut ini visualisasi dari setiap tahap dalam proses
preprossesing dan ekstraksi ciri aksara Batak Karo:
1. Data Aksara
Dalam proses ini data aksara yang bertipe “.jpg” disimpan dengan tipe “.data, dibaca oleh program dengan menggunakan
fungsi [file,path]=uigetfile('*/*.JPG','ambil gambar');
image=imread([path file]);
Berikut ini hasil file aksara yang dibaca:
2. Mengubah Citra Warna.
Dalam pemrosesan ini dimaksudkan untuk mengubah Citra
Warna (RGB), dilanjutkan dari Citra Keabuan mengubah menjadi
Citra Hitam Putih (Biner). Dibaca dengan menggunakan fungsi
grayimage=rgb2gray(image); image2=im2bw(grayimage);
Gambar 4.2 Citra keabuan diubah (RGB) menjadi citra hitam
putih (IM2BW)
3. Resize Citra
Dalam proses resize citra dilakukan secara otomatis yakni,
membaca seluruh citra gambar dan kemudian secara otomatis
menemukan citra terpanjang dan terlebar, setelah ditemukan maka
ukuran tersebut dijadikan sebagai referensi untuk resize gambar.
Dari referensi yang ditemukan ukuran citra pada aksara ini 245 x
1350, namun itu membuat ukuran gambar tidak proposional,
maka ukuran di resize menjadi 600 x 600.
4. Penipisan Citra
Pada proses ini penipisan citra (Thining) menggunakan
fungsi Rosenfeld(Widiarti, 2011). Thining dilakukan untuk
mengubah ukuran ketebalan citra menjadi kecil.
5. Penipisan Citra
Gambar 4.4 Citra setelah di thining
6. Ekstraksi Ciri
Pada penelitian ini ekstraksi ciri menggunakan algoritma
Mark Direction dan Intencity of Character (IoC)(Nugroho, 2016).
Mark Direction yaitu menghitung banyaknya piksel yang
memiliki tetangga berarah horizontal, vertical, diagonal ke kiri,
dan diagonal ke kanan. Mark Direction ini digunakan untuk
menghitung banyaknya piksel yang memenuhi masking
horizontal, vertical, diagonal kiri, dan diagonal kanan, sedangkan
Intencity of Character itu sendiri digunakan untuk menghitung
nilai piksel 0 (berwarna hitam) pada citra. Dalam melakukan
proses ekstraksi ciri dilakukan dengan beberapa tahap, meliputi:
a. Membagi citra menjadi 9 segmen (3x3 segmen)
b. Mencirikan citra pada tiap segmen menggunakan Mark
Direction untuk menghitung berapa yang memenuhi
masking horizontal (horz), vertical (vert), diagonal ke kiri
c. Mencirikan citra pada tiap segmen menggunakan Intencity
of Character untuk menghitung nilai piksel hitam (black).
Gambar 4.5 Citra di bagi menjadi 9 segmen
d. Hasil Prosessing
Setelah melakukan preprossesing dan ekstraksi ciri
maka akan di dapat sebuah data. Data tersebut yang akan
menjadi data untuk diproses.
Gambar 4.6 Ciri 1 dari BA KARO
Proses ciri 1 adalah ciri Black yaitu dengan
memperoleh nilai piksel hitam dari data citra yang di bagi
menjadi 9 segmen. Ketika dalam piksel memenuhi piksel