SKRIPSI
AMMAR ADIANSHAR 091402128
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
PENERAPAN RECURRENT NEURAL NETWORK DALAM IDENTIFIKASI TULISAN TANGAN HURUF JEPANG JENIS KATAKANA
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh Ijazah Sarjana Teknologi Informasi
AMMAR ADIANSHAR 091402128
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
PERSETUJUAN
Judul : PENERAPAN RECURRENT NURAL NETWORK
DALAM IDENTIFIKASI TULISAN TANGAN HURUF JEPANG JENIS KATAKANA
Kategori : SKRIPSI
Nama : AMMAR ADIANSHAR
Nomor Induk Mahasiswa : 091402128
Program Studi : SARJANA (S-1) TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI
Diluluskan di
Medan, Agustus 2014
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dr. Erna Budhiarti Nababan, M.IT NIP. -
Romi Fadillah Rahmat, B.Comp.Sc., M.Sc NIP. 19860303 201012 1004
Diketahui/Disetujui oleh
Program Studi Teknologi Informasi Ketua,
PERNYATAAN
PENERAPAN RECURRENT NURAL NETWORK DALAM IDENTIFIKASI TULISAN TANGAN HURUF JEPANG JENIS KATAKANA
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, Agustus 2014
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Allah SWT Yang Maha Pengasih dan Maha Penyayang, dengan segala rahmat dan karuniaNya lah penulis bisa menyelesaikan penyusunan tugas akhir ini.
Proses penyusunan skripsi ini tidak lepas dari dukungan dan bantuan dari pihak lain. Oleh karena itu penulis mengucapkan terima kasih banyak kepada :
1. Keluarga penulis, terutama kedua orang tua penulis. Ibunda,Hj. Cut Suzana Adiningsih dan Ayahanda, H. Ir. Anshari Syahidin, MBA yang selalu sabar dalam mendidik dan membesarkan penulis. Abang penulis Aqsha Adianshar dan dr.Akbar Adianshar, dan adik penulis, Arief Adianshar, Alya Andarina yang selalu memberikan semangat kepada penulis, serta yang terkasih bagi Penulis Julia Annisa Sitepu, S.TI yang tidak henti-hentinya memberikan semangat dan motivasi kepada penulis sehingga terselesaikannya skripsi ini.
2. Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc dan Ibu Dr. Erna Budhiarti Nababan, M.IT selaku pembimbing yang telah banyak meluangkan waktu dan pikirannya, memotivasi dan memberikan kritik dan saran kepada penulis.
3. Bapak Muhammad Fadly Syahputra B.Sc.M.Sc.IT dan Ibu Sarah Purnamawati S.T.M.Sc selaku penguji yang telah banyak meluangkan waktu dan pikirannya, memotivasi dan memberikan kritik dan saran kepada penulis.
4. Ketua dan Sekretaris Program Studi Teknologi Informasi, Muhammad Anggia Muchtar S.T.MM.IT dan Muhammad Fadly Syahputra B.Sc.M.Sc.IT
5. Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen serta pegawai di Fakultas Ilmu Komputer dan Teknologi Informasi.
6. Seluruh sahabat terbaik penulis yang selalu memberikan dukungan, Ridzuan Ikram Fajri, S.TI, Ade Tambunan, Reza Elfandra Srg, S.TI, Muhammad Ardiansyah, S.TI, Abdi Hafiz, SP, Fadli Rizky, Muhammad Fadlullah, Muhmmad Hafiz Yahya, SE, Yogi Suryo Santoso, Dwiky Syahputra, Ibnu Setiawan, Handra Akira Saito, Nurul Khadijah, S.TI, seluruh member grup SEM***, serta seluruh angkatan 09, serta teman-teman seluruh angkatan mahasiswa USU lainnya yang tidak dapat penulis sebutkan satu persatu, Semoga Allah SWT membalas kebaikan kalian dengan nikmat yang berlimpah.
ABSTRAK
Bahasa Jepang termasuk salah satu bahasa penting dan digunakan secara internasional. Bahasa Jepang menduduki urutan keempat dari sepuluh bahasa yang sering digunakan didunia. Teknik pengenalan pola memiliki banyak perkembangan dan semakin sering dipakai dalam memecahkan suatu permasalahan. Teknik pengenalan pola digunakan untuk pengenalan tulisan tangan, gambar, dan sebagainya. Tulisan tangan Jepang jenis huruf Katakana dengan segala kompleksitasnya ternyata memiliki aturan yang ketat dalam penulisannya. Dalam penerapannya, terdapat ketidakakurasian dalam penulisan huruf Katakana. Hal ini disebabkan oleh banyaknya variasi dan tata cara penulisan Katakana yang berbeda - beda. Tata cara penulisan huruf Katakana memiliki aturan tersendiri khusunya mengenai jumlah goresan Maka dalam penelitian ini, penulis memanfaatkan jaringan Recurrent Neural Network untuk mengenali kata berdasarkan tulisan tangan huruf Katakana. Hasil dari identifikasi tulisan Jepang huruf Katakana menggunakan metode Recurrent Neural Network terbilang cukup berhasil. Dengan menggunakan Recurrent Neural Network, tingkat akurasi pengenalan pada tulisan Jepang huruf Katakana sebesar 86.1952 %
IMPLEMENTATION OF RECURRENT NEURAL NETWORK ON RECOGNITION JAPANESE HANDWRITTING OF KATAKANA
ABSTRACT
Japanese language is one of the important and it used internationally. Japanese ranks fourth of ten languages commonly used in the world. Pattern recognition techniques have a lot of developments and are increasingly being used to solve a problem. Pattern recognition techniques used for handwriting recognition, image, etc. Japanese handwriting of Katakana with all complexity its has a strict rules in writing. In practice, there are inaccuracies in katakana writing. This is due to the many variations and manner of writing Katakana different - different. The syntax of writing katakana has a rules especially about number stokes. So for this research, authors using Recurrent Neural Network for recognizing handwritting of Katakana. The results of the identification of writing Japanese Katakana using Recurrent Neural Network method is quite successful. With using Recurrent Neural Network, accuracy on Japanese handwriting of Katakana are 83.1952 %
DAFTAR ISI
Hal.
ABSTRAK i
ABSTRACT ii
DAFTAR ISI iii
DAFTAR TABEL v
DAFTAR GAMBAR vi
BAB 1 PENDAHULUAN 1
1.1. Latar Belakang 3
1.2. Rumusan Masalah 3
1.3. Batasan Masalah 3
1.4. Tujuan Penelitian 3
1.5. Manfaat Penelitian 3
1.6. Metodologi Penelitian 4
1.7. Sistematika Penulisan 5
BAB 2 LANDASAN TEORI 7
2.1. Citra 7
2.2. Image Processing 8
2.3. Ekstraksi Fitur 13
2.4. Diagonal Based Feature Extraction 14
2.5. Jaringan Syaraf Tiruan 16
2.6. Recurrent Neural Network 18
2.7. Huruf Katakana 20
2.8. Penelitian Terdahulu 21
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 24
3.2.2 Ekstraksi Fitur 29 3.2.3 Recurrent neural Network 31
3.3. Perancangan Sistem 33
3.3.1 Use case diagram 33 3.3.2 Use case spesification 34 3.3.3 Diagram aktivasi aplikasi 36 3.3.4 Perancangan antarmuka aplikasi 37
BAB 4 IMPLEMENTASI DAN PENGUJIAN 40
4.1. Kebutuhan Sistem 40
4.1.1. Perangkat Keras 40 4.1.2. Perangkat Lunak 40
4.2. Hasil Tampilan Aplikasi 41
4.2.1. Tampilan Awal Aplikasi 41 4.2.2. Tampilan Utama Aplikasi 41 4.2.3. Tampilan Pemilihan Citra 42 4.2.4. Tampilan Pengenalan Pola 43
4.3. Rencana Pengujian Sistem 44
4.4. Hasil Pengujian Sistem 45
4.4.1. Pengujian mulai aplikasi 45 4.4.2. Pengujian input citra 45 4.4.3. Pengujian prapengolahan citra ( image processing ) 46 4.4.5. Pengujian Kinerja Sistem 47 4.4.6. Hasil Pengujian Data Latih 50 4.4.7. Hasil Pengujian Sistem 53
BAB 5 KESIMPULAN DAN SARAN 55
5.1. Kesimpulan 55
5.2. Saran 55
DAFTAR TABEL
Hal.
Tabel 2.1 Penelitian Terdahulu 21
Tabel 3.1 Use Case Spesikasi untuk Use Case Cari Citra 34
Tabel 3.2 Use Case Spesikasi untuk Use Case Proses Citra 35
Tabel 4.1 Rencana Pengujian Sistem 44
Tabel 4.2 Pengujian Halaman Mulai Aplikasi 45
Tabel 4.3 Pengujian Input Citra 45
Tabel 4.4 Pengujian Prapengolahan Citra ( image processing ) 46
Tabel 4.5 Pengujian Recurrent Neural Network 46
Tabel 4.6 Hasil Pengujian Citra yang Dilatih 51
DAFTAR GAMBAR
Hal.
Gambar 2.1 Proses Grayscalling 10
Gambar 2.2 Proses Resizing 11
Gambar 2.3 Proses Normalisasi 11
Gambar 2.4 Proses Thinning 12
Gambar 2.5 Penghapusan Pixel 13
Gambar 2.6 Diagonal Based Featured Extraction 15
Gambar 2.7 Histogram Diagonal Zona 15
Gambar 2.8 Struktur Recurrent Neural Network 19
Gambar 2.9 Arsitektur umum Recurent Neural Network 20
Gambar 2.10 Tabel huruf Katakana 21
Gambar 3.1 Skema Pengenalan Kata Tulisan Tangan Huruf Katakana 24
Gambar 3.2 Contoh Penulisan Huruf Katakana 25
Gambar 3.3 Tahapan Prapengolahan Citra 26
Gambar 3.4 Hasil citra grayscalling 27
Gambar 3.5 Hasil citra resizing 28
Gambar 3.6 Hasil citra normalisasi 28
Gambar 3.7 Hasil citra thinning 29
Gambar 3.8 Diagram Ekstraksi Fitur Diagonal Based Feature Extraction 30
Gambar 3.9 Histogram Diagonal Zona 30
Gambar 3.13 Diagram Aktivasi untuk Proses Citra 37
Gambar 3.14 Rancangan Halaman Awal 38
Gambar 3.15 Rancangan Halaman Utama 39
Gambar 4.1 Tampilan Awal Aplikasi 41
Gambar 4.2 Tampilan Utama Aplikasi 42
Gambar 4.3 Tampilan Pemilihan Citra 43
Gambar 4.4 Tampilan pengenalan Pola 44
Gambar 4.5 Proses grayscalling 47
Gambar 4.6 Proses resizing 48
Gambar 4.7 Proses thinning 49
ABSTRAK
Bahasa Jepang termasuk salah satu bahasa penting dan digunakan secara internasional. Bahasa Jepang menduduki urutan keempat dari sepuluh bahasa yang sering digunakan didunia. Teknik pengenalan pola memiliki banyak perkembangan dan semakin sering dipakai dalam memecahkan suatu permasalahan. Teknik pengenalan pola digunakan untuk pengenalan tulisan tangan, gambar, dan sebagainya. Tulisan tangan Jepang jenis huruf Katakana dengan segala kompleksitasnya ternyata memiliki aturan yang ketat dalam penulisannya. Dalam penerapannya, terdapat ketidakakurasian dalam penulisan huruf Katakana. Hal ini disebabkan oleh banyaknya variasi dan tata cara penulisan Katakana yang berbeda - beda. Tata cara penulisan huruf Katakana memiliki aturan tersendiri khusunya mengenai jumlah goresan Maka dalam penelitian ini, penulis memanfaatkan jaringan Recurrent Neural Network untuk mengenali kata berdasarkan tulisan tangan huruf Katakana. Hasil dari identifikasi tulisan Jepang huruf Katakana menggunakan metode Recurrent Neural Network terbilang cukup berhasil. Dengan menggunakan Recurrent Neural Network, tingkat akurasi pengenalan pada tulisan Jepang huruf Katakana sebesar 86.1952 %
IMPLEMENTATION OF RECURRENT NEURAL NETWORK ON RECOGNITION JAPANESE HANDWRITTING OF KATAKANA
ABSTRACT
Japanese language is one of the important and it used internationally. Japanese ranks fourth of ten languages commonly used in the world. Pattern recognition techniques have a lot of developments and are increasingly being used to solve a problem. Pattern recognition techniques used for handwriting recognition, image, etc. Japanese handwriting of Katakana with all complexity its has a strict rules in writing. In practice, there are inaccuracies in katakana writing. This is due to the many variations and manner of writing Katakana different - different. The syntax of writing katakana has a rules especially about number stokes. So for this research, authors using Recurrent Neural Network for recognizing handwritting of Katakana. The results of the identification of writing Japanese Katakana using Recurrent Neural Network method is quite successful. With using Recurrent Neural Network, accuracy on Japanese handwriting of Katakana are 83.1952 %
BAB I
PENDAHULUAN
1.1.Latar Belakang
Bahasa Jepang termasuk salah satu bahasa penting dan digunakan secara internasional. Bahasa Jepang menduduki urutan ke-4 setelah bahasa Inggris, Mandarin, dan Spanyol dari 10 bahasa yang sering digunakan. Berdasarkan data daftar bahasa yang digunakan menurut jumlah penutur asli, bahasa Jepang berada pada urutan ke-9 setelah bahasa Mandarin, Hindi, Spanyol, Inggris, Bengali, Arab, Rusia, dan Portugis (Handoyono & Susanto, 2010).
Manusia memiliki berbagai cara dalam mempelajari bahasa-bahasa asing. Misalnya dengan mempelajarinya dengan otodidak, berbicara aktif, dan kursus. Bahasa asing juga dapat dipelajari secara digital melalui media komputer. Oleh karena itu, mesin (komputer) perlu mengerti dan menguasai karakter huruf dalam bahasa asing agar dapat membantu mempermudah manusia dalam mempelajari bahasa asing tersebut.
Jaringan saraf tiruan merupakan salah satu representasi buatan dari otak manusia yang selalu mencoba untuk mensimulasikan proses pembelajaran pada otak manusia tersebut. Istilah buatan disini digunakan karena jaringan saraf ini diimplementasikan dengan menggunakan program komputer yang mampu menyelesaikan sejumlah proses perhitungan selama proses pembelajaran (Andrijasa, et al. 2010).
Recurrent Neural Network ( RNN ) adalah neural network dengan fasilitas umpan balik menuju neuron itu sendiri maupun neuron yang lain, sehingga aliran informasi dari masukan mempunyai arah jamak (Aribowo, 2010) . Recurrent Neural Network adalah jaringan yang mempunyai minimal satu feedback loop. RNN memiliki kemampuan penggambaran yang sangat bagus dan dapat mengatasi kelemahan feedfoward (Soelaiman & Rifa’i, 2010)
Sudah banyak penelitian teknologi informasi yang bergerak di bidang pengenalan tulisan seperti yang dilakukan oleh Handoyono dan Susanto pada tahun 2010 yang berjudul Penerapan Jaringan Syaraf Tiruan Metode Propagasi Balik dalam Pengenalan Tulisan Tangan Huruf Jepang Jenis Hiragana dan Katakana dan penelitian yang
dilakukan oleh J.Pradeep, et.al yang berjudul Diagonal Feature Extraction Based Handwritten Character System Using Neural Network. Selain itu penelitian terdahulu yang menerapkan metode Recurrent Neural Network yang dilakukan oleh Soelaiman dan Rifa’i yang berjudul Identifikasi Nonlinier dengan Menggunakan Metode Recurrent Neural Network dan Algoritma Dead-Zone Kalman Filter. Meskipun penelitian dalam pengenalan kata sudah banyak dilakukan, tetapi masih diperlukan lagi pengembangan dalam penelitian di bidang pengenalan kata khususnya pada tulisan Katakana.
ini, penulis memanfaatkan jaringan syaraf tiruan recurrent neural network untuk mengenali huruf berdasarkan tulisan tangan huruf Katakana.
1.2 Rumusan Masalah
Dalam penerapannya, terdapat ketidakakurasian dalam penulisan huruf Katakana. Hal ini disebabkan oleh banyaknya variasi dan tata cara penulisan huruf Katakana yang berbeda-beda. Tata cara penulisan huruf Katakana memiliki aturan tersendiri khusunya mengenai jumlah goresan. Oleh karena itu, diperlukan suatu pendekatan untuk mengenali tulisan Jepang huruf Katakana.
1.3 Batasan Masalah
Dalam penelitian ini, ditetapkan beberapa batasan masalah yakni :
1. Pengenalan karakter tulisan tangan Katakana dilakukan secara offline. 2. Input berupa file image yang telah discan dalam format jpeg.
3. Akuisisi citra diambil dari 5 orang sebagai data sampel.
4. User dari sistem ini merupakan orang yang sedang mempelajari tulisan tangan huruf Jepang jenis Katakana.
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk melakukan pengenalan tulisan tangan huruf Jepang jenis Katakana menggunakan Recurrent Neural Network
1.5 Manfaat Penelitian
Adapun manfaat penelitian ini adalah :
pada jaringan syaraf tiruan dalam pengenalan huruf tulisan tangan huruf Katakana.
2. Sebagai bahan referensi untuk penelitian selanjutnya yang berkenaan dengan pengenalan tulisan menggunakan jaringan syaraf tiruan.
1.6 Metodologi Penelitian
Ada beberapa tahapan dalam proses pengerjaan tugas akhir ini. Tahapan metodologi tersebut adalah sebagai berikut :
1. Studi Literatur
Pada tahap ini, penulis mengumpulkan literatur tentang masalah yang diperlukan untuk dalam penelitian. Tahapan ini dilakukan untuk mengetahui apa yang telah diteliti dan dikerjakan sebelumnya sehingga dapat dilakukan pengembangan pada penelitian ini. Adapun literatur yang dikampulkan berkaitan dengan:
1. Teori tentang Recurrent Neural Network. 2. Teori tentang huruf Katakana.
3. Teknik, Image Processing dan pengambilan keputusan menggunakan Recurrent Neural Network
2. Pengumpulan Data
Pada tahapan ini dilakukan untuk mengumpulkan data – data yang mendukung penyelesaian masalah. Data – data yang dikumpulkan berupa data citra huruf
Katakana yang akan digunakan untuk proses pembelajaran dan pengujian pada sistem.
3. Analisis dan Perancangan Sistem
Pada tahapan ini dilakukan analisis terhadap materi dan data yang mendukung terhadap penyelesaian masalah sehingga dapat merancang sistem yang dapat
1. Preprocessing Citra huruf Katakana
Preprocessing Citra dengan tujuan untuk memproses citra huruf Katakana yang
masih dalam ukuran normal atau semula menjadi ukuran pixel 2. Feature extraction
Pada proses ekstraksi fitur digunakan untuk mengekstrak nilai dari luas area huruf Katakana.
3. Implementasi Sistem
Pada tahapan implementasi sistem ini akan dilakukan pengkodean program dengan menggunakan NetBeans.
4. Pengujian Sistem
Pada tahapan pengujian sistem yang telah dibangun akan diuji untuk memastikan apakah sistem telah berjalan sesuai yang diharapkan.
5. Dokumentasi dan Penyusunan Laporan
Pada tahapan ini yaitu penyusunan laporan terhadap analisis dan implementasi Recurrent Neural Network untuk melakukan identifikasi tulisan huruf Jepang jenis Katakana.
1.7Sistematika Penulisan
Sistematika penulisan dari penelitian ini terdiri dari lima bagian utama sebagai berikut:
Bab 1 Pendahuluan
Bab 2: Landasan Teori
Bab ini berisi teori-teori yang digunakan untuk memahami permasalahan yang dibahas pada penelitian ini. Pada bab ini dijelaskan tentang penerapan metode Recurrent Neural Network dalam pengenalan tulisan Jepang huruf Katakana.
Bab 3: Analisis dan Perancangan
Bab ini berisi analisis dan penerapan metode Recurrent Neural Network untuk pengenalan tulisan Jepang huruf Katakana, serta perancangan seperti pemodelan dengan flowchart.
Bab 4: Implementasi dan Pengujian
Bab ini berisi pembahasan tentang implementasi dari analisis dan perancangan yang disusun pada Bab 3 dan pengujian apakah hasil yang didapatkan sesuai dengan yang diharapkan.
Bab 5: Kesimpulan Dan Saran
BAB 2
LANDASAN TEORI
Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan metode Recurrent Neural Network untuk mengidentifikasi jenis tulisan Jepang huruf Katakana.
2.1 Citra
Citra secara harfiah, adalah gambar pada bidang dua dimensi dan disusun oleh banyak piksel yang merupakan bagian terkecil dari citra. Pada umumnya, citra dibentuk dari kotak-kotak persegi empat yang teratur sehingga jarak horizontal dan vertikal antara piksel adalah sama pada seluruh bagian citra (Ldya, et al. 2010). Citra sebagai keluaran dari suatu sistem perekaman data dapat bersifat :
1. optik berupa foto,
2. analog berupa sinyal video seperti gambar pada monitor televisi,
3. digital yang dapat langsung disimpan pada suatu pita magnetik.
1. Citra Biner
Citra biner adalah citra yang hanya mempunyai dua nilai derajat keabuan yaitu hitam dan putih. Piksel-piksel objek bernilai 1 dan piksel-piksel latar belakang bernilai 0. Piksel bernilai 0 ada pada warna putih dan piksel bernilai 1 ada pada warna hitam pada saat menampilkan citra.
2. Citra Keabuan
Citra keabuan adalah citra yang disetiap piksel nya mengandung satu layer dimana nilai instensitasnya berada pada nilai 0 (hitam) – 255 (putih). Untuk menghitung citra keabuan digunakan rumus :
I (x,y) = α . R + β . G + y . B
dengan I(x,y) adalah level keabuan pada suatu koordinat yang diperoleh dengan mengatur warna R (merah), G (hijau), B (biru) yang ditunjukkan oleh nilai parameter α, β dan γ. Secara umum nilai α, β dan γ adalah 0.33. Nilai yang lain juga dapat diberikan untuk ketiga parameter tersbut asalkan total keseluruhannya adalah 1 (Putra, 2009).
3. Citra warna
Citra warna adalah citra digital yang memiliki informasi warna pada setiap pikselnya. Sistem pewarnaan citra warna ada beberapa macam seperti RGB, CMYK, HSV, dll.
2.2 Image Processing
a. Grafika Komputer (computer graphics).
Grafika komputer bertujuan untuk menghasilkan citra dengan primitif-primitif geometri seperti garis, lingkaran, dan sebagainya. Primitif-primitif geometri tersebut memerlukan data deskriptif untuk melukis elemen-elemen gambar.
b. Pengenalan Pola (pattern recognition/image interpretation).
Pengenalan pola adalah proses pengelompokan data numerik dan simbolik secara otomatis oleh mesin. Tujuan dari pengelompokan ini adalah untuk mengenali suatu objek didalam citra. Manusia bisa mengenali objek-objek disekitarnya karena otak manusia belajar mengklasifikasi objek-objek di alam sehingga mampu membedakan suatu objek dengan objek lainnya. Kemampuan sistem visual manusia inilah yang akan ditiru oleh mesin. Komputer menerima masukan berupa citra objek yang akan diidentifikasi, memproses citra tersebut, dan memberikan keluaran berupa deskripsi objek didalam citra.
c. Pengolahan Citra (image processing).
Pengolahan Citra bertujuan memperbaiki kualitas citra agar mudah diinterpretasi oleh manusia / mesin (computer). Teknik - teknik pengolahan citra mentransformasikan citra menjadi citra dengan kualitas yang lebih baik. Pengenalan pola mengelompokkan data numerik dan simbolik (termasuk citra) secara otomatis oleh mesin (komputer). Pengelompokan ini untuk mengenali suatu objek di dalam citra. Komputer menerima masukan berupa citra objek yang diidentifikasi, memproses citra, dan memberi keluaran berupa deskripsi objek di dalam citra (Ldya, et al. 2010).
a. Grayscale
Grayscale adalah teknik yang digunakan untuk mengubah citra berwarna menjadi bentuk
grayscale atau tingkat keabuan (dari hitam - putih). Pembentukan citra keabuan menggunakan metode luminance yakni nilai RGB dikalikan dengan nilai yang telah ditentukan yang kecocokan nya sesuai dengan sensitivitas mata terhadap warna. Hijau adalah warna paling dominan, diikuti merah dan terakhir biru (Lennie et al. 1993). Hasil akhir proses ini adalah nilai keabuan (8 bit) dengan rentang hitam (0) dan putih (255). Pada pengubahan sebuah gambar menjadi grayscale dapat dilakukan dengan cara mengambil semua pixel pada gambar kemudian warna tiap pixel akan diambil informasi mengenai 3 warna dasar yaitu merah, biru dan hijau (melalui fungsi warnatoRGB), ketiga warna dasar ini akan dijumlahkan kemudian dibagi tiga sehingga didapat nilai ratarata. Nilai rata-rata inilah yang akan dipakai untuk memberikan warna pada pixel gambar sehingga warna menjadi grayscale, tiga warna dasar dari sebuah pixel akan diset menjadi nilai rata-rata (melalui fungsi RGBtowarna). Contoh citra yang sudah mengalami grayscalling dapat dilihat pada gambar 2.1
Gambar 2.1 Proses Grayscalling (Santi, 2011)
b. Resizing
Resizing merupakan proses mengubah dan menyamakan citra masukan, dengan
citra yang telah resize harus tetap mempunyai kualitas citra yang bagus. Contoh citra yang sudah mengalami resizing dapat dilihat pada gambar 2.2. Citra sebelah kiri (a) adalah citra kapal yang berukuran 258 KB. Citra sebelah kanan (b) merupakan hasil resizing sehingga ukuran citra menjadi 49 KB .
Gambar 2.2 Proses Resizing (Wijaya et al , 2010) c. Normalisasi
Normalisasi adalah proses mengubah nilai daripada intensitas piksel menjadi satu keseragaman dalam satu intensitas yang lebih mendekati kenormalan daripada kemampuan melihat suatu gambar. Normalisasi terkadang disebut juga pelebaran kontras dan pelebaran histogram (Gonzalez & Woods, 2007). Normalisasi dalam image processing adalah proses yang ditujukan untuk membuat citra lebih mudah dimunculkan fitur-fiturnya. Dengan cara mengubah rentang nilai intensitas piksel dan juga meningkatkan akurasi pengenalan. Contoh citra yang sudah mengalami normalisasi dapat dilihat pada gambar 2.3
d. Thinning
Thinning merupakan proses yang bertujuan untuk mengurangi ukuran dari suatu citra (imagesize) dengan tetap mempertahankan informasi dan karakteristik penting dari citra tersebut. Hal ini diimplementasikan dengan mengubah citra awal dengan pola binary menjadi representasi kerangka (skeletal representation) image tersebut. Objek seperti huruf atau silhouettes dapat lebih mudah dikenali dengan melihat kepada kerangkanya saja (Phillips, 2000).
Thinning hanya digunakan pada citra biner dan menghasilkan citra biner lain sebagai outputnya . Thinning merupakan bentuk "pre-processing" yang digunakan dalam banyak teknik analisa citra. Output dari proses ini disebut sebagai "skeleton" , oleh karena itu thinning bisa juga disebut sebagai "skeletonisasi" . Thinning bertujuan untuk mengurangi bagian yang tidak perlu (redudant) sehingga hanya dihasilkan informasi yang essensial saja. Pola hasil penipisan harus tetap menyerupai bentuk pola asal . Sebagai contoh pada gambar 2.3 adalah huruf "R" dan hasil polanya menjadi rangka "R"
Gambar 2.4 Proses Thinning (Fitri, 2013)
Algoritmanya adalah sebagai berikut:
1. Mula-mula diperiksa jumlah pixel objek (yang bernilai 1), N, di dalam jendela 3 X 3 pixel.
2. Jika N kurang atau sama dengan 2, tidak ada aksi yang dilakukan karena di dalam jendela terdapat ujung lengan objek.
3. Jika N lebih besar dari 7, tidak ada aksi yang dilakukan karena dapat menyebabkan pengikisan (erosion) objek.
Gambar 2. 5 (a) Penghapusan pixel pinggir menyebabkan ketidakterhubungan, (b) penghapusan pixel pinggir memperpendek lengan objek, (c) notasi pixel yang digunakan untuk memeriksa keterhubungan.
4. Jika N lebih besar dari 2, periksa apakah penghilangan pixel tengah menyebabkan objek tidak terhubung. Ini dilakukan dengan membentuk barisan p1p2p3…p8p1. Jika jumlah peralihan 0 ® 1 di dalam barisan tersebut sama dengan 1, berarti hanya terdapat satu komponen terhubung di dalam jendela 3 X 3. Pada kasus ini, dibolehkan menghapus pixel tengah yang bernilai 1 karena penghapusan tersebut tidak mempengaruhi keterhubungan.
2.3 Ekstraksi Fitur
ini mudah untuk dibedakan (Pradeep et. al, 2011). Secara luas, fitur adalah semua hasil pengukuran yang bisa diperoleh. Fitur juga bisa menggambarkan karakteristik objek yang dipantau (Putra, 2009). Contoh dari fitur level rendah adalah intensitas sinyal. Fitur bisa berupa simbol, numerik atau keduanya. Contoh dari fitur simbol adalah warna. Contoh dari fitur numerik adalah berat. Fitur bisa diperoleh dengan mengaplikasikan algoritma pencari fitur pada data masukan.
Fitur dapat dinyatakan dengan variabel kontinu, diskret atau diskret-biner. Fitur biner dapat digunakan untuk menyatakan ada tidaknya suatu fitur tertentu. Fitur yang baik memiliki syarat berikut, yaitu mudah dalam komputasi, memiliki tingkat keberhasilan yang tinggi dan besarnya data dapat diperkecil tanpa menghilangkan informasi penting (Putra, 2009).
2.4 Diagonal Based Featured Extraction
Diagonal Based Feature Extraction adalah proses untuk mengenali karakter tulisan dengan metode offline di dalam pengerjaannya (Pradeep, et.al, 2011). Setiap citra karakter berukuran 90 x 60 piksel kemudian dibagi menjadi 54 zona yang sama, dan masing – masing zona berukuran 10 x 10 piksel. Fitur yang akan di ekstraksi dari setiap zona piksel dengan bergerak secara diagonal dari tiap zona yang masing – masing berukuran 10 x 10 piksel. Setiap zona memiliki 19 garis diagonal dan foreground pixel yang ada disetiap baris diagonal dan dijumlahkan untuk mendapatkan sub-fitur tunggal.
Gambar 2.6 Diagonal Based Featured Extraction (Pradeep et al.2011)
Algoritma diagonal based feature extraction (Pradeep et al. 2011) :
1. Hitung histogram diagonal setiap zona. Histogram diagonal adalah banyaknya piksel hitam setiap diagonal pada satu zona. Setiap zona memiliki 19 nilai histogram diagonal yang disebut Histds, dimana 1 ≤ d ≤ 19. Secara jelas dapat dilihat pada gambar 2.7.
Gambar 2.7 Histogram Diagonal Zona (Pradeep et al. 2011)
Zn =
19
3. Hitung rata-rata zona setiap baris, disebut Bi, dimana 1 ≤ i ≤ 9. Bi =
6
Baris 1 = (Z1+Z2+Z3+Z4+Z5+Z6) /6 Baris 2 = (Z7+Z8+Z9+Z10+Z11+Z12) /6 Baris 3 = (Z13+Z14+Z15+Z16+Z17+Z18) /6 Baris 4 = (Z19+Z20+Z21+Z22+Z23+Z24) /6 Baris 5 = (Z25+Z26+Z27+Z28+Z29+Z30) /6 Baris 6 = (Z31+Z32+Z33+Z34+Z35+Z36) /6 Baris 7 = (Z37+Z38+Z39+Z40+Z41+Z42) /6 Baris 8 = (Z43+Z44+Z45+Z46+Z47+Z48) /6 Baris 9 = (Z49+Z50+Z51+Z52+Z53+Z56) /6
4. Hitung rata-rata zona setiap kolom, disebut Kj, dimana 1 ≤ j ≤ 6 Kj =
9
Kolom 1 = (Z1+Z7+Z13+Z19+Z25+Z31+Z37+Z43+Z49) /9 Kolom 2 = (Z2+Z8+Z14+Z20+Z26+Z32+Z38+Z44+Z50) /9 Kolom 3 = (Z3+Z9+Z15+Z21+Z27+Z33+Z39+Z45+Z51) /9 Kolom 4 = (Z4+Z10+Z16+Z22+Z28+Z34+Z40+Z46+Z52) /9 Kolom 5 = (Z5+Z11+Z17+Z23+Z29+Z35+Z41+Z47+Z53) /9 Kolom 6 = (Z6+Z12+Z18+Z24+Z30+Z36+Z42+Z48+Z54) /9
2.5 Jaringan Syaraf Tiruan
paradigma ini adalah struktur dari sistem pengolahan informasi yang terdiri dari sejumlah besar elemen pemrosesan yang saling berhubungan (neuron), bekerja serentak untuk menyelesaikan masalah tertentu. Cara kerja jaringan saraf tiruan adalah seperti cara kerja manusia, yaitu belajar pola atau klasifikasi data, melalui proses pembelajaran (Sutojo et al. 2010).
Jaringan saraf tiruan disusun dengan asumsi yang sama seperti jaringan saraf biologi (Puspitaningrum, 2006):
1. Pengolahan informasi terjadi pada elemen-elemen pemrosesan (neuron). 2. Sinyal antara dua buah neuron diteruskan melalui link-link koneksi. 3. Setiap link koneksi memiliki bobot terasosiasi.
4. Setiap neuron menerapkan sebuah fungsi aktivasi terhadap input jaringan
(jumlah sinyal input berbobot). Tujuannya adalah untuk menentukan sinyal output.
Pembagian arsitektur jaringan saraf tiruan bisa dilihat dari kerangka kerja dan skema antar interkoneksi. Kerangka kerja jaringan saraf tiruan bisa dilihat dari jumlah lapisan (layer) dan jumlah node pada setiap lapisan (Puspitaningrum, 2006).
Lapisan – lapisan penyusun jaringan saraf tiruan dapat dibagi menjadi tiga : 1. Lapisan input
Node-node di dalam lapisan input disebut unit-unit input. Unit-unit input menerima input dari dunia luar. Input yang dimasukkan merupakan penggambaran dari suatu masalah.
2. Lapisan tersembunyi
Node-node di dalam lapisan tersembunyi disebut unit-unit tersembunyi. Output dari lapisan ini tidak secara langsung dapat diamati.
3. Lapisan output
Node-node pada lapisan output disebut unit-unit output. Keluaran atau output dari
Mengadopsi esensi dasar dari system syaraf biologi, syaraf tiruan dijelaskan yaitu menerima input atau masukan (baik dari data yang dimasukkan atau dari output sel syaraf pada jaringan syaraf. Setiap input datang melalui suatu koneksi atau hubungan yang mempunyai sebuah bobot (weight). Setiap sel syaraf mempunyai sebuah nilai ambang. Jumlah bobot dari input dan dikurangi dengan nilai ambang kemudian akan mendapatkan suatu aktivasi dari sel syaraf (post synaptic potential, PSP, dari sel syaraf). Signal aktivasi kemudian menjadi fungsi aktivasi / fungsi transfer untuk menghasilkan output dari sel syaraf. Jika tahapan fungsi aktivasi digunakan ( output sel syaraf = 0 jika input <0 dan 1 jika input >= 0) maka tindakan sel syaraf sama dengan sel syaraf biologi yang dijelaskan diatas (pengurangan nilai ambang dari jumlah bobot dan membandingkan dengan 0 adalah sama dengan membandingkan jumlah bobot dengan nilai ambang). Biasany tahapan fungsi jarang digunakan dalam jaringan syaraf tiruan.
2.6 Recurrent Neural Network
Recurrent Neural Network ( RNN ) adalah neural network dengan fasilitas umpan balik
menuju neuron itu sendiri maupun neuron yang lain, sehingga aliran informasi dari masukan mempunyai arah jamak (Aribowo, 2010) . Recurrent Neural Network adalah jaringan yang mempunyai minimal satu feedback loop. RNN memiliki kemampuan penggambaran yang sangat bagus dan dapat mengatasi kelemahan feedfoward (Soelaiman & Rifa’i, 2010) . Keluaran RNN tidak hanya bergantung pada masukan saat itu saja, tetapi juga tergantung pada kondisi masukan neural network untuk waktu lampau. Kondisi ini dimaksudkan untuk menampung kejadian lampau diikutkan pada proses komputasi. Hal ini penting untuk masalah yang cukup rumit, dan tanggapan keluaran neural network berkaitan dengan variasi waktu ( time-varying ), sehingga neural network
Gambar 2.8 Struktur Recurrent Neural Network (Aribowo, 2011)
Keluaran Recurrent Neural Network dapat dihitung dengan persamaan sebagai berikut :
dimana :
• xˆ(k) ∈ℜ n adalah internal state vector
• A∈ℜ nxn adalah matrik tetap
• x(k) ∈ℜ n adalah state vector
• u(k) ∈ℜ m adalah vektor masukan, Nilai u(k) dan x(k) diketahui
• mxnk k W W ∈ℜ 1, 2, , adalah bobot pada lapisan hidden • nxm k k V V ∈ℜ 1, 2, , adalah bobot pada lapisan output
• xˆ(k +1) adalah nilai dari state vektor hasil perkiraan pada iterasi ke k +1
Fungsi aktifasi yang digunakan pada jaringan adalah
Nilai σ dan φ dihitung dengan menggunakan fungsi sigmoid (Soelaiman & Rifa’i, 2010). Adapun arsitektur umum Recurrent Neural Network yang dapat dilihat pada gambar 2.9
Gambar 2.9 Arsitektur umum Recurent Neural Network (Soelaiman & Rifa’i, 2010).
2.7 Huruf Katakana
Bahasa Jepang memiliki aturan gramatikal, cara baca dan cara menulis huruf bahasa Jepang. Bahasa Jepang memiliki 3 (tiga) huruf, yaitu huruf hiragana, huruf katakana, dan huruf kanji.
Katakana melambangkan suara-suara yang sama dengan Hiragana, namun tentu saja semua hurufnya berbeda (Handoyono & Susanto, 2010). Untuk lebih jelas dapat dilihat seperti pada gambar 2.10.
Gambar 2.10 Tabel huruf Katakana ( Handoyono ,2011 )
2.8 Penelitian Terdahulu
Di bagian ini akan dijabarkan beberapa penelitian terdahulu. Saat ini sudah banyak penelitian teknologi informasi yang bergerak dibidang kedokteran bagian kardiologi. Untuk lebih jelasnya, pada tabel 2.1 berikut akan dijelaskan penelitian – penelitian yang telah dibuat sebelumnya.
Tabel 2.1 Penelitian terdahulu
No Judul Penulis dan
Tahun
Metode yang digunakan
Keterangan 1 Penerapan Jaringan
Syaraf Tiruan Metode Propagasi Balik dalam
Handoyono, Susanto. 2012
Metode Propagasi Balik
[image:35.595.92.538.646.719.2]Tabel 2.1 Penelitian terdahulu (lanjutan)
No Judul Penulis dan
Tahun
Metode yang digunakan
Keterangan Pengenalan Tulisan
Tangan Huruf Jepang Jenis Hiragana dan Katakana
[image:36.595.97.538.110.719.2]dengan menggunakan gambar pelatihan yang bertujuan untuk menguji ingatan jaringan dengan cara menggeneralisasikan kasus yang dihadapi dan kemudian menarik kesimpulan yang cenderung ke output tertentu .
2 Diagonal Feature Extraction Based Handwritten Character System Using Neural Network. J.Pradeep, et.al 2011 Diagonal Based feature extraction dan menggunakan Neural Network Menggunakan ekstraksi fitur Diagonal Based untuk mengenali karakter tulisan dan menggunakan Neural Network dalam mengambil keputusan dan kesimpulan dari karakter tulisan.
Tabel 2.1 Penelitian terdahulu (lanjutan)
No Judul Penulis dan
Tahun Metode yang digunakan Keterangan Pembuktian hasil identifikasi menggunakan Dead-Zone Kalman Filter.
4 Implementasi Recurrent Neural Network dengan metode pembelajaran Gradient Descent Adaptive Learning Rate untuk pendugaan curah hujan.
Salman. 2011 Recurrent Neural Network (RNN)dan metode Gradient Descent Adaptive Learning Rate
RNN dapat dilatih untuk mempelajari dan menganalisa pola data masa lalu dan berusaha mencari suatu formula atau fungsi yang
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
[image:38.595.122.496.326.664.2]Dalam bab ini, akan dibahas secara terperinci mengenai analisis perancangan sistem, penerapan algoritma, data yang digunakan, serta metode Recurrent Neural Network yang diimplementasikan dalam pengenalan kata berdasarkan tulisan tangan Jepang huruf Katakana. Tujuan dari pembahasan ini adalah untuk menguraikan spesifikasi, kebutuhan dan pengembangan aplikasi. Secara umum, bagan dasar tahap-tahap pengenalan kata dapat dilihat pada gambar 3.1
Gambar 3.1 Skema Pengenalan Kata Tulisan Tangan Huruf Katakana Prapengolahan
citra Akusisi Citra
Citra Latih
Citra Uji
Pelatihan dengan
JST
Pengujian dengan JST
Ekstraksi Fitur
Keluaran
Tahap pertama daripada pengerjaan adalah akuisisi data, yakni membaca citra kata tulisan tangan Katakana yang telah dikumpulkan dan dipindai. Tahap kedua yakni pemrosesan citra yang telah dikumpulkan menjadi satu kesatuan yang seragam agar sesuai untuk tahap selanjutnya. Tahap ketiga yakni ekstraksi fitur, dimana digunakan Diagonal Based Feature Extraction untuk mengekstrak nilai fitur daripada tiap citra yang
akan digunakan sebagai masukan bagi jaringan saraf tiruan. Tahap keempat adalah pelatihan dan pengujian menggunakan Recurrent Neural Network, dimana akan didapat keluaran daripada pelatihan dan pengujian citra oleh jaringan saraf tiruan.
3.1 Data yang Digunakan
[image:39.595.187.417.552.623.2]Data sampel yang digunakan adalah 46 huruf Katakana yang ditulis di kertas berukuran A4 dengan menggunakan spidol tinta warna hitam. Data sampel dikumpulkan dari 13 orang partisipan yang mengerti menuliskan huruf Katakana. Cara penulisan data sampel dalam pengerjaannya yaitu 10 orang menuliskan 46 huruf Katakana sebanyak 1 kali. Adapun perbandingan yang digunakan yaitu 10 orang menuliskan 46 huruf Katakana sebanyak 1 kali untuk digunakan sebagai data latih, dan 3 orang menuliskan 46 huruf Katakana sebanyak 1 kali untuk digunakan sebagai data uji. Total data sampel yang digunakan adalah 460 citra data sampel yang digunakan sebagai data latih dan 138 citra data sampel yang digunakan sebagai data uji. Contoh penulisan huruf Katakana dapat dilihat pada gambar 3.2
Gambar 3.2 Contoh Penulisan Huruf Katakana
formatnya diubah menjadi JPEG. Kemudian data citra akan diproses melalui langkah prapengolahan citra.
3.2 Analisis Sistem
3.2.1 Prapengolahan citra ( Image Processing )
Data citra akan diproses melalui prapengolahan citra. Tahap prapengolahan citra dapat dilihat pada gambar 3.3
normal
grayscalling
resizing
normalisasi
[image:40.595.256.368.284.669.2]thinning
Tahap pertama dalam pengolahan citra adalah mengubah citra warna menjadi citra keabuan. Tahap selanjutnya adalah mengubah ukuran citra menjadi sama atau seragam yakni menjadi ukuran 60 x 90 pixel. Citra yg telah di resizing dan normalisasi kemudian akan mengalami proses thinning yang bertujuan untuk mendapatkan kerangka dari objek kata yang dimana citra hasil dari thinning akan digunakan untuk ekstraksi fitur. Ekstraksi fitur yang digunakan setelah proses prapengolahan citra adalah Diagonal Based Featured Extraction.
3.2.1.1 Proses pembentukan citra keabuan ( Grayscalling )
Tahap pertama dalam melakukan prapengolahan citra yaitu proses mengubah citra warna menjadi citra keabuan. Proses grayscale dilakukan dengan cara mengambil semua piksel pada gambar kemudian warna tiap piksel akan diambil informasi mengenai tiga warna dasar yaitu merah, hijau, dan biru (RGB), dimana ketiga warna dasar ini akan dijumlahkan kemudian dibagi tiga sehingga akan didapatkan nilai rata-rata. Nilai rata-rata inilah yang akan dipakai untuk memberikan warna piksel pada gambar sehinggal warna akan menjadi keabuan (grayscale), tiga warna dasar dari sebuah piksel akan di set menjadi nilai rata-rata ( Santi, 2011 ). Proses mengubah citra warna (RGB) menjadi citra keabuan (grayscale) dapat dihitung dengan rumus :
grayscale = 0.299R + 0,587G + 0,114B... (1)
atau
grayscale = 0,333R + 0,333G + 0,333B... (2)
Perhitungan nilai grayscale yang sebenarnya adalah menggunakan persamaan yang pertama. Untuk lebih mudah digunakan untuk perhitungan manual dan mudah diingat digunakan persamaan yang kedua. Hasil citra grayscalling dapat dilihat pada gambar 3.4
3.2.1.2 Resizing
Setelah didapat citra hasil dari grayscalling, kemudian citra akan diubah ukurannya sesuai dengan standar pengenalan dari proses prapengolahan citra. Tujuan dari resizing dalam prapengolahan citra ini adalah untuk mengubah resolusi atau ukuran vertikal dan horizontal dari suatu citra tersebut. Adapun pada proses prapengolahan citra ini, semua citra diseragamkan menjadi 150 x 150 piksel dengan tujuan agar memudahkan pemrosesan dari prapengolahan citra. Hasil citra resizing dapat dilihat pada gambar 3.5
Gambar 3.5 Hasil citra resizing
3.2.1.3 Normalisasi
[image:42.595.289.347.238.303.2]Normalisasi adalah suatu bagian dari koreksi radiometrik, yaitu untuk menghilangkan perbedaan antara dua atau lebih citra yang berbeda waktu atau lokasi dengan mengaju pada satu citra yang dianggap paling baik dan benar. Dengan kata lain fungsi dari normalisasi adalah untuk mendapatkan data dengan mean nol dan standar deviasi sama dengan satu. Pada proses prapengolahan citra ini, normalisasi bertujuan untuk menyeragamkan nilai piksel dari setiap citra menjadi satu standar untuk di ekstraksi dalam tahap ekstraksi fitur. Hasil citra normalisasi dapat dilihat pada gambar 3.6
Gambar 3.6 Hasil citra normalisasi
3.2.1.4 Thinning
mencari tulang dari sebuah objek ( Skeletonization). Thinning bertujuan untuk mereduksi ukuran dari suatu image dengan tetap mempertahankan nilai atau karakteristik dari image tersebut. Proses nya yaitu menggunakan nilai baru bagi tiap piksel dihasilkan dari nilai piksel pada iterasi sebelumnya. Hasil citra thinning dapat dilihat pada gambar 3.7
Gambar 3.7 Hasil citra thinning
3.2.2 Ekstraksi Fitur
Setelah dilakukan proses prapengolahan citra, kemudian dilakukan tahap ekstraksi fitur. Ekstraksi fitur yang digunakan adalah Diagonal Based Extraction Featured. Ekstraksi fitur dilakukan bertujuan untuk mendapatkan nilai fitur sebagai masukan bagi lapis masukan Recurrent Neural Network. Diagonal Based Feature Extraction adalah proses untuk mengenali karakter tulisan dengan metode offline di dalam pengerjaannya (Pradeep, et.al, 2011). Setiap citra karakter berukuran 60 x 90 piksel kemudian dibagi menjadi 54 zona yang sama, dan masing – masing zona berukuran 10 x 10 piksel.
Bagi citra menjadi 6 kolom dan 9 baris dengan ukuran setiap
zona 10 x 10 piksel
Hitung histogram diagonal setiap
zona
Hitung rata – rata histogram setiap
zona
Hitung rata – rata zona per kolom Hitung rata – rata
zona per baris
Nilai fitur = rata – rata histogram zona, rata – rata
zona per baris, rata – rata zona per kolom
Gambar 3.8 Diagram Ekstraksi Fitur Diagonal Based Feature Extraction
Adapun penjelasan dari diagram pada gambar 3.8 adalah sebagai berikut :
5. Hitung histogram diagonal setiap zona. Histogram diagonal adalah banyaknya piksel hitam setiap diagonal pada satu zona. Setiap zona memiliki 19 nilai histogram diagonal yang disebut Histds, dimana 1 ≤ d ≤ 19. Secara jelas dapat dilihat pada gambar 3.9
[image:44.595.259.408.483.641.2]6. Hitung nilai fitur setiap zona, yaitu rata-rata histogram setiap zona, disebut Zn dimana 1 ≤ n ≤ 54.
Zn =
19
7. Hitung rata-rata zona setiap baris, disebut Bi, dimana 1 ≤ i ≤ 9. Bi =
6
Baris 1 = (Z1+Z2+Z3+Z4+Z5+Z6) /6 Baris 2 = (Z7+Z8+Z9+Z10+Z11+Z12) /6 Baris 3 = (Z13+Z14+Z15+Z16+Z17+Z18) /6 Baris 4 = (Z19+Z20+Z21+Z22+Z23+Z24) /6 Baris 5 = (Z25+Z26+Z27+Z28+Z29+Z30) /6 Baris 6 = (Z31+Z32+Z33+Z34+Z35+Z36) /6 Baris 7 = (Z37+Z38+Z39+Z40+Z41+Z42) /6 Baris 8 = (Z43+Z44+Z45+Z46+Z47+Z48) /6 Baris 9 = (Z49+Z50+Z51+Z52+Z53+Z56) /6
8. Hitung rata-rata zona setiap kolom, disebut Kj, dimana 1 ≤ j ≤ 6 Kj =
9
Kolom 1 = (Z1+Z7+Z13+Z19+Z25+Z31+Z37+Z43+Z49) /9 Kolom 2 = (Z2+Z8+Z14+Z20+Z26+Z32+Z38+Z44+Z50) /9 Kolom 3 = (Z3+Z9+Z15+Z21+Z27+Z33+Z39+Z45+Z51) /9 Kolom 4 = (Z4+Z10+Z16+Z22+Z28+Z34+Z40+Z46+Z52) /9 Kolom 5 = (Z5+Z11+Z17+Z23+Z29+Z35+Z41+Z47+Z53) /9 Kolom 6 = (Z6+Z12+Z18+Z24+Z30+Z36+Z42+Z48+Z54) /9
3.2.3 Recurrent Neural Network
Network. Adapun diagram alur dari Recurrent Neural Network yang telah
dibuat dapat dilihat pada gambar 3.10
start
Input masukan
Input state vektor
Hitung bobot dari input masukan
Hitung bobot dari input masukan
Hitung nilai sigmoid ø danᵟ Hitung keluaran jaringan
If error input ≠error
state vector stop yes
[image:46.595.113.522.136.452.2]no
Gambar 3.10 Diagram alur Recurrent Neural Network
Penjelasan dari gambar 3.10 adalah sebagai berikut :
1. Input masukanberupa akusisi citra dari tahapan prapengolahan citra dan sudah diambil nilai fitur ekstraksinya
2. Input state vector. State Vector berupa target yang ingin dicapai dari citra latih dan citra uji. Melakukan perhitungan state vector dapat dihitung dengan rumus :
x(k) n
4. Melakukan perhitungan nilai hidden layer, dengan rumus :
5. Melakukan perhitungan nilai ø dan ơ dengan menggunakan fungsi sigmoid, adapaun fungsi sigmoid yang digunakan adalah :
6. Menentukan nilai keluaran jaringan, dengan rumus :
3.3Perancangan Sistem
3.3.1 Use case diagram
Gambar 3.11 Use case diagram
3.3.2 Use case spesification
Use case specification merupakan perkembangan dari use case diagram untuk setiap use
case. Use case specification menjelaskan detail bagaimana sebuah use case berkerja. Berikut ini adalah use case specification pada table 3.1 dari sistem yang akan dibangun berdasarkan use case diagram pada gambar 3.11.
Tabel 3.1 Use Case Spesikasi untuk Use Case Cari Citra
Nama use case Cari Citra
Aktor User
Deskripsi Use case ini digunakan oleh user untuk mengambil
data citra tulisan tangan Jepang jenis huruf Katakana.
[image:48.595.112.523.590.713.2]Tabel 3.1 Use Case Spesikasi untuk Use Case Cari Citra (lanjutan)
Characteristic of activation Eksekusi dapat dilakukan oleh siapapun Basic flow - User mengklik menu cari citra.
- Sistem akan menampilkan tempat penyimpanan citra.
- User memilih citra yang akan diproses pada sistem.
- Use case ini berakhir ketika sistem telah selesai menampilkan citra yang telah dipilih oleh user. Post condition Pada use case ini user dapat melakukan pencarian
citra tulisan tangan Jepang jenis huruf Katakana. Limitations -
Tabel 3.2 Use Case Spesikasi untuk Use Case Proses Citra
Nama use case Proses Citra
Aktor User
Deskripsi Use case ini digunakan oleh user untuk memproses
citra tulisan tangan Jepang jenis huruf Katakana yang telah dipilih oleh user dan telah ditampilkan pada sistem.
Pre condition Semua jenis user dapat mengakses use case ini tanpa syarat apapun
Characteristic of activation Eksekusi dapat dilakukan oleh siapapun Basic flow - User mengklik menu image processing.
- Sistem akan melakukan tahapan preprocessing citra dan feature extraction.
[image:49.595.109.522.411.717.2]- Use case ini berakhir ketika sistem telah selesai menampilkan citra akhir yang beserta dengan hasil pengenalan huruf
Post condition Pada use case ini user dapat melihat hasil pengenalan jenis huruf pada sistem.
Limitations -
3.3.3 Diagram aktivasi aplikasi
Diagram aktivasi dari aplikasi menggambarkan urutan aktivitas dalam aplikasi yang sedang dirancang. Dengan adanya diagram aktivasi dapat membantu memahami proses rancangan aplikasi secara keseluruhan. Diagram aktivasi yang peneliti buat menampilkan aktivitas dalam aplikasi yang dapat dilihat pada gambar 3.12
user
Pilih citra Menampilkan tempat penyimpanan citra
Pilih citra yang ingin di uji Menampilkan citra yang telah dipilih
[image:50.595.202.433.365.572.2]
Gambar 3.12 Diagram Aktivasi untuk Mencari Citra
diinginkan maka sistem akan menampilkan citra tersebut pada tempat yang telah tersedia pada halaman sistem utama.
user
Pilih proses citra
Melakukan proses image processing, feature extraction,
dan klasifikasi
Menampilkan hasil pengenalan
[image:51.595.195.441.136.340.2]
Gambar 3.13 Diagram Aktivasi untuk Proses Citra
Pada Gambar 3.13, jika user ingin melakukan pemorsesan citra yang telah dipilih maka dapat dilkukan dengan memilih menu proses citra kemudian sistem akan memproses citra dengan melakukan tahapan preprocessing, feature extraction, dan klasifikasi. Setelah selesai melakukan tahapan tersebut, sistem akan menampilkan hasil akhir pemorsesan citra.
3.3.4 Perancangan antarmuka aplikasi
Antarmuka sistem dari aplikasi dirancang untuk memudahkan user dalam menggunakan aplikasi yang telah dibangun.
menu pada sistem yang akan dibuat. Berikut adalah gambar rancangan dasar antarmuka dari aplikasi identifikasi tulisan Jepang huruf Katakana
1. Rancangan Halaman Awal
Halaman awal merupakan halaman untuk memulai aplikasi. Untuk masuk kehalaman utama maka user diharuskan untuk menekan tombol start application. Adapun rancangan yang dibuat seperti pada gambar 3.14
Gambar 3.14 Rancangan Halaman Awal Keterangan :
A = Tampilan judul pada halaman awal aplikasi
B = Tombol untuk memulai aplikasi
2. Rancangan Halaman Utama
Gambar 3.15 Rancangan Halaman Utama Keterangan :
C = Tempat tampilan citra yang dipilih untuk diproses
D = Tempat tampilan citra yang sudah diproses
E = Tombol untuk memilih citra
F = Tombol untuk melakukan proses pada citra
G = Hasil output dari proses pengenalan citra
BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM
Pada bab ini akan dijelaskan pengimplementasian metode Recurrent Neural Network pada aplikasi pengenalan tulisan Jepang huruf Katakana. Kemudian dilakukan pengujian terhadap sistem yang telah dibangun.
4.1 Kebutuhan Sistem
Kebutuhan sistem pada aplikasi identifikasi tulisan Jepang huruf Katakana berbasis Desktop yang meliputi dari perangkat keras dan perangkat lunak.
4.1.1 Perangkat keras
Spesifikasi perangkat keras yang digunakan untuk implementasi sistem adalah sebagai berikut:
- Processor : Intel Core 2 Duo (2.1 GHz)
- RAM : 1 Gb
- Harddisk : 512 Gb
4.1.2 Perangkat Lunak
Spesifikasi perangkat lunak yang digunakan untuk implementasi sistem adalah sebagai berikut:
- NetBeans IDE 7.2.1
4.2Hasil Tampilan Aplikasi
4.2.1 Tampilan Awal Aplikasi
Pada gambar 4.1 merupakan tampilan awal dari aplikasi identifikasi huruf Katakana. Halaman ini
digunakan untuk memulai aplikasi dengan menekan tombol start application.
[image:55.595.139.493.260.519.2]
Gambar 4.1 Tampilan Awal Aplikasi
4.2.2 Tampilan Utama Aplikasi
Setelah user menekan tombol start application maka akan muncul tampilan utama aplikasi
identifikasi huruf Katakana. Pada halaman ini terdapat canvas tempat penampilan citra, menu
pilih citra yang digunakan untuk memilih citra yang akan diproses, menu image processing yang
digunakan untuk melakukan proses citra, dan menu recurrent yang digunakan untuk
menghasilkan informasi pengenalan citra huruf yang digunakan. Tampilan utama tersebut dapat
[image:56.595.152.479.105.432.2]
Gambar 4.2 Tampilan Utama Aplikasi
4.2.3 Tampilan Pemilihan Citra
Pada tampilan ini user akan memilih citra yang akan diidentifikasi. Disini akan ditampilkan
tempat seluruh penyimpan data user yang secara jelas dapat dilihat pada gambar 4.3 berikut
Gambar 4.3 Tampilan Pemilihan Citra
4.2.4 Tampilan Pengenalan Pola
Pada bagian ini merupakan tampilan utama dari aplikasi identifikasi huruf Katakana. Pada
halaman ini user dapat melihat proses pengolahan citra yang dilakukan. Pada halaman ini akan
ditampilkan tahapan‐tahapan dari image processing. Dan pada halaman ini juga terdapat
informasi mengenai hasil proses pengenalan huruf. Secara jelas dapat dilihat pada gambar 4.4
Gambar 4.4 Tampilan pengenalan Pola
4.3 Rencana Pengujian Sistem
Pengujian yang dilakukan dalam aplikasi ini adalah jalan nya system identifikasi pada tulisan
Jepang huruf Katakana. Hasil identifikasi berupa keluaran (output) kata dari proses
prapengolahan citra, ekstraksi fitur serta metode Recurrent Neural Network pada citra masukan
[image:58.595.162.470.83.394.2](input).
Tabel 4.1 Pengujian Sistem
No. Komponen sistem yang diuji Butir uji
1 Halaman awal Mulaiaplikasi
2 Halaman utama MenuInput citra
Menuimage processing MenuRecurrent
4.4 Hasil Pengujian Sistem 4.4.1 Pengujian mulai aplikasi Pada tabel 4.2 dilakukan pengujian system untuk masuk kedalam system identifikasi tulisan Jepang huruf Katakana.
Tabel 4.2Pengujian halamanmulaiaplikasi
No. Skenario uji Hasil yang diharapkan Hasil
Pengujian 1. User memilih menu
mulai aplikasi
User akan masuk kedalam system dan dapat menuju ke tahap selanjutnya Berhasil 4.4.2 Pengujian input citra Pada tabel 4.3 akan dilakukan pengujian untuk memasukkan data masukan yang berupa sampel citra dari responden yang sudah dimasukkan ke dalam computer dan diubah formatnya
[image:59.595.110.524.254.382.2]menjadiJPEG.
Tabel 4.3Pengujian input citra
No. Skenario uji Hasil yang diharapkan Hasil
Pengujian 1. User memilih menu
input citra dari halaman utama aplikasi
Bisa memasukkan citra masukan yang akan diproses
Berhasil
4.4.3 Pengujian prapengolahan citra ( image processing )
Pada tabel 4.4 akan dilakukan pengujian data yang akan di proses melalui tahap prapengolahan
citra ( image processing ). Prapengolahan citra pada aplikasi ini berupa grayscalling, resizing,
normalisasi, thinning.
Tabel 4.4 Pengujian prapengolahan citra ( image processing )
No. Skenario uji Hasil yang diharapkan Hasil
Pengujian 1. User memilih menu
image processing
Input citra yang sudah dimasukkan bias diproses melalui tahap prapengolahan citra ( image processing ) agar dapat dikenali identifikasinya.
Berhasil
4.4.4 Pengujian Recurrent Neural Network
Pada tabel 4.5 akan dilakukan pengujian Recurrent Neural Network pada citra yang sudah
diproses dari prapengolahan citra dan didapat nilai ekstraksi fiturnya sehingga dapat dikenali
identifikasi dari huruf Jepang tulisan Katakana.
Tabel 4.5 Pengujian Recurrent Neural Network
No. Skenario uji Hasil yang diharapkan Hasil
Pengujian 1. User memilih menu
Recurrent
Citra yang sudah diproses berhasil dikenali melalui Recurrent Neural Network.
4.4.5 Pengujian Kinerja Sistem
Dilakukan pengujian terhadap salah satu citra huruf yang digunakan untuk pengenalan tulisan tangan Jepang huruf Katakana. Data yang digunakan berupa citra huruf He. Dari data citra yang digunakan akan dilakukan image processing, ektraksi fitur, dan tahapan klasifikasi. Adapunhasil yang diperoleh berupa informasi bahwa data citra yang digunakan dapat dikenali sebagai huruf He atau tidak, selain itu juga ditampilkan informasi MSE dan tingkat kecocokan. Secara jelas akan dijabarkan tahapan-tahapan yang dilakukan dalam melakukan pengenalan tulisan tangan Jepang huruf Katakana. Adapun tahapan yang dilakukan diantaranya :
Gambar 4.5 Proses grayscalling
-Setelah dilakukan grayscalling, tahapan image processing selanjutnya adalah resizing. Resizing dilakukan untuk mengubah ukuran citra menjadi sama atau
Gambar 4.6 Proses resizing
-Kemudian dilanjutkan dengan tahan normalisasi. Normalisasi dilakukan untuk membuat citra lebih mudah dimunculkan fitur-fiturnya. Dengan cara mengubah rentang nilai intensitas piksel dan juga meningkatkan akurasi pengenalan.
Gambar 4.7 Proses thinning
-Setelah selesai melakukan image processing, tahapan selanjutnya adalah melakukan ekstraksi fitur
-Tahap terakhir yang dilakukan adalah proses klasifikasi dimana ketika user memilih menu recurrent maka akan dihasilkan informasi tingkat kecocokan dan MSE. Secara jelas dapat dilihat pada gambar 4.8. Dari data citra yang digunakan didapatkan hasil :
Tingkat kecocokan : 63.900863525561164 %
Gambar 4.8 Proses klasifikasi
4.4.6 Hasil Pengujian Data Latih
Citra tulisan Jepang huruf Katakana yang telah dilatih adalah sebanyak 460citra yang terdiri dari
46 huruf Katakana dengan masing‐masing 10 sampel. Dari proses pengujian didapatkan hasil
seperti dapat dilihat pada Tabel 4.6 pada halaman berikutnya.
Tabel 4.6 Hasil Pengujian Citra yang Dilatih
Nama citra Pengujian sampel ke
1 2 3 4 5 6 7 8 9 10
CHI
FU
HA
KO
MO
SHI
WA
TA
NE
HO
A
I
U
E
O
HE
HI
KA
KE
KI
[image:67.595.104.551.127.716.2]KU
MA
ME
MI
MU
N
NI
NO
RA
RI
RO
RU
SA
SE
SO
SU
TE
TSU
WO
YA
YO
Dari hasil pengujian diatas, menggunakan rumus penghitungan persentase akurasi:
[image:69.595.152.473.367.726.2]
dapat disimpulkan bahwa tingkat akurasi pengenalan pola karakter yang dilatih sebesar 89.1304 %. 4.4.7Hasil Pengujian Sistem Pada bagian ini akan ditampilkan seluruh hasil pengujian dari tiga data uji dari tiap masing‐ masing huruf. Adapun hasil yang didapatkan seperti pada tabel 4.7
Tabel 4.7Hasil Pengujian Citra uji
Namacitra Sampel Ke Nama Citra Sampelke
1 2 3 1 2 3
A Na
Chi Ne
E Ni
Fu No
Ha Nu
He O
Hi Ra
Ho Re
I Ri
Ka Ro
Ke Ru
Ki Sa
Ko Se
Ku Shi
Ma So
Me Su
Mi Ta
Mo Te
Mu To
Tabel 4.7 Hasil Pengujian Citra uji (lanjutan)
U Ya
Wa Yu
Wo Yo
Dari hasil pengujian diatas, dengan menggunakan rumus penghitungan persentase akurasi:
dapat disimpulkan bahwa tingkat akurasi pengenalan pola karakteruji sebesar 86.1952 %
BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan pembahasan implementasi dan pengujian yang telah dilakukan maka dapat diperoleh beberapa kesimpulan:
1. Hasil identifikasi dari tulisan Jepang huruf Katakana menggunakan metode Recurrent Neural Network terbilang cukup berhasil.
2. Tingkat akurasi pengenalan pola karakter yang dilatih sebesar 89.1304 %.
3. Dengan menggunakan metode Recurrent Neural Network tingkat akurasi pengenalan pola karakter uji sebesar 86.1952 %
5.2 Saran
Untuk menghasilkan aplikasi yang lebih baik dan maksimal maka dibutuhkan saran dari pihak manapun untuk melengkapi kekurangan yang ada pada aplikasi ini. Saran dari penulis yaitu :
1. Proses identifikasi tulisan Jepang huruf Katakana diharapkan dapat dilakukan dengan menggunakan metode lainnya dengan tujuan untuk memperoleh hasil keakuratan yang lebih baik.
DAFTAR PUSTAKA
Andrijasa, M.F. & Mistianingsih. 2010. Penerapan Jaringan Syaraf Tiruan Untuk Memprediksi Jumlah Pengangguran di Provinsi Kalimantan Timur Dengan
Menggunakan Algoritma Pembelajaran Backpropagation, FMIPA Universitas
Mulawarman.
Aribowo, W. 2010. Stabilisator Sistem Tenaga Berbasis Jaringan Syaraf Tiruan Berulang Untuk Sistem Mesin Tunggal. Fakultas Teknik, Universitas Negeri
Surabaya.
Fitri.2013. (online) Penipisan Pola Citra (Thinning).
http://srifitri07.blogspot.com/2013/12/penipisan-pola-citra-thinning.html ( 20 Mei 2014 )
Gonz