IDENTIFIKASI TULISAN MANDARIN PADA CITRA BIJI CATUR GAJAH CINA BERDASARKAN POLA MENGGUNAKAN DIRECTION FEATURE
EXTRACTION DAN BACKPROPAGATION
SKRIPSI
WILLIAM 111402024
PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA MEDAN
EXTRACTION DAN BACKPROPAGATION
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
WILLIAM 111402024
PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA MEDAN
PERSETUJUAN
Nomor Induk Mahasiswa : 111402024
Program Studi : S1 TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI UNIVERSITAS SUMATERA UTARA Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Seniman, S.Kom, M.Kom Romi Fadillah Rahmat, B.Comp.Sc M.Sc NIP. 19870525 201404 1 001 NIP. 19860303 201012 1 004
Diketahui/disetujui oleh
Program Studi S1 Teknologi Informasi Ketua,
PERNYATAAN
IDENTIFIKASI TULISAN MANDARIN PADA CITRA BIJI CATUR GAJAH CINA BERDASARKAN POLA MENGGUNAKAN DIRECTION FEATURE
EXTRACTION DAN BACKPROPAGATION
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 14Januari 2016
UCAPAN TERIMA KASIH
Puji dan syukur penulis sampaikan kehadirat Tuhan Yang Maha Esa yang telah memberikan rahmat serta restu-Nya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi.
Pertama, penulis ingin mengucapkan terima kasih kepada Bapak selaku Romi Fadillah Rahmat, B.Comp.Sc. M.Sc pembimbing pertama dan Bapak Seniman, S.Kom, M.Kom selaku pembimbing kedua yang telah membimbing penulis dalam penelitian serta penulisan skripsi ini. Penulis tidak akan dapat menyelesaikan skripsi ini tanpa inspirasi serta motivasi yang diberikan dari kedua pembimbing,. Penulis juga mengucapkan terima kasih kepada Bapak Muhammad Fadly Syahputra, B.Sc. M. Sc. IT sebagai dosen pembanding pertama dan Bapak M. Anggia Muchtar, ST. MM.IT sebagai dosen pembanding kedua yang telah memberikan masukan serta kritik yang bermanfaat dalam penulisan skripsi ini. Ucapan terima kasih juga ditjukan kepada semua dosen serta semua pegawai pada program studi S1 Teknologi Informasi, yang telah membantu serta membimbing penulis selama proses perkuliahan.
Penulis tentunya berterima kasih kepada kedua orang tua penulis, Bapak penulis Edi Limbasulinto, serta Ibu penulis Rostina yang telah membesarkan penulis dengan sabar dan penuh cinta. Terima kasih juga penulis ucapkan kepada adik penulis, Wilianto dan Jenny, yang selalu memberikan dukungan kepada penulis. Penulis juga berterima kasih kepada seluruh anggota keluarga penulis yang namanya tidak dapat disebutkan satu-satu.
ABSTRAK
Identifikasi citra adalah satu dari tahapan-tahapan yang digunakan di dalam sistem terautomatisasi, khususnya pengenalan biji catur cina. Pengenalan citra pada tulisan karakter cina adalah sebuah proses untuk mengenali karakter cina yang terdapat pada biji catur cina untuk mendapatkan jumlah dari setiap set catur. Dikarenakan biji catur cina memiliki kontour dan goresan yang kompleks, tulisan pada biji catur susah untuk dikenali oleh manusia awam. Berdasarkan pada fakta yang tertera di atas, pengenalan biji catur cina berdasarkan pada pola sangat penting. Dalam mempermudah dan mengoptimasi kinerja dari jaringan saraf tiruan, berbagai metode digunakan di dalam penelitian ini, seperti pengdeteksian lingkaran dengan Hough Circle Detection, Grayscaling, Binerisasi, Resizing, Thinning, Normalisasi dan Pixelization. Metode yang diajukan di dalam penelitian ini adalah Direction Feature Extraction yang diekstraksi dari citra sebagai fitur dan mengimplementasikan Backpropagation di dalam mengenali biji catur cina berdasarkan pada pola. Di dalam penelitian ini, didapatkan bahwa metode yang diajukan dapat mengenali tulisan pada biji catur cina dengan tingkat keakuratan sebesar 98% untuk berbagai set catur cina dan meetode yang diajukan juga tahan terhadap translasi pada citra, kecerahan, derau dan rotasi sampai 60◦.
CHINESE CHESS CHARACTER IDENTIFICATION USING DIRECTION
FEATURE EXTRACTION AND BACKPROPAGATION
ABSTRACT
Image identification is one of the phases used in automated system, spesifically Chinese character recognition. Image recognition on Chinese chess is a process to recognize Chinese character on Chinese chess in order to obtain the number of each chess set. Due to the fact that Chinese character’s pattern has complex contours and strokes; Handwritten Chinese Character Recognition (HCCR) is difficult to be recognized by new learners, especially humans. Based on the fact stated above, Chinese chess recognition based on pattern becomes very essential. In order to ease
and optimize the neural network’s performance, several pre-processing methods are
applied in this research, such as Circular Hough Transform Detection, Grayscaling, Binerization, Resizing, Thinning, Normalization and Pixelization. The methods proposed in this research consist of using Direction Feature Extraction extracted from an image as features and implementing Backpropagation in identifying Chinese chess character on the image based on its pattern. In this research, it results that the proposed methods are capable of identifying Chinese chess character images with good accuracy of 98% for various chess sets and it is also robust from image transition, brightness, noise and rotation up to 60◦.
DAFTAR ISI
Hal.
Persetujuan ii
Pernyataan iii
Ucapan Terima Kasih iv
Abstrak v
2.2.1.Canny Edge Detection 9
2.2.1.1. Hough Circle Transform 9
2.2.2.1. Dilation 10
2.2.2.2. Gaussian Blur 10
2.2.3.Min-Max Linear Contrast Strecth 10
2.2.4.Colour Space Conversion 11
2.2.4.1.RGB2Grayscale 11
2.2.5. Resizing 12
2.2.6.Image Normalization 12
2.2.7. Thresholding 12
2.2.8. Thinning 12
2.3. Ekstraksi Fitur 13
2.3.1. Direction Feature 13
2.5. Backpropagation 15
2.6. Penelitian Terdahulu 19
BAB 3 Analisis dan Perancangan 23
3.1. Data yang Digunakan 23
3.2. Analisis Sistem 23
3.2.1. Colour Space Conversion 25
3.2.1.1. RGB2Grayscale 25
3.2.2. Image Enhancement 26
3.2.2.1. Gaussian Blur 27
3.2.2.2. Dilation 27
3.2.3.Canny Edge Detection 27
3.2.3.1. Hough Circle Transform 28
3.2.4. Cropping 30
3.2.5.Erase Circle 33
3.2.6. Thresholding 34
3.2.7. Image Normalization 35
3.2.9. Min-Max Linear Contrast Stretch 40
3.2.10. Thinning 41
3.2.11. Binerization 46
3.2.12. Feature Extraction 47
3.2.12.1. Direction Feature Extraction 48
3.2.13. Backpropagation 55
3.3. Perancangan Sistem 62
3.3.1. Perancangan Antarmuka 62
3.3.1.1. Rancangan Tampilan Halaman Menu Utama 62 3.3.1.2. Rancangan Tampilan Halaman Image Preprocessing 63 3.3.1.3. Rancangan Tampilan Halaman Implementasi 64
BAB 4 Implementasi dan Pengujian 66
4.1. Implementasi Sistem 66
4.1.1.Spesifikasi Perangkat Keras dan Perangkat Lunak yang
digunakan 66
4.1.2. Implementasi Perancangan Antarmuka 66
4.2. Pengujian Sistem 74
4.2.1. Pengujian terhadap Dataset Biji Catur Cina dengan
Orientasi Sudut 90◦ 74
4.2.2. Pengujian Hasil terhadap Dataset Biji Catur Cina dengan
Sudut60◦sampai 120◦ 86
BAB 5 Kesimpulan dan Saran 97
5.1. Kesimpulan 97
5.2. Saran 98
DAFTAR TABEL
Hal.
Tabel 2.1 Nilai Label dan Arah pada Direction Feature 13
Tabel 2.2 Matriks neighbour pixel P dalam pelabelan nilai arah 14
Tabel 2.3 Tabel Peneltian Terdahulu 20
Tabel 3.1 Matriks RGB pada citra 3x3 pixel 25
Tabel 3.2 Matriks Grayscale pada citra 3x3 pixel 26
Tabel 3.3 Urutan elemen pixel tetangga pada matriks boolean 43
Tabel 4.1 Ukuran Kinerja Hasil Pengujian 74
Tabel 4.2 Persentase Hasil Pengujian Pengidentifikasian Dataset Citra Biji
Catur Cina Peneliti Kondisi I 76
Tabel 4.3 Persentase Hasil Pengujian Pengidentifikasian Dataset Citra Biji
Catur Cina Peneliti Kondisi II 81
Tabel 4.4 Persentase Hasil Pengujian Pengidentifikasian Dataset Pengujian Font Digital Terhadap Dataset Pelatihan Citra Biji Catur Cina 84
Tabel 4.5 Ukuran Kinerja Hasil Pengujian 87
Tabel 4.6 Persentase Hasil Pengujian Pengidentifikasian Dataset Citra Biji
Catur Cina Peneliti Kondisi I 89
Tabel 4.7 Persentase Hasil Pengujian Pengidentifikasian Dataset Citra Biji
Catur Cina Peneliti Kondisi II 91
Tabel 4.8 Persentase Hasil Pengujian Pengidentifikasian
Dataset Citra Biji Catur Cina Peneliti Kondisi III 93
DAFTAR GAMBAR
Hal.
Gambar 3.1 Arsitektur umum 24
Gambar 3.2 Citra RGB webcam dan Citra grayscale hasil konversi 26
Gambar 3.3 Hasil pendeteksian Hough Circles Detection dan parameter
warna pada citra terdeteksi 30
Gambar 3.4 Citra RGB dan grayscale yang tercrop dengan dimensi
300x300 pixel 32
Gambar 3.5 Cincin pada citra grayscale yang telah terbuang
dan hanya karakter Cina 33
Gambar 3.6 Citra hasil normalisasi dengan ukuran yang bervariasi 38
Gambar 3.7 Citra resize berukuran 24x24 pixel 39
Gambar 3.8 Citra thinning berukuran 24x24 pixel 40
Gambar 3.9 Gambar hasil konversi citra thinning menjadi file matriks biner 46
Gambar 3.10 Matriks Direction 24x24 yang mengandung nilai arah 2-5 47
Gambar 3.11 Transisi nilai keempat arah berukuran 4x24 pada
masing-masing arah 49
Gambar 3.12 Matriks normalisasi transisi keempat sisi berukuran 4x6 52
Gambar 3.13 Matriks Direction Feature Extraction berdimensi 4x24 54
Gambar 3.14 Tampilan Halaman Menu Utama 55
Gambar 3.15 Tampilan Halaman Menu Preprocessing 63
Gambar 3.16 Tampilan Halaman Implementasi 63
Gambar 4.1 Tampilan Halaman Utama 67
Gambar 4.2 Tampilan Halaman Input Character 67
Gambar 4.3 Tampilan Halaman Input Set 68
Gambar 4.5 Tampilan Halaman binerization300x300 69
Gambar 4.6 Tampilan Halaman normalization300to24 70
Gambar 4.7 Tampilan Halaman pixelization24x24 70
Gambar 4.8 Tampilan Halaman thinning 24x24 71
Gambar 4.9 Tampilan Halaman binerization24x24 71
Gambar 4.10 Tampilan Halaman Direction Feature Extraction 72
Gambar 4.11 Tampilan Halaman Training using Backpropagation 73
Gambar 4.12 Tampilan Halaman Implentation 73
Gambar 4.13 Hasil pengujian terhadap biji catur merah dan hitam
dengan orientasi sudut 90◦ dan font yang berbeda 79
Gambar 4.14 Gambar dataset font biji catur cina pada posisi 90◦ 80
Gambar 4.15 Gambaran hasil pengidentifikasian dengan pergeresan
5◦ searah maupun berlawanan arah jarum jam
dari biji catur cina 82
Gambar 4.16 Gambar dataset font pada posisi 5◦ searah jarum jam
dari posisi tegak lurus 83
Gambar 4.17 Gambar dataset font pada posisi 5◦ berlawanan arah jarum jam
dari posisi tegak lurus 83
Gambar 4.18 Hasil pengujian dataset biji catur terhadap font digital mandarin 85
Gambar 4.19 Citra Testing Font Digital 86
Gambar 4.20 Hasil pengujian kondisi II pada biji catur merah dan hitam 93 Gambar 4.21 Hasil pengujian kondisi III pada biji catur merah