• Tidak ada hasil yang ditemukan

Dataset Kata Jawi untuk Sistem Pengenalan Tulisan Tangan Jawi Kuno

N/A
N/A
Protected

Academic year: 2023

Membagikan "Dataset Kata Jawi untuk Sistem Pengenalan Tulisan Tangan Jawi Kuno "

Copied!
9
0
0

Teks penuh

(1)

Dataset Kata Jawi untuk Sistem Pengenalan Tulisan Tangan Jawi Kuno

Baihaqi1,2, Fitri Arnia3, Rusdha Muharar4

1Program Doktor Ilmu Teknik, Program Pascasarjana, Universitas Syiah Kuala, Banda Aceh 23111, Indonesia

2Jurusan Teknik Komputer, Fakultas Teknik, Universitas Serambi Mekkah, Banda Aceh 23245, Indonesia

3,4Jurusan Teknik Elektro dan Komputer, Fakultas Teknik, Universitas Syiah Kuala, Banda Aceh 23111, Indonesia

*Koresponden email: [email protected]

Diterima: 29 Juni 2022 Disetujui: 20 Juli 2022

Abstract

Indonesia has many historical and cultural heritages in the form of ancient documents written in Arabic, Malay, or Jawi. There are six additional letters in Jawi, namely ca, nya, nga, pa, ga, and va to form Jawi’s vocabulary. This ancient Jawi document has suffered many quality degradations such as uneven lighting, varying contrast, blurred ink and writing, black spots, smudges, and several other glitches. Research on handwritten word recognition systems has been done extensively for Arabic scripts and various other writings. Most of the previous research focused on character level, word level, and document level.

However, it still uses publicly available datasets such as IFN/ENIT, CVL dataset, IAM, and several other datasets with similar characteristics. Meanwhile, the Jawi dataset at the word level is still not available at this time. Therefore, this study examines the handwriting recognition system at the word level. The purpose of this study is to propose a new dataset (word Jawi dataset). It is hoped that this new dataset can become a more representative dataset. The process of creating a new dataset is carried out using a manual and semi- automatic approach. Furthermore, the document said Jawi will determine the Ground Truth (GT). This research produces a special dataset of words Jawi as many as 2,310 words.

Keywords: ancient jawi documents, word jawi dataset, ground truth (GT), semi-automatic, handwritten recognition system

Abstrak

Indonesia memiliki banyak peninggalan sejarah dan budaya berupa dokumen kuno yang ditulis dalam bahasa Arab Melayu atau Jawi. Ada enam huruf tambahan dalam Jawi yaitu ca, nya, nga, pa, ga dan va sebagai pembentuk kosa kata Jawi. Dokumen Jawi kuno ini telah mengalami banyak penurunan kualitas seperti pencahayaan yang tidak merata, kontras yang bervariasi, tinta dan tulisan yang kabur, bercak hitam, noda, dan beberapa gangguan lainnya. Penelitian tentang sistem pengenalan kata tulisan tangan telah dilakukan secara ekstensif untuk tulisan Arab dan berbagai tulisan lainnya. Sebagian besar penelitian terdahulu fokus pada level karakter, level kata dan dokumen. Namun, masih menggunakan dataset yang tersedia secara publik seperti IFN/ENIT, CVL dataset, IAM dan beberapa jenis dataset lainnya yang memiliki karakteristik yang mirip. Sedangkan untuk dataset Jawi pada level kata masih belum tersedia saat ini. Oleh karena itu, penelitian ini mengkaji tentang sistem pengenalan tulisan tangan pada level kata.

Tujuan dari penelitian ini mengusulkan dataset baru yaitu (word jawi dataset). Diharapkan dataset baru ini dapat menjadi dataset yang lebih representatif. Proses mengcreate dataset baru ini dilakukan dengan pendekatan manual dan semi otomatis. Selanjutnya dokumen kata Jawi ini akan dilakukan penentuan Ground Truth (GT). Penelitian ini menghasilkan dataset khusus word Jawi sebanyak 2.310 kata.

Kata Kunci: dokumen jawi kuno, word jawi dataset, ground truth (gt), semi otomatis, sistem pengenalan tulisan tangan (handwriting word recognition)

1. Pendahuluan

Indonesia merupakan salah satu negara di Asia Tenggara dan memiliki berbagai kekayaan budaya dan adat istiadat. Salah satu kekayaan budaya dan adat istiadat berupa peninggalan sejarah. Peninggalan sejarah tersebut dapat berupa benda, cagar budaya, dan sebagainya. Aceh merupakan salah satu daerah paling ujung Indonesia yang terkenal dengan budaya dan adat istiadatnya, termasuk peninggalan sejarahnya. Peninggalan sejarah Aceh dapat berupa dokumen-dokumen kuno yang berisi ilmu agama, puisi atau syair, sejarah dan berbagai ilmu lainnya. Dokumen tersebut ditulis dalam bahasa Arab atau huruf Arab.

Huruf Arab tersebut dituliskan dalam bahasa Melayu atau disebut dengan tulisan Jawi. Aksara Arab Melayu

(2)

Serambi Engineering, Volume VII, No.3, Juli 2022 Hal 3546 - 3554 p-ISSN : 2528-3561 e-ISSN : 2541-1934

atau Aksara Jawi, bersama dengan Farsi dan Urdu, adalah salah satu bahasa yang ditulis dengan menggunakan karakter Arab. Penelitian yang dilakukan oleh Saddami [1] tentang printed karakter Jawi ada beberapa karakter tambahan dalam abjad Arab-Melayu atau Jawi yaitu ca, nya, nga, pa, ga, dan va.

Ada empat tahapan utama dalam sistem pengenalan kata tulisan tangan Arabic dan jawi yaitu pre- processing, segmentasi, ekstraksi fitur dan klasifikasi seperti yang ditunjukkan oleh Lamtougui [2].

Tahapan awal dalam penelitian sistem pengenalan tulisan tangan Jawi adalah pre-prosessing. Tahapan pre- processing dilakukan untuk membersihkan citra dokumen sehingga menghasilkan sebuah citra yang bebas noise atau gangguan. Tahapan segmentasi terdiri dari segmentasi teks menjadi subunit, seperti baris, kata atau karakter. Tahapan ini merupakan tahapan penting yang akan berdampak pada sistem pengenalan.

Segmentasi dapat terbagi ke dalam beberapa jenis [3]. Segmentasi halaman ke dalam baris dimana secara umum file paragraf terdiri dari beberapa baris [4]. Selanjutnya adalah segmentasi baris menjadi kata per kata yang tergantung pada jarak antar kata atau spasi. Dalam hal ini terdapat juga karakter yang tidak terhubung ke dalam kata sehingga digolongkan ke dalam sub kata [5].

Tahapan penting lainnya dalam sistem pengenalan kata tulisan tangan adalah ekstraksi fitur.

Ekstraksi fitur yaitu proses pengambilan informasi dari gambar kata atau karakter yang mewakili isi dari teks. Fitur tersebut bisa berupa piksel, data atau bentuk dari kata. Fitur ini akan digunakan untuk membangun model pada tahapan klasifikasi [6]. Tahapan terakhir dari sistem pengenalan ini adalah klasifikasi. Tahapan klasifikasi digunakan untuk memberikan atau menetapkan label kelas pada setiap dataset yang digunakan. Penelitian tentang sistem pengenalan tulisan tangan sudah sangat banyak dilakukan oleh para peneliti dunia. Penelitian tersebut dilakukan terhadap berbagai bentuk tulisan tangan, diantaranya bahasa Inggris, China atau Jepang, India dan Arab. Sistem pengenalan tulisan tangan dengan karakter yang mirip dengan bahasa Arab adalah Urdu dan Farsi. Penelitian tentang pengenalan tulisan tangan Jawi semakin berkembang, misalnya, Zulcaffle [7], dan Diah [8]. Selanjutnya, Saddami [1] melakukan pengembangan terhadap database karakter Jawi untuk dapat digunakan oleh para peneliti di masa yang akan datang.

Penelitian yang berkaitan dengan sistem pengenalan tulisan tangan semakin berkembang pesat saat ini seperti yang telah diuraikan sebelumnya. Penelitian-penelitian tersebut bergerak dari sistem pengenalan pada level karakter huruf, level sub-kata, kata atau bahkan dokumen secara keseluruhan. Oleh karena itu, penelitian pada level kata masih sangat perlu untuk dilakukan dan dikembangkan ke depannya. Sulaiman [9] pada Tahun 2020 melanjutkan penelitian untuk sistem pengenalan tulisan tangan Arab pada level kata (word recognition). Penelitian ini mengusulkan model deep learning baru dengan menerapkan Long Short- Term Memory (LSTM) pada level karakter (character level) dan CNN pada level kata (word level). Ada lima dataset publik yang digunakan untuk ekperimen pada penelitian ini yaitu IFN/ENIT versi 1, IFN/ENIT versi 2, CVL, IAM dan Alexue dataset. Kelima dataset tersebut terdiri dari tiga jenis bahasa yaitu Inggris, Jerman dan Arab. Hasil penelitian menunjukkan bahwa kinerja metode yang diusulkan memiliki kinerja yang lebih baik untuk dataset bahasa Inggris dan Jerman dibandingkan dengan dataset bahasa Arab yang digunakan. Hal ini disebabkan oleh kompleksitas penulisan dari bahasa Arab yang berbeda dengan bahasa Inggris dan Jerman yaitu saling terhubung antara satu dengan yang lainnya.

Berdasarkan beberapa latar belakang dan studi literatur tersebut, maka penelitian untuk sistem pengenalan tulisan tangan Jawi ini memiliki tantangan yaitu adanya penambahan enam buah karakter atau huruf yang akan membentuk kosakata jawi (ca, nya, nga, pa, ga dan va). Oleh karena itu, penelitian ini akan berfokus pada sistem pengenalan kata tulisan tangan untuk dokumen Jawi kuno. Tahapan awal adalah menyiapkan dataset word Jawi. Hal ini dikarenakan saat ini belum ada dataset khusus untuk word jawi yang dapat digunakan oleh para peneliti dalam melakukan penelitian. Oleh karena itu, penelitian ini bertujuan untuk menghasilkan dataset baru yaitu dataset khusus kata Jawi atau word Jawi. Dataset khusus ini dapat digunakan untuk penelitian selanjutnya dalam bidang sistem pengenalan tulisan tangan Jawi (Jawi Handwritten Word Recognition).

2. Metode Penelitian

Tempat dan Waktu Penelitian

Penelitian ini dimulai dengan tahapan awal yaitu studi literatur terhadap penelitian terkait.

Penelitian ini akan dilaksanakan di laboratorium Grup Penelitian Multimedia dan Pengolahan Sinyal pada jurusan Teknik Elektro dan Komputer Universitas Syiah Kuala Banda Aceh. Penelitian ini dilakukan sejak bulan Januari sampai dengan bulan Juni Tahun 2022. Objek penelitian berupa dokumen jawi kuno seperti terlihat pada Gambar 1.

(3)

Gambar 1. Citra warna dokumen Jawi kuno Sumber: [10]

Selanjutnya melakukan pengumpulan data berupa data citra dokumen Jawi kuno seperti pada Gambar 1. Citra dokumen Jawi kuno tersebut dikumpulkan dari Museum Aceh dan Pusat Dokumentasi dan Informasi Aceh (PDIA). Dokumen tersebut di-capture menggunakan kamera, kemudian disimpan dalam memori komputer dengan memberikan nama, label atau inisialisasi untuk tiap-tiap file dokumen.

Proses pengumpulan dokumen Jawi ini memiliki tugas yang spesifik disebabkan oleh karakteristik yang dimiliki oleh dokumen Jawi kuno. Beberapa hal penting yang harus diperhatikan pada tahapan ini adalah jaminan kualitas gambar atau citra yang dimiliki oleh dokumen tersebut. Selanjutnya ukuran dan format citra yang akan digunakan juga menjadi hal penting lainnya yang harus diperhatikan. Tahapan selanjutnya setelah semua dokumen telah berhasil dikumpulkan adalah penentuan Ground Truth (GT) dari dokumen Jawi kuno tersebut. Ground Truth (GT) dokumen adalah referensi kumpulan data yang berisi informasi yang benar atau nilai kebenaran dari dataset kata Jawi yang telah dihasilkan. Ground Truth (GT) ini akan digunakan sebagai pembanding untuk mengukur nilai kebenaran yang dihasilkan. Proses penentuan Ground Truth (GT) ini dilakukan secara manual dengan bantuan dari penglihatan mata manusia (ahli) yang dapat membaca dengan baik terhadap dokumen Jawi tersebut. Namun demikian, ada juga proses penentuan Ground Truth (GT) yang dilakukan dengan pendekatan semi otomatis.

Beberapa contoh tools ground truthing dan benchmarking adalah Pink Panther sebagai alat untuk membuat file kebenaran dasar dari segmentasi dan algoritma segmentasi halaman benchmarking [11].

Aletheia9 dapat digunakan untuk membubuhi keterangan konten tekstual pada gambar, GEDI10 sebagai lingkungan kebenaran dasar untuk gambar dokumen. LabelMe11 adalah tools anotasi terbuka untuk memberi label objek pada gambar, PixLabeler menawarkan antarmuka untuk tingkat piksel pelabelan elemen dalam gambar dokumen [12].

Konstruksi Ground Truth (GT)

Konstruksi data Ground Truth (GT) merupakan bagian penting dalam penelitian ini. Pengukuran kuantitatif dan evaluasi penelitian akan dapat dilakukan jika nilai kebenaran atau Ground Truth (GT) ini tersedia. Ada dua pendekatan yang dapat digunakan dalam proses penentuan Ground Truth (GT) ini yaitu pendekatan manual dan pendekatan semi otomatis. Tidak ada pendekatan yang sepenuhnya otomatis dalam penentuan Ground Truth (GT) ini [13].

Pendekatan Manual

Gambar dokumen secara alami merupakan objek visual. Sebagian besar metode atau pendekatan yang diterapkan terhadap dokumen gambar dimaksudkan untuk meniru kemampuan penglihatan manusia dalam melakukan segmentasi, mengasosiasi, mengenali dan menginterpretasikan seluruh bagian atau komponen pada dokumen tersebut. Itulah sebabnya menurut definisi, mengevaluasi kinerja dari pendekatan penelitian ini berarti membandingkan hasil dengan hasil penglihatan manusia. Data kebenaran dasar yang mewakili kebenaran dari penglihatan manusia kemudian harus dilakukan secara manual oleh manusia itu sendiri. Dalam tugas pengenalan teks, dengan pendekatan manual, pekerjaan yang melelahkan harus dilakukan terlebih dahulu untuk melacak segmen baris teks secara manual atau mungkin ke tingkat segmen kata atau karakter yang lebih dalam dan kemudian membuat anotasi dan menyalin gambar segmen ke dalam format teks yang terkait.

(4)

Serambi Engineering, Volume VII, No.3, Juli 2022 Hal 3546 - 3554 p-ISSN : 2528-3561 e-ISSN : 2541-1934

Proses penentuan Ground Truth (GT) dokumen secara manual sangat membutuhkan waktu yang lama dalam prosesnya [14]. Proses ground truthing manual pasti dapat dilakukan lebih cepat dengan melibatkan lebih banyak orang sebagai ahli dalam penentuan nilai kebenaran, dengan catatan bahwa orang- orang tersebut memenuhi syarat atau ahli dalam proses pembacaan dokumen Jawi tersebut. Saat ini, sebagian besar proses ground truthing tidak dilakukan secara manual lagi. Setidaknya sudah dibantu beberapa alat atau tools untuk mempercepat prosesnya, padahal alat itu tidak memberikan keputusan tentang kebenaran data yang sedang di-ground-trued [15].

Pendekatan Semi Otomatis

Pendekatan semi otomatis mengusulkan cara yang lebih cepat untuk membuat data kebenaran dasar dengan menggunakan beberapa alat atau metode otomatis yang memberikan keputusan awal tentang kebenaran data yang di-ground-kan. Pendekatan otomatis dapat diterapkan di langkah awal atau dapat disisipkan pada langkah tengah proses ground truthing. Misalnya, untuk sistem OCR dengan data transkripsi yang tidak atau kurang tersedia, kerangka kerja anyOCR [14] dan OCRoRACT [15]

mengusulkan pendekatan untuk meminimalkan kebutuhan seorang ahli bahasa untuk menyalin dokumen secara manual. Kebenaran dasar semi benar dari unicode untuk cluster karakter diidentifikasi oleh ahli bahasa setelah menggunakan pendekatan semi otomatis untuk segmentasi baris teks dan karakter.

3. Hasil dan Pembahasan Rancangan Penelitian

Rancangan dalam melakukan penelitian ini dimulai dengan proses pengumpulan citra dokumen Jawi kuno. Dokumen yang telah dikumpulkan tersebut akan digunakan untuk proses selanjutnya yaitu proses cropping (pemecahan) citra dari dokumen utuh menjadi bagian-bagian kecil dokumen sesuai dengan kata per kata. Langkah selanjutnya adalah penentuan Ground Truth (GT) yaitu penentuan nilai kebenran dari dokumen Jawi yang telah dihasilkan.

Mulai

Pengumpulan Data Dokumen Jawi Kuno Museum dan Pusat Dokumentasi dan

Informasi Aceh (PDIA)

Citra Grayscale Dokumen Jawi Kuno

Binerisasi Citra Dokumen Jawi Kuno

Cropping Citra Dokumen Jawi Kuno ke Dalam Bentuk Kata per Kata

Penentuan Ground Truth (GT)

Nilai Kebenaran GT

Citra Hasil Ground Truth (GT)

Pemberian Label Citra Hasil GT

Hasil Dataset Kata Jawi

Recall dan Precision F-Measure

Selesai Ya

Tidak

Gambar 2. Diagram Alir Rancangan Penelitian Sumber: [13]

Proses Cropping Citra Dokumen Jawi Kuno

Tahapan selanjutnya setelah proses pengumpulan data selesai dilakukan adalah proses binarisasi citra dari citra grayscale menjadi citra biner [16]. Setelah citra biner dihasilkan, maka proses selanjutnya adalah melakukan proses cropping citra ke dalam bentuk kata per kata.

(5)

(a) (b) Gambar 3. (a) citra grayscale dan (b) citra hasil binarisasi

Sumber: [10]

Mulai

Citra Dokumen Jawi Kuno Utuh (Halaman)

Cropping Citra Dokumen Jawi Kuno Utuh Ke Dalam Bentuk

Kata Per Kata

Cropping Citra Dokumen Jawi Kuno ke Dalam Bentuk Kata per Kata

Penentuan Batas/

Spasi Antar Kata

Pemberian Label Citra Hasil Cropping

Simpan Citra Hasil Cropping

Selesai

Gambar 4. Diagram Alir Proses Cropping

Proses cropping ini dimulai dari citra dokumen jawi kuno utuh sebagai masukan atau input. Citra dokumen utuh (halaman) tersebut dipecah menjadi citra dalam bagian kecil sesuai dengan kata per kata.

Citra hasil binarisasi pada Gambar 3. (b) dapat dipecah menjadi citra dalam ukuran yang lebih kecil yaitu ke dalam bentuk kata per kata seperti ditunjukkan pada Gambar 5 (citra grayscale) dan Gambar 6 (citra biner).

(6)

Serambi Engineering, Volume VII, No.3, Juli 2022 Hal 3546 - 3554 p-ISSN : 2528-3561 e-ISSN : 2541-1934

(c) (b) (a)

(f) (e) (d)

Gambar 5. Citra dokumen warna hasil cropping kata per kata; (a) “Dengan”, (b) “Nama”, (c) “Allah”, (d) “Memulai”, (e) “Membaca” dan (f) “Kemudian”

Sumber: [17]

(c) (b) (a)

(f) (e) (d)

Gambar 5. Citra dokumen binarisasi hasil cropping kata per kata; (a) “Dengan”, (b) “Dan”, (c) “Allah”, (d) “Iman”, (e) “Itu” dan (f) “Bahwa”

Proses Penentuan Ground Truth (GT) Citra Dokumen Jawi Kuno

Proses penentuan Ground Truth (GT) dapat dilakukan dengan menggunakan dua pendekatan yaitu pendekatan manual dan pendekatan semi otomatis. Pendekatan manual dapat dilakukan dengan bantuan penglihatan (vision) mata manusia (ahli). Bantuan mata manusia disini harus memenuhi persyaratan sebagai ahli atau memiliki kemampuan dalam melakukan pembacaan terhadap tulisan yang ada dalam citra dokumen Jawi kuno.

Gambar 4 menunjukkan proses penentuan Ground Truth (GT) dimulai dari citra hasil cropping pada proses sebelumnya yaitu pada Gambar 4. Proses penentuan Ground Truth (GT) ini akan menghasilkan dataset baru kata Jawi sesuai dengan kata per kata yang terdapat pada setiap dokumen Jawi kuno utuh atau halaman tulisan Jawi.

Dataset Baru Kata Jawi Citra Dokumen Kuno

Berikut ini merupakan beberapa hasil dataset Jawi baru yang telah dihasilkan dalam proses penelitian yang telah dilakukan. Dataset yang dihasilkan berjumlah 2.310 kata yang diperoleh dari total 33 halaman dokumen Jawi kuno yang telah dikumpulkan. Berikut ini merupakan beberapa contoh dataset baru yang telah dihasilkan seperti ditunjukkan pada Tabel 1.

(7)

Mulai

Citra Dokumen Jawi Kuno Hasil Cropping

Citra Hasil GT dengan Pendekatan Manual

Citra Hasil GT dengan Pendekatan Semi Otomatis

Citra Hasil Gabungan dari Pendekatan Manual dan Semi

Otomatis

Dataset Baru Kata Jawi Dihasilkan

Selesai Pendekatan

Manual

Pendekatan Semi Otomatis

Menggunakan Bantuan Penglihatan Mata Manusia (Ahli)

Menggunakan Bantuan Tools dan Penglihatan Mata Manusia (Ahli)

Gambar 6. Diagram Alir Proses Penentuan Ground Truth (GT)

Tabel 1. Beberapa contoh hasil dataset kata Jawi

Dataset Kata Jawi Label Ground Truth (GT)

m1_w1 Dan

m1_w2 Rahmat

m1_w3 Allah

m1_w4 Dan

m1_w5 Salam

m1_w6 Allah

m1_w7 Atas

m1_w8 Penghulu

m1_w9 Kita

m1_w10 Muhammad

(8)

Serambi Engineering, Volume VII, No.3, Juli 2022 Hal 3546 - 3554 p-ISSN : 2528-3561 e-ISSN : 2541-1934

Dataset Kata Jawi Label Ground Truth (GT)

m1_w11 Yaitu

m1_w12 Penghulu

m1_w13 Segala

m1_w14 Nabi

m1_w15 Yang

Tabel 1 menunjukkan beberapa contoh dataset kata Jawi baru yang telah dihasilkan dalam penelitian ini. Pada kolom label diberikan label untuk dataset kata jawi tersebut. Misalnya, m1_w1 yang menerangkan bahwa ini merupakan manuskrip pertama_kata pertama yang terdapat pada dokumen Jawi kuno pertama.

Keterangan:

m1_w1 : manuskrip pertama_kata pertama m1_w2 : manuskrip pertama_kata ke dua m1_w3 : manuskrip pertama_kata ke tiga m1_w4 : manuskrip pertama_kata ke empat m1_w5 : manuskrip pertama_kata ke lima m1_w6 : manuskrip pertama_kata ke enam m1_w7 : manuskrip pertama_kata ke tujuh m1_w8 : manuskrip pertama_kata ke delapan m1_w9 : manuskrip pertama_kata ke sembilan m1_w10: manuskrip pertama_kata ke sepuluh

4. Kesimpulan

Penelitian tentang sistem pengenalan tulisan tangan Jawi membutuhkan dataset kata Jawi dalam jumlah yang besar. Selama ini dataset kata Jawi belum tersedia secara publik. Oleh karena itu, penelitian ini telah berhasil menghasilkan dataset kata Jawi baru. Dataset ini dihasilkan dari total jumlah dokumen Jawi kuno sebanyak 33 halaman. Jumlah dataset kata Jawi yang dihasilkan berjumlah 2.310 kata. Dataset yang dihasilkan telah diberikan label dan nilai kebenarannya atau Ground Truth (GT). Dataset kata Jawi yang telah dihasilkan ini dapat digunakan dalam penelitian lanjutan terkait dengan sistem pengenalan kata tulisan tangan Jawi kuno. Dataset yang dihasilkan diharapkan dapat menjadi dataset yang lebih representatif, sehingga dapat membantu dalam pengembangan penelitian bidang sistem pengenalan tulisan tangan (Jawi Handwritten Word Recognition).

5. Ucapan Terima Kasih

Penulis mengucapkan ucapan terima kasih kepada program Beasiswa Pendidikan Pascasarjana Dalam Negeri (BPPDN), Kementerian Pendidikan, Kebudayaan, Riset dan Teknologi, Indonesia. Program ini memberikan bantuan biaya Pendidikan untuk jenjang Pendidikan Doktor (S3) pada program studi Doktor Ilmu Teknik, Program Pascasarjana Universitas Syiah Kuala, Banda Aceh. Ucapan terima kasih juga kepada Universitas Serambi Mekkah. Penulis juga mengucapkan banyak terima kasih kepada Museum dan Pusat Dokumentasi dan Informasi Aceh (PDIA), atas kerja samanya dalam proses pengambilan data penelitian ini.

6. Referensi

[1] K. Saddami, K. Munadi, and F. Arnia, “A database of printed Jawi character image,” Proc. 2015 3rd Int. Conf. Image Inf. Process. ICIIP 2015, pp. 56–59, 2016, doi: 10.1109/ICIIP.2015.7414740.

[2] H. Lamtougui, H. El Moubtahij, H. Fouadi, A. Yahyaouy, and K. Satori, “Offline Arabic Handwriting Recognition Using Deep Learning: Comparative Study,” 2020 Int. Conf. Intell. Syst.

(9)

Comput. Vision, ISCV 2020, 2020, doi: 10.1109/ISCV49265.2020.9204214.

[3] Y. M. Alginahi, “A survey on Arabic character segmentation,” Int. J. Doc. Anal. Recognit., vol. 16, no. 2, pp. 105–126, 2013, doi: 10.1007/s10032-012-0188-6.

[4] M. Younes and Y. Abdellah, “Segmentation of Arabic Handwritten Text to Lines,” Procedia Comput. Sci., vol. 73, no. Awict, pp. 115–121, 2015, doi: 10.1016/j.procs.2015.12.056.

[5] E. Chammas, C. Mokbel, and L. Likforman-Sulem, “Arabic handwritten document preprocessing and recognition,” Proc. Int. Conf. Doc. Anal. Recognition, ICDAR, vol. 2015-Novem, no. 1, pp.

451–455, 2015, doi: 10.1109/ICDAR.2015.7333802.

[6] E. M. Hicham, H. Akram, and S. Khalid, “Review of Feature Extraction Techniques for Offline Handwriting Arabic Text Recognition,” Int. J. Adv. Eng. Technol., vol. 7, no. 1, pp. 50–58, 2014.

[7] T. M. A. Zulcaffle, A. K. Othman, W. A. W. Z. Abidin, S. Mohammaddan, and A. S. W. Marzuki,

“A thresholding algorithm for text/background segmentation in degraded handwritten Jawi documents,” Proc. - 2010 2nd Int. Conf. Adv. Comput. Control Telecommun. Technol. ACT 2010, pp. 80–84, 2010, doi: 10.1109/ACT.2010.43.

[8] N. M. Diah, N. A. M. Zin, and H. Iida, “Real-time feedback for Jawi characters tracing activity,”

Proc. - 5th Int. Conf. Electr. Eng. Informatics Bridg. Knowl. between Acad. Ind. Community, ICEEI 2015, pp. 121–125, 2015, doi: 10.1109/ICEEI.2015.7352481.

[9] A. Sulaiman, K. Omar, and M. F. Nasrudin, “Two streams deep neural network for handwriting word recognition,” Multimed. Tools Appl., 2020, doi: 10.1007/s11042-020-09923-1.

[10] K. Saddami, K. Munadi, Y. Away, and F. Arnia, “Improvement of binarization performance using local otsu thresholding,” Int. J. Electr. Comput. Eng., vol. 9, no. 1, p. 264, 2019, doi:

10.11591/ijece.v9i1.pp264-272.

[11] M. W. A. Kesiman, S. Prum, J. C. Burie, and J. M. Ogier, “An initial study on the construction of ground truth binarized images of ancient palm leaf manuscripts,” Proc. Int. Conf. Doc. Anal.

Recognition, ICDAR, vol. 2015-Novem, pp. 656–660, 2015, doi: 10.1109/ICDAR.2015.7333843.

[12] M. Windu, A. Kesiman, S. Prum, I. M. G. Sunarya, J. Burie, and M. Ogier, “2014 4th International Conference on Image Processing Theory, Tools and Applications, IPTA 2014,” 2014 4th Int. Conf.

Image Process. Theory, Tools Appl. IPTA 2014, p. 427p, 2015.

[13] M. Windu et al., “AMADI _ LontarSet : The First Handwritten Balinese Palm Leaf Manuscripts Dataset To cite this version : HAL Id : hal-01389853,” pp. 168–173, 2016, doi:

10.1109/ICFHR.2016.39.

[14] M. Jenckel, S. S. Bukhari, and A. Dengel, “AnyOCR: A sequence learning based OCR system for unlabeled historical documents,” Proc. - Int. Conf. Pattern Recognit., vol. 0, pp. 4035–4040, 2016, doi: 10.1109/ICPR.2016.7900265.

[15] A. Ul-Hasan, S. S. Bukhari, and A. Dengel, “OCRoRACT: A Sequence Learning OCR System Trained on Isolated Characters,” Proc. - 12th IAPR Int. Work. Doc. Anal. Syst. DAS 2016, pp. 174–

179, 2016, doi: 10.1109/DAS.2016.51.

[16] K. Saddami, K. Munadi, Y. Away, and F. Arnia, “DHJ: A database of handwritten Jawi for recognition research,” Proc. - 2017 Int. Conf. Electr. Eng. Informatics Adv. Knowledge, Res.

Technol. Humanit. ICELTICs 2017, vol. 2018-Janua, no. ICELTICs, pp. 292–296, 2017, doi:

10.1109/ICELTICS.2017.8253279.

[17] K. Saddami, K. Munadi, Y. Away, and F. Arnia, “Effective and fast binarization method for combined degradation on ancient documents,” Heliyon, vol. 5, no. 10, p. e02613, 2019, doi:

10.1016/j.heliyon.2019.e02613.

Referensi

Dokumen terkait

Taqli>d dalam Aqidah atau Masalah-Masalah Pokok yang Umum al-Us}u>l al-‘Al al-di>n seperti mengetahui Allah dan sifat-sifat-Nya, dalil-dalil kenabian, akhlaq, dan apa saja yang