• Tidak ada hasil yang ditemukan

Penggunaan template matching sebagai salah satu metode dalam mengenali simbol juga mengalami perkembangan, yang terbaru adalah algoritma Optimized

N/A
N/A
Protected

Academic year: 2021

Membagikan "Penggunaan template matching sebagai salah satu metode dalam mengenali simbol juga mengalami perkembangan, yang terbaru adalah algoritma Optimized"

Copied!
9
0
0

Teks penuh

(1)

1 1.1 Latar Belakang

Penelitian mengenai pengenalan ekspresi matematika terus mengalami perkembangan, seiring berkembangnya peralatan interaksi dengan manusia dan bertambahnya minat dalam menyalin dokumen ilmiah ke dalam bentuk elektronik. Pengenalan ekspresi matematika tercetak merupakan bagian penting pada analisis citra dokumen ilmiah (Chan dan Yeung, 2000). Pengenalan ekspresi matematika tercetak dapat dibagi ke dalam dua langkah utama: pengenalan simbol dan analisis struktural. Pengenalan simbol bekerja untuk melakukan segmentasi citra dan mengenali karakter matematis dengan benar. Analisis struktural bertujuan untuk menentukan hubungan antar simbol yang ditemukan, untuk merekonstruksi kembali ekspresi matematika secara lengkap. Kedua masalah ini berkaitan erat karena kesalahan pengenalan pada tahap pengenalan simbol dapat menyebabkan kekeliruan di tahap analisis. Sebaliknya, informasi struktural yang didapatkan dapat digunakan untuk membantu langkah pengenalan simbol (Alvaro dkk., 2011).

Beberapa pendekatan untuk pengenalan terhadap ekspresi matematika tercetak telah diteliti sebelumnya, diantaranya menggunakan pohon (Zanibbi dkk., 2002), graf (Eto dan Suzuki, 2001), atau pendekatan berbasis tata bahasa (Prusa dan Hlavac, 2007) untuk mengenali struktur ekspresi, dan penggunaan metode klasifikasi serta template matching untuk mengenali simbol-simbol pada ekspresi. Penelitian-penelitian ini berhasil melakukan pengenalan terhadap simbol-simbol yang ada di dalam ekspresi matematika, baik sebagai ekuivalensi simbol maupun jenis simbol. Usaha untuk mengubah ekspresi matematika dari satu format ke format lainnya telah dilakukan diantaranya oleh Baker dkk. (2010), yang mengkonversi ekspresi matematika dengan format dokumen PDF ke dalam format MathML dan LaTeX.

Penggunaan template matching sebagai salah satu metode dalam mengenali simbol juga mengalami perkembangan, yang terbaru adalah algoritma Optimized

(2)

Sum of Absolute Difference (OSAD) yang diajukan oleh Dawoud, Samier dan Janier pada tahun 2011. Dalam rangka membangun ciri simbol-simbol yang akan dikenali, OSAD mengumpulkan contoh-contoh simbol yang terdapat pada ekspresi matematika tercetak untuk membangun average face template bagi setiap simbol, dan pada tahap pengenalan simbol akan dilakukan template matching dengan simbol yang didapatkan dari citra uji. Cara yang dapat digunakan untuk menghitung korelasi sebuah average face template dengan blok-blok segi empat pada citra uji adalah similarity measurement, salah satunya menggunakan

Algoritma OSAD merupakan pengembangan algoritma Sum of Absolute

Difference (SAD). Algoritma ini lebih ringkas serta memiliki akurasi yang lebih

baik dibandingkan algoritma-algoritma similarity measurement berbasis korelasi lainnya seperti Sum of Squared Difference (SSD), Normalized Cross Correlation (NCC), dan Sum of Hamming Distances (SHD) (Dawoud dkk., 2011). Algoritma ini telah diuji untuk melakukan pengenalan pola wajah dengan average face yang disusun berdasarkan sampel foto dari Universitas Yale (Yale Dataset) dan Massachusetts Institute of Technology (MIT-CBCL Dataset) dan menghasilkan akurasi sampai dengan 100% (Dawoud dkk., 2011).

Penelitian ini mengkaji dan mengimplementasikan sistem konversi ekspresi matematika yang mencakup pengenalan simbol dan analisis struktural, kemudian melakukan rekontruksi struktur dan simbol-simbol ekspresi yang berhasil dikenali. Pendekatan yang diusulkan untuk pengenalan struktural adalah symbol tree yang dapat mempertahankan struktur ekspresi untuk dituliskan kembali, namun cukup sederhana daripada expression tree karena tidak menyimpan urutan operasi ekspresi. Algoritma OSAD dipakai sebagai mesin pengenalan pola untuk melihat kinerjanya dalam mengenali simbol, dengan average face berupa templat matriks fitur berukuran 3 x 3 untuk setiap simbol. Jenis luaran yang dipertimbangkan adalah penulisan kembali ekspresi matematika dalam format lain. Simbol matematis LaTeX dipilih sebagai luaran hasil konversi karena kemampuan LaTeX untuk memuat ekspresi matematika menggunakan plaintext, sehingga luaran dapat langsung dimanfaatkan pada dokumen tanpa perlu proses embedding atau

(3)

menggunakan library seperti halnya MathML dan Equation Editor. Selain itu tersedia banyak generator LaTeX untuk memeriksa kesesuaian notasi hasil konversi terhadap ekspresi aslinya.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang dikemukakan, maka rumusan masalah pada penelitian ini adalah:

1. Apakah algoritma template matching OSAD sesuai untuk melakukan pengenalan simbol pada konversi citra ekspresi matematika tercetak ke dalam simbol matematis LaTeX?

2. Bagaimana pengaruh average face template yang dibangun terhadap akurasi pengenalan simbol oleh algoritma template matching OSAD?

3. Apakah rancangan pohon simbol (symbol tree) yang diusulkan untuk analisis struktur dapat bekerja dengan baik dalam merepresentasikan struktur ekspresi?

1.3 Batasan Masalah

Penelitian ini akan memiliki batasan masalah sebagai berikut: 1. Masukan dan pola pelatihan berupa citra BMP dan JPEG.

2. Citra masukan berisi satu ekspresi matematika tercetak saja dan tidak memerlukan transformasi dan koreksi prapengolahan selain yang disebutkan pada perancangan sistem.

3. Struktur ekspresi matematika tercetak pada citra masukan adalah ekspresi yang memiliki maksimum 3 baris simbol.

4. Elemen dan karakter dalam ekspresi matematika yang dapat dikenali dan dikonversi adalah yang termasuk sebagai:

(4)

b. Alfabet Yunani seperti tertera pada kelompok 1 simbol matematis LaTeX, sebagaimana ditunjukkan oleh Gambar 1.1.

c. Angka.

d. Simbol +, - , ×, /, ÷, ≤, ≥, ±, =, ≠, ( dan ).

e. Simbol-simbol pecahan (fraction) yang dituliskan sebagai \frac; f’; akar yang dituliskan sebagai \sqrt dan \sqrt[n]; garis atas yang dituliskan sebagai \overline; serta garis bawah yang dituliskan sebagai \underline pada simbol matematis LaTeX, sebagaimana ditunjukkan oleh Gambar 1.1.

f. Simbol-simbol delimiter yaitu |, ||, {, }, /, \, [ dan ].

g. Simbol-simbol yang ukurannya dapat bervariasi yaitu ∑, ∏, U, ∩ dan ∫.

5. Nama-nama fungsi standar sebagaimana ditunjukkan oleh Gambar 1.1 seperti sin, cos, dan tan akan secara otomatis dikenali sebagai sebuah urutan simbol dan diberikan simbol yang sesuai misalnya \sin, \cos dan \tan.

6. Luaran berupa rangkaian simbol matematis LaTeX tanpa adanya tambahan formatting.

7. Jumlah simbol yang dapat dikenali dalam satu ekspresi matematika adalah paling banyak 50 simbol.

(5)

Gambar 1.1 Kelompok 1 hingga 5 LaTeX Mathematical Symbols (Anon., 2015)

1.4 Tujuan Penelitian

Penelitian ini bertujuan untuk menyusun sebuah sistem konversi citra ekspresi matematika tercetak menjadi simbol matematis LaTeX dan melakukan pengujian terhadap akurasinya dalam melakukan konversi berbagai bentuk ekspresi matematika yang sesuai dengan batasan masalah. Selain itu penelitian ini bertujuan

(6)

untuk menemukan pengembangan metode pengenalan struktur berbasis tree yang sesuai untuk dapat memproses berbagai struktur ekspresi matematika tercetak yang sesuai dengan batasan masalah.

1.5 Manfaat Penelitian

Dari uraian latar belakang masalah dan tujuan penelitian, penelitian ini dapat memberi manfaat-manfaat sebagai berikut:

1. Penelitian ini dapat memberikan kontribusi pada bidang pengenalan pola, khususnya pada bidang document analysis and recognition.

2. Penelitian ini dapat memberikan gambaran mengenai kinerja algoritma-algoritma yang digunakan dalam sistem konversi citra ekspresi matematika tercetak.

3. Melalui metode dan algoritma yang digunakan, penelitian ini dapat memberikan manfaat dalam pengembangan pengenalan citra ekspresi matematika, baik untuk konversi ke dalam suatu format, maupun untuk pemrosesan ekspresi matematika.

1.6 Metode Penelitian

Penelitian ini akan dilaksanakan mengikuti tahap-tahap berikut:

1. Pengumpulan Data

Langkah-langkah yang dilakukan pada tahap ini meliputi:

a. Studi pustaka mengenai pengenalan ekspresi matematika, metode-metode pengenalan pola dan optical character recognition (OCR) baik dari laporan penelitian, jurnal, maupun buku. Studi pustaka ini berfungsi sebagai dasar pengetahuan sebelum melakukan penelitian, sekaligus untuk menyusun proposal penelitian.

b. Mengumpulkan contoh-contoh ekspresi matematika tercetak yang ada pada buku-buku, mengubahnya ke dalam bentuk citra digital dan

(7)

melakukan praproses yang diperlukan, untuk selanjutnya digunakan sebagai citra acuan dalam pembangunan ciri simbol.

c. Mengumpulkan referensi mengenai simbol matematis yang digunakan pada LaTeX dan konstruksi sintaksnya. Contoh notasi simbol matematis LaTeX ditunjukkan oleh Gambar 1.2.

Gambar 1.2 Contoh Penulisan Ekspresi Matematika Menggunakan Simbol Matematis LaTeX dan Hasil Ekspresinya

(Sumber: http://crab.rutgers.edu/~karel/latex/class4/class4.html)

2. Analisis dan Perancangan

Langkah-langkah yang dilakukan pada tahap ini meliputi:

a. Pembuatan rancangan sistem yang akan mendukung penelitian ini. Rancangan sistem yang diusulkan melalui proposal ini untuk membantu pelaksanaan penelitian, ditunjukkan oleh Gambar 13. Untuk mendapatkan fitur yang diperlukan, maka setiap simbol yang telah diekstraksi akan dibagi menjadi 9 blok area yang sama besar, kemudian dari setiap area dihitung fitur biner area yang menunjukkan banyaknya piksel bernilai 1 (hitam) pada blok tersebut. Agar akurasi pengenalan simbol lebih baik, peneliti mengusulkan agar ditambahkan lagi sebuah fitur yaitu aspect ratio

(8)

yang diambil dari setiap simbol secara utuh. Fitur ini berguna untuk menentukan orientasi simbol yaitu tegak, mendatar atau netral. Pembuatan matriks fitur acuan (rata-rata) berfungsi untuk mendapatkan wajah rata-rata dari setiap simbol. Ini dilakukan dengan menjumlahkan seluruh matriks sampel dari sebuah simbol, kemudian membaginya dengan jumlah sampel.

b. Perancangan aspek-aspek terkait aplikasi yang dibutuhkan seperti antarmuka, alur sistem dan basis data yang dapat dituangkan dalam bentuk diagram serta mockup atau rancangan awal antarmuka sistem. Seluruh perancangan didasarkan pada keseuaian dengan landasan teori yang digunakan.

3. Implementasi

Langkah-langkah yang dilakukan pada tahap ini meliputi:

a. Pembuatan program aplikasi yang mendukung penelitian dengan bahasa pemrograman yang menggunakan graphical user interface (GUI) dengan menerapkan algoritma dan metode yang akan diuji. b. Mempersiapkan dan melakukan praproses terhadap citra ekspresi

matematika yang didapatkan dari dokumen tercetak. Citra ini selanjutnya akan digunakan sebagai bahan uji.

c. Memasukkan citra acuan ke dalam basis data sistem untuk membangun ciri masing-masing simbol yang akan dikenali.

4. Evaluasi

Langkah-langkah yang dilakukan pada tahap ini meliputi:

a. Melakukan pengujian menggunakan program aplikasi yang telah dibuat. Citra ekspresi matematika tercetak yang bervariasi akan diujikan ke dalam sistem untuk dikenali dan dikonversi. Hasil uji akan dicatat untuk memperoleh tingkat akurasi, mencatat hasil pengenalan dan konversi, serta temuan-temuan yang didapatkan selama melaukan pengujian.

(9)

b. Mengolah hasil pengujian dari poin (a) untuk menghasilkan data berupa akurasi pengenalan dan konversi secara keseluruhan, serta pembahasan permasalahan yang timbul dan penyebabnya. Hasil ini kemudian dibandingkan dengan asumsi awal peneliti, rumusan masalah dan tujuan penelitian untuk selanjutnya diolah menjadi kesimpulan.

Gambar

Gambar 1.1 Kelompok 1 hingga 5  LaTeX Mathematical Symbols (Anon., 2015)
Gambar 1.2 Contoh Penulisan Ekspresi Matematika Menggunakan Simbol  Matematis LaTeX dan Hasil Ekspresinya

Referensi

Dokumen terkait

Dari penjelasan sebelumnya, maka penelitian ini bertujuan untuk menginvestigasi pola pengelompokkan wilayah endemi di Jawa Timur berdasarkan faktor penyebab DBD

Dalam kaitannya dengan hal tersebut, BBKSDA Jawa Timur selaku UPT yang menangani langsung lembaga konser- vasi telah mengadakan pembinaan yang disambut baik oleh pihak

Tuliskan huruf yang tepat untuk setiap kalimat yang benar dalam kotak yang

 Konsep rumah tangga pertanian adalah rumah tangga yang salah satu atau lebih anggota rumah tangganya melakukan dan bertanggungjawab dalam kegiatan pembudidayaan,

www.rb.lapan.go.id | 10 2011 2014 2019 2025 Seluruh Kementerian dan lembaga (K/L) serta pemda ditargetkan telah memiliki komitmen dalam melaksanakan proses

Untuk melakukan konfigurasi lebih jauh terhadap bootloader, seperti letak boot loader bila anda menggunakan GRUB atau LILO, dimana bootloader tersebut diinstal, serta bila anda

Dengan demikian dapat disimpulkan bahwa faktor budaya dan faktor sosial memiliki pengaruh yang signifikan secara bersama-sama terhadap keputusan membeli pada Toko