Pengenalan Huruf Jepang Katakana

BAB II DASAR TEORI

E. Pengenalan Huruf Jepang Katakana

Huruf Jepang dibedakan menjadi 3 macam, yaitu huruf Kanji, huruf Katakana dan huruf Hiragana. Dari ketiga jenis huruf Jepang diatas, masing-masing memiliki pola huruf yang berbeda-beda. Pola huruf Katakana sendiri lebih menekankan pada garis lurus dan sudut lancip, tidak seperti huruf Hiragana yang lebih menekankan pada kurva dan garis parabola. Proses pengenalan pola huruf Katakana sebenarnya sama seperti proses-proses pengenalan pola yang lainnya, yaitu langkah pertama adalah memasukkan input kemudian input tersebut dirubah menjadi suatu matriks berukuran tertentu misal m x n. Setelah itu dikenai proses threshold dan binerisasi yaitu merubah nilai pixel input menjadi bernilai ‘0’ dan ‘1’. Untuk selanjutnya dikenai proses ekstraksi ciri dan akan dibandingkan dengan model/ template (contoh huruf-huruf katakana dalam berbagai versi) yang tersedia dalam data template program untuk diperoleh hasil akhir.

( ) ∑ ∏( ( ))

= =       = ^p k n l ilk il i i x x f x x Fi 1 1 2 1, ,...,

F. Algoritma Pengenal Huruf Tuple-N

Salah satu algoritma yang dapat digunakan untuk mengenali huruf adalah algoritma pengenal Tuple-N. Prinsip algoritma Tuple-N ini mirip dengan algoritma pengenalan pola yang lain yaitu dengan membandingkan input dengan template(pembanding), tetapi dalam Tuple-N ini akan dilakukan penghitungan skor kemiripan dari input dengan template. Dalam algoritma ini input yang dimasukkan harus berukuran sama dengan template yang berukuran m x n dengan masing-masing elemennya harus bernilai ’0’ dan ’1’. Ada 4 hal pokok yang menjadi cara pengenalan pola dari algoritma Tuple-N ini, yaitu : skor kemiripan, skor pixel, IoT (Important of Tuple) dan DoM (Degree of Match). (Priyatma & Parmadi, 2004)

1. Skor Kemiripan

Skor kemiripan didapat dari penjumlahan masing-masing pixel dari masing-masing tuple (baris) dari template-template yang kemudian dibandingkan dengan masukan. Skor kemiripan dapat dihitung dengan menggunakan rumus :

Dimana

∏ menyatakan perkalian memakai operator AND, dan ∑ menyatakan penjumlahan memakai operator OR f( X_ilk ) = X_il , jika pixel berwarna putih ( X_ilk = 1 )

f( Xilk ) = X’il , jika pixel berwarna hitam ( Xilk = 0 ) ’ = menyatakan operator NOT

P = jumlah citra pembanding

n = jumlah elemen dalam setiap tuple / baris

(Priyatma & Parmadi, 2004) Contoh :

Terdapat 3 buah template berukuran 5 x 5 untuk menghitung skor kemiripan, dalam huruf Jepang Katakana template-template ini berbunyi ‘SU’.

Dari template di atas menggunakan ukuran 5 x 5, jadi tuple di atas berjumlah 5 tuple / baris dengan ketentuan baris 1 adalah F1, baris 2 adalah F2 dan seterusnya, dan masing – masing tuple memiliki 5 elemen.

Tuple ke 1 Tuple ke 2 Tuple ke 3

Pixel

Gb 2.3 : Tuple & Pixel

Dengan menggunakan rumus diatas setiap tuple dapat dihitung, sebagai berikut : F1 (x11 , x12 , x13 , x14 , x15) = (x’11 , x’12 , x’13 , x’14 , x’15) + (x’11 , x’12 , x’13 , x’14 , x15) + (x11 , x’12 , x’13 , x’14 , x’15) F2 (x21 , x22 , x23 , x24 , x25) = (x21 , x22 , x23 , x’24 , x25) + (x21 , x22 , x23 , x24 , x’25) + (x21 , x22 , x23 , x’24 , x25) Dapat disederhanakan menjadi

(x21 , x22 , x23 , x’24 , x25) + (x21 , x22 , x23 , x24 , x’25)

F3 (x31 , x32 , x33 , x34 , x35) = (x31 , x32 , x’33 , x34 , x35) + (x31 , x32 , x’33 , x’34 , x35) + (x31 , x32 , x’33 , x’34 , x35)

Dapat disederhanakan menjadi

(x31 , x32 , x’33 , x34 , x35) + (x31 , x32 , x’33 , x’34 , x35)

F4 (x41 , x42 , x43 , x44 , x45) = (x41 , x’42 , x43 , x’44 , x45) + (x41 , x’42 , x43 , x’44 , x45) + (x41 , x’42 , x43 , x44 , x’45) Dapat disederhanakan menjadi

(x41 , x’42 , x43 , x’44 , x45) + (x41 , x’42 , x43 , x44 , x’45)

F5 (x51 , x52 , x53 , x54 , x55) = (x’51 , x52 , x53 , x54 , x’55) + (x’51 , x52 , x53 , x54 , x’55) + (x’51 , x52 , x53 , x54 , x’55) Dapat disederhanakan menjadi

Setelah membuat kelima fungsi di atas, selanjutnya diberikan sebuah input berupa gambar dengan ukuran yang sama yaitu 5 x 5. Seperti terlihat pada gambar dibawah ini.

Sama seperti template, baris 1 adalah F1, dan seterusnya. Dari rumus di atas telah ditentukan bahwa pixel hitam bernilai 0, dan pixel putih bernilai 1, maka dapat ditentukan nilai pixel tiap baris menjadi :

F1 (x11 , x12 , x13 , x14 , x15) = F1 (0, 0, 0, 0, 0) F2 (x21 , x22 , x23 , x24 , x25) = F2 (1, 1, 1, 1, 0) F3 (x31 , x32 , x33 , x34 , x35) = F3 (1, 1, 0, 1, 1) F4 (x41 , x42 , x43 , x44 , x45) = F4 (1, 0, 1, 1, 0) F5 (x51 , x52 , x53 , x54 , x55) = F5 (0, 1, 1, 1, 1) Skor kemiripan = F1 + F2 + F3 + F4 + F5

Langkah selanjutnya adalah memasukkan fungsi dari template di atas ke dalam nilai input. Fungsi OR adalah (+), dan fungsi AND adalah (*). Sehingga hasilnya akan sebagai berikut :

F1 (0, 0, 0, 0, 0) = (0’* 0’* 0’* 0’* 0’) + (0’* 0’* 0’* 0’* 0) + (0* 0’* 0’* 0’* 0’)

= (1* 1* 1*1* 1) + (1* 1* 1* 1* 0) + (0* 1* 1* 1* 1) = 1 + 0 + 0 = 1 F2 (1, 1, 1, 1, 0) = (1* 1* 1* 1’* 0) + (1* 1* 1* 1* 0’) = (1* 1* 1* 0* 0) + (1* 1* 1* 1* 1) = 0 + 1 = 1 F3 (1, 1, 0, 1, 1) = (1* 1* 0’* 1* 1) + (1* 1* 0’* 1’* 1) = (1* 1* 1* 1* 1) + (1* 1* 1* 0* 1) = 1 + 0 = 1 F4 (1, 0, 1, 1, 0) = (1* 0’* 1* 1’* 1) + (1* 0’* 1* 1* 0’) = (1* 1* 1* 0* 0) + (1* 1* 1* 1* 1) = 0 + 1 = 1 F5 (0, 1, 1, 1, 1) = (0’* 1* 1* 1* 1’) = (1* 1* 1* 1* 0) = 0

Skor Kemiripan diperoleh dengan menjumlahkan masing-masing fungsi pada gambar masukan, sehingga:

Skor Kemiripan = F1 + F2 + F3 + F4 + F5 = 1 + 1 + 1 + 1 + 0 = 4

Dari hasil perhitungan di atas disimpulkan bahwa gambar input (Gb.2.5) memiliki 4/5 kemiripan dengan template-template di atas yang berbunyi ‘SU’.

Dari metode Skor Kemiripan ini memiliki kelemahan yaitu posisi suatu pixel dari suatu gambar kurang menjadi penentu kecocokan suatu pola masukan dengan pola-pola template. Ini akan menjadi suatu kesalahan jika gambar suatu input memiliki struktur pixel yang hampir sama dengan template dan akan dikenali sebagai pola template yang salah. Seperti pada contoh di bawah ini:

Gb 2.6 : Huruf HE dan Imbuhannya

Gambar di atas memiliki ukuran matriks 10 x 10. Huruf ’PE’ dan ’BE’ di atas sebenarnya adalah anak dari huruf ’HE’ yang dikenai oleh sisipan yang akan berbunyi ’PE’ dan ’BE’. Apabila kedua huruf di atas (PE dan BE) dikenai dengan metode fungsi boolean, maka kontribusi dari gambar ’PE’ yaitu pixel (2,8), (3,7), (3,9) dan (4,8) dan dari gambar ’ BE’ yaitu pixel (2,9), (3,7), (3,10) dan (4,8) hanya kecil sehingga akan sulit untuk dibedakan oleh komputer kedua gambar tersebut. Untuk mengatasi kesulitan tersebut maka perlu dilakukan proses identifikasi dengan menghitung Skor Pixel dari gambar input terhadap gambar template.

2. Skor Pixel

Skor pixel merupakan skor kepentingan dari tiap tuple dalam tiap kelompok template suatu huruf. Skor pixel dapat dicari dengan menggunakan rumus :

Skor pixel = | NH – NP | / M Dimana :

NH = Nilai berapa kali pixel berwarna hitam dalam kelompok template. NP = Nilai berapa kali pixel berwarna putih dalam kelompok template. M = Banyaknya anggota (template) dari kelompok huruf = NH + NP | | = Operator Absolut

(Priyatma & Parmadi, 2004)

Jadi, dari gambar template (Gb. 2.4) dapat dihitung bahwa untuk pixel (1,1) NH = 2 dan NP = 1 sehingga skor pixel pixel (1,1) menjadi | 2 – 1 | / 3 = 1/3. Dan untuk pixel yang lain menjadi :

Pixel (1,2) = | 3 – 0 | / 3 = 1 Pixel (1,3) = | 3 – 0 | / 3 = 1 Pixel (1,4) = | 3 – 0 | / 3 = 1 Pixel (1,5) = | 2 – 1 | / 3 = 1/3 Pixel (2,4) = | 2 – 1 | / 3 = 1/3 Pixel (2,5) = | 1 – 2 | / 3 = 1/3 Pixel (3,1) = | 0 – 3 | / 3 = 1 Pixel (3,2) = | 0 – 3 | / 3 = 1 Pixel (2,1) = | 0 – 3 | / 3 = 1 Pixel (2,2) = | 0 – 3 | / 3 = 1 Pixel (2,3) = | 0 – 3 | / 3 = 1 Pixel (3,3) = | 3 – 0 | / 3 = 1 Pixel (3,4) = | 2 – 1 | / 3 = 1/3 Pixel (3,5) = | 0 – 3 | / 3 = 1

Dan seterusnya dilakukan hal yang sama terhadap pixel-pixel yang lain, sehingga keseluruhan didapat skor pixel sebagai berikut:

Tabel 2.1 : Tabel Skor Pixel

1/3 1 1 1 1/3

1 1 1 1/3 1/3

1 1 1 1/3 1

1 1 1 1/3 1/3

1 1 1 1 1

3. IoT (Important of Tuple)

Skor pixel yang telah didapat di atas sebenarnya akan digunakan untuk mendapatkan derajat kepentingan suatu tuple, disebut IoT (Important of Tuple). IoT dapat didefinisikan sebagai berikut :

IoT = jumlah skor pixel pada suatu tuple.

(Priyatma & Parmadi, 2004)

Cara mendapatkan nilai IoT hanya dengan menjumlahkan nilai suatu tuple yang telah dihitung pada skor pixel diatas. Seperti berikut ini:

Tuple 1 = ( 1/3 + 1 + 1 + 1 + 1/3 ) = 3 2/3 Tuple 2 = ( 1 + 1 + 1 + 1/3 + 1/3 ) = 3 2/3 Tuple 3 = ( 1 + 1 + 1 + 1/3 + 1 ) = 4 1/3

Tuple 4 = ( 1 + 1 + 1 + 1/3 + 1/3 ) = 3 2/3 Tuple 5 = ( 1 + 1 + 1 + 1 + 1 ) = 5

Dari percobaan di atas dapat disimpulkan bahwa nilai IoT maksimal adalah bernilai 5. Jadi dari tuple di atas, tuple ke-5 menjadi tuple yang paling konsisten dibanding dengan tuple yang lain yaitu nilai antara hitam dan putih selalu sama dalam tiap template pada suatu kelompok. Sehingga tuple ke-5 ini dapat dijadikan pedoman dalam pembandingan antara masukan dengan kelompok template ini (huruf ‘SU’). Jumlah IoT dari kelompok template ini adalah 20 1/3.

4. DoM (Degree of Match)

Dalam algoritma pengenalan pola Tuple-N, syarat untuk mampu mengidentifikasi pola masukan sebagai pola yang dapat dikenali adalah pada skor kecocokan. Kecocokan (matching) antara tuple masukan dengan tuple template merupakan syarat untuk dapat menentukan skor kecocokan total. Untuk mendapatkan skor tersebut, dapat digunakan DoM (Degree of Match / Derajat Kecocokan) yang didefinisikan sebagai berikut :

DoM = NM / P Dimana :

NM = Jumlah huruf pembanding yang tuple-nya cocok dengan tuple huruf yang diuji

P = Jumlah template dalam tiap kelompok huruf. (Priyatma & Parmadi, 2004)

Sehingga dari template (Gb.2.4) dengan input (Gb.2.5) dapat dihitung nilai DoM sebagai berikut :

Tabel 2.2 : Tabel DoM

Jumlah tuple cocok DoM

Tuple 1 1 1/3

Tuple 2 1 1/3

Tuple 3 1 1/3

Tuple 4 1 1/3

Tuple 5 0 0

Sehingga dari percobaan di atas dapat disimpulkan bahwa nilai antara tuple input dengan tuple template kecil (tidak ada yang bernilai 1. Sehingga disimpulkan bahwa input hanya memiliki 1 1/3 kecocokan dengan kelompok huruf ’SU’.

Dalam dokumen PENGENALAN HURUF JEPANG KATAKANA MENGGUNAKAN LOGIKA KABUR (Halaman 32-42)