BAB III LANDASAN TEORI. sangat dibutuhkan pada aplikasi computer vision seperti pencarian teks

(1)

BAB III

LANDASAN TEORI

A. Text Detection

Text detection dapat diartikan sebagai suatu proses pencarian teks yang

terdapat pada sebuah citra. Proses text detection dalam sebuah citra merupakan

salah satu masalah yang sering dihadapi dan selalu menjadi pusat perhatian karena

proses ini sangat dibutuhkan pada aplikasi computer vision seperti pencarian teks

pada gambar (Neumann & Matas, 2012).

Pada penelitian ini proses text detection akan dibantu dengan

menggunakan

library OpenCV. OpenCV adalah suatu library yang terdiri dari

fungsi-fungsi computer vision dan API (Aplication Programming Interface) untuk

melakukan pengolahan citra baik secara high level maupun low level dan sebagai

optimasi dalam menjalankan aplikasi secara realtime. OpenCV sangat disarankan

pada pengembangan aplilkasi computer vision, karena library ini mampu

menciptakan aplikasi yang handal, kuat di bidang digital vision dan mempunyai

kemampuan yang mirip dengan cara pengolahan visual pada manusia. Karena

OpenCV bersifat open source, maka library ini dapat digunakan secara gratis.

Proses

text detection pada OpenCV dikembangkan berdasarkan teori yang

dikemukakan oleh Lukas Neumann dan Jiri Matas (2012). Proses text detection

pada OpenCV terdiri dari dua tahapan. Tahap pertama, secara bertahap sistem

akan menghitung descriptor, berupa: area, parameter, bounding box, dan nilai

euler. Hasi dari perhitungan descriptor akan menghasilkan sejumlah region r

A. Text Detec

cti

ti

tio

o

on

Text

t

d

detection

dapat diar

a

ti

i

ka

n

se

ba

g

ga

g

i

suatu proses pen

en

encarian teks yang

terdap

p

at

at pada sebuah

ah

h

c

cit

it

ra

. Proses

text detection

n

da

la

lam

m

m sebuah citra

ra

a merupakan

sa

a

l

la

lah satu m

m

as

al

ah

a

yan

n

g

g se

sering dihadap

api dan selalu

lu m

m

men

e

jadi

p

us

s

at

p

erhatian

n

n karena

proses

s

i

ini

ni

sanga

s

ga

t

dibutu

tuhkan pada apli

likasi computer

r v

vision

n

se

s

perti

i

pe

nc

ar

a

ian

te

t

ks

pa

a

da

gam

a

ba

a

r

(N

eumann &

& Matas, 20

012 2).

P

Pa

Pada

da penelitian in

ni

prose

es

text

d

de

etection

akan

d

dib

ib

ban

a

tu

u

d

en

engan

menggu

gu

gunakan

librar

ary

y

Op

OpenCV

V. Op

O

e

enCV

CV

ad

dalah su

uat

atu

u

l

li

br

ary yang

g

g terdiri d

dar

ar

ari

fu

f

ngsi

i

i-

-fungsi computer visio

ion

n

da

dan

n API

(Apl

plic

icat

tio

ion Programming Inte

er

r

rface)

u

untu

u

k

mela

la

ku

kuka

k

n pengol

olah

ah

han

an

c

it

ra

b

ai

k secara high

gh

lev

l

ev

el

l

ma

up

u

un

low level

el

l

da

dan seba

a

aga

ga

i

op

o

timasi dalam menjalankan aplikas

as

i

se

e

ec

ca

c

ra

realtime. OpenCV sangat disara

ra

ank

nk

nka

an

a

pa

pada

da

da p

p

engembangan aplilkasi computer vision, karena library

y

in

i

ma

mamp

m

u

me

menc

nc

nciptak

kan ap

li

l

li

ka

si

y

a

an

ang hand

d

dal

al

,

ku

kuat

at

d

di

i

b

bidang

di

digi

gi

gita

ta

tal

l

l vi

i

sion

i

d

dan me

me

memp

mp

mpu

u

unyai

kemamp

mp

mpua

u

n ya

ya

ng

ng mirip dengan

c

ara pen

n

ngolahan visual

l

pa

da

d

man

an

n

u

us

i

ia. Karena

OpenCV bersifat open source, m

m

maka

library

y

ini dapat digunakan secara gratis.

Proses text detection

pada

a

OpenCV

V

V dikembangkan berdasarkan teori yang

dikemukakan oleh Lukas Neumann

n

n dan

n

n Jiri Matas (2012). Proses text detection

pada OpenCV terdiri dari dua tahapan

a

Tahap pertama secara bertahap sistem

(2)

dimana setiap region tersebut akan dijadikan ciri (features) dalam melakukan

proses pendeteksian teks. Hanya External Regions r (ERs) yang memenuhi

kondisi tertentu yang akan digunakan pada tahap selanjutnya. Pada tahap ke-dua,

ERs yang dipilih akan diklasifikasikan ke dalam kategori karakter dan bukan

karakter. Proses ini membutuhkan komputasi yang lebih banyak dibandingkan

komputasi sebelumnya. Proses yang digunakan yaitu: Hole area ratio, convex hull

ratio, dan menghitung jumlah batasan terluar dari infleksi poin. Setelah

penyaringan ERs selesai dilakukan, maka langkah selanjutnya adalah melakukan

pengelompokan ERs ke dalam high-level text blocks, seperti: kata, kalimat,

maupun paragraf.

B. Thresholding

Saif et al., (2013) dalam jurnalnya menjelaskan bahwa thresholding adalah

suatu metode yang digunakan untuk memisahkan antara objek dan

background-nya. Thresholding digunakan untuk mengatur jumlah derajat keabuan (grayscale)

yang ada pada citra (Gupta et al., 2012). Citra dari hasil thresholding biasanya

sering dipakai lebih lanjut untuk proses ekstraksi fitur serta pengenalan objek.

Teknik

thresholding

dapat dibedakan atas 2 (dua) macam, yaitu: Global

Thresholding dan Local Adaptive Thresholding. Pada Global Thresholding,

proses dilakukan dengan mengelompokan warna piksel menggunakan sebuah

nilai ambang (threshold) yang berlaku untuk seluruh bagian pada citra. Sedangkan

pada

Local Adaptive Thresholding, proses dilakukan dengan membagi citra

kondisi tertentu yang akan d

d

ig

u

un

unakan pada

ta

ha

p

selanjutnya. Pada tahap ke-dua,

ERs yang dipilih a

a

ka

kan

diklasifikasikan ke dalam ka

te

go

g

ri karakter dan bukan

karakter. Pr

r

o

os

oses ini membutuhk

hk

an

k

om

pu

ta

t

si

i

y

ang lebih bany

ny

nyak dibandingkan

komput

ut

utasi sebelumnya

ya

. Pr

Pr

o

os

o

es yang digunakan ya

a

it

u:

H

Hole area ratio,

o,

o convex hull

ra

a

at

t

tio

, dan

n

me

ng

n

hitung

ng

j

jumlah bata

tasan terluar

r

da

d

ri inf

nf

le

e

ks

i

poin.

Setelah

peny

y

ar

in

gan

ga

n ER

R

Rs

s

selesa

sai dilakukan, m

maka langkah se

el

lanjut

tny

ny

nya ad

dal

al

ah

m

elak

k

u

ukan

pe

e

ng

n

el

l

o

ompo

po

pok

kan ERs ke

e

d

dalam

hig

gh-level text

t b

blocks, sepert

rt

ti:

i

ka

a

ata

ta

,

kalima

a

at,

t

ma

up

u

un

n

p

par

arag

agraf.

B. B

Thresholding

Sa

S

if et al.,

, (

(

20

13

13 )

)

da

d

la

m

ju

j

rnalnya me

e

nj

el

elas

as

ka

n

b

ba

hw

hwa

threshol

ol

oldi

di

ding

adal

al

ah

suatu metode yang digunakan untu

u

uk

k

k me

me

misahkan antara objek dan

backgr

r

rou

ou

ound

nd

nd-

d

ny

nya.

Th

Thresholding

Th

digunakan untuk mengatur jumlah derajat keabua

an

n

(

((

(

gr

gray

aysc

ay

sc

sca

a

ale

)

ya

yang

ng

ng ada p

ada

d

ci

i

tr

tra

a

(Gu

(G

upta et

al

al.,

.,

,

2

01

01 2)

2)

.

C

Citra da

da

d ri

ri

h

has

as

asil

il

th

thre

h

sholding

h

ng

bi

as

asanya

sering

g

d

ip

ak

kai l

l

eb

ih

ih lanjut untuk pr

pr

proses eks

ks

kst

traksi fitur sert

ta

a

pe

ng

enal

al

l

an

an objek.

Teknik

thresholding

dapa

at dibedaka

a

an atas 2 (dua) macam, yaitu: Global

Thresholding

dan

Local Adapti

ti

tive Thres

s

sholding. Pada

Global Thresholding,

proses dilakukan dengan mengelom

om

ompo

o

k

kan warna piksel menggunakan sebuah

nilai ambang (threshold)

d

yang berlaku

u

untuk seluruh bagian pada citra Sedangkan

(3)

menjadi beberapa sub citra, kemudian pada setiap sub citra akan dilakukan proses

segmentasi menggunakan nilai threshold yang berbeda (Al-amri et al., 2010).

Metode

thresholding yang digunakan pada penelitian ini adalah metode

Global Thresholding. Pada Global Thresholding, metode yang digunakan adalah

dengan menentukan suatu nilai ambang (threshold) yang digunakan untuk

mengelompokan warna piksel. Seluruh piksel pada citra akan dikonversikan

menjadi hitam atau putih, dengan ketentuan dimana piksel yang levelnya lebih

tinggi dari level threshold akan diubah menjadi putih, dan sebaliknya piksel yang

levelnya berada di bawah dari level threshold akan diubah menjadi hitam. Secara

umum, persamaan untuk mengubah citra grayscale menjadi citra biner dapat

ditulis sebagai berikut:

[3,1]

dengan g(x,y) adalah citra biner dari citra grayscale f(x,y), dan T menyatakan nilai

ambang (threshold). Nilai T memegang peranan sangat penting dalam proses

pengambangan. Kualitas hasil citra biner sangat tergantung dari nilai T yang

digunakan.

Berikut merupakan contoh citra grayscale

yang diubah ke dalam bentuk

citra biner dengan menggunakan teknik thresholding:

Metode

thresholding

ng

g

ya

yang digunak

k

an

an p

p

ada penelitian ini adalah metode

Global Thresholdin

n

ng

g

.

Pada

Global Thresholding

, meto

ode

de

yang digunakan adalah

dengan men

en

n

e

entukan suatu ni

i

l

lai am

am

ba

ng

(

th

threshold

d

) yang

d

igunakan untuk

mengel

el

elompokan wa

a

arn

rn

rna

a

pi

p

ksel. Seluruh piks

k

el

l

p

pad

ad

a

citra akan d

d

dik

ik

i

onversikan

me

menjadi hi

hi

ta

m

a

at

au p

p

ut

ih

ih,

de

ngan ket

etentuan dim

man

an

na

a

piksel

el

y

an

ang

g

leveln

nya

ya

y

lebih

tinggi

gi

d

ar

i l

i

le

l

ve

e

l

l th

thresh

hol

o

d akan diubah

h

menjadi putih,

h, dan

s

eb

e

alik

ikny

ny

nya

a

a pi

pi

ks

k

el y

y

yang

le

e

ve

vel

l

lnya

y

be

er

erada di bawah

h

d

dari level

th

thr

reshold

akan

an diubah menj

nj

jad

a

i hi

hi

ita

ta

tam.

m

Secar

r

ra

um

u

, p

pe

pers

rsam

a

aan untuk me

meng

n

ubah

h c

citra

gr

gray

ayscale

menjadi

i

ci

citr

tr

ra

a

bi

i

ine

ne

ner

r

da

d

pat

t

ditulis

s

sebagai beri

iku

kut:

t:

[

3

3 3,1]

de

d

ngan g(x,y) adalah citra biner dar

r

i

i ci

c

tr

tra

a

grayscale f(x,y), dan T menyatakan

n

ni

il

ila

a

ai

am

amba

bang

ba

ng

(

(threshold). Nilai T memegang peranan sangat penting

d

g

d

al

am

pr

os

oses

pe

peng

ng

ngambangan.

K

Kua

ua

uali

li

lita

ta

tas

s hasil

ci

tr

tra

a

a bi

bine

bi

ne

ner

r

r sangat

t

er

erga

ga

gan

nt

ntung

d

dari nilai

ai

ai T

T

T yang

diguna

na

naka

ka

n.

Berikut merupakan conto

o

oh citra

gra

a

ayscale

yang diubah ke dalam bentuk

citra biner dengan menggunakan t

t

teknik

thre

re

resholding:

(4)

Gambar 3.1 Contoh hasil Thresholding

Dikutip Dari: Ramadijanti N., Setiawardhana,& Mahsun H. (2009). Social Network (http://digilib.its.ac.id/public/ITS-NonDegree-7548-7405040015-bab2.pdf)

Gambar sebelah kiri merupakan gambar original dan gambar sebelah kanan

adalah gambar hasil dari thresholding

C. Segmentasi

Citra

Segmentasi citra (image segmentation) merupakan bagian dari proses

pengolahan citra. Proses segmentasi citra merupakan suatu proses pra pengolahan

pada sistem pengenalan objek dalam citra. Segmentasi citra mempunyai arti

membagi suatu citra menjadi wilayah-wilayah yang homogen berdasarkan kriteria

tertentu antara tingkat keabuan suatu piksel dengan tingkat keabuan piksel–piiksel

tetangganya. Hasil dari proses segmentasi ini akan digunakan untuk proses tingkat

lebih lanjut yang dapat dilakukan pada suatu citra, misalnya proses klasifikasi

citra ataupun proses identifikasi suatu obyek (Saif et al., 2013 ; Al-amri et al.,

2010 ; Gupta et al., 2012).

Saif et al. (2013) berpendapat bahwa segmentasi citra adalah suatu proses

pembagian daerah citra menjadi beberapa bagian yang lebih kecil berdasarkan tata

Ga

G mbar333.1CContohhh hasasaill ThlThThrrereshshsholololdididinnng

Dikutip DaDaDarirri: Ramadijanti N.,,,SeSeSetititiawawawararardhdhdhanananaa,a,& &&MahsunHHH. (2009)99 . SoSS cial Netttwwow rk

(

(hthttpp:/://d/diigilib.iitsts.ac.id/public/ITS-NonDegree-75488-747405040000155--babab2.pdf)ff

Gamb

mb

mba

a

ar seb

b

bel

e

ah kiri me

meru

r

pakan ga

am

mbar

origin

nal

al

dan gamb

mb

bar

a

seb

eb

el

ah

kana

a

an

ad

adal

al

alah

a

ga

am

ba

r hasil dari thr

resh

s

olding

g

C. Segmentasi Citra

a

Se

Segm

gmen

enta

tasi

si citra

(i

(

mage segmentation)

)

merupa

paka

kan

n

ba

bagi

gian

an

dar

ar

i

i pros

os

s

es

pengolahan citra. Proses segment

nt

ntas

as

asi

i

citr

r

a m

a

m

merupakan suatu proses pra pengola

la

ha

han

n

pa

p da

da

sistem pengenalan objek dalam citra. Segmentasi citra mempu

pu

ny

nya

ai

a

ar

rti

me

memb

mb

mbag

ag

i

i su

su

atu

at

t

u

ci

c

ci

tr

tra

r

a

menj

me

nj

njad

ad

i

wi

wila

la

ya

yah

h

-wi

wi

laya

la

ya

h

h ya

ya

ang

ng

hom

h

om

og

o

og

en

e

ber

b

er

r

da

dasa

sa

rkan

rk

n

k

ri

t

teria

tert

rt

ten

en

tu

u

u a

a

nt

ar

a

ti

ting

ng

g

ka

t

t keabuan su

su

suatu piksel

l

d

dengan ting

g

gka

ka

t ke

ke

keab

ab

uan

ua

n

pi

ks

s

e

el

el–piiksel

–

tetangganya. Hasil dari proses seg

eg

egmentasi in

ini akan digunakan untuk proses tingkat

n

lebih lanjut yang dapat dilakuka

ka

an pada su

ua

u

tu citra, misalnya proses klasifikasi

citra ataupun proses identifikasi su

u

uatu ob

ob

obyek (Saif et al., 2013 ; Al-amri et al.,

2010 ; Gupta et al., 2012).

(5)

suatu bagian yang sangat penting dalam analisis citra secara otomatis, karena pada

prosedur ini obyek hasil segmentasi akan digunakan untuk proses selanjutnya,

misalnya: pada pengenalan pola.

Beberapa teknik segmentasi citra diantaranya: thresholding,

Connected

Component Labeling (CCL) dan segmentasi berbasis Clusterring seperti Iterasi,

K-means, fuzzy C-means dan SOM. Pada penelitian ini, metode segmentasi yang

digunakan adalah Connected Component Labeling (CCL). Metode ini sangat

cocok digunakan dalam proses pemisahan karakter yang terdapat pada sebuah

citra. Pada penelitian ini, proses segmentasi karakter digunakan pada saat

melakukan pemisahan karakter yang terdapat pada ekspresi matematika.

D. Connected Component Labeling

Salah satu metode dari segmentasi adalah Connected Component

Labeling.

Connected Component Labeling adalah sebuah algoritma

pengelompokan sederhana yang bertujuan untuk mengisolasi, mengukur, dan

mengidentifikasi potensi daerah obyek dalam citra (Rajaraman & Chokkalingam,

2013). Metode ini akan menghasilkan sebuah citra dengan label baru yang sudah

terkait satu sama lainnya antar sesama komponen. Dengan metode ini, akan

dilakukan segmentasi untuk memisahkan setiap karakter yang terdapat pada citra.

Operasi pelabelan dari daerah obyek akan memberikan nama atau nomor

yang unik ke semua piksel bernilai 1 yang termasuk dalam daerah tersebut. Hasil

pelabelan adalah komponen individu yang dapat diekstraksi. Algoritma

Connected Component Labeling dapat bekerja pada citra biner dengan

misalnya: pada pengenalan po

po

la

la.

Beberapa t

tek

ek

n

nik segmentasi citra diantaranya:

:

th

t

resholding,

Connected

Component La

La

Labeling

(CCL) da

a

n

se

gm

en

ta

si

s

b

er

e

basis

Clusterr

r

rin

in

ing

seperti Iterasi,

K-K

K mean

an

ans, fuzzy C-

C

C me

e

ean

ans

an

s

da

d

n

SOM

M

.

Pada pen

elit

l

itia

it

ia

an

n

in

ini,

in

i

metode segm

m

mentasi yang

di

i

ig

g

gunakan

n

ad

adal

al

ah

a

Conn

nn

nnec

e

ted Compon

o

ent Labeli

ling

ng

(C

(

CL

L

L)

)

).

M

e

et

e

ode in

i

sangat

cocok

k

di

gu

naka

ka

a

n

dala

am

m proses pemis

isahan karakter

r

yang

t

er

e

dapa

a

t pa

t

pa

pada

d

seb

b

buah

ci

i

t

ra

.

P

Pada

a penelitian in

a

ini,

i, proses se

egmentasi k

karakter digu

un

n

nakan

n

n pa

pa

pada saa

a

at

me

la

kuka

ka

kan

n

pe

pemisahan karakt

kter

er yang t

ter

rdapat p

pad

ada ekspresi mat

tem

emat

at

tik

i

a.

D

.

Connected Compon

nen

e

t

t La

Labeling

Sa

S

lah satu

u

m

et

od

d

e

da

ri segment

t

as

i

ad

al

ah

Connected

C

d

C

Co

Compon

n

nen

en

ent

t

La

L

beling.

Connected

Componen

en

ent

t

Labeling

L

adalah sebuah algo

o

ri

tm

m

a

pe

peng

ng

ngel

el

om

o

pokan sederhana yang bertujuan untuk mengisolasi, me

me

eng

ng

uk

ukur

ur

ur,

d

dan

me

meng

ng

ngiden

ti

i

fi

fik

k

ka

si p

i

p

ot

en

si

si d

d

daerah

h

h ob

obye

ob

yek

ye

k

da

la

lam citra

(R

ajar

aj

ar

aman

&

& Chokk

kk

kkal

al

alin

in

ngam,

2013

3)

3 )

).

Me

M

tode

e

i

ni

ni akan menghasi

si

silk

l

an seb

b

u

uah citra dengan

n

l

ab

el

b

ba

a

ru

y

yang sudah

terkait satu sama lainnya antar

r

r sesama k

k

komponen. Dengan metode ini, akan

dilakukan segmentasi untuk mem

m

mis

i

ahkan se

e

etiap karakter yang terdapat pada citra.

Operasi pelabelan dari daera

ra

ah ob

b

byek akan memberikan nama atau nomor

yang unik ke semua piksel bernilai 1 ya

y

ng termasuk dalam daerah tersebut Hasil

(6)

menggunakan metode 4-connectivity atau 8-connectivity (Asano & Tanaka, 2010).

Proses pelabelan dilakukan dengan menggunakan sebuah penanda yang berfungsi

untuk mencari titik p yang menunjukkan piksel tempat label akan diberikan pada

daerah

foreground. Ketika kondisi bernilai benar maka akan dilakukan

pengecekan ke seluruh titik tetangga dari p (tergantung dari jumlah

n-connectivity). Jika semua tetangga adalah background maka akan diberikan label

baru pada p. Tetapi apabila hanya satu tetangga yang bernilai foreground maka

label p sama dengan label tetangga. Dengan begitu, setiap karakter akan diberi

label yang berbeda sehingga karakter yang satu dengan karakter yang lain dapat

dipisahkan berdasarkan label yang dimilikinya.

Gambar 3.2 dan 3.3 akan menunjukan contoh hasil dari penerapan metode

connected component labeling pada sebuah citra.

Gambar 3.2 Contoh citra biner

Dikutip dari : Rajaraman (2013). Connected Components Labeling and Extraction Based Interphase Removal from Chromosome Images

untuk mencari titik p yang m

m

en

enunjukkan p

ik

se

l

l tempat label akan diberikan pada

daerah

foreground

d

. Ketika kondisi bernilai benar

r

r maka akan dilakukan

pengecekan

n

k

ke seluruh titik tet

et

an

gg

a

da

d

ri

p

(tergantung

g

g dari jumlah

n-connec

c

ct

t

tivity

). Jika se

e

emu

mu

a

t

tetangga adalah

back

kgr

rou

ou

o

nd

nd m

m

maka akan di

i

ibe

b

rikan label

ba

a

r

ru pada

a

p.

p

T

et

api ap

ap

ab

ila hanya sa

i

il

at

tu tetangga ya

ya

ang

ng

berni

ni

nila

la

lai

i

fo

foreground

nd

n

maka

label

p

sa

ma

m

d

e

en

engan

la

label tetangga. D

Dengan begitu,

u,

s

etiap

p

karakt

kt

er

aka

a

k

n di

di

dibe

b

ri

la

a

be

bel

l

l ya

y

ng

g

b

berbeda sehin

ngg

gga karakter

r y

yang satu d

de

engan karakter

er

r yan

n

ng

g

la

in dap

a

at

a

di

dipi

pi

pis

s

sahk

k

kan

an

b

ber

e

dasarkan label

el y

yang dimi

milikiny

ya

a.

Gambar 3.2

2 da

dan

n 3

.

3 akan

an m

men

nun

nju

uk

kan

n contoh

h

has

asil

il

d

ari penera

ra

apan meto

o

de

co

c

nnec

c

cted component labeli

ling

ng

pa

ad

da sebua

ah

h ci

citr

ra.

a.

Gambar333.2 CoCoontoh citra biner

(7)

Gambar 3.3 Contoh citra hasil proses connected component labeling

Dikutip dari : Rajaraman (2013). Connected Components Labeling and Extraction Based Interphase Removal from Chromosome Images

Salah satu metode yang dapat digunakan untuk proses connected

component labeling adalah 8-Connectivity Sequential Connected Component

Labeling. Hasil dari proses ini berupa matrix label yang berasal dari citra biner.

Algoritma

8-connectivity sequential connected component labeling merupakan

jenis algoritma two-pass dari connected component labeling. Algoritma ini akan

menelusuri citra sebanyak dua kali (two-pass). Berikut merupakan alur dari

metode connected component labeling:

Gambar 3.4 8-connectivity neighbourhood Ga

Ga

Gambar 333.333Contoh citra hasilpproses connected coompmpmponent lalalabebeb lililingnn Dikukukutitip dariri : Rajaraman (201313). Connected Coompm onennntststs Labbelinnnggg an

an

and ExtractionnBBased Interphasee Removal fromm CChromosome e eImageseses

S

Salah

h sa

satu metode ya

yang d

dap

pat d

dig

igu

unakan untuk

uk

p

ro

se

es

co

conn

nn

nnec

e

ted

d

compo

on

onent labeling

ad

adal

alah

a

8 8-

-Co

Conn

nnec

cti

iv

vity

ty Seq

eque

uent

ntia

ial Connected

Compon

n

nen

en

ent

La

L

beli

i

in

ng. Hasil dari proses in

ini

i

berupa matrix

x

label yang berasal dari

l

i

citra

a

b

biner

r

.

Algori

i

it

tm

tma

a

8 8-co

co

conn

nn

nne

ec

ectivity

y seq

que

ent

nt

ntial conn

n

ne

ec

ected comp

p

pon

nen

en

ent

t

la

labe

beli

ling

ng

merupa

a

ka

kan

n

je

jenis algoritma

two-pass

-

dari

connec

c

te

ed

d component labeling.

d

Algoritma in

n

i

i ak

ak

a

an

me

mene

ne

lusu

su

suri

ri

c

cit

it

ra

s

eb

an

a

an

ya

k

du

a kali (two-pa

-

pa

pass

ss)

ss

)

.

Be

e

ri

ku

t

me

ru

pa

kan

ka

k

n

al

alur

ur

d

dari

me

(8)

1. Telusuri citra dari kiri ke kanan, atas ke bawah

2. Fase

scanning: (pass pertama), Jika piksel (A) adalah foreground maka

cek piksel tetangganya.

a.

Jika B adalah foreground maka labeli A sama seperti label B

b.

Selain itu jika C adalah foreground

maka labeli A sama seperti

label C

c.

Selain itu jika D adalah foreground

maka labeli A sama seperti

label D

d.

Jika E adalah foreground maka:

1)

Jika A belum berlabel maka labeli A sama seperti label E

2)

Jika A sudah berlabel maka catat hal ini dalam Equivalent

Map

e.

Jika B,C,D dan E adalah background

maka labeli A dengan label

baru dan tambahkan jumlah objek yang ditemukan

3. Tahap analisis: Dari Equivalent Map disiapkan remapping array untuk

proses perbaikan pada matrix label.

4. Fase

Labeling: (pass kedua), Perbaiki label pada matrix menggunakan

remapping array.

Matrix label kemudian akan ditelusuri untuk mendapatkan daftar dari

obyek-obyek yang ada pada gambar beserta informasi lokasi dan ukuran dari setiap label.

cek piksel tetangganya

ya

ya.

a. Jika

a

B

B adalah

foreground

maka labeli A

sa

ma

m

seperti label B

b.

b. Selain itu jika C

C

ad

al

ah

h

fore

fo

re

regr

gr

gro

o

ound

maka lab

b

bel

el

i

A sama seperti

label

C

c

c. Se

Se

lain i

i

tu

j

jik

ik

a

D adalah

a

foreground

nd

ma

m

ka

l

abel

ab

el

i

A sama

a

a seperti

la

b

be

l

D

d

d.

Ji

ka E adala

lah

h

foregrou

und

nd maka:

1) Jika A

A b

bel

e

um b

ber

rlabel ma

mak

ka labeli A sama

ma

sep

s

ep

perti

l

lab

ab

el

E

2)

2) Ji

Jika A sud

udah

ah

b

ber

rlabe

bel m

maka c

cat

atat

at h

hal ini dalam

m

Equivale

e

en

n

nt

Map

e. Jika

ka

B

,C

C

,D

D

d

an

E

adalah

back

ck

ckgr

gr

grou

ound

nd

ma

ka

ka labeli A de

de

den

ngan lab

ab

el

baru dan tambahkan

ju

juml

ml

mlah

ah

ah objek yang ditemukan

3

3. Tahap analisis: Dari Equivalent Map

disiapkan

remapping

g

ar

arra

a

ay

y

un

unt

t

tuk

proses per

ba

ik

an

an pada ma

a

trix

tr

ix

ix l

l

ab

abel

el

.

4.

4

4 Fa

Fa

F

se

La

abe

be

beli

li

ling: (pass

((

kedu

du

dua), Perb

rbaiki label pad

rb

ad

d

a

m

ma

trix

i

m

e

enggunakan

remapping array.

Matrix label kemudian akan ditel

l

u

us

u

uri

i

i untuk mendapatkan daftar dari

obyek-obyek yang ada pada gambar beserta i

in

nformasi lokasi dan ukuran dari setiap label

(9)

E. Ekstraksi

Fitur

Choudhary & Rishi (2011) dan Kader & Deb (2012) berpendapat bahwa

proses ekstraksi fitur merupakan proses menandai dan menyimpan semua fitur

dari hasil segmentasi karakter. Fitur adalah suatu bentuk informasi atau

karakteristik dari segmen yang bisa dijadikan sebagai tanda pengenal dari bentuk

segmen karakter tersebut, oleh karena itu fitur harus unik untuk tiap bentuk

karakter.

Ekstraksi fitur akan mengubah huruf / angka yang terdapat dalam citra

menjadi susunan kode angka (yaitu angka 0 dan 1). Ekstraksi fitur berfungsi untuk

mengubah suatu pola menjadi bit-bit digital sehingga dapat dimengerti oleh

komputer.

F. Learning Vector Quantization

Menurut Soleiman & Fetanat (2014), Learning Vector Quantization

(LVQ) adalah suatu metode yang melakukan pembelajaran pada lapisan

kompetitif yang terawasi.

Lapisan kompetitif akan secara otomatis belajar untuk

mengklasifikasikan vektor-vektor input. Kelas-kelas yang diperoleh sebagai hasil

dari lapisan kompetitif ini hanya tergantung pada jarak antara vektor-vektor input.

Apabila beberapa vektor input memiliki jarak yang sangat berdekatan, maka

vektor-vektor input tersebut akan dikelompokan dalam kelas yang sama. Metode

yang digunakan untuk menghitung jarak vektor pada jaringan LVQ adalah

Euclidian Distance, dengan demikian waktu yang diperlukan untuk melakukan

proses pengenalan pola relatif cepat. Hal ini sangat cocok diterapkan pada aplikasi

proses ekstraksi fitur merupa

pa

ka

kan proses men

en

enan

an

a

dai dan menyimpan semua fitur

dari hasil segment

nt

a

asi karakter. Fitur adalah suatu

tu

u bentuk informasi atau

karakteristik

k

d

dari segmen yang

b

is

s

a

di

d

ja

di

ka

n se

se

s

bagai tanda pe

e

eng

ng

enal dari bentuk

segmen

en

en karakter ters

rs

eb

b

ut

ut,

,

oleh karena itu fi

f

fitu

t

r

ha

haru

ru

us

s unik untuk

k

k tiap bentuk

ka

a

r

rakter.

Ek

st

s

raks

ks

s

i

fitur ak

a

an menguba

ah

h huruf / angk

ka

a

yang

g

g terda

d

pa

pat

t

t da

da

la

l

m

ci

c

tra

me

nj

nj d

ad

adi su

us

su

sunan kode ang

gka

k

(yaitu an

ng

gka 0 dan 1)

1).

.

Ek

straksi fitu

u

ur

r

berf

rf

fun

un

gs

g

gsi untu

u

uk

k

me

ng

n

ub

b

a

ah

s

sua

u

tu pola menj

njad

adi bit-b

bit

t digita

al

l

sehingga dap

pat

at

d

im

men

gert

ge

rt

i

oleh

h

kompu

u

ute

t

r.

F. Le

L

arning

g V

Vec

ec

ecto

tor

to

r

r Qu

Qu

Quan

an

anti

t

zation

Menurut Soleiman & Fet

t

an

anat

t

t (

(

(2014),

Learning Vector Quantiza

za

zati

ti

io

on

o

(L

(LVQ

VQ

VQ)

)

adalah suatu metode yang melakukan pembelajaran pa

pa

da

l

lap

ap

apis

is

san

ko

komp

mp

mpetit

if

if yang tera

f

ra

wa

wasi

si.

si

Lapisa

a

n

ko

komp

mp

mpet

etit

et

it

iti

if akan

se

ca

cara

ra

r

ot

toma

tis

i

bela

la

ja

r u

untuk

u

k

meng

g

kl

as

a

if

fi

ikas

as

s

ik

a

an vektor-vektor

r

r input. Ke

Ke

Kelas-

kelas yang

d

ip

er

e

ol

leh

h

s

eb

ebagai hasil

dari lapisan kompetitif ini hanya

tergantung

g

pada jarak antara vektor-

vektor input.

a

Apabila beberapa vektor input

me

m

miliki

jarak yang sangat berdekatan, maka

vektor-vektor input tersebut akan d

d

dik

i

elom

om

ompokan dalam kelas yang sama. Metode

h

yang digunakan untuk menghitung jarak vektor pada jaringan LVQ adalah

(10)

berbasis

mobile yang membutuhkan operasi perhitungan yang sangat cepat,

sehingga aplikasi yang dibangun dapat berjalan dengan optimal.

1. Arsitektur Jaringan LVQ

Metode LVQ dapat digunakan untuk proses pengelompokan dimana

jumlah kelompok telah ditentukan sesuai dengan rancangan arsitekturnya

(target/kelas sudah ditentukan). Menurut Chen, Tsai & Yang (2010), LVQ

merupakan salah satu metode pembelajaran yang handal dalam melakukan

pengklasifikasian. Soleiman & Fetanat (2014) berpendapat bahwa pada jaringan

LVQ, lapisan kompetitif akan belajar untuk mengklasifikasikan vektor input

terhadap lapisan input yang terdapat pada jaringan LVQ.

Umer & Khiyal (2007) berpendapat bahwa arsitektur jaringan LVQ dapat

dikelompokan atas tiga bagian yaitu: input layer, competitive layer (hidden layer),

dan

output layer. Pada input layer berisi vektor-vektor input yang

mendeskripsikan fitur / ciri dari sekumpulan pola yang akan dikenali. Pada

competitive layer, setiap lapisan unit akan melakukan clustering / pengelompokan

terhadap vektor input. Hasil clustering diperoleh dari perhitungan jarak (euclidian

disctance) antara vektor input dengan lapisan unit. Vektor-vektor input yang

memiliki jarak euclidian yang sangat berdekatan dengan salah satu lapisan unit,

maka vektor input dan lapisan unit tersebut akan dikelompokan ke dalam kelas

(class) yang sama. Sedangkan pada output layer berisi jumlah target yang

merepresentasikan jumlah kelas yang terdapat pada jaringan LVQ.

1. Arsitektur J

J

Ja

a

aringan LVQ

Meto

o

d

de

de LVQ dapat di

di

gu

u

na

ka

n

un

tu

u

k

pr

p

oses penge

e

elo

lo

mpokan dimana

jumlah

h

h kelompok

te

tela

la

a

h

ditentukan sesuai

i

de

deng

ng

an

an rancangan

a

rsitekturnya

(t

t

a

ar

ge

t/kela

la

as

s

su

da

d

h di

i

tent

te

ntuk

an

). Menu

n

rut Chen,

Ts

T

ai &

&

Y

Yan

an

ang

g

(2010)

0)

0),

,

LVQ

merupa

pa

ka

n

sala

la

h

h satu

u metode pemb

mbelajaran yang

g

hand

nd

dal

a

dal

alam

am

m

elak

ku

uk

u

an

pe

e

ng

n kl

kl

a

asifik

ik

as

ian. Soleima

man

n

& Fetan

nat

t (2014) be

erp

rpendapat bahw

hw

hwa pa

a

ada

da

j

jaringa

a

an

n

LV

Q

, la

a

api

pisa

san

n

kompetitif a

aka

kan bela

aja

ar

untu

uk

k

me

ngklasifikas

sik

ikan

an

n vek

k

to

r

i

in

i

put

t

terhada

a

ap lapisan

i

np

put

ut y

yang terd

dap

pat

a

p

pad

da ja

jari

in

ngan LVQ

VQ.

Umer & Khiyal (20

007 07)

) be

ber

rpendapa

at

t b

bahw

hwa arsitektur jaringan

n

LVQ d

d

dapa

a

at

dike

lo

m

mp

mpokan atas

s ti

ti

tiga

ga

b

ag

ia

n

ya

y

itu: input la

a

aye

ye

yer

r

r,

c

com

om

ompe

pe

peti

ti

t

ti

tive layer (

(hi

hi

idd

dd

dden lay

y

er

er),

),

da

d

n

output layer. Pada

input

t

la

ay

a

y

yer

berisi vektor-vektor input

y

yan

an

ang

me

mend

nd

ndes

es

kripsikan fitur / ciri dari sekumpulan pola yang akan dik

ik

enal

en

e

al

i.

i. P

P

Pa

a

ada

co

comp

mp

mpetitive l

l

layer

, se

se

seti

ti

ap

l

lapisan u

u

uni

ni

nit

t

t ak

ak

akan

an m

an

melakuk

m

k

an

cl

clus

us

uste

ring /

i

/ peng

g

el

om

p

pokan

terhad

ad

adap

ap

vekto

o

r

in

input. Hasil cluste

te

tering

dipe

pe

peroleh dari perhi

hi

tu

ng

an j

j

ar

ak

(

(euclidian

disctance) antara vektor input

dengan lap

p

pisan unit. Vektor-vektor input yang

memiliki jarak euclidian

yang san

an

angat berd

d

dekatan dengan salah satu lapisan unit,

maka vektor input dan lapisan unit

it

t terse

se

sebut akan dikelompokan ke dalam kelas

(class) yang sama Sedangkan pada

a

output layer

berisi jumlah target yang

(11)

Gambar 3.5 Contoh Arsitektur Jaringan LVQ

Dikutip dari Kusumadewi (2004). Jaringan Syaraf Tiruan. Hal 296

dimana:

X

= Vektor Masukan (x

1

,…,x

2

,…,x

n

)

F

= Lapisan kompetitif

Y_in

= Masukan kelapisan kompetitif

Y

= Keluaran (Output)

W

= Vektor bobot untuk unit keluaran

||x - w|| = Selisih nilai jarak Euclidean antara vektor input dengan vektor

bobot untuk unit Output

Gambar 3.5 adalah arsitektur jaringan LVQ (Learning Vector

Quantization)

yang terdiri dari 6 node

lapisan masukan (Input layer),

2 node

lapisan tersembunyi (Hidden layer) serta 2 node lapisan keluaran (Output layer).