BAB III
LANDASAN TEORI
A.
Text Detection
Text detection dapat diartikan sebagai suatu proses pencarian teks yang
terdapat pada sebuah citra. Proses text detection dalam sebuah citra merupakan
salah satu masalah yang sering dihadapi dan selalu menjadi pusat perhatian karena
proses ini sangat dibutuhkan pada aplikasi computer vision seperti pencarian teks
pada gambar (Neumann & Matas, 2012).
Pada penelitian ini proses text detection akan dibantu dengan
menggunakan
library OpenCV. OpenCV adalah suatu library yang terdiri dari
fungsi-fungsi computer vision dan API (Aplication Programming Interface) untuk
melakukan pengolahan citra baik secara high level maupun low level dan sebagai
optimasi dalam menjalankan aplikasi secara realtime. OpenCV sangat disarankan
pada pengembangan aplilkasi computer vision, karena library ini mampu
menciptakan aplikasi yang handal, kuat di bidang digital vision dan mempunyai
kemampuan yang mirip dengan cara pengolahan visual pada manusia. Karena
OpenCV bersifat open source, maka library ini dapat digunakan secara gratis.
Proses
text detection pada OpenCV dikembangkan berdasarkan teori yang
dikemukakan oleh Lukas Neumann dan Jiri Matas (2012). Proses text detection
pada OpenCV terdiri dari dua tahapan. Tahap pertama, secara bertahap sistem
akan menghitung descriptor, berupa: area, parameter, bounding box, dan nilai
euler. Hasi dari perhitungan descriptor akan menghasilkan sejumlah region r
A.
Text Detec
cti
ti
tio
o
on
Text
t
d
d
detection
dapat diar
a
a
ti
i
i
ka
ka
ka
n
n
n
se
se
se
ba
ba
ba
g
ga
g
i
i
i
suatu proses pen
en
encarian teks yang
terdap
p
p
at
at
at pada sebuah
ah
h
c
c
cit
it
it
ra
ra
ra
. Proses
text detection
n
da
da
da
la
la
lam
m
m sebuah citra
ra
a merupakan
sa
a
a
l
la
lah satu m
m
m
as
as
as
al
al
al
ah
a
a
yan
n
n
g
g
g se
sering dihadap
api dan selalu
lu m
m
men
e
e
jadi
p
p
p
us
us
s
at
at
at
p
p
p
erhatian
n
n karena
proses
s
s
i
i
ini
ni
ni
sanga
s
s
ga
ga
t
t
t
dibutu
tuhkan pada apli
likasi computer
r v
vision
n
se
s
s
perti
i
pe
pe
pe
nc
nc
nc
ar
a
a
ian
te
t
t
ks
pa
a
a
da
da
da
gam
a
ba
a
a
r
r
(N
eumann &
& Matas, 20
012
2).
P
Pa
Pada
da penelitian in
ni
prose
es
text
d
de
etection
akan
d
dib
ib
ban
a
tu
u
u
d
d
d
en
en
engan
menggu
gu
gunakan
librar
ary
y
Op
OpenCV
V.
Op
O
e
enCV
CV
ad
dalah su
uat
atu
u
l
li
br
ary yang
g
g terdiri d
dar
ar
ari
fu
f
ngsi
i
i-
-fungsi computer visio
ion
n
da
dan
n API
(Apl
plic
icat
tio
ion Programming Inte
er
r
rface)
u
u
untu
u
k
k
k
mela
la
ku
ku
kuka
k
n pengol
olah
ah
han
an
an
c
c
c
it
it
it
ra
ra
b
b
b
ai
ai
ai
k secara high
gh
gh
lev
l
l
ev
ev
el
el
l
ma
ma
ma
up
up
up
u
un
low level
el
l
da
da
dan seba
a
aga
ga
ga
i
i
i
op
o
timasi dalam menjalankan aplikas
as
as
i
i
i
se
e
ec
ca
c
ra
realtime. OpenCV sangat disara
ra
ank
nk
nka
an
a
pa
pa
pada
da
da p
p
p
engembangan aplilkasi computer vision, karena library
y
y
in
in
in
i
i
ma
ma
mamp
m
m
u
me
me
menc
nc
nciptak
kan ap
li
l
li
ka
ka
ka
si
si
si
y
y
y
a
an
ang hand
d
dal
al
al
,
,
,
ku
ku
kuat
at
at
d
d
di
i
i
b
b
bidang
di
di
digi
gi
gita
ta
tal
l
l vi
i
sion
i
d
dan me
me
memp
mp
mpu
u
unyai
kemamp
mp
mpua
u
n ya
ya
ya
ng
ng
ng mirip dengan
c
c
c
ara pen
n
ngolahan visual
l
l
pa
pa
pa
da
d
d
man
an
n
u
us
us
i
i
ia. Karena
OpenCV bersifat open source, m
m
maka
library
y
ini dapat digunakan secara gratis.
Proses text detection
pada
a
a
OpenCV
V
V dikembangkan berdasarkan teori yang
dikemukakan oleh Lukas Neumann
n
n dan
n
n Jiri Matas (2012). Proses text detection
pada OpenCV terdiri dari dua tahapan
a
Tahap pertama secara bertahap sistem
dimana setiap region tersebut akan dijadikan ciri (features) dalam melakukan
proses pendeteksian teks. Hanya External Regions r (ERs) yang memenuhi
kondisi tertentu yang akan digunakan pada tahap selanjutnya. Pada tahap ke-dua,
ERs yang dipilih akan diklasifikasikan ke dalam kategori karakter dan bukan
karakter. Proses ini membutuhkan komputasi yang lebih banyak dibandingkan
komputasi sebelumnya. Proses yang digunakan yaitu: Hole area ratio, convex hull
ratio, dan menghitung jumlah batasan terluar dari infleksi poin. Setelah
penyaringan ERs selesai dilakukan, maka langkah selanjutnya adalah melakukan
pengelompokan ERs ke dalam high-level text blocks, seperti: kata, kalimat,
maupun paragraf.
B. Thresholding
Saif et al., (2013) dalam jurnalnya menjelaskan bahwa thresholding adalah
suatu metode yang digunakan untuk memisahkan antara objek dan
background-nya. Thresholding digunakan untuk mengatur jumlah derajat keabuan (grayscale)
yang ada pada citra (Gupta et al., 2012). Citra dari hasil thresholding biasanya
sering dipakai lebih lanjut untuk proses ekstraksi fitur serta pengenalan objek.
Teknik
thresholding
dapat dibedakan atas 2 (dua) macam, yaitu: Global
Thresholding dan Local Adaptive Thresholding. Pada Global Thresholding,
proses dilakukan dengan mengelompokan warna piksel menggunakan sebuah
nilai ambang (threshold) yang berlaku untuk seluruh bagian pada citra. Sedangkan
pada
Local Adaptive Thresholding, proses dilakukan dengan membagi citra
kondisi tertentu yang akan d
d
ig
ig
ig
u
un
unakan pada
ta
ta
ta
ha
ha
ha
p
p
p
selanjutnya. Pada tahap ke-dua,
ERs yang dipilih a
a
a
ka
ka
kan
diklasifikasikan ke dalam ka
te
te
te
go
g
g
ri karakter dan bukan
karakter. Pr
r
r
o
os
oses ini membutuhk
hk
hk
an
an
an
k
k
k
om
om
om
pu
pu
pu
ta
ta
t
si
si
i
y
y
y
ang lebih bany
ny
nyak dibandingkan
komput
ut
utasi sebelumnya
ya
ya
. Pr
Pr
Pr
o
os
o
es yang digunakan ya
a
a
it
it
it
u:
u:
u:
H
H
Hole area ratio,
o,
o convex hull
ra
a
at
t
tio
, dan
n
n
me
me
me
ng
n
n
hitung
ng
ng
j
jumlah bata
tasan terluar
r
da
d
d
ri inf
nf
nf
le
le
e
ks
ks
ks
i
i
i
poin.
Setelah
peny
y
y
ar
ar
ar
in
in
in
gan
ga
ga
n ER
R
Rs
s
selesa
sai dilakukan, m
maka langkah se
el
lanjut
tny
ny
nya ad
dal
al
al
ah
ah
ah
m
m
m
elak
k
k
k
k
u
u
ukan
pe
e
e
ng
ng
n
el
el
l
o
ompo
po
pok
kan ERs ke
e
d
dalam
hig
gh-level text
t b
blocks, sepert
rt
ti:
i
i
ka
a
ata
ta
ta
,
,
,
kalima
a
at,
t
t
ma
ma
ma
up
up
u
un
n
p
par
arag
agraf.
B.
B
Thresholding
Sa
S
if et al.,
, (
(
(
20
20
20
13
13
13
)
)
)
da
da
d
la
la
la
m
m
m
ju
j
j
rnalnya me
e
e
nj
nj
nj
el
el
elas
as
ka
ka
ka
n
n
n
b
ba
ba
hw
hwa
threshol
ol
oldi
di
ding
adal
al
al
ah
ah
ah
suatu metode yang digunakan untu
u
uk
k
k me
me
me
misahkan antara objek dan
backgr
r
rou
ou
ound
nd
nd-
d
d
ny
ny
nya.
Th
Thresholding
Th
digunakan untuk mengatur jumlah derajat keabua
an
n
n
(
(
(
(
((
(
gr
gray
aysc
ay
sc
sca
a
ale
)
ya
ya
yang
ng
ng ada p
ada
d
d
ci
i
tr
tr
tra
a
a
(Gu
(G
(G
upta et
al
al
al.,
.,
,
2
2
2
01
01
01
2)
2)
2)
.
C
C
Citra da
da
d ri
ri
ri
h
h
has
as
asil
il
th
thre
h
sholding
h
h
ng
ng
bi
bi
bi
as
as
asanya
sering
g
g
d
d
d
ip
ip
ip
ak
kai l
l
l
eb
eb
eb
ih
ih
ih lanjut untuk pr
pr
proses eks
ks
kst
traksi fitur sert
ta
a
a
pe
pe
pe
ng
ng
ng
enal
al
l
an
an
an objek.
Teknik
thresholding
dapa
at dibedaka
a
an atas 2 (dua) macam, yaitu: Global
Thresholding
dan
Local Adapti
ti
tive Thres
s
sholding. Pada
Global Thresholding,
proses dilakukan dengan mengelom
om
ompo
o
o
k
k
kan warna piksel menggunakan sebuah
nilai ambang (threshold)
d
d
yang berlaku
u
untuk seluruh bagian pada citra Sedangkan
menjadi beberapa sub citra, kemudian pada setiap sub citra akan dilakukan proses
segmentasi menggunakan nilai threshold yang berbeda (Al-amri et al., 2010).
Metode
thresholding yang digunakan pada penelitian ini adalah metode
Global Thresholding. Pada Global Thresholding, metode yang digunakan adalah
dengan menentukan suatu nilai ambang (threshold) yang digunakan untuk
mengelompokan warna piksel. Seluruh piksel pada citra akan dikonversikan
menjadi hitam atau putih, dengan ketentuan dimana piksel yang levelnya lebih
tinggi dari level threshold akan diubah menjadi putih, dan sebaliknya piksel yang
levelnya berada di bawah dari level threshold akan diubah menjadi hitam. Secara
umum, persamaan untuk mengubah citra grayscale menjadi citra biner dapat
ditulis sebagai berikut:
[3,1]
dengan g(x,y) adalah citra biner dari citra grayscale f(x,y), dan T menyatakan nilai
ambang (threshold). Nilai T memegang peranan sangat penting dalam proses
pengambangan. Kualitas hasil citra biner sangat tergantung dari nilai T yang
digunakan.
Berikut merupakan contoh citra grayscale
yang diubah ke dalam bentuk
citra biner dengan menggunakan teknik thresholding:
Metode
thresholding
ng
g
ya
ya
yang digunak
k
k
an
an
an p
p
p
ada penelitian ini adalah metode
Global Thresholdin
n
ng
g
g
.
Pada
Global Thresholding
, meto
ode
de
de
yang digunakan adalah
dengan men
en
n
e
entukan suatu ni
i
i
l
l
lai am
am
am
ba
ba
ba
ng
ng
ng
(
th
th
threshold
d
d
) yang
d
d
igunakan untuk
mengel
el
elompokan wa
a
arn
rn
rna
a
a
pi
p
p
ksel. Seluruh piks
k
k
el
l
l
p
p
pad
ad
ad
a
a
citra akan d
d
dik
ik
i
onversikan
me
me
menjadi hi
hi
hi
ta
ta
ta
m
m
m
a
at
at
au p
p
p
ut
ut
ut
ih
ih
ih,
de
ngan ket
etentuan dim
man
an
na
a
a
piksel
el
el
y
y
y
an
an
ang
g
g
leveln
nya
ya
y
lebih
tinggi
gi
gi
d
d
d
ar
ar
ar
i l
i
i
le
l
ve
e
e
l
l
l th
thresh
hol
o
d akan diubah
h
menjadi putih,
h, dan
s
s
s
eb
eb
e
alik
ikny
ny
nya
a
a pi
pi
pi
ks
k
k
el y
y
yang
le
e
e
ve
ve
vel
l
lnya
y
be
er
erada di bawah
h
d
dari level
th
thr
reshold
akan
an diubah menj
nj
jad
a
a
i hi
hi
ita
ta
tam.
m
m
Secar
r
ra
um
um
um
um
u
u
, p
pe
pers
rsam
a
aan untuk me
meng
n
ubah
h c
citra
gr
gray
ayscale
menjadi
i
ci
citr
tr
ra
a
a
bi
i
ine
ne
ner
r
r
da
d
d
pat
t
ditulis
s
sebagai beri
iku
kut:
t:
[
[
[
3
3
3,1]
de
d
ngan g(x,y) adalah citra biner dar
r
i
i
i ci
c
c
tr
tr
tra
a
a
grayscale f(x,y), dan T menyatakan
n
n
n
n
ni
il
ila
a
ai
am
am
amba
bang
ba
ng
ng
(
(threshold). Nilai T memegang peranan sangat penting
d
d
g
d
d
d
al
al
al
am
am
am
pr
pr
pr
os
os
oses
pe
pe
peng
ng
ngambangan.
K
K
Kua
ua
uali
li
lita
ta
tas
s hasil
ci
ci
ci
tr
tr
tra
a
a bi
bine
bi
ne
ner
r
r sangat
t
t
t
er
er
erga
ga
gan
nt
ntung
d
d
dari nilai
ai
ai T
T
T yang
diguna
na
naka
ka
ka
n.
Berikut merupakan conto
o
oh citra
gra
a
ayscale
yang diubah ke dalam bentuk
citra biner dengan menggunakan t
t
teknik
thre
re
resholding:
Gambar 3.1 Contoh hasil Thresholding
Dikutip Dari: Ramadijanti N., Setiawardhana,& Mahsun H. (2009). Social Network (http://digilib.its.ac.id/public/ITS-NonDegree-7548-7405040015-bab2.pdf)
Gambar sebelah kiri merupakan gambar original dan gambar sebelah kanan
adalah gambar hasil dari thresholding
C. Segmentasi
Citra
Segmentasi citra (image segmentation) merupakan bagian dari proses
pengolahan citra. Proses segmentasi citra merupakan suatu proses pra pengolahan
pada sistem pengenalan objek dalam citra. Segmentasi citra mempunyai arti
membagi suatu citra menjadi wilayah-wilayah yang homogen berdasarkan kriteria
tertentu antara tingkat keabuan suatu piksel dengan tingkat keabuan piksel–piiksel
tetangganya. Hasil dari proses segmentasi ini akan digunakan untuk proses tingkat
lebih lanjut yang dapat dilakukan pada suatu citra, misalnya proses klasifikasi
citra ataupun proses identifikasi suatu obyek (Saif et al., 2013 ; Al-amri et al.,
2010 ; Gupta et al., 2012).
Saif et al. (2013) berpendapat bahwa segmentasi citra adalah suatu proses
pembagian daerah citra menjadi beberapa bagian yang lebih kecil berdasarkan tata
Ga
Ga
G mbar333.1CContohhh hasasaill ThlThThrrereshshsholololdididinnng
Dikutip DaDaDarirri: Ramadijanti N.,,,SeSeSetititiawawawararardhdhdhanananaa,a,& &&MahsunHHH. (2009)99 . SoSS cial Netttwwow rk
(
(
(hthttpp:/://d/diigilib.iitsts.ac.id/public/ITS-NonDegree-75488-747405040000155--babab2.pdf)ff
Gamb
mb
mba
a
ar seb
b
bel
e
ah kiri me
meru
r
pakan ga
am
mbar
origin
nal
al
dan gamb
mb
bar
a
a
seb
eb
eb
el
el
el
ah
ah
ah
kana
a
an
ad
ad
adal
al
alah
a
a
ga
am
am
ba
r hasil dari thr
resh
s
olding
g
C.
Segmentasi Citra
a
Se
Segm
gmen
enta
tasi
si citra
(i
(
(
mage segmentation)
)
merupa
paka
kan
n
ba
bagi
gian
an
dar
ar
ar
i
i
i pros
os
s
es
es
es
pengolahan citra. Proses segment
nt
ntas
as
asi
i
i
citr
r
r
a m
a
a
m
merupakan suatu proses pra pengola
la
la
ha
ha
han
n
n
pa
pa
p da
da
da
sistem pengenalan objek dalam citra. Segmentasi citra mempu
pu
pu
ny
ny
nya
ai
ai
a
a
ar
rti
me
me
memb
mb
mbag
ag
ag
i
i
i su
su
su
atu
at
t
u
ci
c
ci
tr
tra
r
a
a
menj
me
me
nj
njad
ad
ad
i
i
wi
wi
wila
la
la
ya
ya
yah
h
h
-wi
wi
wi
laya
la
la
ya
ya
h
h
h ya
ya
ang
ng
ng
hom
h
h
om
om
og
o
og
en
en
e
ber
b
b
er
r
da
da
dasa
sa
sa
rkan
rk
rk
n
n
k
k
k
ri
ri
ri
t
teria
tert
rt
ten
en
en
tu
u
u a
a
a
nt
nt
nt
ar
ar
ar
a
a
a
ti
ti
ting
ng
g
ka
ka
ka
t
t
t keabuan su
su
suatu piksel
l
d
d
dengan ting
g
gka
ka
ka
t ke
ke
keab
ab
ab
uan
ua
ua
n
n
pi
pi
pi
ks
ks
s
e
el
el–piiksel
–
tetangganya. Hasil dari proses seg
eg
egmentasi in
ini akan digunakan untuk proses tingkat
n
lebih lanjut yang dapat dilakuka
ka
an pada su
ua
u
tu citra, misalnya proses klasifikasi
citra ataupun proses identifikasi su
u
uatu ob
ob
obyek (Saif et al., 2013 ; Al-amri et al.,
2010 ; Gupta et al., 2012).
suatu bagian yang sangat penting dalam analisis citra secara otomatis, karena pada
prosedur ini obyek hasil segmentasi akan digunakan untuk proses selanjutnya,
misalnya: pada pengenalan pola.
Beberapa teknik segmentasi citra diantaranya: thresholding,
Connected
Component Labeling (CCL) dan segmentasi berbasis Clusterring seperti Iterasi,
K-means, fuzzy C-means dan SOM. Pada penelitian ini, metode segmentasi yang
digunakan adalah Connected Component Labeling (CCL). Metode ini sangat
cocok digunakan dalam proses pemisahan karakter yang terdapat pada sebuah
citra. Pada penelitian ini, proses segmentasi karakter digunakan pada saat
melakukan pemisahan karakter yang terdapat pada ekspresi matematika.
D.
Connected Component Labeling
Salah satu metode dari segmentasi adalah Connected Component
Labeling.
Connected Component Labeling adalah sebuah algoritma
pengelompokan sederhana yang bertujuan untuk mengisolasi, mengukur, dan
mengidentifikasi potensi daerah obyek dalam citra (Rajaraman & Chokkalingam,
2013). Metode ini akan menghasilkan sebuah citra dengan label baru yang sudah
terkait satu sama lainnya antar sesama komponen. Dengan metode ini, akan
dilakukan segmentasi untuk memisahkan setiap karakter yang terdapat pada citra.
Operasi pelabelan dari daerah obyek akan memberikan nama atau nomor
yang unik ke semua piksel bernilai 1 yang termasuk dalam daerah tersebut. Hasil
pelabelan adalah komponen individu yang dapat diekstraksi. Algoritma
Connected Component Labeling dapat bekerja pada citra biner dengan
misalnya: pada pengenalan po
po
po
la
la
la.
Beberapa t
tek
ek
ek
n
nik segmentasi citra diantaranya:
:
:
th
t
resholding,
Connected
Component La
La
Labeling
(CCL) da
a
a
n
n
n
se
se
se
gm
gm
gm
en
en
en
ta
ta
ta
si
s
s
b
b
b
er
e
basis
Clusterr
r
rin
in
ing
seperti Iterasi,
K-K
K mean
an
ans, fuzzy C-
C
C me
e
ean
ans
an
s
s
da
d
d
n
SOM
M
M
.
Pada pen
elit
l
itia
it
ia
an
n
in
ini,
in
i
i
metode segm
m
mentasi yang
di
i
ig
g
gunakan
n
n
ad
ad
adal
al
al
ah
a
a
Conn
nn
nnec
e
ted Compon
o
ent Labeli
ling
ng
ng
(C
(
CL
L
L)
)
).
M
M
M
e
et
e
ode in
i
i
i
sangat
cocok
k
k
di
di
di
gu
gu
gu
naka
ka
a
n
n
n
dala
am
m proses pemis
isahan karakter
r
yang
t
t
t
er
e
e
dapa
a
a
t pa
t
t
pa
pada
d
d
seb
b
buah
ci
i
i
t
t
t
ra
ra
ra
.
P
P
Pada
a penelitian in
a
ini,
i, proses se
egmentasi k
karakter digu
un
n
nakan
n
n pa
pa
pada saa
a
at
me
me
me
la
la
la
kuka
ka
kan
n
pe
pemisahan karakt
kter
er yang t
ter
rdapat p
pad
ada ekspresi mat
tem
emat
at
tik
i
a.
D
D
.
Connected Compon
nen
e
t
t La
Labeling
Sa
S
lah satu
u
m
m
m
et
et
et
od
od
d
e
e
da
da
da
ri segment
t
t
as
as
as
i
i
i
ad
ad
ad
al
al
al
ah
ah
ah
Connected
C
d
C
Co
Compon
n
nen
en
ent
t
t
La
L
L
beling.
Connected
Componen
en
ent
t
t
Labeling
L
L
adalah sebuah algo
o
o
ri
ri
ri
tm
tm
m
a
pe
pe
peng
ng
ngel
el
el
om
om
o
pokan sederhana yang bertujuan untuk mengisolasi, me
me
eng
ng
ng
uk
uk
ukur
ur
ur,
d
d
dan
me
me
meng
ng
ngiden
ti
i
fi
fi
fik
k
ka
si p
i
i
p
p
ot
ot
ot
en
en
en
si
si
si d
d
daerah
h
h ob
obye
ob
yek
ye
k
k
da
da
da
la
la
lam citra
(R
(R
(R
ajar
aj
aj
ar
ar
aman
&
&
& Chokk
kk
kkal
al
alin
in
ngam,
2013
3)
3
)
).
Me
M
M
tode
e
e
i
i
i
ni
ni
ni akan menghasi
si
silk
l
l
an seb
b
b
u
u
uah citra dengan
n
n
l
l
l
ab
ab
ab
el
b
ba
a
ru
ru
ru
y
yang sudah
terkait satu sama lainnya antar
r
r sesama k
k
komponen. Dengan metode ini, akan
dilakukan segmentasi untuk mem
m
mis
i
i
ahkan se
e
etiap karakter yang terdapat pada citra.
Operasi pelabelan dari daera
ra
ah ob
b
byek akan memberikan nama atau nomor
yang unik ke semua piksel bernilai 1 ya
y
ng termasuk dalam daerah tersebut Hasil
menggunakan metode 4-connectivity atau 8-connectivity (Asano & Tanaka, 2010).
Proses pelabelan dilakukan dengan menggunakan sebuah penanda yang berfungsi
untuk mencari titik p yang menunjukkan piksel tempat label akan diberikan pada
daerah
foreground. Ketika kondisi bernilai benar maka akan dilakukan
pengecekan ke seluruh titik tetangga dari p (tergantung dari jumlah
n-connectivity). Jika semua tetangga adalah background maka akan diberikan label
baru pada p. Tetapi apabila hanya satu tetangga yang bernilai foreground maka
label p sama dengan label tetangga. Dengan begitu, setiap karakter akan diberi
label yang berbeda sehingga karakter yang satu dengan karakter yang lain dapat
dipisahkan berdasarkan label yang dimilikinya.
Gambar 3.2 dan 3.3 akan menunjukan contoh hasil dari penerapan metode
connected component labeling pada sebuah citra.
Gambar 3.2 Contoh citra biner
Dikutip dari : Rajaraman (2013). Connected Components Labeling and Extraction Based Interphase Removal from Chromosome Images
untuk mencari titik p yang m
m
m
en
en
enunjukkan p
ik
ik
ik
se
se
se
l
l tempat label akan diberikan pada
daerah
foreground
d
d
. Ketika kondisi bernilai benar
r
r maka akan dilakukan
pengecekan
n
k
k
ke seluruh titik tet
et
et
an
an
an
gg
gg
gg
a
a
a
da
d
d
ri
ri
ri
p
p
p
(tergantung
g
g dari jumlah
n-connec
c
ct
t
tivity
). Jika se
e
emu
mu
mu
a
t
t
tetangga adalah
back
kgr
rou
ou
o
nd
nd
nd m
m
maka akan di
i
ibe
b
b
rikan label
ba
a
a
r
r
ru pada
a
p.
p
p
T
T
T
et
et
et
api ap
ap
ap
ab
ab
ab
ila hanya sa
i
il
at
tu tetangga ya
ya
ang
ng
ng
berni
ni
nila
la
lai
i
i
fo
fo
foreground
nd
n
maka
label
p
p
p
sa
sa
sa
ma
m
m
d
d
d
e
en
engan
la
label tetangga. D
Dengan begitu,
u,
s
etiap
p
p
karakt
kt
kt
er
er
er
aka
a
a
k
k
n di
di
dibe
b
b
ri
la
a
a
be
be
bel
l
l ya
y
ng
g
b
b
berbeda sehin
ngg
gga karakter
r y
yang satu d
de
engan karakter
er
r yan
n
ng
g
g
la
la
la
in dap
a
at
a
di
di
dipi
pi
pis
s
sahk
k
kan
an
b
ber
e
dasarkan label
el y
yang dimi
milikiny
ya
a.
Gambar 3.2
2 da
dan
n 3
.
3 akan
an m
men
nun
nju
uk
kan
n contoh
h
h
has
asil
il
d
ari penera
ra
apan meto
o
de
de
de
co
c
nnec
c
cted component labeli
ling
ng
pa
ad
da sebua
ah
h ci
citr
ra.
a.
Gambar333.2 CoCoontoh citra biner
Gambar 3.3 Contoh citra hasil proses connected component labeling
Dikutip dari : Rajaraman (2013). Connected Components Labeling and Extraction Based Interphase Removal from Chromosome Images
Salah satu metode yang dapat digunakan untuk proses connected
component labeling adalah 8-Connectivity Sequential Connected Component
Labeling. Hasil dari proses ini berupa matrix label yang berasal dari citra biner.
Algoritma
8-connectivity sequential connected component labeling merupakan
jenis algoritma two-pass dari connected component labeling. Algoritma ini akan
menelusuri citra sebanyak dua kali (two-pass). Berikut merupakan alur dari
metode connected component labeling:
Gambar 3.4 8-connectivity neighbourhood Ga
Ga
Gambar 333.333Contoh citra hasilpproses connected coompmpmponent lalalabebeb lililingnn Dikukukutitip dariri : Rajaraman (201313). Connected Coompm onennntststs Labbelinnnggg an
an
and ExtractionnBBased Interphasee Removal fromm CChromosome e eImageseses
S
S
Salah
h sa
satu metode ya
yang d
dap
pat d
dig
igu
unakan untuk
uk
p
ro
se
se
es
co
co
conn
nn
nnec
e
e
ted
d
compo
on
onent labeling
ad
adal
alah
a
8
8-
-Co
Conn
nnec
cti
iv
vity
ty Seq
eque
uent
ntia
ial Connected
Compon
n
nen
en
ent
La
L
L
beli
i
in
ng. Hasil dari proses in
ini
i
berupa matrix
x
label yang berasal dari
l
i
citra
a
a
b
b
biner
r
r
.
Algori
i
it
tm
tma
a
8
8-co
co
conn
nn
nne
ec
ectivity
y seq
que
ent
nt
ntial conn
n
ne
ec
ected comp
p
pon
nen
en
ent
t
t
la
labe
beli
ling
ng
merupa
a
a
ka
ka
kan
n
n
je
je
jenis algoritma
two-pass
-
dari
connec
c
c
te
te
ed
d component labeling.
d
Algoritma in
n
n
i
i
i ak
ak
ak
a
a
an
me
me
mene
ne
ne
lusu
su
suri
ri
ri
c
c
cit
it
it
ra
ra
ra
s
s
s
eb
eb
eb
an
a
an
ya
ya
k
k
k
du
du
du
a kali (two-pa
-
pa
pass
ss)
ss
)
)
.
Be
Be
e
ri
ri
ri
ku
ku
ku
t
t
t
me
me
me
ru
ru
ru
pa
pa
pa
kan
ka
k
n
al
al
alur
ur
ur
d
d
dari
me
me
1.
Telusuri citra dari kiri ke kanan, atas ke bawah
2.
Fase
scanning: (pass pertama), Jika piksel (A) adalah foreground maka
cek piksel tetangganya.
a.
Jika B adalah foreground maka labeli A sama seperti label B
b.
Selain itu jika C adalah foreground
maka labeli A sama seperti
label C
c.
Selain itu jika D adalah foreground
maka labeli A sama seperti
label D
d.
Jika E adalah foreground maka:
1)
Jika A belum berlabel maka labeli A sama seperti label E
2)
Jika A sudah berlabel maka catat hal ini dalam Equivalent
Map
e.
Jika B,C,D dan E adalah background
maka labeli A dengan label
baru dan tambahkan jumlah objek yang ditemukan
3.
Tahap analisis: Dari Equivalent Map disiapkan remapping array untuk
proses perbaikan pada matrix label.
4.
Fase
Labeling: (pass kedua), Perbaiki label pada matrix menggunakan
remapping array.
Matrix label kemudian akan ditelusuri untuk mendapatkan daftar dari
obyek-obyek yang ada pada gambar beserta informasi lokasi dan ukuran dari setiap label.
cek piksel tetangganya
ya
ya.
a. Jika
a
B
B
B adalah
foreground
maka labeli A
sa
sa
sa
ma
m
seperti label B
b.
b.
b. Selain itu jika C
C
C
ad
ad
ad
al
al
al
ah
ah
h
fore
fo
fo
re
regr
gr
gro
o
ound
maka lab
b
bel
el
el
i
i
A sama seperti
label
C
C
C
c
c
c. Se
Se
Se
lain i
i
i
tu
tu
tu
j
j
jik
ik
a
D adalah
a
foreground
nd
nd
ma
m
m
ka
l
l
l
abel
ab
ab
el
el
i
i
i
A sama
a
a seperti
la
la
la
b
b
be
l
D
D
d
d
d.
Ji
ka E adala
lah
h
foregrou
und
nd maka:
1) Jika A
A b
bel
e
um b
ber
rlabel ma
mak
ka labeli A sama
ma
sep
s
ep
perti
l
l
lab
ab
ab
el
el
el
E
2)
2) Ji
Jika A sud
udah
ah
b
ber
rlabe
bel m
maka c
cat
atat
at h
hal ini dalam
m
m
Equivale
e
en
n
nt
Map
e. Jika
ka
B
B
B
,C
C
C
,D
D
D
d
d
d
an
an
an
E
E
E
adalah
back
ck
ckgr
gr
grou
ound
nd
nd
ma
ma
ma
ka
ka labeli A de
de
den
ngan lab
ab
ab
el
el
el
baru dan tambahkan
ju
ju
juml
ml
mlah
ah
ah objek yang ditemukan
3
3
3.
Tahap analisis: Dari Equivalent Map
disiapkan
remapping
g
g
ar
ar
arra
a
ay
y
y
un
un
unt
t
tuk
proses per
ba
ba
ba
ik
ik
ik
an
an
an pada ma
a
trix
tr
tr
ix
ix l
l
l
ab
ab
abel
el
el
.
4.
4
4
Fa
Fa
F
se
La
La
abe
be
beli
li
ling: (pass
((
kedu
du
dua), Perb
rbaiki label pad
rb
ad
d
a
a
a
m
m
ma
trix
i
m
m
m
e
e
enggunakan
remapping array.
Matrix label kemudian akan ditel
l
l
u
us
u
uri
i
i untuk mendapatkan daftar dari
obyek-obyek yang ada pada gambar beserta i
in
nformasi lokasi dan ukuran dari setiap label
E. Ekstraksi
Fitur
Choudhary & Rishi (2011) dan Kader & Deb (2012) berpendapat bahwa
proses ekstraksi fitur merupakan proses menandai dan menyimpan semua fitur
dari hasil segmentasi karakter. Fitur adalah suatu bentuk informasi atau
karakteristik dari segmen yang bisa dijadikan sebagai tanda pengenal dari bentuk
segmen karakter tersebut, oleh karena itu fitur harus unik untuk tiap bentuk
karakter.
Ekstraksi fitur akan mengubah huruf / angka yang terdapat dalam citra
menjadi susunan kode angka (yaitu angka 0 dan 1). Ekstraksi fitur berfungsi untuk
mengubah suatu pola menjadi bit-bit digital sehingga dapat dimengerti oleh
komputer.
F.
Learning Vector Quantization
Menurut Soleiman & Fetanat (2014), Learning Vector Quantization
(LVQ) adalah suatu metode yang melakukan pembelajaran pada lapisan
kompetitif yang terawasi.
Lapisan kompetitif akan secara otomatis belajar untuk
mengklasifikasikan vektor-vektor input. Kelas-kelas yang diperoleh sebagai hasil
dari lapisan kompetitif ini hanya tergantung pada jarak antara vektor-vektor input.
Apabila beberapa vektor input memiliki jarak yang sangat berdekatan, maka
vektor-vektor input tersebut akan dikelompokan dalam kelas yang sama. Metode
yang digunakan untuk menghitung jarak vektor pada jaringan LVQ adalah
Euclidian Distance, dengan demikian waktu yang diperlukan untuk melakukan
proses pengenalan pola relatif cepat. Hal ini sangat cocok diterapkan pada aplikasi
proses ekstraksi fitur merupa
pa
pa
ka
ka
kan proses men
en
enan
an
a
dai dan menyimpan semua fitur
dari hasil segment
nt
nt
a
asi karakter. Fitur adalah suatu
tu
u bentuk informasi atau
karakteristik
k
k
d
d
dari segmen yang
b
b
b
is
s
s
a
a
di
d
d
ja
ja
ja
di
di
di
ka
ka
ka
n se
se
s
bagai tanda pe
e
eng
ng
ng
enal dari bentuk
segmen
en
en karakter ters
rs
rs
eb
eb
b
ut
ut
ut,
,
,
oleh karena itu fi
f
fitu
t
r
r
ha
ha
haru
ru
us
s unik untuk
k
k tiap bentuk
ka
a
a
r
r
rakter.
Ek
Ek
Ek
st
st
s
raks
ks
s
i
i
i
fitur ak
a
an menguba
ah
h huruf / angk
ka
a
yang
g
g terda
d
pa
pa
pat
t
t da
da
da
la
l
m
ci
c
c
tra
me
me
me
nj
nj
nj d
ad
adi su
us
su
sunan kode ang
gka
k
(yaitu an
ng
gka 0 dan 1)
1).
.
Ek
straksi fitu
u
ur
r
r
berf
rf
fun
un
un
gs
g
gsi untu
u
uk
k
me
me
me
ng
n
n
ub
b
a
ah
ah
s
sua
u
tu pola menj
njad
adi bit-b
bit
t digita
al
l
sehingga dap
pat
at
d
d
im
im
men
gert
ge
ge
rt
rt
i
i
i
oleh
h
kompu
u
ute
t
r.
F.
Le
L
arning
g V
Vec
ec
ecto
tor
to
r
r Qu
Qu
Quan
an
anti
t
t
zation
Menurut Soleiman & Fet
t
t
an
an
anat
t
t (
(
(2014),
Learning Vector Quantiza
za
zati
ti
io
on
o
(L
(L
(LVQ
VQ
VQ)
)
)
adalah suatu metode yang melakukan pembelajaran pa
pa
pa
da
da
da
l
l
lap
ap
apis
is
san
ko
ko
komp
mp
mpetit
if
if yang tera
f
ra
ra
wa
wa
wasi
si.
si
Lapisa
a
a
n
n
n
ko
ko
komp
mp
mpet
etit
et
it
iti
if akan
se
se
se
ca
ca
cara
ra
r
ot
toma
tis
i
bela
la
la
ja
ja
ja
r u
untuk
u
k
meng
g
kl
kl
kl
as
as
a
if
fi
ikas
as
s
ik
ik
ik
a
a
an vektor-vektor
r
r input. Ke
Ke
Kelas-
kelas yang
d
d
d
ip
ip
ip
er
e
ol
leh
h
h
s
s
s
eb
eb
ebagai hasil
dari lapisan kompetitif ini hanya
tergantung
g
pada jarak antara vektor-
vektor input.
a
Apabila beberapa vektor input
me
m
m
miliki
jarak yang sangat berdekatan, maka
vektor-vektor input tersebut akan d
d
dik
i
i
elom
om
ompokan dalam kelas yang sama. Metode
h
yang digunakan untuk menghitung jarak vektor pada jaringan LVQ adalah
berbasis
mobile yang membutuhkan operasi perhitungan yang sangat cepat,
sehingga aplikasi yang dibangun dapat berjalan dengan optimal.
1.
Arsitektur Jaringan LVQ
Metode LVQ dapat digunakan untuk proses pengelompokan dimana
jumlah kelompok telah ditentukan sesuai dengan rancangan arsitekturnya
(target/kelas sudah ditentukan). Menurut Chen, Tsai & Yang (2010), LVQ
merupakan salah satu metode pembelajaran yang handal dalam melakukan
pengklasifikasian. Soleiman & Fetanat (2014) berpendapat bahwa pada jaringan
LVQ, lapisan kompetitif akan belajar untuk mengklasifikasikan vektor input
terhadap lapisan input yang terdapat pada jaringan LVQ.
Umer & Khiyal (2007) berpendapat bahwa arsitektur jaringan LVQ dapat
dikelompokan atas tiga bagian yaitu: input layer, competitive layer (hidden layer),
dan
output layer. Pada input layer berisi vektor-vektor input yang
mendeskripsikan fitur / ciri dari sekumpulan pola yang akan dikenali. Pada
competitive layer, setiap lapisan unit akan melakukan clustering / pengelompokan
terhadap vektor input. Hasil clustering diperoleh dari perhitungan jarak (euclidian
disctance) antara vektor input dengan lapisan unit. Vektor-vektor input yang
memiliki jarak euclidian yang sangat berdekatan dengan salah satu lapisan unit,
maka vektor input dan lapisan unit tersebut akan dikelompokan ke dalam kelas
(class) yang sama. Sedangkan pada output layer berisi jumlah target yang
merepresentasikan jumlah kelas yang terdapat pada jaringan LVQ.
1.
Arsitektur J
J
Ja
a
aringan LVQ
Meto
o
o
d
de
de LVQ dapat di
di
di
gu
u
u
na
na
na
ka
ka
ka
n
n
n
un
un
un
tu
u
u
k
k
k
pr
p
oses penge
e
elo
lo
lo
mpokan dimana
jumlah
h
h kelompok
te
te
tela
la
a
h
h
h
ditentukan sesuai
i
i
de
de
deng
ng
ng
an
an
an rancangan
a
a
a
rsitekturnya
(t
t
t
a
a
ar
ge
t/kela
la
as
s
s
su
su
su
da
d
d
h di
i
i
tent
te
te
ntuk
an
). Menu
n
rut Chen,
Ts
Ts
T
ai &
&
&
Y
Y
Yan
an
ang
g
g
(2010)
0)
0),
,
LVQ
merupa
pa
pa
ka
ka
ka
n
n
n
sala
la
la
h
h
h satu
u metode pemb
mbelajaran yang
g
hand
nd
dal
a
a
dal
alam
am
am
m
m
m
elak
ku
uk
u
an
pe
e
e
ng
ng
n kl
kl
kl
a
asifik
ik
ik
as
ian. Soleima
man
n
& Fetan
nat
t (2014) be
erp
rpendapat bahw
hw
hwa pa
a
ada
da
da
j
jaringa
a
an
n
LV
LV
LV
Q
Q
Q
, la
a
api
pisa
san
n
kompetitif a
aka
kan bela
aja
ar
untu
uk
k
me
ngklasifikas
sik
ikan
an
n vek
k
k
to
to
to
r
r
r
i
in
i
put
t
terhada
a
ap lapisan
i
np
put
ut y
yang terd
dap
pat
a
p
pad
da ja
jari
in
ngan LVQ
VQ.
Umer & Khiyal (20
007
07)
) be
ber
rpendapa
at
t b
bahw
hwa arsitektur jaringan
n
LVQ d
d
dapa
a
at
dike
lo
lo
lo
m
mp
mpokan atas
s ti
ti
tiga
ga
ga
b
b
b
ag
ag
ia
ia
ia
n
n
n
ya
ya
y
itu: input la
a
aye
ye
yer
r
r,
c
com
om
ompe
pe
peti
ti
t
ti
tive layer (
(hi
hi
idd
dd
dden lay
y
y
er
er
er),
),
),
da
d
n
output layer. Pada
input
t
t
la
ay
a
y
yer
berisi vektor-vektor input
y
y
yan
an
ang
me
me
mend
nd
ndes
es
es
kripsikan fitur / ciri dari sekumpulan pola yang akan dik
ik
ik
enal
en
e
al
al
i.
i.
i. P
P
Pa
a
ada
co
co
comp
mp
mpetitive l
l
layer
, se
se
seti
ti
ti
ap
ap
ap
l
l
lapisan u
u
uni
ni
nit
t
t ak
ak
akan
an m
an
melakuk
m
k
k
an
an
an
cl
cl
clus
us
uste
ring /
i
/ peng
g
el
el
el
om
om
om
p
p
pokan
terhad
ad
adap
ap
ap
vekto
o
o
r
r
r
in
in
input. Hasil cluste
te
tering
dipe
pe
peroleh dari perhi
hi
hi
tu
tu
tu
ng
ng
ng
an j
j
j
ar
ar
ar
ak
ak
ak
(
(euclidian
disctance) antara vektor input
dengan lap
p
pisan unit. Vektor-vektor input yang
memiliki jarak euclidian
yang san
an
angat berd
d
dekatan dengan salah satu lapisan unit,
maka vektor input dan lapisan unit
it
t terse
se
sebut akan dikelompokan ke dalam kelas
(class) yang sama Sedangkan pada
a
output layer
berisi jumlah target yang
Gambar 3.5 Contoh Arsitektur Jaringan LVQ
Dikutip dari Kusumadewi (2004). Jaringan Syaraf Tiruan. Hal 296
dimana:
X
= Vektor Masukan (x
1,…,x
2,…,x
n)
F
= Lapisan kompetitif
Y_in
= Masukan kelapisan kompetitif
Y
= Keluaran (Output)
W
= Vektor bobot untuk unit keluaran
||x - w|| = Selisih nilai jarak Euclidean antara vektor input dengan vektor
bobot untuk unit Output
Gambar 3.5 adalah arsitektur jaringan LVQ (Learning Vector
Quantization)
yang terdiri dari 6 node
lapisan masukan (Input layer),
2
node
lapisan tersembunyi (Hidden layer) serta 2 node lapisan keluaran (Output layer).
Lapisan
input memiliki 6 node
yang disimbolkan dengan nilai x1, x2, x3, x4, x5,
Ga
Gambar 3.5 Contohoh Arsitektur Jaringngaan LVQ
Dikutip dari KKususumadewi (200004). Jaringan SSyyaraf Tiruan. Haall l296