BAB II DASAR TEORI
2.2. Pemrosesan Citra
Analisa dokumen citra mempunyai tujuan untuk mengenali komponen
tulisan dan gambar yang terkandung dalam citra serta mengambil informasi yang ada
dalam citra itu sendiri. Analisa citra dokumen mempunyai 2 komponen penting yaitu
pemrosesan textual dan pemrosesan grafis.
Pemrosesan citra merupakan salah satu tahap dalam analisa dokumen citra
yang berfungsi untuk mempersiapkan citra yang akan dianalisa. Pemrosesan citra
sendiri mempunyai tujuan agar citra dapat lebih mudah dan lebih cepat untuk
diproses.
Dalam Pemrosesan citra, beberapa tahap yang akan dilakukan dapat
dijabarkan sebagai berikut :
1. Grayscaling
Citra grayscale merupakan citra dimana representasi setiap piksel diwakili
dengan hanya satu jenis atau satu nilai warna dalam skala keabuan. Untuk
mendapatkan nilai intensitas keabuan, maka dapat dihitung dengan
menjumlahkan 30% dari nilai channelRed pada citra RGB, 59% channel Green,
dan 11% channel Blue. Hasil penjumlahan dari setiap elemen tersebut, yang
kemudian akan direpresentasikan dalam setiap channel Red, Green dan Blue
dengan nilai intensitas yang sama.
2. Tresholding
Tresholding atau yang disebut juga sebagai gray – level segmentation (pemisahan
warna dalam skala keabuan) merupakan proses pengubahan dari sebuah citra
dengan skala keabuan menjadi citra biner atau citra dengan 2 intensitas warna
yaitu hitam dan putih.
3. Thinning
Thinning atau skeletonization merupakan proses dimana citra yang telah
dibinerkan akan direduksi hingga yang tersisa merupakan garis tengah atau
kerangka dari objek. Tujuan dari proses thinning adalah mencari informasi dasar
dari citra sehingga dapat mempermudah analisis pada tahap selanjutnya.
2.3 Thinning
2.3.1 Pengertian Thinning
Secara garis besar, thinning dapat diartikan sebagai proses pereduksian
wilayah dari tepi objek berupa citra hingga yang tersisa merupakan garis tengahnya
saja atau dapat disebut juga sebagai skeleton atau kerangka. Skeleton atau kerangka
oleh J.R. Parker (1997) diasumsikan sebagai representasi bentuk dari suatu objek
dalam jumlah piksel yang relatif kecil (sedikit), yang dimana kesemuanya merupakan
bagian yang struktural, oleh karena itu representasi itu menjadi dibutuhkan. Sebuah
kerangka diharapkan dapat merepresentasikan bentuk dari sebuah objek dalam
jumlah piksel yang relatif kecil, yang dimana semuanya saling berkaitan dan
merupakan yang terpenting. Dalam garis yang ada pada kerangka, dapat terwakili
informasi yang ada pada citra yang sesungguhnya.
Dalam konsep yang telah dikembangkan oleh banyak orang, J.R. Parker
(1997) mengemukakan bahwa tidak semua objek dapat dikenai operasi thinning, dan
hasil dari operasi thinning itu sendiri yang disebut sebagai kerangka mempunyai
kemungkinan untuk tidak berfungsi disemua situasi. J.R. Parker (1997) juga
mengemukakan bahwa thinning merupakan operasi untuk mengidentifikasi kerangka
sebuah objek, operasi thinning itu sendiri tidak didefinisikan oleh algoritma yang
digunakan.
2.3.2 Definisi thinning
Thinning mempunyai beberapa definisi atau metode berdasarkan uraian yang
dikemukakan oleh J.R. Parker (1997), yang diantaranya adalah sebagai berikut :
1. Medial Axis Transform
Medial Axis Function (MAF) mungkin merupakan definisi yang diperkenalkan
oleh Blum pada tahun 1967. MAF memperlakukan semua batas piksel terluar
objek sebagai titik–titik sumber dari wave front (gelombang tepi). Setiap piksel
membangkitkan setiap titik tetangganya (titik yang berhubungan) agar menjadi
bagian dari wave front. Gelombang ini melewati setiap titik hanya satu kali dan
ketika dua gelombang bertemu mereka akan saling membatalkan dan
menghasilkan sudut. Medial axis (poros tengah) merupakan tempat dimana sudut
itu berada dan saling membentuk skeleton. Metode Medial Axis Transform yang
diterapkan pada sebuah objek huruf T dapat diilustrasikan pada gambar 2.2
berikut (J.R. Parker, 1997):
Gambar 2.2 contoh hasil Medial Axis Transform seperti yang diuraikan J.R. Parker (1997)
2. Iterative Morphological Method
Mayoritas dari algoritma thinning didasarkan pada penghilangkan lapisan–
lapisan piksel hingga tidak ada lagi lapisan yang dapat dihilangkan. Pada
penerapannya, ada beberapa aturan yang digunakan dalam penghilangan lapisan
piksel. Dan kadang - kadang, proses pencocokan dengan template digunakan
untuk mengimplementasikan metode ini. Algoritma thinning Stentiford
merupakan salah satu contoh dari metode ini. Penjelasan secara detail dari
algoritma Stentiford akan dibahas pada bab ini.
Algoritma Stentiford yang diterapkan pada huruf T dapat diilustrasikan pada
gambar 2.3 di bawah ini:
Gambar 2.3 Contoh iterasi pada huruf T yang terjadi dalam algoritma Stentiford seperti yang diungkapkan oleh J.R. Parker (1997)
3. Contour Based Method
Contour Based Method merupakan cara lain dalam mendapatkan kerangka dari
sebuah objek. Metode ini bekerja dengan mendeteksi bentuk terluar dari objek.
Contour Based Algorithm mempunyai alur inti sebagai berikut :
1. Mendeteksi bagian / bentuk terluar dari objek.
2. Mengidentifikasi piksel dari bagian yang tidak dapat dihapus.
4. Jika ada bagian piksel yang telah dihapuskan pada langkah 3 , ulangi dari
langkah pertama.
Metode ini mencoba untuk menyingkirkan penggunaan template 3 x 3 dalam
operasinya.
4. Line Following (Line Tracing)
Line Following merupakan salah satu metode dalam mengidentifikasi dan
mendapatkan kerangka dari objek. Metode ini bekerja dengan menggunakan
pointer untuk menentukan arah dari garis.
5. Memperlakukan objek sebagai Polygon
Cara lain untuk melakukan operasi thinning dapat dilakukan dengan
memperlakukan batas terluar (boundary) objek sebagai polygon sebelum
diidentifikasi kerangkanya. Memperlakukan batas luar objek sebagai polygon
dapat diilustrasikan dengan gambar 2.4 berikut:
Gambar 2.4 ilustrasi polygon dan kerangkanya seperti yang diungkapkan oleh J.R. Parker (1997)
6. Force Based Thinning
Forced Based Thinning juga merupakan salah satu metode untuk
mengidentifikasi kerangka objek. Metode ini bekerja, pertama dengan mencari
piksel background yang mempunyai setidaknya satu objek piksel sebagai
tetangganya dan memberi tanda. Piksel ini akan diasumsikan memberi penekanan
gaya berlawanan ke semua objek piksel, semakin dekat jarak piksel disekitarnya
dengan piksel yang ditandai ini, maka semakin besar gaya tekan yang akan
didapat. Daerah gaya ini dipetakan dengan membagi-bagi daerah menjadi
kotak-kotak kecil dan menghitung gaya yang bekerja pada sudut-sudut kotak-kotak. Kerangka
(skeleton) dari objek terletak di dalam kotak yang mempunyai gaya bekerja di
sudutnya mempunyai arah yang saling berlawanan.
2.4Algoritma Thinning Stentiford
Algoritma Thinning Stentiford pertama kali diperkenalkan oleh F. W. M.
Stentiford dan R. G. Mortimer. Algoritma Stentiford menggunakan template
berukuran 3 x 3 untuk melakukan pencocokan dengan citra. Ketika kecocokan
terjadi, titik tengah dari piksel 3 x 3 tersebut akan dihapus (diubah warnanya ke
warna putih).
Algoritma Stentiford menggunakan 4 buah template, yaitu :
M1 M2 M3 M4
Gambar 2.5. Template yang digunakan StentifordTanda X yang dijabarkan pada template mengindikasikan piksel, dimana nilai
pada piksel tersebut dapat bernilai 0 maupun 1.
Algoritma stentiford dapat dijabarkan sebagai berikut :
1. Cari lokasi piksel (i,j) dimana piksel yang ada di citra I, cocok dengan
template M1.
2. Jika titik tengah piksel bukan merupakan endpoint (titik akhir) dan
mempunyai indeks konektivitas = 1, maka tandai piksel ini untuk
penghapusan.
3. ulangi langkah 1 – 2 untuk semua lokasi piksel yang cocok dengan template
M1.
4. ulangi langkah 1 – 3 untuk sisa template yang belum dicocokkan : M2, M3,
M4.
5. jika ada piksel yang telah ditandai sebelumnya untuk proses penghapusan,
maka hapuskan piksel tersebut dengan mengubahnya menjadi warna putih.
6. jika masih ada piksel yang dapat dihapus pada langkah ke 5, maka ulangi
semua proses mulai dari langkah ke – 1, jika tidak berhenti
Setiap Template mempunyai fungsi yang berbeda – beda. M1 berfungsi untuk
mencari piksel-piksel yang dapat dihilangkan pada bagian tepi atas objek, bergerak
dengan arah kiri ke kanan atas ke bawah. M2 akan mencocokkan pada bagian tepi
kiri dari objek, template ini bergerak dengan arah dari bawah ke atas, dari kiri ke
kanan. M3 akan mencari piksel–piksel sepanjang tepi bawah bergerak dari kanan ke
kiri, bawah ke atas. M4 akan mencocokan piksel–piksel pada bagian kanan objek
dari atas ke bawah, kanan ke kiri.
Dalam proses tersebut, ditemukan beberapa permasalahan. Yaitu ketika
proses penghapusan menemui sebuah endpoint. Sebuah piksel disebut Endpoint
(Titik ujung) ketika piksel tersebut hanya terhubung dengan 1 piksel diantara 8 piksel
disekitarnya. Ketika proses dilakukan dan endpoint tersebut akan dihapus, Semua
bagian dari citra yang berupa garis lurus, kurva terbuka akan ikut terhapus.
Indeks Konektivitas adalah konsep yang dikembangkan untuk mengurangi
masalah tersebut. Indeks Konektivitas merupakan ukuran untuk menentukan
seberapa banyak objek akan terhubung dengan sebuah piksel. Untuk menghitung
indeks konektivitas dapat digunakan rumus:
(N N N )
N
C
k k k s k k n +1 +2 ∈⋅
⋅
−
=∑
Dari konsep konektivitas tersebut, dapat diilustrasikan:
C1 C2 C3 C4 C0
Gambar 2.6 : Ilustrasi konektivitas piksel tengah dengan 8 piksel disekitarnyaN
kmerupakan nilai warna dari salah satu dari delapan tetangga piksel yang
terlibat, dan S = {1, 3, 5, 7}, N
1adalah nilai warna dari piksel di sebelah kanan dari
piksel tengah dan piksel lainnya diberi nomor secara berurutan mengikuti arah jarum
jam. Posisi dari setiap delapan anggota piksel yang menjadi tetangga dari piksel
pusat, mungkin dapat ditunjukkan dengan gambar 2.7 di bawah ini:
Gambar 2.7 Posisi nomor setiap delapan anggota tetangga