BAB 2 LANDASAN TEORI

(1)

BAB 2

LANDASAN TEORI

2.1. Computer Vision

Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

dunia yang dilihat dalam satu atau lebih citra dan merekonstruksikan properti-properti yang ada seperti bentuk, iluminasi dan distribusi warna (Szeliski, 2011, p. 3).

Baik manusia maupun hewan dapat dengan sangat mudah mendeskripsikan citra, seperti mendeskripsikan objek, cahaya, bayangan, nama orang, ekspresi wajah, dan sebagainya, sedangkan algoritma Computer Vision sangat rentan terhadap kesalahan. Secara umum, kesulitan untuk menangkap perseptual suatu citra dapat dianggap sama dengan kesulitan pada algoritma kognitif seperti pembuktian logika dan perencanaan pada bidang Artificial Intelligence (Szeliski, 2011, p. 3).

2.2. Citra Digital

Citra dapat dinyatakan sebagai suatu fungsi dua dimensi , dengan maupun adalah posisi koordinat sedangkan merupakan amplitudo pada posisi , yang sering dikenal sebagai intensitas atau grayscale (Gonzalez & Woods, 2002, p. 1). Ketika nilai , , dan amplitudo terbatas dan bernilai diskrit, citra tersebut dikatakan sebagai citra digital.

Pemrosesan citra digital menunjuk ke suatu proses pengolahan suatu citra sebagai

input dan output dengan tujuan untuk melakukan ekstraksi atribut dari citra tersebut

(2)

2.3. Properti Cahaya pada Citra Digital

Suatu citra digital merupakan komposisi dari sampel titik-titik (pixel) yang merepresentasikan nilai intensitas atau warna. Nilai-nilai ini berasal dari pencahayaan, refleksi, dan bayangan. Fenomena yang berhubungan dengan persepsi citra yang ditangkap pada mata manusia meliputi kecerahan (brightness) dan kontras.

2.3.1 Illumination/Lighting

Iluminasi atau pencahayaan merupakan properti cahaya yang ada pada scene yang disebabkan oleh adanya sumber cahaya. Sumber cahaya secara umum dapat dibedakan menjadi sumber titik dan sumber cahaya area (Szeliski, 2011, p. 54).

Sumber cahaya titik berasal dari satu lokasi tertentu pada space, misalnya cahaya lampu ataupun titik yang berasal dari jarak tak hingga seperti cahaya matahari. Sumber cahaya memiliki intensitas dan spektrum warna. Sumber cahaya area merupakan kumpulan dari sumber cahaya titik pada suatu area, misalnya lampu fluorescent. Sumber cahaya area cenderung untuk menyebarkan intensitas cahaya yang sama ke semua objek pada scene.

Iluminasi diukur sebagai jumlah cahaya (photon) yang mencapai permukaan objek. Satuan iluminasi adalah lux/m2 atau lumens/m2. Iluminasi dapat diukur menggunakan lux meter. Semakin dekat sumber cahaya terhadap area yang disinari, semakin tinggi pula nilai iluminasinya.

Iluminasi yang jatuh pada suatu permukaan dapat disimbolkan dengan . Pada suatu citra digital, distribusi iluminasi untuk setiap pixel dapat disimbolkan dengan

(3)

2.3.2 Reflectance

Reflektansi adalah properti pada cahaya yang menyebar/dipantulkan jika cahaya tersebut jatuh pada permukaan objek. Nilai reflektansi dapat diukur dengan menghitung rasio cahaya yang dipantulkan terhadap jumlah cahaya yang datang. Reflektansi dapat disimbolkan dengan , sedangkan distribusi reflektansi pada suatu citra dapat disimbolkan dengan , (Rahman, 1995).

Berikut adalah model reflektansi menurut Szeliski (2011, p. 55). 1. Bidirectional Reflectance Distribution Function (BRDF)

BRDF merupakan fungsi empat dimensi yang mendeskripsikan seberapa banyak gelombang yang datang pada arah insiden yang dipantulkan pada arah . Fungsi BRDF dapat ditulis sebagai , , , ; .

Gambar 2.1 M odel Bidirectional Reflectance Distribution Function

Fungsi BDRF bersifat resiprokal, karena peran dan dapat dipertukarkan tanpa mengubah hasil. Kebanyakan permukaan bersifat isotropik, karena arah cahaya yang pada permukaan tidak menentu. Untuk permukaan isotropik, BRDF dapat disederhanakan menjadi , , | |; atau , , ; .

2. Diffuse Reflection

Komponen diffuse sering disebut sebagai refleksi matte/Lambertian. Komponen ini akan menyebarkan cahaya pada jumlah yang sama ke segala arah. Dengan

(4)

3. Specular Reflection

Refleksi spekular merupakan pemantulan sempurna seperti cermin. Cahaya yang datang dan menyentuh permukaan objek akan direfleksikan ke satu arah sesuai dengan hukum pemantulan cahaya (law of reflection) yang menyatakan bahwa sudut datang adalah sama dengan sudut pantul ( ).

4. Phong Reflection

Refleksi Phong adalah model empiris untuk iluminasi lokal. Phong mendeskripsikan refleksi cahaya suatu permukaan sebagai kombinasi dari refleksi

diffuse pada permukaan kasar, refleksi spekular pada permukaan yang berkilau,

dan faktor dari ambient illumination yang merupakan cahaya yang berasal dari hasil pemantulan sekitarnya (misalnya dinding, langit).

2.3.3 Luminance

Luminansi dideskripsikan sebagai banyaknya cahaya yang melewati atau dipancarkan dari suatu area. Luminansi diukur pada suatu permukaan yang merefleksikan cahaya, sehingga merupakan hasil perkalian antara iluminasi dan reflektansi. Luminansi seringkali digunakan untuk mengukur refleksi dari suatu permukaan (Land & McCann, 1971).

Nilai luminansi mengindikasikan jumlah cahaya yang akan terdeteksi oleh manusia yang melihat pada permukaan pada sudut tertentu. Oleh karenanya, luminansi merupakan indikasi seberapa besar kecerahan (brightness) pada permukaan akan dipersepsikan.

Pada citra digital, luminansi dapat disimbolkan dengan yaitu intensitas tiap pixel pada citra. Nilai ini merupakan perkalian antara nilai iluminasi dan reflektansi pada

(5)

2.3.4 Brightness

M eskipun citra digital ditampilkan sebagai kumpulan elemen intensitas yang diskrit, manusia mampu membedakan antara level intensitas yang berbeda. Brightness (kecerahan) merupakan intensitas yang dipersepsikan oleh manusia, sehingga bersifat subjektif. Penelitian menunjukkan bahwa kecerahan subjektif merupakan fungsi logaritma dari intensitas cahaya (luminansi) yang masuk ke mata (Gonzalez & Woods, 2002, p. 38).

Gonzales dan Woods (2002, p. 40) menambahkan bahwa kecerahan yang dipersepsikan tidak hanya terbatas pada fungsi intensitas karena dua fenomena, yaitu fenomena Mach Bands dan kontras simultan. Fenomena Mach Bands merupakan fenomena yang menunjukkan bahwa manusia cenderung menambahkan atau mengurangi persepsi kecerahan pada batas antara area yang memiliki intensitas berbeda. Fenomena kontras simultan menunjukkan bahwa intensitas suatu area dapat lebih terang dan lebih gelap tergantung dari area di sekitarnya.

2.3.5 Contrast

Kontras adalah perbedaan pada properti visual yang membuat suatu objek pada citra dapat dibedakan dengan objek yang lainnya. Pada persepsi visual, kontras ditentukan dari perbedaan dalam warna dan kecerahan dari objek dan objek lainnya jika dilihat dari tempat dan waktu yang sama. Karena sistem visual manusia lebih sensitif terhadap kontras daripada daripada luminansi absolute pada citra, manusia dapat mendeskripsikan citra meskipun terdapat perbedaan iluminasi yang besar (Peli, 1990).

(6)

2.4. Color Model

Color model (atau color space atau color system) adalah suatu model matematika

yang mendeskripsikan cara agar warna-warna dapat direpresentasikan sebagai tuplet angka. Tujuan model warna ini adalah suatu standar untuk spesifikasi warna. Esensinya, model warna digambarkan pada sistem koordinat. Setiap warna direpresentasikan sebagai titik koordinat (Gonzalez & Woods, 2002, p. 289).

2.4.1 RGB

Pada model RGB, setiap warna merupakan komponen spektral utama, yaitu merah, hijau, dan biru. M odel RGB ini berbasis sistem koordinat. Komponen merah, hijau, dan biru merupakan komponen utama. Warna hitam merupakan origin, sedangkan putih merupakan warna pada titik terjauh dari origin. Pada model ini, warna abu-abu (titik yang memiliki nilai RGB sama) berada pada garis dari titik hitam hingga putih (Gonzalez & Woods, 2002, p. 290).

Citra RGB direpresentasikan dalam tiga komponen citra R, G, dan B. Ketika citra tersebut ditampilkan pada monitor, ketiga citra akan digabungkan pada layar untuk menghasilkan citra komposit.

2.4.2 CMYK

Cyan, magenta, dan yellow (CM Y) merupakan warna sekunder dari cahaya, atau

warna primer dari pigmen. Jika suatu permukaan dengan pigmen cyan disinari dengan putih, maka tidak ada warna merah yang dipantulkan. Hal ini dikarenakan cyan mengurangi warna merah dari cahaya putih (Gonzalez & Woods, 2002, p. 294).

Alat-alat yang digunakan untuk mencetak citra membutuhkan input data CM Y atau memerlukan konversi RGB ke CM Y secara internal. Konversi ini dilakukan dengan

(7)

operasi sederhana: , , 1,1,1 , , dengan asumsi nilai RGB sudah dinormalisasi.

Dalam prakteknya, warna hitam sulit diproduksi dengan mengkombinasikan warna C, M, dan Y. Oleh karenanya, untuk memproduksi warna hitam, digunakan warna keempat, yaitu hitam sehingga model CM YK dikenal dengan K sebagai black (hitam).

2.4.3 HS V

HSV (Hue, Saturation, Value) merupakan projeksi dari model RGB ke sudut

chroma non-linear, persentase saturasi radial, dan nilai luminansi. Secara lebih detail, value didefinisikan sebagai nilai rata-rata atau maksimum dari nilai warna, saturation

didefinisikan sebagai jarak dari diagonal, dan hue didefinisikan sebagai arah dari warna (Szeliski, 2011, p. 79).

M odel HSV memisahkan komponen intensitas dari citra warna, sehingga model ini merupakan model yang ideal untuk mengembangkan algoritma pemrosesan citra yang intuitif dan natural (Gonzalez & Woods, 2002, p. 295).

2.5. Retinex

2.5.1 Konsep Retinex

Konsep Retinex berawal dari pemikiran Edwin H. Land dan John J. M cCann (1971, p. 1) mengenai cara manusia mempersepsikan warna suatu objek. Hipotesis awal dari Land adalah warna dari suatu objek bergantung dari jumlah cahaya yang masuk ke mata, namun hal tersebut tidak sepenuhnya benar. Penelitian Land menunjukkan bahwa jumlah cahaya yang masuk ke mata tidak menentukan warna objek.

(8)

Cahaya yang masuk ke mata didefinisikan sebagai luminansi yang merupakan perkalian antara iluminasi dan reflektansi. Land melakukan percobaan dengan menggunakan variabel iluminasi sebagai variabel kontrol dan menunjukkan bahwa persepsi warna suatu objek tidak bergantung pada iluminasi, tetapi bergantung pada reflektansi absolut dari objek tersebut (Land & M cCann, 1971).

Skema yang mendeskripsikan persepsi warna ini disebut sebagai Retinex karena melibatkan bagian retina dan korteks. Sistem retina merupakan sistem yang memiliki sedikitnya tiga reseptor yang mampu menerima cahaya gelombang pendek (biru), sedang (hijau), dan panjang (merah). Berbeda dengan sistem pengambilan citra pada kamera, citra yang dibentuk oleh masing-masing reseptor tidak langsung digabungkan, tetapi dibandingkan oleh korteks yang digunakan untuk merespon luminansi. Persepsi luminansi ini disebut sebagai kecerahan (lightness/brightness). Pemrosesan pada korteks cenderung mengkorelasikan reflektansi pada objek dengan baik, sehingga manusia dapat dengan baik mendeskripsikan warna suatu objek di bawah kondisi iluminasi bervariasi.

Untuk memformulasikan Retinex, terdapat dua gagasan yang dikemukakan.

1. Penelitian tentang dua persegi (gambar 2.2) menunjukkan bahwa garis tepi antara dua area mempengaruhi kecerahan. Ketika garis tepi dihilangkan atau ditutup dengan suatu benda, maka kedua area persegi akan memiliki kecerahan yang sama. Berdasarkan pengamatan, atribut tepi dalam hal ini tidak harus bersifat tajam, namun juga bisa bersifat kabur.

(9)

Gambar 2.2 Dua persegi dengan kecerahan berbeda

Dengan mengasumsikan bahwa dua titik yang berdekatan memiliki iluminasi yang sama, maka rasio luminansi dari dua titik tersebut akan mendekati rasio reflektansinya. Oleh karenanya, dengan suatu prosedur mengambil rasio dari dua titik berdekatan dapat mendeteksi tepi sekaligus mengeliminasi efek dari iluminasi yang bervariasi.

2. Jika diberikan prosedur untuk mendapatkan rasio reflektansi dari dua area yang berdekatan (dijelaskan pada nomor 1), maka rasio reflektansi dari dua area yang berjauhan dapat dihitung dengan cara mengalikan semua rasio dari area-area yang membentuk jalur dari area yang satu ke area yang lain.

(10)

Sebagai contoh, pada gambar 2.3 diberikan figur M ondrian (lukisan dengan bentuk kotak-kotak). Area paling atas memiliki luminansi sebesar 0,75. Area terbawah memiliki luminansi 0,12. Rasio reflektansi didapat dengan mengalikan semua rasio pada jalur yang ditemui. Diasumsikan bahwa luminansi tepi adalah sama dengan luminansi daerah pusat, maka rasio reflektansi area paling atas dengan area paling bawah adalah = 6,25. Selain dapat menentukan rasio area paling atas dengan paling bawah, prosedur ini menghasilkan nilai rasio reflektansi semua area yang ada pada jalur.

M elalui gagasan di atas, maka Retinex bekerja pada jalur dengan mengalikan rasio luminansi untuk mendapatkan rasio reflektansi. Rasio luminansi pada gambar 2.3 merupakan luminansi area, sedangkan citra digital menggunakan elemen pixel. Land mengemukakan asumsi: “jika elemen pixel yang digunakan, rasio yang mendekati 1 dianggap memiliki nilai 1 untuk melakukan toleransi variasi iluminasi”. Konsep ini disebut juga dengan thresholding (Land & M cCann, 1971, p. 6).

Setiap jalur yang dipilih dan dilalui membuat semua area memiliki nilai reflektansi relatifnya dengan area lain. Nilai reflektansi pada area pertama pada jalur dianggap memiliki reflektansi absolut terbesar, misalnya 100. Jalur-jalur yang berbeda dapat memberikan hasil yang berbeda terhadap reflektansi absolut. Dengan merata-ratakannya, maka akan diketahui reflektansi absolut yang nilainya mendekati nilai sesungguhnya. Sebagai contoh, area A, B, C, D, E, F, G masing-masing memiliki nilai luminansi {60, 20, 40, 100, 60, 80, 30}. Jika jalur bergerak dari A ke G, maka diperoleh reflektansi absolut {100, 33, 67, 100, 60, 80, 30}. Jika jalur bergerak dari G ke A, maka

(11)

akan diperoleh reflektansi absolut {60, 20, 40, 100, 75, 100, 100}. Dengan meratakan kedua hasil reflektansi absolut dari kedua jalur, diperoleh reflektansi absolut rata-rata sebesar {80, 27, 53, 100, 68, 90, 65} yang mendekati nilai reflektansi sesungguhnya. Konsep Retinex dengan menggunakan jalur merupakan Retinex versi statis yang kemudian direvisi oleh Land (1983, p. 1) dan Provenzi (Provenzi, Carli, & Rizzi, 2005).

Retinex versi dinamis dikembangkan oleh Land (1983, p. 1), Rahman (Rahman, 1995),

Jobson, Woodell (Jobson & Woodell, 1995), dan Provenzi (Provenzi, Carli, & Rizzi, 2005) untuk komputasi yang lebih sederhana.

2.5.2 Formulasi Retinex

Berikut adalah formulasi Retinex menurut Provenzi (Provenzi, Carli, & Rizzi, 2005, p. 2614).

Diberikan citra digital, asumsikan terdapat koleksi jalur dengan merupakan nilai channel R, G, dan B. Jalur dikomposisikan sebagai rangkaian pixel dimulai dari

dan berakhir di . Didefinisikan merupakan jumlah pixel yang dilalui pada jalur dan 1, … , . Untuk semua jalur , :{1, ..., }, 1 dan .

Untuk kesederhanaan, digunakan simbol untuk pixel ke pada jalur , misalnya dan 1 , untuk 1, … , 1. Jika setiap pixel memiliki intensitas (nilai R, G, B) yaitu , maka rasio intensitas

(12)

Formula untuk menghitung nilai kecerahan (L) pada pixel generik ke- diberikan sebagai berikut.

1

merupakan fungsi. : , 1, … , . 1 dan untuk setiap 1, … , 1, jika 0 1 1 jika 1 1 jika 1 1 ∏ 1 ∏ jika 1 ∏

Simbol menyatakan threshold yang digunakan agar algoritma dapat melakukan toleransi terhadap perubahan intensitas, misalnya gradien sebagai reaksi iluminasi.

Pilihan pertama pada fungsi berlaku jika intensitas pixel lebih kecil daripada intensitas pixel sebelumnya, , maka akan mengembalikan nilai .

Pilihan kedua berlaku jika terdapat perubahan kecil pada intensitas kedua pixel. Pada kasus ini, didefinisikan menjadi 1, sehingga perkalian rasio sebelumnya tidak mengalami perubahan.

Pilihan ketiga berlaku jika rasio lebih besar dari 1 , namun hasil perkalian … belum mencapai nilai intensitas maksimum (1 ), sehingga menghasilkan seperti pada piihan pertama.

(13)

Jika hasil perkalian … lebih besar dari intensitas maksimum (1 , maka rangkaian nilai perkalian tersebut akan diset menjadi 1, yang berarti nilai lokal maksimum sudah dicapai. Pilihan ini mengimplementasikan mekanisme reset.

Formula Retinex di atas dapat dirumuskan ulang dalam bentuk fungsi logaritma. M enurut Provenzi (2005, p. 2615), hal ini lebih diimplementasikan karena transformasi logaritma mengubah perkalian menjadi penjumlahan dan perkalian menjadi pengurangan, sehingga mengurangi biaya komputasi algoritma. Untuk konstruksi logaritma tersebut, fungsi identitas dilakukan pada hasil perkalian yang selalu bernilai positif.

1

exp log

1

exp log

Jika log , log , 0, maka

fungsi menjadi 0, dan untuk setiap 1, … , 1,

jika ∞ ̃ 0 jika ̃ ̃

jika ̃ ̃

(14)

Simbol ̃ disederhakan menjadi log 1 . Dengan demikian, formula logaritma untuk Retinex statis dapat dirumuskan ulang menjadi sebagai berikut.

1

exp

2.5.3 Single-S cale Retinex

Single-Scale Retinex (SSR) atau Surround Retinex merupakan Retinex versi

dinamis yang dikemukakan oleh Land (1983, p. 5165) untuk meniru sistem kerja neuron pada sistem persepsi warna manusia. Berbeda dengan Retinex statis, Retinex versi dinamis tidak menggunakan jalur, tetapi menggunakan fungsi sekitar (surround function) untuk meradiasikan intensitas ke pixel sekitarnya.

Berikut formulasi Single-Scale Retinex menurut Rahman (1995), Jobson, dan Woodell (1995).

, log , log , ,

, merupakan output Retinex. , adalah distribusi citra pada pixel ke , . Simbol “*” menyatakan operator konvolusi. , merupakan fungsi Gaussian yang didefinisikan sebagai berikut. Simbol menyatakan channel warna, misalnya R, G, dan B.

, , /

Nilai adalah konstanta Gaussian yang mengatur seberapa jauh kurva Gaussian menyebar. Nilai dapat memiliki hubungan dengan nilai standar deviasi , yaitu

(15)

ditentukan sedemikian rupa , 1. Hubungan nilai dengan standar deviasi yaitu

√ . Fungsi Gaussian dapat ditulis kembali sebagai berikut.

, , 1 √2

Operasi Retinex di atas dilakukan untuk setiap channel R, G, B untuk menghasilkan citra dengan warna konstan (independen terhadap iluminasi). Ide komputasi ini berawal dari definisi luminansi sebagai perkalian antara iluminasi dan reflektansi.

, , ,

, merupakan distribusi iluminasi sekitar , dan , merupakan distribusi reflektansi sekitar, maka rasio luminansi titik , dengan titik sekitar dapat dicari sebagai berikut.

, ,

,

, , , ,

Dengan asumsi bahwa nilai iluminasi sekitar , memiliki nilai sama atau mendekati dengan nilai iluminasi titik , , maka rasio luminansi akan mendekati rasio reflektansinya. Kemudian, dengan melakukan operasi logaritma yang menurut Rahman (1995) sangat tepat untuk memproduksi hasil yang terbaik pada fungsi sekitar, maka Single-Scale Retinex diformulasikan menjadi , log ,

, log ,

(16)

2.6. Multi-S cale Retinex

Multi-Scale Retinex (M SR) dikembangkan (Jobson, Rahman, & Woodell, 1997)

karena keterbatasan yang dimiliki oleh Single-Scale Retinex (SSR), yaitu sebagai berikut. 1. SSR mampu melakukan kompresi jarak dinamis (Dynamic Range

Compression/DRC) pada citra jika digunakan pada skala rendah, sehingga

memungkinkan citra dengan jarak dinamis sangat lebar dikompresi dengan melakukan penguatan bagian gelap dan melemahkan bagian yang terang. Pada skala besar, SSR mampu menghasilkan citra dengan lebih alami dengan impresi kecerahan yang besar pada area. M asalah yang dihadapi SSR adalah SSR tidak mampu melakukan kedua hal tersebut sekaligus.

2. SSR cenderung untuk membuat area berwarna sama menjadi berwarna abu-abu, terutama jika digunakan skala rendah (Barnard & Funt, 1998).

3. Kasus yang jarang terjadi adalah citra output SSR dapat mengalami distorsi/pergeseran warna (Barnard & Funt, 1998).

Untuk mengatasi masalah SSR, skala yang berbeda digunakan dan diberi bobot yang berbeda untuk menggabungkan kelebihan dan menghilangkan kelemahan yang dimiliki dari skala rendah dan skala besar. Ide ini merupakan dasar dari Multi-Scale

Retinex. Berikut adalah formulasi original dari Jobson, Rahman, dan Woodell (1997).

merupakan output dari Multi-Scale Retinex (M SR) yang merupakan jumlah dari output SSR yang masing-masing diberi bobot. adalah jumlah skala yang

(17)

digunakan. adalah bobot yang diasosiasikan dengan skala ke- . merupakan

output dari SSR yang diasosiasikan dengan skala ke- . Simbol menyatakan channel

warna, misalnya R, G, dan B.

Fungsi Gaussian yang digunakan oleh ditulis kembali sebagai berikut.

, , / 1

√2

Simbol menyatakan parameter yang diberikan untuk fungsi Gaussian yang memiliki hubungan dengan standar deviasi , yaitu 2 . Berdasarkan formula M SR tersebut, konstruksi M SR ditentukan oleh parameter-parameter berikut.

1. Jumlah skala ( )

M enurut Jobson (1997), jumlah skala yang digunakan adalah 3 sebagai jumlah skala minimum yang menyediakan output yang baik berdasarkan persepsi visual dan waktu komputasi yang cepat.

2. Skala yang digunakan (

Berdasarkan eksperimen oleh Jobson (1997), Skala yang digunakan harus terdiri dari skala rendah ( 20 , sedang ( 80 , dan tinggi ( 200). Skala rendah digunakan untuk mengkompresi jarak dinamis dan memberikan detil pada citra yang gelap dan terang. Skala sedang digunakan untuk mengurangi efek “halo” yang berada di sekeliling tepi, sekaligus untuk memberikan impresi natural. Skala tinggi digunakan untuk memberikan kecerahan seperti citra natural.

3. Bobot untuk skala tiap output SSR

Berdasarkan eksperimen oleh Jobson (1997), bobot yang merata sudah cukup untuk aplikasi. Jika 3, maka 1 3⁄ , 1, 2, 3.

(18)

2.7. Ekualisasi Histogram

Subbab ini akan membahas teori mengenai ekualisasi histogram yang diperlukan agar dapat digunakan sebagai perbandingan dengan metode Multi-Scale Retinex.

Histogram dari suatu citra digital dengan level intensitas 0, 1 adalah fungsi distribusi disktret dengan adalah level intensitas ke- dan adalah jumlah

pixel pada citra yang memiliki nilai intensitas (Gonzalez & Woods, 2002, p. 88).

Histogram merupakan basis dari teknik pemrosesan citra berbasis spasial (manipulasi langsung pixel suatu citra). M anipulasi histogram dapat digunakan untuk memperbaiki kualitas citra. Selain itu, histogram berperan dalam menyediakan statistik citra yang berguna, serta mudah dan cepat dikalkulasikan, sehingga sering digunakan dalam pemrosesan citra secara real-time (Gonzalez & Woods, 2002, p. 88).

Ekualisasi Histogram (atau linearisasi histogram) adalah suatu teknik pemrosesan citra yang memetakan input pixel dengan intensitas ke nilai output pixel dengan intensitas berdasarkan distribusi kumulatif histogram (Gonzalez & Woods, 2002).

Jika distribusi peluang histogram dinyatakan sebagai , 0, 1, 2, … , 1 dengan adalah jumlah pixel yang memiliki intensitas dan adalah jumlah pixel pada citra, maka distribusi kumulatif peluang histogram dapat dinyatakan sebagai ∑ . Fungsi ekualisasi histogram, , dapat ditulis sebagai berikut.

(19)

2.8. Koreksi Gamma

Subbab ini akan membahas teori mengenai koreksi gamma yang diperlukan agar dapat digunakan sebagai perbandingan dengan metode Multi-Scale Retinex.

Koreksi gamma memetakan input pixel dengan intensitas ke output pixel dengan intensitas secara non-linear dengan menggunakan fungsi pangkat (Gonzalez & Woods, 2002, p. 80).

Nilai gamma, , adalah nilai konstan. Nilai input pixel dan merupakan nilai intensitas yang sudah dinormalisasi, sehingga memiliki nilai di antara 0 dan 1.

Nilai , jika diberi nilai 1, maka akan menjadikan fungsi tersebut menjadi fungsi identitas. Jika 1, maka citra output akan cenderung lebih terang, sedangkan jika

1, output citra akan cenderung lebih gelap dari citra awal.

Suatu konsep yang salah menyatakan bahwa koreksi gamma digunakan untuk mengompensasikan hasil output yang merupakan fungsi pangkat dari CRT/cathode ray

tube. Koreksi gamma suatu citra digunakan untuk mendekati properti dari penglihatan

manusia yang mendekati fungsi pangkat (Poynton, 1998).

2.9. Sistem Pengenalan Wajah

Sistem pengenalan wajah merupakan aplikasi komputer yang digunakan untuk mengidentifikasi atau memverifikasi seseorang dari suatu citra wajah. M enurut Jain et al. (2007, p. 2), sistem pengenalan wajah secara umum terdiri dari empat modul, yaitu:

(20)

1. Deteksi wajah

Proses deteksi wajah berusaha untuk menentukan segment-segment bagian wajah agar terpisah dengan bagian latar (background). Sebuah pendeteksi wajah yang ideal mampu mengidentifikasi dan menemukan lokasi semua wajah yang ada di dalam sebuah citra tanpa memperhatikan posisi, skala, orientasi, umur, dan ekspresi. Dalam kasus video, deteksi wajah biasanya dilakukan dengan cara

tracking, yaitu mendeteksi berdasarkan citra sebelumnya tanpa deteksi ulang,

sehingga dapat dilakukan secara real time. 2. Alignment

Proses alignment berusaha untuk mendapatkan lokalisasi yang lebih akurat dan menormalisasikan wajah. Suatu citra wajah dinormalisasikan sesuai dengan properti geometriknya seperti ukuran wajah dan orientasi wajah dengan menggunakan transformasi atau perubahan bentuk. Citra wajah biasanya kemudian dinormalisasi lagi berdasarkan properti fotometrik, seperti iluminasi.

3. Ekstraksi fitur wajah

Ekstraksi fitur merupakan proses untuk mengekstrak atau mengambil informasi yang terdapat pada citra wajah yang sudah dinormalisasi. Hasil proses ini adalah vektor fitur (feature vector) yang merupakan bentuk lain dari representasi citra wajah.

4. Pencocokan fitur

Proses pencocokan fitur (feature matching) merupakan proses membandingkan vektor fitur yang merupakan hasil ekstraksi citra input dengan vektor fitur yang ada pada database. Dalam hal ini, database adalah kumpulan beberapa orang yang sudah diidentifikasi beserta vektor fiturnya dan dibuat berdasarkan proses

(21)

pendaftaran (enrollment). Tingkat kesamaan tertentu antara vektor fitur dengan database mengindikasikan suatu wajah yang dikenali atau sebaliknya.

Gambar 2.4 Alur pemrosesan pengenalan wajah

Hasil dari sistem pengenalan wajah sangat bergantung pada hasil ekstraksi yang merepresentasikan wajah dan metode klasifikasi yang digunakan untuk membedakan wajah yang satu dengan wajah yang lain, sementara normalisasi dan lokalisasi merupakan basis untuk mengekstraksi fitur yang efektif (Jain, Flynn, & Ross, 2007, p. 3).

2.10. AForge.NET

Aforge.NET merupakan library yang dikhususkan pada bidang Computer Vision dan Artificial Intelligence yang secara original dikembangkan oleh Andrew Kirillov untuk framework .NET dalam bahasa pemrograman C# dan C++.

Aforge.NET merupakan projek yang open source. Kode sumber dan binary dari Aforge.NET tersedia pada website www.aforge.com dan berada di bawah lisensi LGPL.

Versi pertama dari Aforge.NET dirilis ada tanggal 21 Desember 2006. Kode Aforge.NET berfokus pada pemrosesan citra. Kemudian, kode tersebut menjadi awal dari projek open source. Versi yang pertama kali memiliki paket instalasi adalah versi 1.2.0 yang dirilis 15 M aret 2007. Versi Aforge.NET yang paling baru adalah versi 2.2.3 yang

(22)

dirilis 12 Desember 2011 dengan ukuran paket instalasi sebesar 31,5 M b, ukuran dokumentasi adalah 13,3 M b, dan jumlah file sumber sebanyak 455 dengan total ukuran 3,71M b.

Fitur-fitur AForge.NET yang digunakan pada skripsi ini adalah fitur pada

framework AForge.Imaging yang memiliki fungsi-fungsi pemrosesan citra yang umum,

meliputi konvolusi, ekualisasi histogram, koreksi gamma, dan manipulasi pixel secara langsung menggunakan class seperti UnmanagedImage dan BaseFilter.

2.11. EmguCV

EmguCV merupakan pembungkus (wrapper) .NET untuk library OpenCV yang digunakan untuk pemrosesan citra. Library OpenCV (Open Source Computer Vision) sendiri merupakan library yang digunakan untuk pemrosesan pada Computer Vision secara real time, dikembangkan oleh Intel dan didukung oleh Willow Garage. Dengan menggunakan EmguCV, fungsi OpenCV dapat dipanggil melalui bahasa yang kompatibel dengan .NET, seperti C#, VB, VC++, IronPython, dan sebagainya.

Versi terbaru EmguCV adalah versi 2.3.0. Versi ini mengikuti versi OpenCV versi yang sama, yaitu 2.3.0.

Fitur-fitur pada EmguCV yang digunakan dalam skripsi meliputi fungsi untuk deteksi objek wajah dan fungsi untuk pengenalan wajah menggunakan class dengan nama

EigenObjectRecognizer. Pengenalan wajah ini menggunakan metode Principal Component Analysis untuk mengekstraksi fitur pada citra wajah.