• Tidak ada hasil yang ditemukan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB 1 PENDAHULUAN. 1.1 Latar Belakang"

Copied!
10
0
0

Teks penuh

(1)

PENDAHULUAN

1.1 Latar Belakang

Pengenalan pola atau dikenal dengan sebutan pattern recognition merupakan salah satu cabang sains yang pada dasarnya adalah suatu sistem yang bertujuan mengklasifikasi objek-objek ke dalam kategori-kategori atau kelas-kelas (Theodoridis, 2003), berdasarkan baik pada apriori pengetahuan atau pada informasi statistik yang diambil dari pola. Pola-pola tersebut biasanya diklasifikasikan ke dalam kelompok pengukuran atau pengamatan yang juga menentukan titik-titik ruang multidimensi yang tepat. Suatu sistem pengenalan pola yang lengkap terdiri atas suatu sensor yang mengumpulkan pengamatan untuk diklasifikasi atau digambar, suatu skema mekanisme ekstraksi fitur yang menghitung informasi numerik atau simbolik dari pengamatan, dan skema klasifikasi atau deskripsi yang mengklasifikasikan atau mendeskripsikan pengamatan dengan mengandalkan fitur yang diekstraksi (Wikipedia, 22 Februari 2010).

Berbagai metode dikenal dalam pengenalan pola, seperti analisis diskriminan linier, model hidden markov, k-Nearest Neighbour (kNN), teori Bayes, support vector machine (SVM) hingga metode kecerdasan buatan seperti artificial neural network. Pada umumnya, masyarakat mengenal pengenalan pola hanya dapat diselesaikan dengan metode-metode dalam bidang komputer salah satunya seperti artificial neural network, dan tidak mengenal pengenalan pola secara statistika. Oleh karena itu, dalam penelitian ini penulis mengemukakan pengenalan pola secara statistika yakni dengan menggunakan pendekatan analisis diskriminan linier.

(2)

Desain dari sebuah sistem pengenalan pola terdiri atas tiga aspek sebagai berikut:

1. akuisisi data dan pre-proses 2. representasi data, dan 3. pengambilan keputusan

Proses pada sistem pengenalan pola dimulai dari pemilihan pola sebagai sensor, kemudian pola-pola tersebut masuk ke teknik pemrosesan, bagan representasi, dan terakhir adalah proses pemodelan pembuatan keputusan. Dalam hal ini, empat pendekatan terbaik yang dikenal untuk pengenalan pola ialah:

1. pencocokan template (template matching) 2. klasifikasi statistik

3. sintaktis atau pencocokan struktur, dan 4. jaringan saraf tiruan

Model-model ini tidak independen dan kadang memiliki metode pengenalan pola yang sama dengan perbedaan interpretasi (Jain et. al, 2000).

Pada pengenalan pola terdapat bagan klasifikasi yang digunakan untuk mengelompokkan data. Bagan klasifikasi yang digunakan dalam penelitian ini akan menggunakan pendekatan statistik. Pengenalan pola secara statistik didasarkan pada pola-pola karakterisasi statistik, dengan asumsi bahwa pola-pola yang dihasilkan merupakan suatu sistem probabilitas.

Fukunaga (1990) dalam tulisannya menyajikan cara-cara dasar perhitungan matematika untuk proses pembuatan keputusan secara statistik dalam pengenalan pola. Tujuan utama pattern recognition adalah mengklarifikasikan mekanisasi sulit yang sering ditemukan dalam dunia sehari-hari seperti langkah dalam permainan catur didasarkan pada pola yang ada di papan catur, pembelian atau persediaan penjualan diputuskan melalui suatu pola informasi yang kompleks.

Beragam algoritma dalam statistika dapat diterapkan untuk pengenalan pola seperti teori Bayes, k-Nearest Neighbour (kNN), dan analisis diskriminan linier.

(3)

Dalam penelitian ini, peneliti menggunakan metode Analisis Diskriminan Linier dan perkembangannya yakni metode Analisis Diskriminan Linier 2-Dimensi dan Analisis Diskriminan Linier 2-Dimensi Simetris. Analisis Diskriminan Linier selanjutnya disingkat penulis dengan ADL telah sukses diaplikasikan dalam visualisasi komputer. Peneliti menggunakan metode ini karena metode ini dapat mengklasifikasikan objek-objek dengan baik sehingga terdapat perbedaan antara pola yang memudahkan untuk proses pengenalan pola. Sebagai suatu pendekatan analisis subruang untuk mempelajari struktur berdimensi rendah data berdimensi tinggi, ADL mencari suatu himpunan vektor-vektor yang memaksimumkan Criterion Fisher Discriminant. Metode ini secara simultan meminimumkan sebaran dalam kelas (Sw) dan memaksimumkan sebaran antar kelas (Sb) dalam proyeksi fitur ruang vektor.

1 [ ][ ] k i c T w k i k i i X X S XX    

 

  1 [ ][ ] c T b i i i i S N      

 

dimana Ni adalah jumlah sampel pada kelas

X

i, dan i adalah image rata-rata dari

kelas X , dan i  adalah rata-rata keseluruhan. Rumus rata-rata kelas dan rata-rata keseluruhan adalah sebagai berikut:

1 i i x i x N

 

 adalah mean (rata-rata) dari kelas ke-i, dan 1 1

i k

i x x

N



 

 adalah rata-rata keseluruhan (Fukunaga, 1990).

Metode-metode dasar termasuk Fisherfaces telah diteliti oleh Belhumeur, et. al (1997) dan variansinya telah diteliti sebelumnya oleh Swets dan Weng (1996). Belheumeur et. al (1997) mendiskusikan perbandingan antara Fisherfaces dan Eigenfaces serta menunjukkan bahwa pendekatan ADL lebih baik dibandingkan Analisis Komponen Utama (AKU). Beberapa tahun berikutnya, metode Analisis Diskriminan Linier 2-Dimensi yang kemudian disingkat penulis dengan ADL2-D diperkenalkan oleh Liu et al. (1993). Selanjutnya, Li dan Yuan (2005) dan Xiong et. al (2005) memformulasikan gambar berdasarkan perhitungan matriks sebaran antar kelas dan matriks sebaran dalam kelas. Metode ini tidak mengubah gambar ke dalam vektor sehingga terjadi pereduksian dimensi dari matriks-matriks gambar. Penelitian berikutnya, Song et. al (2005) dan Yang et. al (2003) menggunakan korelasi kolom

(4)

demi kolom untuk mereduksi sejumlah kolom. Kemudian, Yang et. al (2005) memperbaiki dan memberikan suatu algoritma pertama untuk mereduksi banyaknya kolom, dan selanjutnya mereduksi banyaknya baris. Metode ini merupakan algoritma yang dependen. Sebelumnya, Ye et. al (2004) memperkenalkan suatu order bebas (independen) ADL2-D dengan suatu solusi algoritma iterasi. Mereka mempertimbangkan proyeksi data ke dalam suatu ruang yang merupakan produk tensor dalam 2 vektor ruang.

Meskipun metode ADL2-D lebih baik dibandingkan metode ADL klasik, namun metode ini menyisakan suatu problem mendasar yang tidak terpecahkan. Untuk vektor 1-Dimensi, matriks sebaran antar kelas maupun matriks sebaran dalam kelas didefinisikan tunggal. Untuk matriks 2-Dimensi seperti gambar, dan pada umumnya gambar bersifat tidak simetris Xi  XiT, maka matriks sebaran antar kelas maupun matriks sebaran dalam kelas didefinisikan tidak tunggal yakni

( T) ( T ),

b b

S XXS X X ( T) ( T ),

w w

S XXS X X

sehingga terdapat sejumlah pilihan-pilihan yang mungkin untuk menentukan fungsi objektif ADL yang tepat.

1.2 Perumusan Masalah

Analisis Diskriminan Linier 2-Dimensi menimbulkan masalah keraguan dalam sistem pengklasifikasian, sebagai contoh untuk matriks 2-Dimensi seperti gambar, dapat menghasilkan suatu matriks tidak simetris yakni Xi  XiT. Dalam kaitan ini, matriks sebaran antar-kelas (Sb) maupun matriks sebaran dalam-kelas (Sw) didefinisikan tidak tunggal, sehingga terdapat sejumlah pilihan untuk menentukan fungsi objektif ADLD. Oleh karena itu, peneliti mengajukan suatu metode Analisis Diskriminan Linier 2-Dimensi Simetris untuk mengatasi masalah keraguan tersebut dan menentukan fungsi objektif optimum yang tepat.

(5)

1.3 Tinjauan Pustaka

Pengenalan pola merupakan cabang sains yang bertujuan untuk mengklasifikasi objek-objek ke dalam kategori-kategori atau kelas-kelas (Theodoridis, 2003). Aplikasi pengenalan pola sangat luas, di antaranya mengenali suara dalam sistem pengamanan, membaca huruf dalam OCR, mengklasifikasikan penyakit secara otomatis berdasarkan hasil diagnosa kondisi medis pasien, analisis gambar, pengenalan karakter, mengidentifikasi seseorang, dan sebagainya.

Berbagai metode dikenal dalam pengenalan pola, seperti analisis diskriminan linier, model hidden markov hingga metode kecerdasan buatan seperti artificial neural network. Banyak peneliti menggunakan Analisis Diskriminan untuk mengklasifikasikan objek dalam visualisasi komputer. Mereka menggunakan sistem pengklasifikasian umum dengan urutan pengenalan pola sebagai sensor, pengukuran pola, pemilihan pola, pengklasifikasian, dan yang terakhir adalah sistem evaluasi. Selanjutnya, Yu and Dasgupta (2008) menggunakan metode pengenalan pola dengan sebutan Conserved Self Pattern Recognition Algorithm (CSPRA) yang diaplikasikan untuk mendiagosis penyakit kanker payudara. Algoritma ini mendeteksi kasus malignant menggunakan data yang dikumpulkan oleh Dr. Wolberg, kemudian dievaluasi untuk pengukuran rata-rata deteksi dan kesalahan alarm rata-rata. Hasil penelitian ini menunjukkan bahwa pendekatan yang mereka gunakan telah menjanjikan dan memberikan suatu potensi yang besar dalam pendiagnosisan kanker secara klinis.

Sistem pengenalan pola yang selalu digunakan dalam penelitian, dioperasikan ke dalam dua model yaitu: pelatihan (learning) dan pengujian (testing). Peraturan dari modul pemrosesan adalah dengan membagi-bagi pola dari latar belakang, pemindahan noise, menormalisasikan pola, dan pengoperasian lain yang akan terlibat dalam pendefinisian representasi data.

Dalam model pelatihan (learning), modul pengekstrasi fitur atau pemilihan fitur menemukan fitur yang tepat untuk mempresentasikan pola masukan dan kemudian sistem klasifikasi dilatih untuk mempartisi ruang fitur. Tanda panah balik mengikuti suatu rancangan untuk mengoptimisasikan pemrosesan. Dalam model

(6)

klasifikasi, pengklasifikasi terlatih memberikan pola masukan ke salah satu pola-pola kelas dengan pertimbangan berdasarkan fitur-fitur terhitung. Untuk lebih jelasnya mari perhatikan bagan pengenalan dan pengklasifikasian pola berikut (Jain et. al, 2000). test pola Pengklasifikasian Pelatihan latihan pola

Gambar 1.1 : Model pengenalan pola secara statistik

Metode klasifikasi yang digunakan dalam pengenalan pola ini adalah Analisis Diskriminan Linier 2-Dimensi Simetris (ADL2-D Simetris) yaitu perkembangan dari Analisis Diskriminan Linier klasik (ADL klasik). Analisis diskriminan adalah teknik statistika multivariat yang terkait dengan pemisahan (separating) atau alokasi/klasifikasi (classification) sekelompok objek atau observasi ke dalam kelompok (group) yang telah terlebih dahulu didefinisikan. Dalam tujuan pengenalan objek (observasi), metode ini mencoba menemukan suatu ‘discriminant’ yang nilainya secara numeris sedemikian sehingga mampu memisahkan objek yang karakteristiknya telah diketahui. Sedangkan dalam tujuan klasifikasi objek, metode ini akan mensortir objek (observasi) ke dalam 2 atau lebih kelas (Fukunaga, 1990).

Jika diberikan suatu matriks data A R N n, ADL klasik bertujuan untuk menemukan suatu transformasi G R N l yang memetakan setiap kolom a dari

Pemrosesan Pengukuran

fitur Pengklasifikasian

Pemrosesan Pengukuran

(7)

matriks A, untuk 1≤ i ≤ n, dalam ruang dimensi N ke vektor bi dalam ruang dimensi l.

Yakni G : N n T l( )

i i i

a R b G a R l N . Ekivalennya, ADL bertujuan untuk menemukan suatu ruang vektor  direntangkan oleh { }l1

i i

g dimana G= [g1, g2, …,gl], sehingga setiap ai diproyeksikan ke  oleh ( . ,...,1 . )

T T T l

i l i

g a g a  (Ye et. al, 2004).R Asumsikan bahwa data asli dalam A dipartisi ke dalam k kelas sehingga A = { ∏1, ∏2,…, ∏k}, dimana ∏i memuat ni titik data dari kelas ke –i, dan

ki1nin. ADL klasik bertujuan untuk menemukan transformasi optimal G sehingga struktur kelas dari data ruang berdimensi tinggi yang asli diubah ke dalam ruang berdimensi rendah (Ye et. al, 2004).

Dalam metode Analisis Diskriminan Linier, terdapat dua matriks sebaran yaitu matriks sebaran dalam kelas disimbolkan dengan S , dan matriks sebaran antar kelas w disimbolkan dengan Sb didefinisikan masing-masing sebagai berikut:

1 [ ][ ] k i c T w k i k i i X X S XX    

 

  (1.1) 1 [ ][ ] c T b i i i i S N      

  (1.2)

dimana N adalah jumlah sampel pada kelas i

X

i, dan i adalah image rata-rata dari

kelas X , dan i  adalah rata-rata keseluruhan. Rumus rata-rata kelas dan rata-rata

keseluruhan adalah sebagai berikut: 1 i i x i x N

 

 adalah mean (rata-rata) dari kelas ke-i, dan

1 1 i k i x x N



 

 adalah rata-rata keseluruhan (Fukunaga, 1990).

Seperti diutarakan sebelumnya, metode Analisis Diskriminan mengharapkan dapat meminimumkan matriks sebaran dalam-kelas

 

S sementara matriks sebaran antar w kelas

 

S dimaksimumkan. Dalam transformasi linier, sebuah transformasi optimal b

(8)

G akan memaksimumkan ( L b

S ) dan meminimumkan ( L w

S ). Optimisasi umum dalam Analisis Diskriminan Linier meliputi (lihat Fukunaga, 1990) :

1 1

max{ (( ) )} dan min{ (( ) )}

b w

L L L L

w G b

G trace S S trace S S

 

Catatan bahwa trace(A/B) = trace(B-1A) = trace (AB-1).

Penelitian selanjutnya tentang Analisis Diskriminan Linier 2-Dimensi (ADL2-D) yakni suatu metode baru yang merupakan perkembangan dari Analisis Diskriminan Linier. Beberapa tahun belakangan ini, metode-metode ADL2-D ini telah diperkenalkan. Li and Yuan (2005), dan Xiong et. al (2005) memformulasikan gambar berdasarkan perhitungan matriks sebaran dalam kelas dan antar kelas. Metode-metode tersebut tidak merepresentasikan gambar ke dalam vektor sehingga tereduksi secara dimensional ke dalam matriks gambar. Song et. al (2005) dan Yang et. al (2003) menggunakan korelasi kolom demi kolom untuk mereduksi sejumlah kolom. Selanjutnya Yang et. al (2005) memperbaiki dan memberikan suatu algoritma untuk mereduksi bilangan-bilangan pada kolom pertama dan mereduksi bilangan-bilangan pada baris berikutnya. Metode ini merupakan suatu algoritma dependen. Ye et. al (2005) memperkenalkan suatu ADL2-D independen dengan suatu algoritma solusi iteratif.

Untuk Analisis Diskriminan Linier 2 Dimensi, perbedaan utama antara ADL klasik dan ADL2-D yang peneliti usulkan dalam penelitian ini adalah perwakilan (representasi) data. ADL klasik menggunakan representasi vektor, sedangkan D bekerja dengan data dalam representasi matriks. Dalam penggunaan metode ADL2- ADL2-D akan terlihat bahwa representasi mengarah ke eigen-dekomposisi pada matriks dengan ukuran lebih kecil. Lebih khusus, ADL2-D melibatkan eigen-dekomposisi dari matriks dengan ukuran r × r dan c × c, yang jauh lebih kecil daripada matriks ADL klasik (Ye et. al, 2005).

Dalam ADL2-D telah disepakati bahwa suatu himpunan gambar disimbolkan dengan X =(X1, X2, ..., Xn), Xi r c . Dengan intuisi yang sama dengan ADL klasik, ADL2-D mencoba untuk mencari suatu transformasi bilinier

(9)

sehingga kelas-kelas yang berbeda dipisahkan. Kuncinya adalah bagaimana memilih ruang bagian L dan R berdasarkan matriks sebaran dalam kelas dan antar kelas (Luo et. al, 2007).

Tidak seperti ADL klasik, ADL2-D menganggap hal berikut (l 1×l2) - ruang dimensi L⊗R, yang merupakan tensor product (kronecker product) dua ruang berikut: L direntang oleh 1

1 { }l

i i

u dan R direntangkan oleh 1

1 { }l

i i

v . Didefinisikan dua matriks L = [u1, ..., ul] Rr l1 dan R = [v1, ..., vl] Rc l2. Kemudian proyeksi dari XRr c ke ruang L⊗ R adalah LTX R Rl l12 (Ye et. al, 2004).

Meskipun demikian, ADL2-D mempunyai suatu masalah mendasar yaitu masalah keraguan sehingga metode tersebut menimbulkan banyak spekulasi untuk menentukan suatu fungsi objektif optimum. ADL2-D Simetris adalah suatu perkembangan metode dari ADL2-D yang diperkenalkan oleh Luo, et al. (2007). Kontribusi utama dalam penelitian ini adalah untuk memperkenalkan suatu representase data baru untuk memecahkan masalah ambigu dari ADL2-D yang ada. Pendekatan ini didorong oleh satu kunci penelitian: jika gambar simetris, yakni Xi = XiT , maka: ( T) ( T ), w w S XXS X X

(

T

)

(

T

).

b b

S XX

S X X

Kemudian masalah ambigu yang terdapat dalam ADL2-D biasa dapat dipecahkan. Karena alasan ini, peneliti memperkenalkan suatu representasi data baru yang disebut “Transformasi Bilinier.”

1.4 Tujuan Penelitian

Adapun tujuan penelitian yakni untuk menentukan fungsi objektif optimum ADL2-D Simetris dan algoritma untuk mengatasi masalah keraguan yang terdapat pada ADL2-D biasa.

(10)

1.5 Manfaat Penelitian

1. Memberikan manfaat bagi pembaca untuk lebih mengetahui dan memahami tentang pengenalan pola secara statistika dengan pendekatan Analisis Diskriminan Linier 2-Dimensi Simetris yang juga dapat digunakan dalam pengklasifikasian data.

2. Dapat diaplikasikan dalam pengenalan wajah atau klasifikasi objek dalam visualisasi komputer.

1.6 Metodologi Penelitian

Metode ini bersifat literatur dan kepustakaan. Untuk mengatasi masalah keraguan yang terdapat pada Analisis Diskriminan Linier 2-Dimensi biasa dilakukan dengan cara pendekatan sebagai berikut:

1. Terlebih dahulu memahami cara menentukan matriks sebaran dalam kelas (Sw), matriks sebaran antar kelas (Sb) yang merupakan matriks kovarians, matriks R dan L, eigen vektor dari kedua matriks tersebut, dan transformasi bilinier Bl = LTAl R.

2. Menganalisis persamaan-persamaan yang terdapat pada Analisis Diskriminan Linier 2-Dimensi kemudian dengan menggunakan Transformasi Bilinier akan ditentukan fungsi objektif optimum ADL2-D 3. Menguraikan teorema dan kemudian menyelesaikan masalah keraguan

yang terdapat pada ADL2-D biasa

4. Menyusun algoritma sebagai solusi untuk mengatasi masalah keraguan yang dapat digunakan dalam program visualisasi komputer

5. Mengaplikasikan metode baik fungsi objektif maupun algoritma sehingga dapat lebih jelas terurai bahwa metode ADL2-D Simetris memiliki kelebihan dalam hal mengatasi masalah keraguan yang ditimbulkan dalam ADL2-D dan akan diperlihatkan hasil pengklasifikasian yang efisien dan akurat.

Gambar

Gambar 1.1 :  Model pengenalan pola secara statistik

Referensi

Dokumen terkait

H1: (1) Terdapat perbedaan produktivitas kerja antara karyawan yang diberi insentif dengan karyawan yang tidak diberi insentif (2) Terdapat perbedaan

7.4.4 Kepala LPPM menentukan tindakan perbaikan yang harus dilakukan pada periode Pelaporan Hasil Pengabdian kepada masyarakat berikutnya.. Bidang Pengabdian kepada masyarakat

Ketika orang-orang dari budaya yang berbeda mencoba untuk berkomunikasi, upaya terbaik mereka dapat digagalkan oleh kesalahpahaman dan konflik bahkan

Dengan cara yang sama untuk menghitung luas Δ ABC bila panjang dua sisi dan besar salah satu sudut yang diapit kedua sisi tersebut diketahui akan diperoleh rumus-rumus

Dari teori-teori diatas dapat disimpulkan visi adalah suatu pandangan jauh tentang perusahaan, tujuan-tujuan perusahaan dan apa yang harus dilakukan untuk

Penelitian yang dilakukan di TK AndiniSukarame Bandar Lampung betujuan meningkatkan kemampuan anak dalam mengenal konsep bilangan melalui media gambar pada usia

Ketersediaan informasi lokasi rumah sakit, fasilitas dan layanan yang tersedia di rumah sakit dan tempat kejadian dapat tersedia secara jelas dan terkini sehingga penentuan

Alhamdulillahirobbil’alamin segala puji syukur dan sembah sujud, penyusun panjatkan kehadirat Allah SWT, atas rahmat, hidayah, dan kasih sayang-Nya sehingga penyusun