Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan

(1)

(2)



Terdapat banyak jenis pola:

 Pola visual

 Pola temporal

 Pola logikal



Tidak ada tepat satu teori untuk menyelesaikan

problem pengenalan pola



Terdapat model standar yang dapat dijadikan teori

acuan

 Statistik atau Fuzzy

 _{Syntatic atau Struktur}

 _{Berbasis pengetahuan}

Statistical Pattern Recognition

(3)



Problem pengenalan pola didefinisikan

sebagai problem klasifikasi



Daftar kata kunci :



Klasifikasi



_Fitur



Vektor fitur

(4)



Diperlukan suatu sistem untuk melakukan

pengenalan

 Sistem mengenali data kemudian mengklasifikasi data

tersebut berdasarkan pola tertentu ke suatu klas



Contoh aplikasi yang melakukan …

 _{Pengenalan suara}

 _{Identifikasi sidik jari}

 Pengenal karakter secara optik (OCR)

(5)

 Terdapat data dengan pola visual

 _{Data merepresentasikan karakter 26 huruf alfabet}

 _{Definisi problem:}

 Pengenalan pola data yang diklasifikasikan ke 26 kelas

 Data kelas 1 adalah huruf A dengan segala variasi penulisannya, dst

(6)

 _{Data merepresentasikan karakter 26 huruf alfabet}

 Definisi tujuan sistem  mengklasifikasikan data ke 26 kelas

yang ada berdasarkan standar polanya

 Problem yang muncul

 Q₁: Apa yang akan dibandingkan? FITUR

 Q₂: Bagaimana mengukur tingkat kesamaan pola?

standar pola kelas 1

Array nilai tingkat terang pixel

Data dengan pola visual

standar pola kelas 2 standar pola kelas 4 DITERIMA DITERIMA DITOLAK

(7)

 _{Fitur adalah suatu nilai yang dapat membantu sebagai}

pembeda

 _{Contoh dalam klasifikasi huruf cetak}

◦ Dalam penentuan fitur untuk pembandingan perlu …

 tahu luas area huruf

 tahu daerah perbatasan luar huruf

◦ Dalam pengukuran tingkat kesamaan huruf dilakukan …

 Berdasarkan rasio kepadatan luas area penulisan huruf dengan area batas

luar huruf (disebut perimeter) : Huruf B lebih padat daripada huruf O

 Berdasarkan tingkat simetri area huruf bagian atas dengan bawah. Huruf B

lebih simetri daripada huruf P

 _{Beberapa fitur dapat sensitif akan perubahan nilai}

◦ Fitur tingkat kelurusan sisi kiri huruf

 Pola untuk membedakan huruf D atau O

(8)



_{Set nilai sejumlah}

d

_{fitur dihasilkan dari pengukuran}

setiap data yang akan diklasifikasikan

◦ _x₁ _{= area}

◦ _x₂ _{= perimeter, …,}

◦ x_d = panjang garis melengkung / jarak garis lurus



_{Nilai sejumlah}

d

_{fitur dari suatu data disimpan sebagai}

sebuah matrik baris

x



Vektor Fitur

◦ _Vektor

x

_memiliki

d

_{baris = suatu data memiliki}

d

_dimensi

◦ _Vektor

x

_{digambarkan sebagai suatu titik pada ruang fitur}

(9)

 _{Pola suatu data hasil dari pengukuran direpresentasikan dalam}

sebuah vektor

 Pada pengenalan pola terjadi pengurangan jumlah informasi,

pemetaan atau pelabelan informasi

(10)

 _{Sekumpulan ikan diletakkan pada ban berjalan}

 _{Berdasarkan sensor optik, mesin dapat mengelompokkan}

ikan-ikan tersebut sebagai SeaBass dan Salmon

 Analisa problem

 Set posisi kamera untuk mengambil gambar ikan-ikan

 Dari gambar akan diekstrak informasi fitur:

▪ Panjang ikan

▪ Tingkat kecerahan warna sisik ikan

▪ Lebar badan ikan

▪ Jumlah dan bentuk sirip ikan

(11)

sensor optik kumpulan ikan pada ban berjalan pra pemrosesan gambar

ikan-ikan segmentasioperasi gambar untuk

membedakan setiap ikan

ekstraksi

fitur klasifikasi

peng-hasil pengelom-pokkan ikan

salmon seabass

• lebar badan ikan • tingkat

kecerahan warna sisik ikan

(12)

ERROR SALMON

(13)

ERROR

SALMON

NILAI AMBANG BATAS

(14)

 _{Penentuan nilai ambang batas (threshold decision boundary) menentukan}

nilai biaya (cost function)

 _Solusi

 Menambah atau mengurangi nilai ambang batas

14

TEORI KEPUTUSAN

ERROR

SEABASS

Jika nilai ambang batas dikurangi:

•  seabass masuk klas salmon berkurang

•  salmon masuk klas seabass bertambah

(15)

 _{Digunakan fitur lebar ikan dan tingkat kecerahan sisik ikan}

x

T

_{= [}

_x

1

,

x

2

]

(16)

 _{Batas pemisah} (decision boundary) terbaik memberikan hasil klasifikasi yang optimal

(17)

 _{Sistem pengenalan tidak memiliki sifat generalisasi jika}

◦ Sistem hanya dapat mengklasifikasi data pelatihan

◦ Sistem tidak dapat mengklasifikasi dengan baik data baru GENERALISASI

(18)

SENSING :

• menggunakan alat optik untuk menangkap pola visual (mis: kamera) • sistem pengenalan pola sensitif akan resolusi alat optik untuk mengurangi data terdistorsi xT _{= [}_x 1, x2] salmon seabass SEGMENTASI :

• pola – pola yang ada harus terpisah, tidak bertumpuk

POST PROCESSING :

• melakukan evaluasi tingkat kesalahan (error rate)

• mempertimbangkan mengganti jenis fitur untuk pengenalan

(19)

 Collect data_{: mengumpulkan data untuk}

pelatihan dan uji coba

 Feature choice: memilih fitur yang akan

digunakan berdasarkan data dan menentukan informasi prior

 Model choice_{: memilih model klasifikasi.}

(catatan: telah ditetapkan model pengenalan pola berdasarkan teori statistik)

 Train classifier: dengan data pelatihan,

informasi prioir akan berubah sampai performa fungsi klasifikasi optimal

 Evaluate classifier: melakukan evaluasi tingkat kesalahan kemudian mempertimbangkan untuk mengganti fitur KOMPLEKSITAS KOMPUTASI Trade-off antara kemudahan komputasi dengan performa

(20)



Pembelajaran Supervised



_{Terdapat kategori/klas/label sebagai hasil klasifikasi}



_{Terdapat fungsi biaya untuk setiap pola pada data}

pelatihan



Pembelajaran Unsupervised



_{Sistem akan membentuk cluster/kelompok/gugus}

(21)

 _{Melakukan ekstraksi fitur data asal untuk mendapat set fitur} d; x₁, x₂, …, x_d  Desain ekstraktor fitur tergantung pada problem

 _Keinginan

◦ _{Ekstraktor fitur menghasilkan vektor fitur yang sama untuk setiap data pada suatu klas}

 Kenyataan

◦ Ekstraktor fitur menghasilkan vektor fitur yang relatif sama untuk setiap data pada

suatu klas

◦ Variasi vektor fitur data pada satu kelas lebih kecil dibanding data pada lain kelas

(22)



Membuat solusi hipotesa awal, kemudian

diadaptasi modelnya sampai optimal

 CARA INTUITIF



_{Menurunkan fungsi pengklasifikasi optimal dari}

model matematisnya

 Membahas teori:

▪ Pencocokan template (template matching)

▪ Pengklasifikasian mencari jarak terdekat (minimum-distance

classifiers)

▪ Pengukuran (metrics)

▪ Perkalian inner product

▪ Diskriminan linear

(23)

 _{Contoh huruf alfabet D dan O dengan variasi penulisannya}

 _{Gambar D dan O kiri dijadikan acuan/template karena bebas}

distorsi

 _{Data-data gambar sebelah kanan akan dicocokkan dengan}

(24)

 Ada beberapa pendekatan yaitu:

 Maximum Correlation = jumlah kesamaan

▪ Menghitung jumlah pixel hitam atau putih yang sama antar data dengan

template

▪ Pilih kelas dengan nilai kesamaan terbesar

 Minimum Error = jumlah ketidaksamaan

▪ Menghitung jumlah pixel yang tidak sama (pixel hitam pada data dengan pixel

putih pada template atau sebaliknya)

▪ Pilih kelas dengan nilai ketidaksamaan terkecil

 Digunakan jika variasi pada setiap kelas tergantung pada ada

tidaknya tambahan noise

 Pada pengenalan huruf tidak terdapat distorsi akibat translation, rotation,

(25)

 _{Ekspresi Matematika dari} Template Matching _{sebagai berikut:}

◦ Terdapat vektor fitur x untuk data input

◦ Ditentukan sejumlah c klas

◦ Ditentukan template untuk setiap klas, m₁, m₂, …, m_c

 _Errortemplate matching _antara x _{dan template ke} k_,m_k _dihitung

dari norm vektor (x - m_k) = || x - m_k || dan k = {1…c}

 _{Penghitungan ||}x _- m_k _{|| = menghitung jarak antara vektor} x _dan

vektor m_k

 _{Pengklasifikasi akan mencari error terkecil = mencari jarak}

terdekat

(26)

(27)



Ada banyak cara untuk mendefinisikan Norm

||

u

||. Contoh sebagai berikut :



Manhattan

₍

taxicab

₎

metric

▪ ||

u

|| = |

u

₁

| + |

u

₂

|+ |

u

₃

| + ... + |

u

_d

|

▪ Contoh: digunakan pada template matching pengenalan huruf dengan menghitung jumlah ketidaksamaan



Euclidean metric

▪ ||

u

|| =

sqrt

(

u

₁2

+

u

₂2

+ ... +

u

_d2

)

▪ Untuk selanjutnya akan digunakan model ini



Mahalanobis metric

(28)

 Contour _{dari jarak konstan} Euclidean _berbentuk circles_/spheres  Contour dari jarak konstan Manhattan berbentuk squares/boxes

 Contour _{dari jarak konstan} Mahalanobis _berbentuk ellipses/ellipsoids

 _{Untuk selanjutnya pengukuran jarak akan menggunakan} metric Euclidean