• Tidak ada hasil yang ditemukan

Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan

N/A
N/A
Protected

Academic year: 2021

Membagikan "Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan"

Copied!
28
0
0

Teks penuh

(1)
(2)

Terdapat banyak jenis pola:

 Pola visual

 Pola temporal

 Pola logikal

Tidak ada tepat satu teori untuk menyelesaikan

problem pengenalan pola

Terdapat model standar yang dapat dijadikan teori

acuan

 Statistik atau Fuzzy

Syntatic atau Struktur

Berbasis pengetahuan

Statistical Pattern Recognition

(3)

Problem pengenalan pola didefinisikan

sebagai problem klasifikasi

Daftar kata kunci :

Klasifikasi

Fitur

Vektor fitur

(4)

Diperlukan suatu sistem untuk melakukan

pengenalan

 Sistem mengenali data kemudian mengklasifikasi data

tersebut berdasarkan pola tertentu ke suatu klas

Contoh aplikasi yang melakukan …

Pengenalan suara

Identifikasi sidik jari

 Pengenal karakter secara optik (OCR)

(5)

 Terdapat data dengan pola visual

Data merepresentasikan karakter 26 huruf alfabet

Definisi problem:

 Pengenalan pola data yang diklasifikasikan ke 26 kelas

 Data kelas 1 adalah huruf A dengan segala variasi penulisannya, dst

(6)

Data merepresentasikan karakter 26 huruf alfabet

 Definisi tujuan sistem  mengklasifikasikan data ke 26 kelas

yang ada berdasarkan standar polanya

 Problem yang muncul

 Q1: Apa yang akan dibandingkan? FITUR

 Q2: Bagaimana mengukur tingkat kesamaan pola?

standar pola kelas 1

Array nilai tingkat terang pixel

Data dengan pola visual

standar pola kelas 2 standar pola kelas 4 DITERIMA DITERIMA DITOLAK

(7)

Fitur adalah suatu nilai yang dapat membantu sebagai

pembeda

Contoh dalam klasifikasi huruf cetak

◦ Dalam penentuan fitur untuk pembandingan perlu …

 tahu luas area huruf

 tahu daerah perbatasan luar huruf

◦ Dalam pengukuran tingkat kesamaan huruf dilakukan …

 Berdasarkan rasio kepadatan luas area penulisan huruf dengan area batas

luar huruf (disebut perimeter) : Huruf B lebih padat daripada huruf O

 Berdasarkan tingkat simetri area huruf bagian atas dengan bawah. Huruf B

lebih simetri daripada huruf P

Beberapa fitur dapat sensitif akan perubahan nilai

◦ Fitur tingkat kelurusan sisi kiri huruf

 Pola untuk membedakan huruf D atau O

(8)

Set nilai sejumlah

d

fitur dihasilkan dari pengukuran

setiap data yang akan diklasifikasikan

x1 = area

x2 = perimeter, …,

◦ xd = panjang garis melengkung / jarak garis lurus

Nilai sejumlah

d

fitur dari suatu data disimpan sebagai

sebuah matrik baris

x

Vektor Fitur

Vektor

x

memiliki

d

baris = suatu data memiliki

d

dimensi

Vektor

x

digambarkan sebagai suatu titik pada ruang fitur

(9)

Pola suatu data hasil dari pengukuran direpresentasikan dalam

sebuah vektor

 Pada pengenalan pola terjadi pengurangan jumlah informasi,

pemetaan atau pelabelan informasi

(10)

Sekumpulan ikan diletakkan pada ban berjalan

Berdasarkan sensor optik, mesin dapat mengelompokkan

ikan-ikan tersebut sebagai SeaBass dan Salmon

 Analisa problem

 Set posisi kamera untuk mengambil gambar ikan-ikan

 Dari gambar akan diekstrak informasi fitur:

▪ Panjang ikan

▪ Tingkat kecerahan warna sisik ikan

▪ Lebar badan ikan

▪ Jumlah dan bentuk sirip ikan

(11)

sensor optik kumpulan ikan pada ban berjalan pra pemrosesan gambar

ikan-ikan segmentasioperasi gambar untuk

membedakan setiap ikan

ekstraksi

fitur klasifikasi

peng-hasil pengelom-pokkan ikan

salmon seabass

• lebar badan ikan • tingkat

kecerahan warna sisik ikan

(12)

ERROR SALMON

(13)

ERROR

SALMON

NILAI AMBANG BATAS

(14)

Penentuan nilai ambang batas (threshold decision boundary) menentukan

nilai biaya (cost function)

Solusi

 Menambah atau mengurangi nilai ambang batas

14

TEORI KEPUTUSAN

ERROR

SEABASS

Jika nilai ambang batas dikurangi:

•  seabass masuk klas salmon berkurang

•  salmon masuk klas seabass bertambah

(15)

Digunakan fitur lebar ikan dan tingkat kecerahan sisik ikan

x

T

= [

x

1

,

x

2

]

(16)

Batas pemisah (decision boundary) terbaik memberikan hasil klasifikasi yang optimal

(17)

Sistem pengenalan tidak memiliki sifat generalisasi jika

◦ Sistem hanya dapat mengklasifikasi data pelatihan

◦ Sistem tidak dapat mengklasifikasi dengan baik data baru GENERALISASI

(18)

SENSING :

• menggunakan alat optik untuk menangkap pola visual (mis: kamera) • sistem pengenalan pola sensitif akan resolusi alat optik untuk mengurangi data terdistorsi xT = [x 1, x2] salmon seabass SEGMENTASI :

• pola – pola yang ada harus terpisah, tidak bertumpuk

POST PROCESSING :

• melakukan evaluasi tingkat kesalahan (error rate)

• mempertimbangkan mengganti jenis fitur untuk pengenalan

(19)

Collect data: mengumpulkan data untuk

pelatihan dan uji coba

Feature choice: memilih fitur yang akan

digunakan berdasarkan data dan menentukan informasi prior

Model choice: memilih model klasifikasi.

(catatan: telah ditetapkan model pengenalan pola berdasarkan teori statistik)

Train classifier: dengan data pelatihan,

informasi prioir akan berubah sampai performa fungsi klasifikasi optimal

Evaluate classifier: melakukan evaluasi tingkat kesalahan kemudian mempertimbangkan untuk mengganti fitur KOMPLEKSITAS KOMPUTASI Trade-off antara kemudahan komputasi dengan performa

(20)

Pembelajaran Supervised

Terdapat kategori/klas/label sebagai hasil klasifikasi

Terdapat fungsi biaya untuk setiap pola pada data

pelatihan

Pembelajaran Unsupervised

Sistem akan membentuk cluster/kelompok/gugus

(21)

Melakukan ekstraksi fitur data asal untuk mendapat set fitur d; x1, x2, …, xd  Desain ekstraktor fitur tergantung pada problem

Keinginan

Ekstraktor fitur menghasilkan vektor fitur yang sama untuk setiap data pada suatu klas

 Kenyataan

◦ Ekstraktor fitur menghasilkan vektor fitur yang relatif sama untuk setiap data pada

suatu klas

◦ Variasi vektor fitur data pada satu kelas lebih kecil dibanding data pada lain kelas

(22)

Membuat solusi hipotesa awal, kemudian

diadaptasi modelnya sampai optimal

 CARA INTUITIF

Menurunkan fungsi pengklasifikasi optimal dari

model matematisnya

 Membahas teori:

▪ Pencocokan template (template matching)

▪ Pengklasifikasian mencari jarak terdekat (minimum-distance

classifiers)

▪ Pengukuran (metrics)

▪ Perkalian inner product

▪ Diskriminan linear

(23)

Contoh huruf alfabet D dan O dengan variasi penulisannya

Gambar D dan O kiri dijadikan acuan/template karena bebas

distorsi

Data-data gambar sebelah kanan akan dicocokkan dengan

(24)

 Ada beberapa pendekatan yaitu:

 Maximum Correlation = jumlah kesamaan

▪ Menghitung jumlah pixel hitam atau putih yang sama antar data dengan

template

▪ Pilih kelas dengan nilai kesamaan terbesar

 Minimum Error = jumlah ketidaksamaan

▪ Menghitung jumlah pixel yang tidak sama (pixel hitam pada data dengan pixel

putih pada template atau sebaliknya)

▪ Pilih kelas dengan nilai ketidaksamaan terkecil

 Digunakan jika variasi pada setiap kelas tergantung pada ada

tidaknya tambahan noise

 Pada pengenalan huruf tidak terdapat distorsi akibat translation, rotation,

(25)

Ekspresi Matematika dari Template Matching sebagai berikut:

◦ Terdapat vektor fitur x untuk data input

◦ Ditentukan sejumlah c klas

◦ Ditentukan template untuk setiap klas, m1, m2, …, mc

Error template matching antara x dan template ke k, mk dihitung

dari norm vektor (x - mk) = || x - mk || dan k = {1c}

Penghitungan || x - mk || = menghitung jarak antara vektor x dan

vektor mk

Pengklasifikasi akan mencari error terkecil = mencari jarak

terdekat

(26)
(27)

Ada banyak cara untuk mendefinisikan Norm

||

u

||. Contoh sebagai berikut :

Manhattan

(

taxicab

)

metric

||

u

|| = |

u

1

| + |

u

2

|+ |

u

3

| + ... + |

u

d

|

▪ Contoh: digunakan pada template matching pengenalan huruf dengan menghitung jumlah ketidaksamaan

Euclidean metric

||

u

|| =

sqrt

(

u

12

+

u

22

+ ... +

u

d2

)

▪ Untuk selanjutnya akan digunakan model ini

Mahalanobis metric

(28)

Contour dari jarak konstan Euclidean berbentuk circles/spheresContour dari jarak konstan Manhattan berbentuk squares/boxes

Contour dari jarak konstan Mahalanobis berbentuk ellipses/ellipsoids

Untuk selanjutnya pengukuran jarak akan menggunakan metric Euclidean

Referensi

Dokumen terkait