• Tidak ada hasil yang ditemukan

Menurut Gonzales dan Woods (2002), sebuah citra dapat didefinisikan sebagai fungsi dua dimensi f(x , y), dengan x dan y adalah koordinat spasial atau bidang, dan nilai amp litudo f untuk masing-masing pasangan x dan y disebut intensitas atau derajat keabuan dari citra pada titik tersebut. Jika nilai x, y, serta

nilai amp litudo f berupa nilai d iskret, citra disebut citra digital. Citra digital tersusun atas sejumlah elemen yang masing-masing memiliki nilai dan lokasi tertentu yang disebut dengan picture elements (pixels).

Ekstr aksi Ciri

Devijver dan Kittler (1982, diacu dalam Trier et al. 1995) mendefinisikan ekstraksi ciri sebagai masalah “mengekstraksi informasi yang sangat relevan dari data mentah untuk proses klasifikasi, dalam arti meminimalkan variabili-tas pola dalam kelas sambil memperbesar varia-bilitas pola antarkelas.”

Metode Ekstraksi Ciri Zoning

Zoning merupakan salah satu metode ekstraksi ciri pada citra karakter. Secara u mu m, dengan metode ekstraksi ciri zoning, citra akan dibagi menjadi beberapa zona yang berukuran sama. Setiap zona kemudian d iambil cirinya.

Ada beberapa variasi algoritme untuk metode ekstraksi ciri zoning, yang dapat dikelo mpokkan berdasarkan

Tabel 1 Pengelo mpokan beberapa variasi metode ekstraksi ciri zoning

Kelo mpok Referensi

Ciri yang diambil Rata-rata jarak

antara pixel dan titik acuan

Rajashekararadhya dan Ranjan (2008), Gatos et al. (2011)

Rata-rata sudut antara pixel dan titik acuan

Rajashekararadhya dan Ranjan (2009a), Rajashe-kararadhya dan Ran jan (2009b)

Titik acuan

Image centroid Rajashekararadhya dan Ranjan (2008), Rajashe-kararadhya dan Ran jan (2009a), Rajashekarara-dhya dan Ranjan (2009b) Zone centroid Rajashekararadhya dan

Ranjan (2008), Rajashe-kararadhya dan Ran jan (2009b)

Titik lain Gatos et al. (2011) Posisi zona

Tetap Rajashekararadhya dan Ranjan (2008), Rajashe-kararadhya dan Ran jan (2009a), Rajashekarara-dhya dan Ranjan (2009b) Berubah-ubah

(adaptif)

Gatos et al. (2011)

Beberapa di antaranya tercantum dalam Tabel 1. Dalam penelitian in i, variasi metode ekstraksi ciri zoning yang digunakan adalah variasi yang disebutkan oleh Rajashekararadhya dan Ranjan (2008), yaitu metode ekstraksi ciri jarak metrik ICZ (image centroid and zone), metode ekstraksi ciri jarak metrik ZCZ (zone centroid and zone), dan metode ekstraksi ciri gabungan (ICZ dan ZCZ). Tahapan pengerjaan dari masing-masing algoritme akan dijelaskan sebagai berikut.

 Metode ekstraksi ciri jarak metrik Image Centroid and Zone

1 Hitung centroid (pusat) dari citra masukan.

2 Bagi citra masukan men jadi n zona yang sama.

3 Hitung jarak antara centroid citra dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang

ada dalam zona.

5 Hitung jarak rata-rata antara titik-titik tersebut.

6 Ulangi langkah 3–5 untuk semua zona secara berurutan.

7 Akhirnya, akan didapatkan n ciri untuk klasifikasi dan pengenalan.

 Metode ekstraksi ciri jarak metrik Zone Centroid and Zone

1 Bagi citra masukan men jadi n zona yang sama.

2 Hitung centroid tiap zona.

3 Hitung jarak antara centroid zona dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang

ada dalam zona.

5 Hitung jarak rata-rata antara titik-titik tersebut.

6 Ulangi langkah 3–5 untuk semua zona secara berurutan.

7 Akhirnya, akan didapatkan n ciri untuk klasifikasi dan pengenalan.

 Metode ekstraksi ciri gabungan (ICZ dan ZCZ)

1 Hitung centroid dari citra masukan. 2 Bagi citra masukan men jadi n zona yang

sama.

3 Hitung jarak antara centroid citra dan setiap pixel yang ada dalam zona. 4 Ulangi langkah 3 untuk semua pixel yang

ada dalam zona.

5 Hitung jarak rata-rata antara titik-titik tersebut.

6 Hitung centroid tiap zona.

7 Hitung jarak antara centroid zona dan setiap pixel yang ada dalam zona. Ada beberapa variasi algoritme untuk

metode ekstraksi ciri zoning, yang dapat dikelo mpokkan berdasarkan ciri yang diambil, titik acuan yang digunakan, dan posisi zona. Beberapa

8 Ulangi langkah 7 untuk semua pixel yang ada dalam zona.

9 Hitung jarak rata-rata antara titik-titik tersebut.

10 Ulangi langkah 3–9 untuk semua zona secara berurutan.

11 Akhirnya, akan didapatkan 2n ciri untuk klasifikasi dan pengenalan.

K-fold Cross-validation

Cross-validation merupakan metode statisti-ka untuk mengevaluasi dan membandingstatisti-kan algoritme pembelajaran dengan membagi data men jadi dua bagian: satu bagian digunakan untuk mempelajari atau melatih model dan bagian lainnya digunakan untuk memvalidasi model tersebut. Salah satu bentuk cross-validation ialah k -fold cross-cross-validation.

Pada k -fold cross-validation, awalnya data dibagi menjadi k bagian yang berukuran sama (atau hampir sama). Secara berurutan, pelatihan dan validasi dilakukan sebanyak k ulangan sehingga dalam setiap perulangan satu bagian data yang berbeda digunakan untuk validasi sementara k – 1 bagian lainnya digunakan untuk pembelajaran atau pelatihan (Refaeilzadeh et al. 2009).

Support Vector Machine

Support Vector Machine (SVM) merupakan prosedur pembelajaran konstruktif yang universal yang berbasis teori pembelajaran

statistik. Istilah “universal” berarti bahwa SVM

dapat digunakan untuk mempelajari beragam representasi, seperti jaringan saraf (dengan fungsi aktivasi sigmoid biasa), radial basis function, dan spline. SVM mengo mbinasikan empat konsep berbeda, yaitu implementasi baru dari prinsip induktif Structural Risk Minimiza-tion (SRM), pemetaan data masukan ke ruang dimensi tinggi, fungsi linear dengan kendala pada kompleksitas, dan dualitas teori optimisasi (Cherkassky & Mulier 2007).

SVM akan mencari hyperplane (bidang pe-misah) terbaik yang memisahkan data dari suatu permasalahan. Menurut Osuna et al. (1997), suatu data dikatakan linearly separable (dapat dipisahkan secara linear) jika untuk permasa-lahan tersebut dapat dicari pasangan (w, b) sedemikian sehingga:

i b i kelas (1) i b - i kelas (2)

Gambar 1 Keadaan linearly separable. Karenanya, ruang hipotesis adalah set fungsi yang diberikan oleh

b si n b

Gambar 1 menunjukkan kondisi suatu data yang linearly separable. Pada gambar tersebut, terdapat sebuah hyperplane yang memisahkan data di kelas +1 (lingkaran) dengan data di kelas

–1 (kotak). Terdapat pula margin, yaitu jarak antara hyperplane dengan elemen terluar dari kedua kelas. Bidang pemisah terbaik adalah bidang pemisah yang menghasilkan n ilai margin terbesar.

SVM d irancang tidak hanya untuk dapat menyelesaikan permasalahan linear, tetapi juga permasalahan non-linear. Agar permasalahan non-linear dapat diselesaikan, permasalahan tersebut dapat dipetakan ke dalam ruang ciri berdimensi lebih tinggi, kemudian diterapkan klasifikasi linear dalam ruang tersebut. Tepat-nya, variabel input x dipetakan ke dalam vektor variabel ciri ϕ(x) dengan fungsi transformasi

x ϕ . Fungsi yang memetakan suatu permasalahan non-linear ke dalam ruang ciri yang lebih tinggi disebut dengan fungsi k ernel, K(x, y). Terdapat tiga k ernel yang biasa digunakan dalam SVM, yaitu sebagai berikut (Osuna et al. 1997).

 Polinomial dengan derajat d:

Gaussian Radial Basis Function (RBF):

e - - an

Multi Layer Perceptron (untuk beberapa nilai ): tanh - .

Metode M ulti-class SVM One -versus-all Pada awalnya, SVM d idesain untuk melakukan klasifikasi biner, dengan kata lain hanya dapat menangani data yang memiliki dua kelas. Cara untuk mengembangkan SVM agar

Kelas –1 Kelas +1

dapat digunakan untuk klasifikasi banyak kelas merupakan isu riset yang masih berjalan. Salah satu metode yang digunakan untuk klasifikasi multi-class SVM ialah metode one-versus-all atau metode one-against-all.

Menurut Hsu dan Lin (2002), metode one-versus-all kemungkinan merupakan metode implementasi untuk klasifikasi multi-class SVM paling awal. Metode ini membangun k model SVM, dengan k adalah jumlah kelas yang ada. Model SVM ke-i dilatih menggunakan semua contoh di kelas ke-i dengan label positif (kelas 1), dan semua contoh di kelas lain dengan label negatif (kelas –1). Setelah dilaku kan pelatihan SVM, d idapatkan k fungsi keputusan dari k model tersebut. Misalkan ada data baru x yang diujikan pada model SVM one-versus-all ini, x akan masuk ke dalam kelas tertentu yang memiliki nilai fungsi keputusan terbesar.

METODE PENELITIAN

Dokumen terkait