Proses Testing - Pengenalan Pola

BAB II LANDASAN TEORI

2.2. Pengenalan Pola

2.2.4. Proses Testing

Proses testing merupakan proses pencocokan kemiripan dan pengenalan motif batik Yogyakarta. Data test akan dimasukkan pada fungsi diskriminan yang terbentuk pada proses training. Pada proses ini data citra motif batik yang digunakan sebanyak 100 dari 500 data citra motif batik. 2.2.5. Metode Linear Discriminant Analysis (LDA)

Banyak metode yang dapat digunakan untuk klasifikasi pengenalan pola. Salah satu teknik yang sangat populer dan cukup sederhana untuk menyelesaikan masalah klasifikasi adalah analisis diskriminan linear (Linear Discriminant Analysis), selanjutnya disebut dengan LDA. LDA termasuk dalam kategori supervised learning, karena dalam pemakaian LDA ada tahapan training untuk menemukan parameter model yang diperlukan. Selanjutnya model yang diperoleh digunakan untuk melakukan prediksi bila ada data baru dan harus dilakukan pengelompokan.

Metode LDA memaksimalkan diskriminasi antar kelas dan meminimalkan persebaran dalam kelas. Metode ini memiliki kegunaan untuk mengklasifikasikan obyek ke dalam dua grup atau lebih.

Analisis diskriminan berguna ketika ingin membentuk sebuah model prediktif dari beberapa kelompok (group) berdasarkan pada karakteristik masing-masing kasus. Prosedur pembentukan fungsi diskriminan (pada lebih

dari dua kelompok, serangkaian set dari fungsi diskriminan) berdasarkan pada kombinasi linear dari variabel-variabel prediktor yang memberikan pembeda terbaik dari kelompok-kelompok tersebut. Fungsi dibentuk dari sebuah sampel pada sebuah kasus di dalam sebuah group yang telah diketahui; fungsi lalu dapat diaplikasikan pada kasus baru dengan pengukuran pada variabel-variabel prediktor yang tidak diketahui masuk pada kelompok mana.

2.2.5.1. Algoritma Pemodelan Linear Discriminant Analysis

Analisis diskriminan adalah teknik statistik multivariate yang terkait dengan pemisahan (separating) atau alokasi/klasifikasi (classification) sekelompok obyek atau observasi ke dalam kelompok (group) yang telah terlebih dahulu didefinisikan. Dalam tujuan pengenalan obyek (observasi), metode ini mencoba menemukan suatu discriminant yang nilainya mampu memisahkan obyek yang karakteristiknya telah diketahui. Sedangkan dalam tujuan klasifikasi obyek, metode ini akan mensortir obyek (observasi) ke dalam dua atau lebih kelas.

Cara kerja Linear Discriminant Analysis yaitu dengan mencari bobot untuk setiap kelompok. Metode ini memaksimalkan jarak antar kelas dan meminimalkan jarak dalam kelas. Fungsi diskriminan yang terbentuk berfungsi untuk memisahkan kelompok.

Setelah feature didapat, maka pemodelan Linear Discrminant Analysis dapat dibangkitkan. Linear Discriminant Analysis

mengasumsikan matriks-matriks kovarians kelas yang sama. Output dari analisis diskriminan ini yaitu mendapatkan fungsi yang digunakan untuk mengelompokkan observasi-observasi ke dalam salah satu kelas, yang kemudian disebut fungsi diskriminan. Model persamaan diskriminan, yaitu:

𝒇𝒊 ⁼𝝁𝒊𝑪−𝟏𝒙_𝒌^𝑻−^𝟏_𝟐𝝁𝒊𝑪−𝟏𝝁_𝒊^𝑻+𝐥𝐨𝐠(𝑷𝒊⁾ Dimana: 𝜇𝑖^{= rata-rata kelas ke-}ⁱ^,

𝑥_𝑘𝑇_{= data yang ditranspose,}

𝐶−1 = matriks covariance yang diinverskan,

𝑃_𝑖 = probabilitas data dalam kelas i terhadap seluruh data. Untuk mendapatkan fungsi diskriminan tersebut, terdapat beberapa langkah yang harus dilakukan, yaitu:

1. Dengan menghitung mean dari setiap kelompok atau kelas dan mean dari keseluruhan kelompok atau kelas. Perhitungan ini untuk menghitung bobot setiap kelompok sehingga dapat meminimalkan jarak dalam kelompok atau kelas.

2. Menghitung matriks covariance kelompok i yang didapati dari:

𝐶

_𝑖

=

⁽^𝑥^𝑖 0 )𝑇𝑥_𝑖0 𝑛_𝑖 (2.1) (2.2)

Dimana:

𝑥_𝑖0 = mean corrected data, merupakan hasil dari pengurangan data dari kelompok xi dengan rata-rata keseluruhan kelompok.

𝑛𝑖^{= banyaknya kelompok ke-}ⁱ^.

3. Membentuk pooled within group covariance matrix (matriks covariance dalam kelompok), rumus yang digunakan:

𝐶 𝑟,𝑠 =

𝑛 ^𝑔_𝑖=1

𝑛

_𝑖

.𝐶

_𝑖

(𝑟,𝑠)

Dimana:

𝑛 = total dari banyaknya setiap kelompok ke-i, 𝑔= banyaknya kelompok (kelas),

𝑛_𝑖 = banyaknya kelompok ke-i,

𝐶𝑖⁽𝑟,𝑠) = nilai covariance kelompok ke-i pada baris ke-r dan baris ke-s.

4. Kemudian hasil dari perhitungan dari langkah ke-3 diinverskan, maka nilai matriks covariance ini yang akan digunakan dalam perhitungan fungsi diskriminan.

5. Menghitung Pi yang merupakan probabilitas vektor. Setiap baris merepresentasikan probabilitas dari kelompok ke-i.

𝑃

_𝑖

=𝑛

_𝑖

𝑁

(2.3)

Dimana:

𝑛_𝑖 = Banyaknya anggota dari kelompok ke-i, 𝑁 = Jumlah anggota dari seluruh kelompok.

Contoh perhitungan menggunakan metode Linear Discriminant Analysis:

 Berikut merupakan data chip rings yang lulus (passed) dan tidak

lulus (not passed) uji kualitas dari suatu perusahaan yang memproduksi chip ring berkualitas tinggi dengan pertimbangan curvature dan diameter.

Tabel2.1 Data chip rings

Curvature Diameter Quality Control Result

2.95 6.63 Passed 2.53 7.79 Passed 3.57 5.65 Passed 3.16 5.47 Passed 2.58 4.46 Not Passed 2.16 6.22 Not Passed 3.27 3.52 Not Passed

Terdapat data chip ring baru untuk diuji kualitasnya dengan menggunakan metode LDA, yaitu:

Tabel2.2 Data test chip ring Curvature Diameter Quality Control Result

2.81 5.46 ????

Catatan:

Penyelesaian:

x = feature seluruh data. Setiap baris merepresentasikan satu kelas; setiap kolom berdiri untuk satu feature.

y = indeks kelas (passed = 1; not passed = 2).

dan

= data feature untuk kelas i. Setiap baris merepresentasikan satu kelas; setiap kolom berdiri untuk satu feature. Penulis memisahkan x ke dalam beberapa kelompok berdasarkan indeks kelas pada y.

Langkah pertama dalam perhitungan LDA yaitu mencari rata-rata feature dalam setiap kelas dan menghitung rata-rata keseluruhan kelas, yaitu:

= rata-rata keseluruhan kelas, mean dari seluruh data.

Langkah kedua yaitu mencari matriks covariance kelas i dengan menggunakan rumus 2.10, yaitu:

= mean corrected data, dari data feature untuk kelas i.

Sehingga didapat matriks covariance dari kelas i dengan menggunakan rumus 2.2, yaitu:

Langkah ketiga, menghitung pooled within group covariance matrix (matriks covariance dalam kelompok) dengan menggunakan rumus 2.3, yaitu:

Maka, pooled covariance matriks yang didapat yaitu:

Langkah keempat, inverse dari pooled covariance matriks, yaitu:

Langkah kelima, menghitung probabilitas kelas ke-i, dengan menggunakan rumus 2.4, yaitu:

Hasil perhitungan dari setiap langkah-langkah tersebut digunakan pada fungsi diskriminan (rumus 2.1) untuk setiap kelas, pada contoh ini akan menghasilkan dua fungsi diskriminan, yaitu:

𝒇𝟏⁼𝝁𝟏𝑪−𝟏𝒙_𝒌^𝑻−^𝟏_𝟐𝝁𝟏𝑪−𝟏𝝁_𝟏𝑻₊𝐥𝐨𝐠(𝑷𝟏⁾

𝒇𝟏⁼ 𝟑.𝟎𝟓 𝟔.𝟑𝟖 𝟓_𝟎^._.^{𝟕𝟒𝟓 𝟎}_{𝟕𝟗𝟏 𝟎}_.^.^𝟕𝟗𝟏_{𝟕𝟎𝟏 𝒙}_𝒌𝑻−^𝟏_𝟐 𝟑.𝟎𝟓 𝟔.𝟑𝟖 𝟓_𝟎^._.^{𝟕𝟒𝟓 𝟎}_{𝟕𝟗𝟏 𝟎}^._.^𝟕𝟗𝟏_𝟕𝟎𝟏_𝟔^𝟑^._.^𝟎𝟓_𝟑𝟖+𝐥𝐨𝐠(𝟎.𝟓𝟕𝟏)

𝒇_𝟐=𝝁_𝟐𝑪−𝟏𝒙_𝒌^𝑻−_{𝟐 𝝁}^𝟏 _𝟐𝑪−𝟏𝝁_𝟐𝑻₊𝐥𝐨𝐠(𝑷_𝟐)

𝒇𝟐= 𝟐.𝟔𝟕 𝟒.𝟕𝟑 𝟓_𝟎^._.^{𝟕𝟒𝟓 𝟎}_{𝟕𝟗𝟏 𝟎}_.^.^𝟕𝟗𝟏_{𝟕𝟎𝟏 𝒙}_𝒌𝑻−^𝟏_𝟐 𝟐.𝟔𝟕 𝟒.𝟕𝟑 𝟓_𝟎^._.^{𝟕𝟒𝟓 𝟎}_{𝟕𝟗𝟏 𝟎}^._.^𝟕𝟗𝟏_𝟕𝟎𝟏_𝟒^𝟐^._.^𝟔𝟕_𝟕𝟑+𝐥𝐨𝐠(𝟎.𝟒𝟐𝟗)

Kemudian data-data chip rings setiap baris yang ditranspose terlebih dahulu (𝑥_𝑘𝑇₎ dimasukkan dalam perhitungan tersebut. Untuk menentukan hasil quality control lulus uji atau tidak yaitu dengan melihat hasil dari perhitungan 𝑓1 dan 𝑓2 yang memiliki nilai

Covariance matriks inilah yang akan digunakan untuk setiap kelas dalam pembentukan fungsi diskriminan untuk klasifikasi (membentuk model).

maksimum. Berikut hasil yang diperoleh dari perhitungan fungsi diskriminan untuk setiap baris data, yaitu:

Gambar2.4. Perhitungan fungsi diskriminan

Dari hasil perhitungan dengan metode LDA di atas, data test yaitu data baru chip ring yang akan diuji quality control-nya menghasilkan indeks 2 yaitu termasuk dalam kelas not passed.

2.2.6. Metode Evaluasi 5-Fold Cross Validation

Setelah melakukan proses training dan testing maka metode evaluasi dengan 5-fold cross validation dapat dilakukan. Metode evaluasi digunakan untuk mengetahui tingkat akurasi sistem pengenal motif batik. Metode 5-fold cross validation membagi tiap kelompok motif batik Yogyakarta menjadi lima kelompok data yang kemudian secara bergantian dijadikan data untuk training maupun testing dalam lima langkah pengujian yang saling silang. Dimisalkan terdapat n-buah motif batik untuk satu jenis motif batik

Yogyakarta, sehingga tiap kelompok memiliki n/5 buah anggota. Diberikan nilai n = 25 data, sehingga pembagiannya ialah:

 Kelompok 1:

 data motif “Ceplok Kece” ke 1 hingga 5,

 data motif “Kawung Galar” ke 1 hingga 5,

 data motif “Nitik Cengkeh” ke 1 hingga 5,

 data motif “Parang Barong” ke 1 hingga 5,

 data motif “Parisewuli Seling Pamor” ke 1 hingga 5,

 data motif “Truntum” ke 1 hingga 5,

 data motif “Tambal” ke 1 hingga 5,

 data motif “Parang Tuding” ke 1 hingga ke 5,

………..

 data motif “Parang Kunci” ke 1 hingga 5.

 Kelompok 2:

 data motif “Ceplok Kece” ke 6 hingga 10,

 data motif “Kawung Galar” ke 6 hingga 10,

 data motif “Nitik Cengkeh” ke 6 hingga 10,

 data motif “Parang Barong” ke 6 hingga 10,

 data motif “Parisewuli Seling Pamor” ke 6 hingga 10,

 data motif “Truntum” ke 6 hingga 10,

 data motif “Tambal” ke 6 hingga 10,

 data motif “Parang Tuding” ke 6 hingga ke 10,

 data motif “Parang Kunci” ke 6 hingga 10.

 Kelompok 3:

 data motif “Ceplok Kece” ke 11 hingga 15,

 data motif “Kawung Galar” ke 11 hingga 15,

 data motif “Nitik Cengkeh” ke 11 hingga 15,

 data motif “Parang Barong” ke 11 hingga 15,

 data motif “Parisewuli Seling Pamor” ke 11 hingga 15,

 data motif “Truntum” ke 11 hingga 15,

 data motif “Tambal” ke 11 hingga 15,

 data motif “Parang Tuding” ke 11 hingga 15,

…………

 data motif “Parang Kunci” ke 11 hingga 15.

 Kelompok 4:

 data motif “Ceplok Kece” ke 15 hingga 20,

 data motif “Kawung Galar” ke 15 hingga 20,

 data motif “Nitik Cengkeh” ke 15 hingga 20,

 data motif “Parang Barong” ke 15 hingga 20,

 data motif “Parisewuli Seling Pamor” ke 15 hingga 20,

 data motif “Truntum” ke 15 hingga 20,

 data motif “Tambal” ke 15 hingga 20,

…………

 data motif “Parang Kunci” ke 15 hingga 20.

 Kelompok 5:

 data motif “Ceplok Kece” ke 16 hingga 25,

 data motif “Kawung Galar” ke 16 hingga 25,

 data motif “Nitik Cengkeh” ke 16 hingga 25,

 data motif “Parang Barong” ke 16 hingga 25,

 data motif “Parisewuli Seling Pamor” ke 16 hingga 25,

 data motif “Truntum” ke 16 hingga 25,

 data motif “Tambal” ke 16 hingga 25,

 data motif “Parang Tuding” ke 16 hingga 25,

…………

 data motif “Parang Kunci” ke 16 hingga 25.

Data masukan dipisah untuk memastikan bahwa evaluasi dilakukan tanpa memproses data yang sama. Pemrosesan dengan data yang sama dapat terjadi ketika data masukan berjumlah sangat banyak. Jika data yang sama diproses dalam training dan testing, maka nilai validasi terhadap evaluasi akan berkurang walaupun angka akurasi meningkat.

Gambar2.5. Gambaran metode evaluasi 5-Fold Cross Validation

Masing-masing kotak yang terdapat pada gambar merupakan kotak yang mewakili satu kelompok data. Tiap satu kelompok data bergantian menjadi data testing pada satu langkah pengujian, sedangkan lainnya menjadi data training.

2.3. Matriks Data Multivariat

Data multivariate adalah data yang diperoleh dari hasil pengukuran terhadap n observasi-observasi berdasarkan variabel-variabel random p. Secara umum data multivariate disajikan dalam bentuk matriks X berukuran p x n sebagai berikut:

1 2 3 4 5 Testing Pengujian 1 Pengujian 2 Pengujian 3 Pengujian 4 Pengujian 5 Training 2 3 4 5 1 3 4 5 1 1 2 4 5 1 2 3 5 1 2 3 4

Kelompok data no.5 menjadi data training bersama dengan kelompok data 2, 3, 4.

Kelompok data no.5 menjadi data testing.

Gambar2.6. Matriks data multivariat

dimana I= 1, 2, ….., p dan j= 1, 2, ….., n.

Data multivariate dinotasikan dengan X = {Xij}, dengan Xij merupakan pengamatan terhadap variabel random ke-i pada observasi ke-j.

Dalam dokumen Pengenalan motif batik Yogyakarta dengan metode Linear Discriminant Analysis (LDA) : studi kasus di Museum Batik Yogyakarta) - USD Repository (Halaman 31-44)