• Tidak ada hasil yang ditemukan

BAB II LANDASAN TEORI

2.2. Pengenalan Pola

2.2.4. Proses Testing

Proses testing merupakan proses pencocokan kemiripan dan pengenalan motif batik Yogyakarta. Data test akan dimasukkan pada fungsi diskriminan yang terbentuk pada proses training. Pada proses ini data citra motif batik yang digunakan sebanyak 100 dari 500 data citra motif batik. 2.2.5. Metode Linear Discriminant Analysis (LDA)

Banyak metode yang dapat digunakan untuk klasifikasi pengenalan pola. Salah satu teknik yang sangat populer dan cukup sederhana untuk menyelesaikan masalah klasifikasi adalah analisis diskriminan linear (Linear Discriminant Analysis), selanjutnya disebut dengan LDA. LDA termasuk dalam kategori supervised learning, karena dalam pemakaian LDA ada tahapan training untuk menemukan parameter model yang diperlukan. Selanjutnya model yang diperoleh digunakan untuk melakukan prediksi bila ada data baru dan harus dilakukan pengelompokan.

Metode LDA memaksimalkan diskriminasi antar kelas dan meminimalkan persebaran dalam kelas. Metode ini memiliki kegunaan untuk mengklasifikasikan obyek ke dalam dua grup atau lebih.

Analisis diskriminan berguna ketika ingin membentuk sebuah model prediktif dari beberapa kelompok (group) berdasarkan pada karakteristik masing-masing kasus. Prosedur pembentukan fungsi diskriminan (pada lebih

dari dua kelompok, serangkaian set dari fungsi diskriminan) berdasarkan pada kombinasi linear dari variabel-variabel prediktor yang memberikan pembeda terbaik dari kelompok-kelompok tersebut. Fungsi dibentuk dari sebuah sampel pada sebuah kasus di dalam sebuah group yang telah diketahui; fungsi lalu dapat diaplikasikan pada kasus baru dengan pengukuran pada variabel-variabel prediktor yang tidak diketahui masuk pada kelompok mana.

2.2.5.1. Algoritma Pemodelan Linear Discriminant Analysis

Analisis diskriminan adalah teknik statistik multivariate yang terkait dengan pemisahan (separating) atau alokasi/klasifikasi (classification) sekelompok obyek atau observasi ke dalam kelompok (group) yang telah terlebih dahulu didefinisikan. Dalam tujuan pengenalan obyek (observasi), metode ini mencoba menemukan suatu discriminant yang nilainya mampu memisahkan obyek yang karakteristiknya telah diketahui. Sedangkan dalam tujuan klasifikasi obyek, metode ini akan mensortir obyek (observasi) ke dalam dua atau lebih kelas.

Cara kerja Linear Discriminant Analysis yaitu dengan mencari bobot untuk setiap kelompok. Metode ini memaksimalkan jarak antar kelas dan meminimalkan jarak dalam kelas. Fungsi diskriminan yang terbentuk berfungsi untuk memisahkan kelompok.

Setelah feature didapat, maka pemodelan Linear Discrminant Analysis dapat dibangkitkan. Linear Discriminant Analysis

mengasumsikan matriks-matriks kovarians kelas yang sama. Output dari analisis diskriminan ini yaitu mendapatkan fungsi yang digunakan untuk mengelompokkan observasi-observasi ke dalam salah satu kelas, yang kemudian disebut fungsi diskriminan. Model persamaan diskriminan, yaitu:

π’‡π’Š =ππ’Šπ‘ͺβˆ’πŸπ’™π’Œπ‘»βˆ’πŸπŸππ’Šπ‘ͺβˆ’πŸππ’Šπ‘»+π₯𝐨𝐠(π‘·π’Š) Dimana: πœ‡π‘– = rata-rata kelas ke-i,

π‘₯π‘˜π‘‡ = data yang ditranspose,

πΆβˆ’1 = matriks covariance yang diinverskan,

𝑃𝑖 = probabilitas data dalam kelas i terhadap seluruh data. Untuk mendapatkan fungsi diskriminan tersebut, terdapat beberapa langkah yang harus dilakukan, yaitu:

1. Dengan menghitung mean dari setiap kelompok atau kelas dan mean dari keseluruhan kelompok atau kelas. Perhitungan ini untuk menghitung bobot setiap kelompok sehingga dapat meminimalkan jarak dalam kelompok atau kelas.

2. Menghitung matriks covariance kelompok i yang didapati dari:

𝐢

𝑖

=

(π‘₯𝑖 0 )𝑇π‘₯𝑖0 𝑛𝑖 (2.1) (2.2)

Dimana:

π‘₯𝑖0 = mean corrected data, merupakan hasil dari pengurangan data dari kelompok xi dengan rata-rata keseluruhan kelompok.

𝑛𝑖 = banyaknya kelompok ke-i.

3. Membentuk pooled within group covariance matrix (matriks covariance dalam kelompok), rumus yang digunakan:

𝐢 π‘Ÿ,𝑠 =

1

𝑛 𝑔𝑖=1

𝑛

𝑖

.𝐢

𝑖

(π‘Ÿ,𝑠)

Dimana:

𝑛 = total dari banyaknya setiap kelompok ke-i, 𝑔= banyaknya kelompok (kelas),

𝑛𝑖 = banyaknya kelompok ke-i,

𝐢𝑖(π‘Ÿ,𝑠) = nilai covariance kelompok ke-i pada baris ke-r dan baris ke-s.

4. Kemudian hasil dari perhitungan dari langkah ke-3 diinverskan, maka nilai matriks covariance ini yang akan digunakan dalam perhitungan fungsi diskriminan.

5. Menghitung Pi yang merupakan probabilitas vektor. Setiap baris merepresentasikan probabilitas dari kelompok ke-i.

𝑃

𝑖

=𝑛

𝑖

𝑁

(2.3)

Dimana:

𝑛𝑖 = Banyaknya anggota dari kelompok ke-i, 𝑁 = Jumlah anggota dari seluruh kelompok.

Contoh perhitungan menggunakan metode Linear Discriminant Analysis:

ο‚· Berikut merupakan data chip rings yang lulus (passed) dan tidak

lulus (not passed) uji kualitas dari suatu perusahaan yang memproduksi chip ring berkualitas tinggi dengan pertimbangan curvature dan diameter.

Tabel2.1 Data chip rings

Curvature Diameter Quality Control Result

2.95 6.63 Passed 2.53 7.79 Passed 3.57 5.65 Passed 3.16 5.47 Passed 2.58 4.46 Not Passed 2.16 6.22 Not Passed 3.27 3.52 Not Passed

Terdapat data chip ring baru untuk diuji kualitasnya dengan menggunakan metode LDA, yaitu:

Tabel2.2 Data test chip ring Curvature Diameter Quality Control Result

2.81 5.46 ????

Catatan:

Penyelesaian:

x = feature seluruh data. Setiap baris merepresentasikan satu kelas; setiap kolom berdiri untuk satu feature.

y = indeks kelas (passed = 1; not passed = 2).

dan

,

= data feature untuk kelas i. Setiap baris merepresentasikan satu kelas; setiap kolom berdiri untuk satu feature. Penulis memisahkan x ke dalam beberapa kelompok berdasarkan indeks kelas pada y.

Langkah pertama dalam perhitungan LDA yaitu mencari rata-rata feature dalam setiap kelas dan menghitung rata-rata keseluruhan kelas, yaitu:

,

= rata-rata keseluruhan kelas, mean dari seluruh data.

Langkah kedua yaitu mencari matriks covariance kelas i dengan menggunakan rumus 2.10, yaitu:

= mean corrected data, dari data feature untuk kelas i.

,

Sehingga didapat matriks covariance dari kelas i dengan menggunakan rumus 2.2, yaitu:

,

Langkah ketiga, menghitung pooled within group covariance matrix (matriks covariance dalam kelompok) dengan menggunakan rumus 2.3, yaitu:

Maka, pooled covariance matriks yang didapat yaitu:

Langkah keempat, inverse dari pooled covariance matriks, yaitu:

Langkah kelima, menghitung probabilitas kelas ke-i, dengan menggunakan rumus 2.4, yaitu:

Hasil perhitungan dari setiap langkah-langkah tersebut digunakan pada fungsi diskriminan (rumus 2.1) untuk setiap kelas, pada contoh ini akan menghasilkan dua fungsi diskriminan, yaitu:

π’‡πŸ=𝝁𝟏π‘ͺβˆ’πŸπ’™π’Œπ‘»βˆ’πŸπŸππŸπ‘ͺβˆ’πŸππŸπ‘»+π₯𝐨𝐠(π‘·πŸ)

π’‡πŸ= πŸ‘.πŸŽπŸ“ πŸ”.πŸ‘πŸ– πŸ“πŸŽ..πŸ•πŸ’πŸ“ πŸŽπŸ•πŸ—πŸ 𝟎..πŸ•πŸ—πŸπŸ•πŸŽπŸ π’™π’Œπ‘»βˆ’πŸπŸ πŸ‘.πŸŽπŸ“ πŸ”.πŸ‘πŸ– πŸ“πŸŽ..πŸ•πŸ’πŸ“ πŸŽπŸ•πŸ—πŸ 𝟎..πŸ•πŸ—πŸπŸ•πŸŽπŸ πŸ”πŸ‘..πŸŽπŸ“πŸ‘πŸ– +π₯𝐨𝐠(𝟎.πŸ“πŸ•πŸ)

π’‡πŸ=𝝁𝟐π‘ͺβˆ’πŸπ’™π’Œπ‘»βˆ’πŸ 𝝁𝟏 𝟐π‘ͺβˆ’πŸππŸπ‘»+π₯𝐨𝐠(π‘·πŸ)

π’‡πŸ= 𝟐.πŸ”πŸ• πŸ’.πŸ•πŸ‘ πŸ“πŸŽ..πŸ•πŸ’πŸ“ πŸŽπŸ•πŸ—πŸ 𝟎..πŸ•πŸ—πŸπŸ•πŸŽπŸ π’™π’Œπ‘»βˆ’πŸπŸ 𝟐.πŸ”πŸ• πŸ’.πŸ•πŸ‘ πŸ“πŸŽ..πŸ•πŸ’πŸ“ πŸŽπŸ•πŸ—πŸ 𝟎..πŸ•πŸ—πŸπŸ•πŸŽπŸ πŸ’πŸ..πŸ”πŸ•πŸ•πŸ‘ +π₯𝐨𝐠(𝟎.πŸ’πŸπŸ—)

Kemudian data-data chip rings setiap baris yang ditranspose terlebih dahulu (π‘₯π‘˜π‘‡) dimasukkan dalam perhitungan tersebut. Untuk menentukan hasil quality control lulus uji atau tidak yaitu dengan melihat hasil dari perhitungan 𝑓1 dan 𝑓2 yang memiliki nilai

Covariance matriks inilah yang akan digunakan untuk setiap kelas dalam pembentukan fungsi diskriminan untuk klasifikasi (membentuk model).

maksimum. Berikut hasil yang diperoleh dari perhitungan fungsi diskriminan untuk setiap baris data, yaitu:

Gambar2.4. Perhitungan fungsi diskriminan

Dari hasil perhitungan dengan metode LDA di atas, data test yaitu data baru chip ring yang akan diuji quality control-nya menghasilkan indeks 2 yaitu termasuk dalam kelas not passed.

2.2.6. Metode Evaluasi 5-Fold Cross Validation

Setelah melakukan proses training dan testing maka metode evaluasi dengan 5-fold cross validation dapat dilakukan. Metode evaluasi digunakan untuk mengetahui tingkat akurasi sistem pengenal motif batik. Metode 5-fold cross validation membagi tiap kelompok motif batik Yogyakarta menjadi lima kelompok data yang kemudian secara bergantian dijadikan data untuk training maupun testing dalam lima langkah pengujian yang saling silang. Dimisalkan terdapat n-buah motif batik untuk satu jenis motif batik

Yogyakarta, sehingga tiap kelompok memiliki n/5 buah anggota. Diberikan nilai n = 25 data, sehingga pembagiannya ialah:

ο‚· Kelompok 1:

 data motif β€œCeplok Kece” ke 1 hingga 5,

 data motif β€œKawung Galar” ke 1 hingga 5,

 data motif β€œNitik Cengkeh” ke 1 hingga 5,

 data motif β€œParang Barong” ke 1 hingga 5,

 data motif β€œParisewuli Seling Pamor” ke 1 hingga 5,

 data motif β€œTruntum” ke 1 hingga 5,

 data motif β€œTambal” ke 1 hingga 5,

 data motif β€œParang Tuding” ke 1 hingga ke 5,

………..

 data motif β€œParang Kunci” ke 1 hingga 5.

ο‚· Kelompok 2:

 data motif β€œCeplok Kece” ke 6 hingga 10,

 data motif β€œKawung Galar” ke 6 hingga 10,

 data motif β€œNitik Cengkeh” ke 6 hingga 10,

 data motif β€œParang Barong” ke 6 hingga 10,

 data motif β€œParisewuli Seling Pamor” ke 6 hingga 10,

 data motif β€œTruntum” ke 6 hingga 10,

 data motif β€œTambal” ke 6 hingga 10,

 data motif β€œParang Tuding” ke 6 hingga ke 10,

 data motif β€œParang Kunci” ke 6 hingga 10.

ο‚· Kelompok 3:

 data motif β€œCeplok Kece” ke 11 hingga 15,

 data motif β€œKawung Galar” ke 11 hingga 15,

 data motif β€œNitik Cengkeh” ke 11 hingga 15,

 data motif β€œParang Barong” ke 11 hingga 15,

 data motif β€œParisewuli Seling Pamor” ke 11 hingga 15,

 data motif β€œTruntum” ke 11 hingga 15,

 data motif β€œTambal” ke 11 hingga 15,

 data motif β€œParang Tuding” ke 11 hingga 15,

…………

 data motif β€œParang Kunci” ke 11 hingga 15.

ο‚· Kelompok 4:

 data motif β€œCeplok Kece” ke 15 hingga 20,

 data motif β€œKawung Galar” ke 15 hingga 20,

 data motif β€œNitik Cengkeh” ke 15 hingga 20,

 data motif β€œParang Barong” ke 15 hingga 20,

 data motif β€œParisewuli Seling Pamor” ke 15 hingga 20,

 data motif β€œTruntum” ke 15 hingga 20,

 data motif β€œTambal” ke 15 hingga 20,

…………

 data motif β€œParang Kunci” ke 15 hingga 20.

ο‚· Kelompok 5:

 data motif β€œCeplok Kece” ke 16 hingga 25,

 data motif β€œKawung Galar” ke 16 hingga 25,

 data motif β€œNitik Cengkeh” ke 16 hingga 25,

 data motif β€œParang Barong” ke 16 hingga 25,

 data motif β€œParisewuli Seling Pamor” ke 16 hingga 25,

 data motif β€œTruntum” ke 16 hingga 25,

 data motif β€œTambal” ke 16 hingga 25,

 data motif β€œParang Tuding” ke 16 hingga 25,

…………

 data motif β€œParang Kunci” ke 16 hingga 25.

Data masukan dipisah untuk memastikan bahwa evaluasi dilakukan tanpa memproses data yang sama. Pemrosesan dengan data yang sama dapat terjadi ketika data masukan berjumlah sangat banyak. Jika data yang sama diproses dalam training dan testing, maka nilai validasi terhadap evaluasi akan berkurang walaupun angka akurasi meningkat.

Gambar2.5. Gambaran metode evaluasi 5-Fold Cross Validation

Masing-masing kotak yang terdapat pada gambar merupakan kotak yang mewakili satu kelompok data. Tiap satu kelompok data bergantian menjadi data testing pada satu langkah pengujian, sedangkan lainnya menjadi data training.

2.3. Matriks Data Multivariat

Data multivariate adalah data yang diperoleh dari hasil pengukuran terhadap n observasi-observasi berdasarkan variabel-variabel random p. Secara umum data multivariate disajikan dalam bentuk matriks X berukuran p x n sebagai berikut:

1 2 3 4 5 Testing Pengujian 1 Pengujian 2 Pengujian 3 Pengujian 4 Pengujian 5 Training 2 3 4 5 1 3 4 5 1 1 2 4 5 1 2 3 5 1 2 3 4

Kelompok data no.5 menjadi data training bersama dengan kelompok data 2, 3, 4.

Kelompok data no.5 menjadi data testing.

Gambar2.6. Matriks data multivariat

dimana I= 1, 2, ….., p dan j= 1, 2, ….., n.

Data multivariate dinotasikan dengan X = {Xij}, dengan Xij merupakan pengamatan terhadap variabel random ke-i pada observasi ke-j.

Dokumen terkait