Analisis dilakukan terhadap data populasi tanaman iris dan data pengenalan anggur. Kedua data digunakan untuk memverifikasi hasil yang diperoleh menggunakan AKU kernel. Selanjutnya data yang memberikan hasil yang sama dengan karya ilmiah ini dipilih untuk dianalisis salah klasifikasinya dalam hal ini data pengenalan anggur. Gambar 3 memvisualisasikan plot pencar dari beberapa pasang peubah untuk data pengenalan anggur, diambil beberapa pasang peubah karena dimensi data yang cukup besar. Pada gambar terlihat bahwa plot pencar hanya terdiri atas satu kelompok yang berisi baik kelompok 1, 2, dan 3 yang tidak dapat dipisahkan dengan beberapa data menjadi pencilan. Hal ini tidak cukup baik bila digunakan dalam menganalisis struktur pada data dan akan menyulitkan dalam pengklasifikasian data objek ke dalam kelompok tersebut, karena akan menyebabkan salah klasifikasi yang cukup besar. Oleh karena itu, AKU kernel akan digunakan untuk menyelesaikan permasalahan ini.
11
Gambar 3 Plot pencar dari beberapa pasang peubah data pengenalan anggur Terlihat dari gambar bahwa hubungan antarpeubah adalah tak terpisah untuk setiap kelompok. Deskripsi data yang digunakan dapat diamati dalam Tabel 2. Pemilihan parameter pada fungsi kernel didasarkan pada plot pencar dari setiap pasang peubah, dengan mencoba-coba beberapa nilai yang berbeda dan dipilih parameter dengan hasil yang lebih baik. Karena pada dasarnya belum ada ketentuan nilai parameter untuk setiap fungsi kernel. Tabel 2 menggambarkan nilai-nilai yang ada dari setiap peubah. Rata-rata dan simpangan baku (SB) dari setiap peubah akan digunakan untuk standarisasi data. Karya ilmiah ini akan menggunakan dua fungsi kernel yaitu linear (sesuai dengan AKU) dan Gauss. Deskripsi kedua fungsi kernel diberikan pada Tabel 3.
12
Tabel 4 Matriks kovarians
No Peubah Al AM Ab AA Mg TF Fl FF Pa IW Wa OD Pr 1 Al 0.656 1.481 0.047 -0.852 3.180 0.141 0.198 -0.029 0.062 1.022 -0.012 0.041 163.394 2 AM 1.481 203.325 0.432 1.654 21.006 0.303 0.744 -0.008 0.264 1.871 -0.022 -0.246 508.050 3 Ab 0.047 0.432 0.075 0.406 1.104 0.023 0.029 0.011 0.001 0.164 -0.005 0.001 19.193 4 AA -0.852 1.654 0.406 11.657 -5.209 -0.655 -1.107 0.243 -0.370 -0.095 -0.189 -0.600 -468.616 5 Mg 3.180 21.006 1.104 -5.209 203.900 2.003 2.628 -0.540 1.941 6.675 0.176 0.665 1775.845 6 TF 0.141 0.303 0.023 -0.655 2.003 0.412 0.554 -0.037 0.222 -0.090 0.063 0.317 99.648 7 Fl 0.198 0.744 0.029 -1.107 2.628 0.554 1.013 -0.063 0.374 -0.385 0.124 0.560 156.148 8 FF -0.029 -0.008 0.011 0.243 -0.540 -0.037 -0.063 0.043 -0.024 0.014 -0.007 -0.046 -15.218 9 Pa 0.062 0.264 0.001 -0.370 1.941 0.222 0.374 -0.024 0.328 -0.034 0.039 0.211 59.554 10 IW 1.022 1.871 0.164 -0.095 6.675 -0.090 -0.385 0.014 -0.034 5.374 -0.276 -0.706 230.768 11 Wa -0.012 -0.022 -0.005 -0.189 0.176 0.063 0.124 -0.007 0.039 -0.276 0.052 0.092 16.999 12 OD 0.041 -0.246 0.001 -0.600 0.665 0.317 0.560 -0.046 0.211 -0.706 0.092 0.504 69.923 13 Pr 163.394 508.050 19.193 -468.616 1775.845 99.648 156.148 -15.218 59.554 230.767 16.999 69.923 99166.720
Tabel 2 Deskripsi data pengenalan anggur No
. Peubah Rata-rata Maksimum Minimum SB∗
1 Alkohol(Al) 13.0036 14.83 11.03 0.809732
2 Asam malat(AM) 3.409831 192 0.74 14.25921
3 Abu(Ab) 2.36618 3.23 1.36 0.274265
4 Alkali pada abu(AA) 19.43876 30 10 3.414296
5 Magnesium(Mg) 99.71348 162 70 14.27937
6 Total fenol (TF) 2.28864 3.88 0.128 0.642152
7 Flavonoid (Fl) 2.023927 5.08 0.099 1.006646
8 Fenol yang bukan flavonoid(FF) 0.372556 2.58 0.13 0.206944
9 Proanthosianin(Pa) 1.590899 3.58 0.41 0.572359
10 Intensitas warna(IW) 5.05809 13 1.28 2.318286
11 Warna(Wa) 0.957506 1.71 0.48 0.228484
12 Anggur yang diencerkan pada
OD280/OD315 (OD) 2.611629 4 1.27 0.710065
13 Prolina(Pr) 746.8933 1680 278 314.9075
* SB = simpangan baku
Tabel 3 Fungsi kernel yang diaplikasikan
No. Jenis fungsi Fungsi Par. 0
1 Linear � ,� =��� -
2 Gauss �,� = exp(− � − � 2 02) 1, 1.25,…, 6 Analisis data dilakukan pada data yang telah distandarisasi, atau bersesuaian dengan matriks korelasi. Hal ini dikarenakan varians setiap peubah memiliki nilai yang perbedaannya cukup besar, sehingga tanpa distandarisasi analisis hanya akan terfokus pada peubah dengan varians terbesar. Tabel 4 dan Tabel 5 masing-masig menjelaskan matriks kovarians dan matriks korelasi.
13 Tabel 5 Matriks korelasi
No Peubah Al AM Ab AA Mg TF Fl FF Pa IW Wa OD Pr 1 Al 1.000 0.128 0.214 -0.308 0.275 0.271 0.243 -0.174 0.133 0.544 -0.064 0.071 0.641 2 AM 0.128 1.000 0.110 0.034 0.103 0.033 0.052 -0.003 0.032 0.057 -0.007 -0.024 0.113 3 Ab 0.214 0.110 1.000 0.433 0.282 0.128 0.106 0.196 0.008 0.258 -0.075 0.003 0.222 4 AA -0.308 0.034 0.433 1.000 -0.107 -0.299 -0.322 0.344 -0.189 -0.012 -0.242 -0.248 -0.436 5 Mg 0.275 0.103 0.282 -0.107 1.000 0.218 0.183 -0.183 0.237 0.202 0.054 0.066 0.395 6 TF 0.271 0.033 0.128 -0.299 0.218 1.000 0.858 -0.281 0.605 -0.061 0.430 0.695 0.493 7 Fl 0.243 0.052 0.106 -0.322 0.183 0.858 1.000 -0.300 0.648 -0.165 0.539 0.784 0.493 8 FF -0.174 -0.003 0.196 0.344 -0.183 -0.281 -0.300 1.000 -0.199 0.029 -0.150 -0.312 -0.234 9 Pa 0.133 0.032 0.008 -0.189 0.237 0.605 0.648 -0.199 1.000 -0.025 0.296 0.519 0.330 10 IW 0.544 0.057 0.258 -0.012 0.202 -0.061 -0.165 0.029 -0.025 1.000 -0.522 -0.429 0.316 11 Wa -0.064 -0.007 -0.075 -0.242 0.054 0.430 0.539 -0.150 0.296 -0.522 1.000 0.565 0.236 12 OD 0.071 -0.024 0.003 -0.248 0.066 0.695 0.784 -0.312 0.519 -0.429 0.565 1.000 0.313 13 Pr 0.641 0.113 0.222 -0.436 0.395 0.493 0.493 -0.234 0.330 0.316 0.236 0.313 1.000
Analisis data menggunakan AKU kernel cukup baik memisahkan antarkelompok dengan menggunakan dua komponen utama pertama. Walaupun masih ada sebagian kecil objek antarkelompok yang bercampur. Dari kedua fungsi yang digunakan terlihat bahwa plot pencar dari dua komponen utama kernel pertama cukup mampu mengambarkan pola yang terpisah pada data. Gambar selanjutnya akan memvisualisasikan plot pencar dari dua komponen utama untuk setiap fungsi kernel.
Gambar 4 AKU atau fungsi linear Gambar 5 Fungsi Gauss dengan
parameter 0= 1
Gambar 6 Fungsi Gauss dengan Gambar 7 Fungsi Gauss dengan parameter 0= 1.25 parameter 0 = 1.5
14
Gambar 8 Fungsi Gauss dengan Gambar 9 Fungsi Gauss dengan parameter 0= 1.75 parameter 0 = 2
Gambar 10 Fungsi Gauss dengan Gambar 11 Fungsi Gauss dengan parameter 0= 2.25 parameter 0= 2.5
Gambar 12 Fungsi Gauss dengan Gambar 13 Fungsi Gauss dengan parameter 0= 2.75 parameter 0 = 3
Gambar 14 Fungsi Gauss dengan Gambar 15 Fungsi Gauss dengan parameter 0 = 3.25 parameter 0 = 3.5
15
Gambar 16 Fungsi Gauss dengan Gambar 17 Fungsi Gauss dengan parameter 0 = 3.75 parameter 0= 4
Gambar 18 Fungsi Gauss dengan Gambar 19 Fungsi Gauss dengan parameter 0= 4.25 parameter 0= 4.5
Gambar 20 Fungsi Gauss dengan Gambar 21 Fungsi Gauss dengan parameter 0= 4.75 parameter 0= 5
Gambar 22 Fungsi Gauss dengan Gambar 23 Fungsi Gauss dengan parameter 0= 5.25 parameter 0 = 5.5
16
Gambar 24 Fungsi Gauss dengan Gambar 25 Fungsi Gauss dengan parameter 0= 5.75 parameter 0 = 6
Dengan menggunakan dua komponen utama pertama, fungsi kernel linear dan Gauss memberikan hasil pemisahan antarkelompok yang lebih baik jika dibandingkan dengan plot pencar antarpeubah. Dalam karya ilmiah ini dilakukan perbandingan pada dua buah data yaitu data tanaman iris dan data pengenalan anggur. Keduanya memiliki perbandingan dengan artikel dalam jurnal yang sudah ada, hasilnya dijelaskan dalam Gambar 26 dan 27. Pada data pengenalan anggur yang dijelaskan dalam Lampiran 1 untuk fungsi Gauss dengan parameter
0 = 3 diperoleh hasil yang cukup baik dan relatif sama dengan yang diperoleh pada artikel dalam jurnal. Nilai dan vektor eigen untuk 0= 3 dijelaskan dalam Lampiran 2.
(a) (b)
Gambar 26 Perbandingan hasil data pengenalan anggur (a) karya ilmiah (b) Sugiyama (2013)
Pemisahan data tanaman iris menggunakan AKU kernel sebelumnya telah dikerjakan dan menghasilkan plot yang berbeda dengan yang dijelaskan oleh Djakaria et al. (2010). Karena jurnal tersebut hanya menggunakan fungsi kernel Gauss dengan tidak menjelaskan setiap parameter yang digunakan, sehingga perbedaan ini sulit diketahui di mana letaknya. Walaupun ada satu parameter yang dijelaskan yaitu untuk parameter 0= 0.001 2 namun hasilnya tetap sangat berbeda.
17
(a) (b)
Gambar 27 Perbandingan hasil data tanaman iris (a) karya ilmiah (b) Djakaria et al. (2010)
Karena tidak mungkin kedua hasil benar, maka kemungkinan salah satu ada yang salah atau kedua-duanya salah. Oleh karena itu diperlukan penelusuran selanjutnya yang dapat memberikan hasil yang baik dan benar untuk dalam penggunaan AKU kernel.
Setelah diperoleh hasil pemisahan yang cukup baik antarkelompok, selanjutnya akan dibahas tentang pengklasifikasian kelompok menggunakan AKU kernel. Pengklasifikasian ini akan membandingkan dua fungsi kernel yaitu fungsi linear (bersesuaian dengan AKU) dan Gauss. Analisis data yang dilakukan pada prosedur analisis data ialah untuk data yang distandarisasi. Pada Tabel 7, 8, 9, dan 10 dijelaskan hasil yang diperoleh menggunakan fungsi kernel linear dan Gauss. Pada Tabel 6 dijelaskan jumlah kesalahan untuk setiap parameter dari fungsi Gauss, serta grafiknya.
Tabel 6 Hasil salah klasifikasi (SK) fungsi Gauss
h0 1 1.25 1.5 1.75 2 2.25 2.5 2.75 3 3.25 3.5 SK 58 65 59 37 53 56 31 61 38 38 41 %SK 32.58% 36.51% 33.15% 20.78% 29.77% 31.46% 17.42% 34.27% 21.35% 21.58% 23.03 h0 3.75 4 4.25 4.5 4.75 5 5.25 5.5 5.75 6 SK 66 45 45 47 71 73 52 50 51 70 %SK 37.08% 25.3% 25.3% 26.4% 39.88% 41.01% 29.2% 28.09% 28.65% 39.33%
Semula diperkirakan ada tren kuadrat dari salah klasifikasi yang dapat digunakan untuk menduga hasil klasifikasi terkecil dengan menggunakan regresi kuadratik untuk nilai parameter 0 yang digunakan. Namun, hasil yang diperoleh terlihat pada Gambar 28 yaitu terjadi perubahan banyaknya salah klasifikasi yang tidak teratur. Selanjutnya akan digunakan AKU kernel untuk menyelesaikan klasifikasi kelompok. Pada dasarnya studi dilakukan pada fungsi Gauss untuk parameter 0= 1, 1.25, …, 6. Namun, untuk memberikan gambaran hasilnya, dipilih tiga parameter dengan nilai kesalahan yang berbeda-beda yaitu untuk
18
Gambar 28 Grafik kesalahan klasifikasi
Fungsi linear memiliki salah klasifikasi sebesar 30.89%. Terlihat bahwa salah klasifikasi kelompok menggunakan fungsi ini banyak terdapat pada kelompok 3. Hal ini terjadi karena antarkelompok ini memang sulit dipisahkan secara keseluruhan dan juga karena jarak yang berdekatan antarkelompok.
Tabel 7 Hasil pengklasifikasian kelompok data dengan fungsi linear Kelompok asal Kelompok prediksi Total SK 1 2 3 1 54 0 5 59 5 2 4 47 20 71 24 3 3 23 22 48 26
Fungsi Gauss dengan parameter 0=1 memiliki salah klasifikasi sebesar 32.584%. Terlihat bahwa salah klasifikasi kelompok menggunakan fungsi ini banyak terdapat pada kelompok 3. Hal ini juga terjadi karena antarkelompok ini memang sulit dipisahkan secara keseluruhan dan juga karena jarak yang berdekatan antarkelompok. Hasil ini relatif mirip dengan fungsi kernel linear.
Tabel 8 Hasil pengklasifikasian kelompok data dengan fungsi Gauss 0=1 Kelompok asal Kelompok prediksi Total SK 1 2 3 1 43 16 0 59 16 2 0 58 13 71 13 3 0 29 19 48 29
Fungsi Gauss dengan parameter 0=2.5 memiliki salah klasifikasi sebesar 17.416%. Terlihat bahwa salah klasifikasi kelompok menggunakan fungsi ini banyak terdapat pada kelompok 2. Hal ini berbeda dengan yang hasil diperoleh sebelumnya.
Tabel 9 Hasil pengklasifikasian kelompok data dengan fungsi Gauss 0=2.5 Kelompok asal Kelompok prediksi Total SK 1 2 3 1 54 0 5 59 5 2 0 47 24 71 24 3 0 2 46 48 2
Fungsi Gauss dengan parameter 0= 6 memiliki salah klasifikasi sebesar 39.326%, hasil ini cukup besar bila dibandingkan dengan yang lainnya. Terlihat
19 bahwa salah klasifikasi kelompok menggunakan fungsi ini banyak terdapat pada kelompok 2. Hasil salah klasifikasi yang dipeoleh cukup besar dan kurang baik digunakan untuk klasifikasi kelompok.
Tabel 10 Hasil pengklasifikasian kelompok data dengan fungsi Gauss 0=6 Kelompok asal Kelompok prediksi Total SK 1 2 3 1 32 27 0 59 27 2 41 28 2 71 41 3 0 0 48 48 0
Pengklasifikasian menggunakan fungsi Gauss dengan menggunakan parameter 0 = 1, 2.5, 6 memiliki hasil salah klasifikasi sebesar 32.584%, 17.416% dan 39.326% secara berturut-turut. Terlihat bahwa salah klasifikasi kelompok menggunakan fungsi ini banyak terdapat pada setiap kelompok bergantung pada parameter. Hal ini terjadi karena dalam pemilihan parameter untuk fungsi kernel belum ada ketentuannya, hanya disesuaikan berdasarkan hasil atau tipe plot yang lebih baik.