• Tidak ada hasil yang ditemukan

Dengan bobot optimal yang telah didapatakan maka kita dapat mentransformasikan sample pada tabel 4.16 dengan cara forwardpropagation seperti pada persamaan (2.2), sehingga didapat hasil transformasi sample pada tabel 4.1 sebagai berikut:

Tabel 4.17 Training Sample John Hopkins University Ionosphere Dataset Pada Tabel 4.16 Setelah Transformasi

Feature 1 Feature 2 Target 0,5014 0,50258 Good

Tabel 4.18 Training Sample John Hopkins University Ionosphere Dataset (a) Sebelum Transformasi (b) Sesudah Transformasi

spl# rdr#1 rdr#2 rdr#3 rdr#4 rdr#5 … rdr#34 Target 1 1 0 0,9 -0,5 0,85 … -0,45 Good … … … … 101 1 0 1 -1 0 … 0 Good … … … … 143 1 0 1 -0,05 1 … -0,6 Bad … … … … 253 1 0 0 0 0 … 0 Bad (a)

sample# Feature 1 Feature 2 Target

1 0,5027 0,4998 Good … … … … 101 0,5026 0,4998 Good … … … … 143 0,5022 0,4995 Bad … … … … 253 0,5027 0,4999 Bad (b)

Setelah proses transformasi selesai dilakukan pada seluruh training sample dalam John Hopkins University Ionosphere Dataset , selanjutnya akan melalui proses cluster seperti pada pada persamaan (2.10), sebagai berikut:

Untuk kemudian diolah dalam komputer menggunakan MATLAB R2010a dalam perhitungan me-minimisasi nilai pada fungsi pada persamaan (2.12) untuk mendapatkan kesimpulan bahwa sample x termasuk dalam class yang dimiliki oleh , , . Berikut akan disajikan dalam tabel hasil dari seluruh perhitungan proses cluster pada training sample dan landmark pada John Hopkins University Ionosphere Dataset yang telah ditransformasi:

Tabel 4.19 Cluster-isasi Pada John Hopkins University Ionosphere Dataset Setelah Transformasi sample# 1 101 143 253 1 1 … 0,25 … 0,99 … 0,73 … … … … 101 0,25 … 1 … 0,1 … 0,2 … … … … 143 0,99 … 0,27 … 1 … 0,69 … … … … 253 0,73 … 0,09 … 0,69 … 1 keterangan: = instance “Good”

= sample dengan similarity function = 1

Setelah seluruh training sample di-transformasi kedalam low dimensional data, maka akan diuji tingkat akurasi classifier maupun sebelum maupun sesudah dataset di-transformasi, hasilnya dijabarkan dalam tabel 4.20 berikut:

Tabel 4.20 Perbandingan Tingkat Ketelitian Classifier Pada John Hopkins University Ionosphere Dataset Sebelum Dan Sesudah Transformasi

# training

sample # test sample

akurasi (%)

sebelum transformasi sesudah transformasi

50 10 90% 90%

100 10 90% 80%

150 10 90% 80%

200 10 90% 90%

250 10 90% 80%

Berikut disajikan grafik perbandingan tingkat ketelitian classifier sebelum dan sesudah transformasi pada John Hopkins University Ionosphere Dataset:

Gambar 4.7 Grafik Perbandingan Tingkat Ketelitian Classifier John Hopkins University Ionosphere Dataset Sebelum Dan Sesudah Transformasi

Pada gambar 4.8 berikut, disajikan grafis hasil proses cluster mulai dari jumlah training sample paling sedikit yaitu 50 training sample sampai 250 training sample:

(a) (b)

(c) (d)

(e)

Gambar 4.8 Grafis Hasil Cluster Pada John Hopkins University Ionosphere Dataset Sesudah Transformasi (a) 50 Sample (b) 100 Sample (c) 140 Sample

(d) 200 Sample (e) 250 Sample

Terlihat pada hasil percobaan penggunaan Support Vector Backpropagation pada klasifikasi John Hopkins University Ionosphere Dataset pada gambar 4.9 menggunakan (a) diperoleh tingkat ketelitian dalam melakukan cluster-isasi pada dataset yang telah ditransformasi ( hanya memiliki 2 features ) adalah sebesar 90% sementara pada dataset yang tidak ditransformasi ( memiliki 34 features ) diperoleh tingkat ketelitian sebesar 90%, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi ( hanya memilki 2 features ) sama dengan tingkat ketelitian

pada dataset yang tidak ditrasformasi ( memilki 34 features ). Pada hasil percobaan (b) diperoleh tingkat ketelitian dalam melakukan proses cluster-isasi pada dataset yang telah ditransformasi ( hanya memiliki 2 features ) adalah sebesar 80% sementara pada dataset yang tidak ditransformasi diperoleh tingkat ketelitian sebesar 90%, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi (hanya memiliki 2 features ) 10 % lebih rendah daripada tingkat ketelitian klasifikasi pada dataset yang tidak ditransformasi ( memiliki 34 features ). Pada hasil percobaan (c) diperoleh tingkat ketelitian dalam melakukan proses cluster-isasi pada dataset yang telah ditransformasi ( hanya memiliki 2 features ) adalah sebesar 80% sementara pada dataset yang tidak ditransformasi diperoleh tingkat ketelitian sebesar 90%, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi (hanya memiliki 2 features ) 10% lebih rendah daripada tingkat ketelitian klasifikasi pada dataset yang tidak ditransformasi ( memiliki 34 features ). Pada hasil percobaan (d) diperoleh tingkat ketelitian dalam melakukan proses cluster-isasi pada dataset yang telah ditrasformasi ( hanya memiliki 2 features ) adalah sebesar 90% sementara pada dataset yang tidak ditransformasi ( memiliki 34 features ) diperoleh tingkat ketelitian sebesar 90%, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditrasnformasi ( hanya memiliki 2 features ) sama dengan tingkat klasifikasi pada dataset yang tidak ditransformasi ( memiliki 34 features ). Pada percobaan (e) diperoleh tingkat ketelitian dalam melakukan proses cluster-isasi pada dataset yang telah ditransformasi ( hanya memiliki 2 features ) adalah sebesar 80% sementara pada dataset yang tidak ditransformasi ( memililki 34 features ) diperoleh tingkat ketelitian sebesar 90%, dalam hal ini tingkat ketelitian klasifikasi pada dataset yang telah ditransformasi ( hanya memiliki 2 features ) sama dengan tingkat ketelitian pada dataset yang tidak ditransformasi ( memiliki 34 features ). Secara keseluruhan hasil percobaan penggunaan Support Vector Backpropagation pada John Hopkins University Ionosphere Dataset memberikan hasil tingkat ketelitian yang cenderung sama pada dataset yang telah ditransformasi (hanya memiliki 2 features) dengan dataset yang tidak ditransformasi ( memiliki 34 features ).

Serangkaian percobaan telah dilakukan terhadap Iris Plants Dataset yang memiliki 4 attributes, Wisconsin Diagnostic Breast Cancer Dataset yang memiliki 9 attributes, Cleveland Heart Disease Dataset yang memilki 13 attributes dan John

Hopkins University Ionosphere Dataset yang memilki 34 attributes, penelitian juga dilakukan menggunakan jumlah training sample yang beragam mulai dari 30, 50, 100, 150, 300 bahkan sampai 600 sample. Dari hasil penelitian terlihat bahwa proses cluster pada Iris Plants Dataset menggunakan dataset yang telah ditransformasi oleh Support Vector Backpropagation mencapai tingkat akurasi menggunakan hanya 30 dari 150 training sample. Hasil penelitian proses cluster pada Wisconsin Diagnostic Breast Cancer Dataset menggunakan dataset yang telah ditransformasi oleh Support Vector Backpropagation mencapai tingkat akurasi 100% menggunakan 100 dari 680 training sample, namun tingkat akurasi akan turun drastis menjadi 0% jika menggunakan training sample lebih dari 100 sample ( 200-680 sample ) ini dikarenakan persebaran ( sparness ) data dalam feature space menjadi sangat padat mengakibatkan masing-masing class akan saling membaur dalam feature space yang sangat terbatas, kondisi ini sering disebut overfitting sehingga tidak mungkin ditemukan garis pemisah ( decision boundary ) yang akan memisahkan masing-masing class. Hasil penelitian proses cluster pada Cleveland Heart Disease Dataset menggunakan dataset yang telah ditransformasi oleh Support Vector Backpropagation mencapai tingkat akurasi optimal sebesar 70% menggunakan hanya 50 dari 250 training sample. Hasil penelitian proses cluster pada John Hopkins University Ionosphere Dataset menggunakan dataset yang telah ditransformasi oleh Support Vector Backpropagation mencapai tingkat akurasi optimal sebesar 90% menggunakan hanya 50 dari 300 training sample.

BAB 5

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Berdasarkan analisis dari sistem dan pengujian sistem secara menyeluruh yang telah dilakukan pada bab sebelumnya, maka kesimpulan pada penelitian ini antara lain:

1. Penggunaan Support Vector Backpropagation dalam proses cluster-isasi pada high dimensional dataset dapat mencapai tingkat ketelitan optimal walaupun training sample yang tersedia jumlahnya sedikit.

2. Cluster-isasi menggunakan Support Vector Backpropagation pada Iris Plants Dataset mancapai tingkat ketelitian optimal sebesar 100% hanya pada 30 dari 150 training sample, sementara pada Wisconsin Diagnostic Breast Cancer Dataset dicapai tingkat ketelitian optimal sebesar 100% hanya pada 100 dari 680 training sample, sementara pada Cleveland Heart Disease Dataset dicapai tingakat ketelitian optimal sebesar 70% hanya pada 50 dari 250 training sample, sementara pada John Hopkins University Ionosphere Dataset dicapai tingkat ketelitian sebesar 90% hanya pada 50 dari 250 training sample.

3. Khusus pada proses cluster-isasi pada Wisconsin Diagnostic Breast Cancer Dataset dicapai akurasi sebesar 100% pada 100 training sample namun tingkat akurasi menurun menjadi 0% jika menggnakan training sample lebih dari 100 sample, ini diakibatkan proses clusterisasi pada jumlah training sample yang sangat banyak meningkatkan persebaran data mengalami overfitting.

5.2. Saran

Pada penelitian ini terdapat beberapa saran dalam pengembangan penelitian ini lebih lanjut, yakni:

1. Perlunya pembuatan Graphical User Interface yang layak. 2. Perlunya penelitian lebih lanjut dalam proses cluster-isasi.

3. Percobaan dapat menggunakan algoritma jaringan syaraf tiruan yang berbeda contohnya Perceptron atau LVQ.

Dokumen terkait