HASIL DAN PEMBAHASAN Pemilihan Feature - Klasifikasi Sidik Jari Menggunakan Support Vector Mac

Keterangan:

t : Jumlah data (dalam data testing) yang diklasifikasikan secara benar

n : Jumlah data testing Evaluasi dan Analisis Hasil

Evaluasi dilakukan dengan melakukan penghitungan nilai akurasi. Nilai akurasi diperoleh dengan melakukan prediksi terhadap data menggunakan model klasifikasi. Dari hasil prediksi ini kemudian dihitung jumlah data yang diklasifikasikan secara benar dan salah. Evaluasi juga dilakukan dengan melihat kinerja SVM dalam mengklasifikasikan citra sidik jari, ketika dibandingkan dengan classifier yang lain, seperti Naïve Bayes dan KNN.

HASIL DAN PEMBAHASAN Pemilihan Feature

Eksperimen pertama yaitu pemilihan feature, menggunakan classifier SVM dengan menggunakan kernel polynomial (poly kernel), dan C = 1. Dalam eksperimen ini dilakukan beberapa percobaan dengan menggunakan feature yang berbeda. Berikut ini adalah

feature-feature yang dicobakan dengan hasil yang ditampilkan pada Tabel 3.

1. Feature 1, Jumlah BIF dan RIG setiap region

Feature 1 mengambil karakterisitik dari citra sidik jari, yaitu lokasi bifurcation dan ridge ending. Untuk setiap region, dihitung jumlah bifurcation dan ridge ending. Sehingga feature 1 memiliki format:

Keterangan:

bk : Jumlah BIF pada region k rk : Jumlah RIG pada region k k : Region, C : Kelas target citra sidik jari

2. Feature 2, jumlah jenis BIF/RIG setiap region + jumlah jenis theta setiap region Jenis BIF/RIG dikodekan dengan angka 0 sampai dengan 9. Jenis theta dikodekan dengan angka 0 sampai dengan 31. Contoh pengambilan data untuk feature ke 2 ditampilkan pada Gambar 10. Format penulisan feature adalah sebagai berikut:

Keterangan:

k : Region,

brgk : Jumlah jenis BIF/RIG pada region k,

θjk : Jumlah jenis theta h pada region k,

C : Kelas target citra sidik jari

Gambar 10 Contoh pengambilan feature jumlah jenis BIF/RIG setiap region dan jumlah jenis theta setiap region pada region 21. br01,br02,…,br025,br11,br12,…br125,

…br91,br92,…br925,

θ01, θ02,…,θ025, θ11, θ12,…, θ125,…,θ311, θ 312,…,θ3125,C

8 Tabel 3 Hasil eksperimen pemilihan feature

Feature Akurasi (%)

Feature 1 40.7

Feature 2 74.0

Keterangan:

Feature 1 : Jumlah BIF dan RIG setiap region Feature 2 : Jumlah jenis BIF/RIG + Jumlah

jenis theta setiap region

Program yang Digunakan

Penelitian ini menggunakan program-program sebagai berikut:

1. Mindtct (eksternal) 2. Wsq2Min

3. Min2Arff

4. Weka 3.6.2 (eksternal)

Program-program tersebut digunakan dalam proses yang berbeda dalam klasifikasi. Gambar 11 mengilustrasikan tentang proses klasifikasi dan program yang digunakan.

Gambar 11 Proses klasifikasi dan program yang digunakan.

Mindtct adalah program yang dibuat dalam bahasa C oleh NBIS. Mindtct berperan dalam proses ekstraksi citra sidik jari. Masukan dari program mindtct adalah file citra berformat wsq. Sedangkan keluarannya berupa file plain text berekstensi min. File min memberikan informasi jumlah minutiae, lokasi minutiae,

jenis minutiae, kemiringan minutiae, dan ketetanggaan antara minutiae satu dengan yang lain.

Wsq2Min adalah program yang dikembangkan dalam penelitian ini dengan bahasa Java. Program ini digunakan bersama dengan program mindtct. Pada siklus hidupnya, mindtct hanya dapat memroses satu file, sehingga untuk memroses file wsq yang jumlahnya lebih dari satu harus dilakukan pemanggilan ulang terhadap program mindtct. Agar proses ekstraksi dapat berjalan lebih cepat dan cukup satu pemanggilan, mindtct perlu dikombinasikan dengan Wsq2Min. Masukan dari program Wsq2Min adalah directory tempat file wsq berada, dan keluarannya adalah file min.

Program Min2Arff adalah program yang dikembangkan dalam penelitian ini juga menggunakan bahasa Java. Program ini berperan dalam proses pemilihan feature untuk proses klasifikasi. Masukan untuk program Min2Arff adalah file min, dan keluarannya adalah file arff. File arff adalah standar file yang digunakan oleh program weka. File arff berisi informasi hasil ekstraksi feature.

Weka adalah program dalam bahasa Java, yang dibuat oleh Universitas Waikato. Weka adalah program machine learning, yang digunakan untuk melakukan teknik-teknik data mining seperti klasifikasi dan clustering. Masukan untuk program Weka adalah file arff, dan keluarannya adalah model klasifikasi. Model klasifikasi yang diperoleh akan digunakan untuk memprediksi data ke dalam kelas yang sudah ditentukan.

Pemilihan Classifier dan Konfigurasi Parameter

Dalam penelitian ini classifier yang digunakan adalah SVM, KNN, dan Naïve Bayes. Feature yang digunakan adalah feature yang memberikan akurasi terbaik pada eksperimen pertama yaitu feature yang menggunakan jenis BIF/RIG setiap region dan jumlah jenis theta setiap region. Hasil perbandingan nilai akurasi dengan menggunakan beberapa classifier ditampilkan pada Tabel 4.

9 Tabel 4 Hasil klasifikasi dari beberapa

classifier

Classifier Akurasi

Naïve Bayes 56.1%

KNN (K=15) 66.6%

SVM 77.5%

Dari eksperimen pemilihan classifier, diperoleh kesimpulan bahwa classifier SVM memberikan akurasi yang lebih baik dibandingkan dengan classifier Naïve Bayes dan KNN. Selanjutnya akan dilakukan beberapa eksperimen dengan menggunakan parameter pada SVM yang berbeda. Hasil eksperimen konfigurasi parameter SVM ditampilkan pada Tabel 5. Nilai akurasi terbaik yaitu 79.7% diperoleh dengan menggunakan kernel RBF (Gamma = 0.1) dan C = 10. Tabel 5 Hasil eksperimen pemilihan parameter

pada SVM A B C D E F 1 RBF 1 0.01 ^- 76.8 2 RBF 10 0.01 ^- 77.8 3 RBF 20 0.01 ^- 77.5 4 RBF 30 0.01 ^- 76.7 5 RBF 50 0.01 ^- 75.9 6 RBF 100 0.01 ^- 75.4 7 RBF 10 0.05 - 78.7 8 RBF 10 0.1 - 79.7 9 Polynomial 10 - 1 73.2 10 Polynomial 10 - 2 79.4 11 Polynomial 10 - 3 79.5 Keterangan: A : Nomor B : Kernel C : Constraint D : Gamma E : Eksponen F : Akurasi (%) Analisis

Feature untuk merepresentasikan citra sidik jari diambil dari level ke dua sidik jari, yaitu jumlah jenis BIF/RIG setiap region dan jumlah jenis theta setiap region. Jumlah jenis BIF/RIG mampu memberikan model atau pola lokasi jenis minutiae dan hubungan minutiae satu dengan yang lain. Jumlah jenis theta akan

memberikan informasi pergerakan lengkungan sudut minutiae.

Feature jenis BIF/RIG dan theta akan diekstrak dalam bentuk region. Dari percobaan yang telah dilakukan region berukuran 5x5 memberikah akurasi yang lebih baik. Tabel 2, menampilkan hasil percobaan dengan menggunakan variasi beberapa ukuran region. Pemilihan ukuran region yang terlalu kecil (sedikit), memberikan variasi yang kecil sehingga arah pergerakan ridge tidak dapat diidentifikasi lebih detail, sebaliknya region yang lebih besar (banyak), akan menghasilkan atribut pada instance menjadi banyak, sehingga komputasi menjadi lebih berat.

Classifier yang digunakan adalah SVM dengan menggunakan kernel RBF (gamma = 1.0) dan C = 10. Berdasarkan literatur yang dipelajari, pada banyak kasus SVM memberikan hasil yang lebih baik dibandingkan dengan classifier yang lain (Nugroho et al. 2005). Dalam penelitian ini terbukti bahwa untuk seluruh data yang dicobakan, SVM mampu mengklasifikasikan secara benar lebih banyak jika dibandingkan dengan Naïve Bayes dan KNN. Hasil klasifikasi dan sebaran citra sidik jari setiap kelas dapat dilihat dengan memperhatikan confusion matrix dalam Tabel 6.

Tabel 6 Confusion matrix dari klasifikasi citra sidik jari dengan menggunakan feature jumlah jenis BIF/RIG + jumlah jenis theta dan classifier SVM (gamma = 0.1) dan C=10

Kelas hasil klasifikasi

l r w a t L 689 46 68 0 1 R 40 615 78 0 2 W 95 84 844 0 0 A 20 25 2 0 2 T 49 28 6 0 1 Keterangan:

L : Left loop A : Arch R : Right loop T : Tented Arch W : Whorl

Bagian baris (menggunakan huruf kapital) adalah kelas yang sebenarnya. Sedangkan bagian kolom (mengunakan huruf kecil) adalah kelas hasil prediksi yang dilakukan oleh model. Contoh pembacaan dari 804 instance Left loop, 689 instance yang diidentifikasi sebagai Left loop, sedangkan 46 diidentifikasikan sebagai Right loop, 68

10 sebagai Whorl, 0 sebagai Arch, dan 1 yang

diidentifikasi sebagai Tented arch.

Dari confusion matrix pada Tabel 6 kita mendapatkan informasi sebaran hasil klasifikasi untuk setiap kelas. Tabel 7 menunjukkan jumlah instance dan akurasi untuk setiap kelas.

Tabel 7 Jumlah instance dan akurasi setiap kelas

Kelas Jumlah instance Akurasi (%)

L 804 85.7

R 735 83.7

W 1023 82.5

A 49 0.0

T 84 1.2

Tabel 7 menunjukkan bahwa akurasi untuk kelas Arch dan Tented Arch lebih kecil dibanding dengan tiga kelas lainnya. Hal ini berbanding lurus dengan jumlah instance kelas tersebut yang jumlahnya relatif sedikit dibanding kelas yang lain. Sehingga dapat disimpulkan bahwa jumlah data training berpengaruh terhadap tingkat akurasi.

Dalam dokumen Klasifikasi Sidik Jari Menggunakan Support Vector Machine Dengan Feature Berbasis Minutiae Menggunakan Metode Region (Halaman 32-35)