.
SELEKSI FITUR DAN PARAMETER OPTIMAL DENGAN
MENGGUNAKAN ALGORITMA GENETIKA PADA
KLASIFIKASI FUZZY ARTMAP BERBOBOT
Bain Khusnul Khotimah1Universitas Trunojoyo, Bangkalan, Jawa Timur1
ABSTRAK
Klasifikasi fuzzy ARTMAP berbobot adalah metode baru dalam klasifikasi yang diperoleh dengan mengkombinasikan simplified fuzzy ARTMAP dan symmetric fuzzy ART ditambah pembobotan pheromone sesuai konsep koloni semut. Dimana algoritma ini mempunyai parameter yang optimal diantaranya pembobotan pheromon, pembobotan likenessIntensity dan nilai batas vigilance yang mempengaruhi kinerja klasifikasi. Sedangkan kinerja klasifikasi umumnya dipengaruhi oleh penggunaan fitur pada data untuk menghasilkan sebuah model, padahal tidak semua fitur tersebut relevan terhadap hasil klasifikasi. Apabila hal tersebut terjadi pada data yang memiliki ukuran dan dimensi yang sangat besar, maka membuat kinerja algoritma menjadi tidak efektif dan efisien, misalnya saja waktu pemrosesan menjadi lebih lama akibat banyak fitur yang harus diproses. Salah satu solusi yang digunakan untuk mengatasi masalah tersebut adalah dengan menggunakan seleksi fitur. Seleksi fitur adalah salah satu tahap praproses pada klasifikasi yang dilakukan dengan cara memilih fitur-fitur yang relevan terhadap data yang mempengaruhi hasil klasifikasi. Seleksi fitur digunakan untuk mengurangi dimensi data dan fitur yang tidak relevan, serta untuk meningkatkan efektifitas dan efisiensi kinerja dari algoritma klasifikasi. Algoritma genetika mampu mendapatkan nilai fitur dan parameter optimal secara otomatis dengan hasil yang lebih tinggi. Sedangkan hasil akurasi dengan menggunakan algoritma genetika sebesar 89.07 dan menggunakan algoritma grid search menunjukkan hasil akurasi 87.81. Uji coba dilakukan hingga konvergen dengan parameter dan fitur optimal untuk setiap data set menyesuaikan karakteristik data set yang digunakan. Pada data iris mencapai nilai akurasi tertinggi dibandingkan data set lainnya. Pada uji coba tersebut menunjukkan algoritma genetika lebih baik dibandingkan algoritma grid search.
Kata kunci:seleksi fitur, parameter optimal, fuzzy ARTMAP berbobot, algoritma genetika, algoritma grid search
PENDAHULUAN
Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui [1]. Jika diberikan sekumpulan data yang terdiri dari beberapa fitur dan kelas, maka klasifikasi adalah menemukan model dari kelas tersebut sebagai fungsi dari fitur-fitur yang lain. Pada umumnya algoritma klasifikasi menggunakan semua fitur yang terdapat pada data untuk membangun sebuah model, padahal tidak semua fitur tersebut relevan terhadap hasil klasifikasi. Apabila hal tersebut terjadi pada data yang memiliki ukuran dan dimensi yang sangat besar, maka membuat kinerja algoritma menjadi tidak efektif dan efisien, misalnya saja waktu pemrosesan menjadi lebih lama akibat banyak fitur yang harus
. diproses. Salah satu solusi yang digunakan untuk mengatasi masalah tersebut adalah dengan menggunakan seleksi fitur. Seleksi fitur adalah salah satu tahap praproses pada klasifikasi yang dilakukan dengan cara memilih fitur-fitur yang relevan terhadap data yang mempengaruhi hasil klasifikasi. Seleksi fitur digunakan untuk mengurangi dimensi data dan fitur yang tidak relevan, serta untuk meningkatkan efektifitas dan efisiensi kinerja dari algoritma klasifikasi [2]. Pada Klasifikasi juga dipengaruhi oleh pemilihan parameter, karena dengan parameter optimal akan meningkatkan unjuk kaerja klasifikasi [3].
Metode klasifikasi yang digunakan pada klasifikasi ini adalah pengembangan dari metode fuzzy ARTMAP diperoleh dengan mengkombinasikan antara simplified
fuzzy ARTMAP dan symmetric fuzzy ART yang mempunyai fungsi aktifasi dan fungsi mach yang terpengaruh jumlah data di dalam node, hal ini menimbulkan ketidakadilan
terhadap node yang memiliki jumlah pattern lebih banyak. Untuk mengatasi masalah tersebut dilakukan modifikasi pembobotan dengan menambahkan konsep algoritma koloni semut pada fuzzy ARTMAP sehingga disebut FAM berbobot atau fuzzy ARTMAP berbobot. Prinsip algoritma ini mirip dengan penyelesaian kasus terpendek dimana setiap semut akan mengikuti jalan yang mengandung jumlah pheromon lebih banyak dibanding lainnya. Semakin dekat jalur yang dilalui semut maka semut yang lewat akan semakin banyak dan jejak pheromon yang ditinggalkan juga semakin banyak, begitu juga sebaliknya. Sehingga cluster node yang dihasilkan akan menyesuaikan dengan jumlah pattern dan dapat menampung pattern lebih banyak [4].
Permasalah dalam metode Fuzzy ARTMAP Berbobot adalah tergantung penggunaan fitur subset pada data dengan fitur yang banyak tinggi dan pemilihan parameter pada saat proses pembelajaran yang mempengaruhi kinerja klasifikasi. Sehingga penelitian ini akan melakukan seleksi fitur dan estimasi parameter dengan menggunakan algoritma genetika yang tujuannya dapat meningkatkan kinerja pada classifier. Karena Algoritma genetika sangat baik untuk menyelesaikan permasalahan optimasi dan melakukan
search point dengan mencari pola baru yang diharapkan memiliki nilai fitness yang
lebih baik dari seluruh kromosom dan dapat meningkatkan kinerja pada classifier (5).
METODE ART
Algoritma Fuzzy ARTMAP Berbobot merupakan pengembangan dari algoritma
ART yang prinsipnya menggunakan pembobotan. Dimana fungsi pembobotan W = {w1,
w2, …,wC} pada setiap Nuron N ={N1, N2, …, NC} yang yang menyatakan dan jumlah
pola dari X sejumlah data. ART-1 menggunakan inherently nonsymmetrical architecture untuk menghitung intrinsically symmetric fuzzy ART (S-Fuzzy ART) yang mengadopsi
symmetric activation dan match function, yaitu T(x,wj)=T(wj,x) dan T(x,wj)=M(x,wj)
[6]. Dengan Tiga fungsi utama adalah fungsi T (), M () and U (). Sedangkan NEWNODE(new) dalam algoritma tersebut adalah sebuah macro routine yang
mengalokasikan new node (template) untuk network, yaitu T (x, w) disebut sebagai
activation function, yang digunakan untuk mengukur derajat dari resemblance dari x
dengan w. wj w x w x T j j     ) , ( (1)
Dimana a adalah choice parameter, a > 0
M( x, wj) disebut match function, yang digunakan untuk menentukan seberapa jauh
. x w x w x M ( , j)   j (2)
Fungsi ini digunakan sebagai conjunction untuk vigilance parameter
 
0,1, dimana
x wj
M , yang berarti resonansi. Vigilance merupakan parameter network
terpenting untuk menentukan resolusinya : larger vigilance value normally yields larger
number dari output nodes dan presisi yang bagus.
U ( x, wj) disebut update function, yang digunakan untuk mengupdate sebuah template
setelah resonansi dengan sebuah pola: ) ( ) 1 ( ) , (xwj wj x wj U     (3)
dimana  adalah learning rate, 0 1. Nilai yang lebih tinggi dari  dihasilkan
dalam faster learning. Disebut sebagai fast learning dalam ART ketika = 1.
Operator  dalam persamaan (2.1) hingga (2.2) adalah bitwise AND operator, yaitu a
b = (a1 AND b1, a2AND b2, … acC AND bc) , dan || a|| adalah dirumuskan sebagai
berikut,
  D i i a a 1 (4)Simmetric Fuzzy ART (S-Fuzzy ART)
Pada metode ART menggunakan dua bentuk penggabungan dari symmetric
activation dan match function adalah:
2 1 1 ) , ( ) , ( j j j w x w x M w x T     (5) atau
 
     D d D d d d D d d d j j w x w x w x M w x T 1 1 1 } , min{ ) , ( ) , ( (6)Fuzzy ARTMAP Berbobot
Metode ini merupakan pengembangan dari SFAM dan fuzzy ARTMAP yang mana algoritma ini secara umum mengkombinasikan antara fuzzy ARTMAP dan
synmetric fuzzy ART serta ditambah dengan pembobotan node cluster berdasarkan
jumlah pola dan size dari node cluster tersebut. Ada beberapa hal yang perlu diperhatikan dalam fuzzy ARTMAP sebagai berikut dimana nilai fungsi dari aktifasi T() dan match (M) pada suatu node output tidak terpengaruh terhadap jumlah data yang ada dalam node terxebut, dengan kata lain jika ada dua node output yang memiliki bentuk dan ukuran yang sama, tetapi memiliki jumlah pattern yang ada tidak sama, maka nilai T() maka menimbulkan ketidakadilan terhadap node yang memiliki jumlah pattern yang lebih banyak [7]. Sehingga ide dasar fuzzy ARTMAP berbobot adalah mencari bentuk formula baru dari T() dan M() yang merupakan hasil relaksasi fungsi pada SFAM dan
S-fuzzy ART dengan mengalikan dengan parameter likenessintensity (Li). Serta
dijumlahkan dengan bobot pheromon dengan maksud memberi nilai lebih besar pada ukuran cluster node yang memiliki pattern lebih banyak.
. Proses pembobotan dalam algoritma ini mengadopsi sistem pheromon dan peluruhannya pada sistem koloni semut, dan penerapan jejak pheromon pada metode
ARTMAP terletak pada seberapa pertambahan size (pola baru sudah didalam cluster).
Jika tidak terjadi pertambahan size (pola baru sudah didalam cluster) maka tingkat kepekatan pheromon dalam node tersebut semakin besar walaupun terjadi peluruhan karena waktu. Akan tetapi, jika pola baru menyebabkan ukuran cluster node bertambah besar, maka tingkat peluruhan/evaporasi kepekatan pheromon juga semakin besar karena harus disebar ke ruang baru sehingga tingkat kepekatan pheromon menjadi berkurang [4]. Ilustrasi dari perubahan kepekatan pheromon seperti ditunjukkan pada Gambar 1.
Gambar 1. Size cluster node bertambah karena beresonansi dengan pola baru
Dari ilustrasi Gambar 1. jejak pheromon dapat ditulis dengan persamaan :
) 1 ( ) (   t w t w r j j (7)
( ( () ( ())) ( 1) || ( 1)|| ) 1 ( 1)
1
(
w t t r t elseif t w t j j j j j jt
   
(8) Dimana :r =ratio pertambahan size cluster node baru dengan size cluster node lama.
= constant pheromon yang ditinggalkan setiap terjadi update cluster node.
=constant evaporasi/peluruhan setiap terjadi update cluster node.
) 1 (t j
 = jejak pheromon jika terjadi resonansi antara pola dengan node output.
Pengembangan lainnya dari algoritma SFAM ini dengan menggabung antara nilai yang dihasilkan dari T() dan M() pada persamaan dengan nilai dari symmetric fuzzy
ARTMAP, dimana T() dan M() berbobot ditunjukkan pada persamaan berikut ini:
2 1 1 * * ) 1 ( ) , ( j j j j i w x w n w x w x T          (9) j j j j j i w x w w x w x M          2 1 1 * * ) 1 ( ) , ( (10)
Nilai adalah bobot kesimetrisan yang jika nilainya  1berarti sama dengan
persamaan fuzzy ARTMAP ditambah pembobotan dan jika nilai  0maka prinsip
.
Algoritma Genetika
Algoritma genetika pertama kali diperkenalkan oleh John Holland dari Universitas Michigan (1975), Setiap masalah yang berbentuk adaptasi dapat
diformulasikan dalam terminologi genetika. Algoritma ini termasuk jenis
nonpolynomial (NP) yang secara khusus dapat di terapkan untuk memecahkan masalah
optimasi yang kompleks, sehingga baik untuk aplikasi yang memerlukan startegi pemecahan masalah secara adaptif [8]. Masalah dibangun dengan sebuah populasi yang terdiri dari individu-individu yang mempresentasikan sebuah solusi yang mungkin bagi persoalan yang ada. Individu dilambangkan dengan sebuah nilai fitness yang akan digunakan untuk mencari solusi terbaik bagi persoalan yang ada, dimana nilai fitness menggambarkan hasil solusi yang sudah dikodekan. Selama berjalan induk harus digunakan untuk reproduksi, pindah silang (crossover) dan mutasi untuk menciptakan keturunan sesuai Gambar 2. Algoritma genetika akan bekerja secara baik dengan proses evolusi pada populasi sampai mengalami konvergensi untuk mendapatkan solusi yang optimum sesuai Gambar 3. [8][9]
Seleksi Fitur dan Parameter menggunakan Algoritma Genetika
Algoritma genetika telah dikembangkan untuk proses pencarian solusi secara acak dengan mengembangkan populasi yang menyatakan sekumpulan solusi. Proses pencarian dilakukan berdasarkan teori evolusi genetika melalui seleksi, crossover dan mutasi gen untuk memperoleh individu yang terbaik. Pada proses ini digunakan proses seleksi fitur dan pemilihan parameter yang tujuannya untuk mempercepat waktu komputasi, dengan menggunakan algoritma genetika ditunjukkan pada Gambar 4.
Gambar 2. Proses mutasi dan crossover
.
Inisialisasi Parameter
Sebelum menganalisa fitness, maka perlu menganalisa parameter yang berpengaruh terhadap classifier diantaranya analisa fungsi pada metode fuzzy ARTMAP berbobot diantaranya RHO= vigilance untuk tingkat resonansi pada saat learning, PI =
PheromonIntensity untuk pembobotan nilai bias, dan LI = LikenessIntensity untuk
menentukan kisimetrisan yang menentukan jumlah node cluster yang terbentuk.
Fitness Function
Kromosom pada individu mewakili parameter fungsi fuzzy ARTMAP untuk menghasilkan nilai fitness. Nilai fitness dihitung pada setiap populasi kromosom dan diambil nilai fitness tertinggi pada setiap populasi [4]. Fitness yang digunakan untuk mengukur performansi klasifikasi.
fitness = Wax FAMB_accuracy + WFx
1 1       
nf i i ixF C (11) dimana:Wa = Pembobotan kinerja klasifikasi (accuracy)
Wf = Pembobotan pada fitur yang terpilih
Ci = cost pada fitur yang terpilih
Fi = fitur yang terpilih
FAMB_acc = nilai akurasi pada klasifikasi
Proses perhitungan fitness dipengaruhi oleh jumlah fitur terpilih Fi dan nilai
akurasi dari klasifikasi. Sedangkan nilai bobot diset range nilai mulai dari 0-1, factor bobot pada akurasi klasifikasi dan factor bobot pada fitur digunakan untuk mencari kestabilan klasifikasi sampai memperoleh hasil yang paling optimum.
.
Gambar 4. Optimasi parameter menggunakan algoritma genetika
Desain Kromosom
Algoritma genetika digunakan untuk menentukan fitur dan estimasi parameter yang tujuannya untuk meningkatkan akurasi klasifikasi. Pendekatan fitur diperoleh dari hasil ekstraksi fitur dengan melambangkan fitur adalah f, sedangkan hasil analisa
parameter fungsi fuzzy ARTMAP berbobot terdiri dari parameter =vigilance (Rho), Pi
= pheromonintensity dan Li = likenessintensity. Nilai minimum dan maksimum pada parameter dibatasi oleh user. Kromosom gen diilustrasikan pada Gambar 3.2 dan
dinyatakan dalam bit string dengan ghenotype yang disimbolkan nf
f f g g1 ~ menyatakan fitur,    n g
g1 ~ menyatakan nilai parameter vigilance, g ~pi gnpipi
1 menyatakan nilai
parameter pi, nli
li li g
g ~1 menyatakan parameter li.
nf f f g g1 ~ g1 ~ gn npi pi pi g g ~1 nli li li g g ~1
Gambar 5. Desain kromosom inisialisasi fitur dan parameter
Proses pengubahan ghenotype menjadi phenotype dinyatakan sebagai berikut:
xd p p pl p 1 2 min max min     (12)
. dimana :
p = phenotype pada bit string
minp= nilai minimum pada parameter
maxp= nilai maksimum pada parameter
d = nilai desimal pada bit string l = panjang bit string
Adapun langkah-langkah yang dilakukan dalam optimasi menggunakan algoritma genetika sebagai berikut:
1. Preprosesing Data: Input data yang digunakan adalah data UCI repository untuk mendapatkan data yang relevan perlu dilkukan normalisasi nilai attribut data
sehingga memiliki nilai pada range 0 – 1. Attr adalah data yang akan
dinormalisasikan. Attr (i) menunjukkan nilai attribut ke i dari data. Untuk menormalisasikan attribut ke i, dicari nilai minVal, yaitu nilai minimum attribut yang bersesuaian dari data pelatihan. Dicari juga maxVal, yaitu nilai maksimum attribut yang bersesuaian dari data pelatihan.
Val Val Val v vt min max min    (13) dimana:
v = nilai asli attr(i) vt= nilai skala attr(i)
maksval= upper bound pada nilai attr(i) minval = low bound pada nilai attr(i)
2. Mengubah genotype ke phenotype pada setiap nilai fitur dan parameter.
3. Feature subset. Setelah operasi genetika dengan mengubah masing-masing bagiankromosom fitur dari genotype ke dalam bentuk phenotype kemudian hasil fitur dapat diperoleh
4. Fungsi Fitness. Pada setiap kromosom menyatakan parameter dan fitur yang dipilih pada sejumlah dataset klasifikasi FAMB. Kemudian dihitung kinerja klasifier untuk mengevaluasi masing-masing kromosom untuk mengevaluasi fungsi fitness.
5. Menentukan jumlah iterasi. Iterasi dilakukan untuk mengevaluasi satu generasi untuk menghasilkan nilai fitness, begitu seterusnya sampai ke generasi berikutnya.
6. Operasi genetika. Dilakukan crossover 1-point dan mutasi pada individu yang
sudah terseleksi. Nilai individu terbaik diperoleh pada saat fitness berada posisi optimal mulai urutan pertama sampai generasi akhir. Kemudian fitness diambil pada kondisi konvergen (stabil) dan nilai individu terbaik berupa kromosom yag diperoleh kemudian didekodekan menjadi nilai real. Untuk menjaga agar individu bernilai fitness tertinggi tersebut tidak hilang selama evolusi, maka perlu dibuat satu atau beberapa kopinya. Prosedur ini dikenal sebagai elitisme.
PEMBAHASAN HASIL PENELITIAN Data Dan Skenario Uji Coba
Pada uji coba klasifikasi dilakukan pelatihan (training) untuk mendapatkan pemodelan dan jumlah fitur yang optimal. Sedangkan tahapan testing untuk mengukur pemodelan yang menghasilkan akurasi. Jumlah fitur terpilih akan mempengaruhi hasil akhir klasifikasi dengan menggunakan metode fuzzy ARTMAP berbobot. Uji coba dilakukan dengan menggunakan uji performansi 10-folds ross-validation untuk
. membandingkan hasil yang dicapai oleh metode FAMB berbasis GA atau GA-FAMB dan FAMB berbasis Grid search atau disebut GS-FAMB. Tujuan uji 10-folds
cross-validation untuk mengetahui hasil uji coba pada perbedaan partisi data. Proses uji coba
dengan membagi data menjadi 10 bagian, dimana setiap data digunakan untuk satu training maupun satu testing dengan proses saling bergantian. Uji coba dilakukan pada sebagian set data UCI machine learning repository pada Tabel 1. sesuai dengan alamat
http://www.ics.uci.edu/~mlearn-/databases. Media yang implementasi sistem yang
digunakan, antara lain: (a) perangkat keras CPU intel (R) core (TM) 2 duo CPU T7250 @ 2 GHz dan RAM 1 GB, (b) sistem operasi Windows XP (c) bahasa pemrograman
MATLAB.
Tabel 1. Data Uci Repository
No. Nama Jumlah
Kelas
Jumlah Record Nominal Fitur
Numeric Fitur
Total Fitur
1 German (kartu kredit) 2 1000 0 24 24
2 Australian (Kartu kredit)
2 690 6 8 14
3 Pima Indian Diabetes 2 760 0 8 8
4 Heart Disease 2 270 7 6 13
5 Breast Cancer 2 699 0 10 10
6 Ionosphere 2 351 0 34 34
7 Iris 3 150 0 4 4
8 Sonar 2 208 0 60 60
Tabel 2. Hasil Uji Coba Dengan Algoritma Genetika
Fold ke- Iterasi 1 (50) Iterasi 2 (100) Iterasi 3 (300) Fitur Terpilih Fitnes 1 Fitness 1 Fitness 1 1 35 33 31 26 ±1.3 85.30 85.02 85.67 2 45 43 46 23±1.6 93.85 92.45 84.10 3 34 30 32 20±.1.4 92.80 93.15 86.83 4 30 28 30 19±1.6 90.95 91.06 87.95 5 25 23 24 16±1.2 90.65 90.54 86.63 6 32 28 34 23±0.8 88.65 89.25 90.07 7 28 29 33 20±1.2 93.78 95.64 97.63 8 25 22 28 16±1.3 85.85 85.40 88.53 9 26 34 29 16±1.0 87.83 87.87 87.76 10 30 32 31 19±1.3 86.73 86.76 86.23
Tabel 3. Hasil Uji Coba dengan Algoritma Genetika dan Grid search
Algoritma Genetika Algoritma Grid search
Fold ke-Sensi tifitas Spesi fisitas Akur asi Fitur Terpilih Rho P I SeSensiti fffitas Spesi fisitas Akur asi Rho P I 1 98.23 91.66 95.10 26 0.211 0.041 0.441 97.12 91.66 90.16 0.041 0.441 0.241 2 96.77 93.00 93.55 23 0.016 0.017 0.214 97.77 94.56 90.23 0.017 0.214 0.006 3 95.77 96.83 92.10 20 0.298 0.013 0.480 95.77 95.83 92.83 0.013 0.480 0.198 4 94.04 95.98 90.55 19 0.306 0.375 0.662 93.04 93.65 89.90 0.375 0.662 0.306 5 94.72 95.83 90.05 16 0.024 0.022 0.166 93.72 95.83 88.83 0.002 0.166 0.054 6 93.72 92.83 88.05 23 0.015 0.020 0.178 93.72 95.83 87.53 0.010 0.178 0.025 7 95.45 91.43 86.18 20 0.024 0.223 0.261 93.45 95.83 85.83 0.023 0.261 0.064 8 93.72 91.20 85.05 16 0.140 0.039 0.332 92.72 95.83 85.73 0.039 0.332 0.240 9 95.45 90.60 85.05 16 0.153 0.00 0.238 95.45 87.09 84.83 0.00 0.238 0.053 10 100 91.30 85.01 19 0.123 0.010 0.340 93.13 86.30 82.30 0.010 0.340 0.193 Mean 95.31 93.06 89.07 94.75 93.24 87.81
.
Uji Kompleksitas Algoritma Genetika
Pada Hasil uji coba ditunjukkan pada Tabel 2. menunjukkan pembelajaran data set uci repository ionosphere pada iterasi 50, 100 dan 300 menunjukkan tingkat kestabilan dicapai pada nilai fitness ± 87. Tingkat kestabilan diperoleh pada saat algoritma GA mengalami kondisi konvergen dengan nilai optimal ± 87 dimana nilai tersebut tidak mengalami perubahan sampai akhir iterasi, begitu juga untuk data set yang lain. Dan nilai fitness tertinggi sebanding nilai rata-rata akurasi training pada masing-masing fold.
Pada Tabel 3. digunakan data ionosphere dengan menggunakan uji coba 10-cross validation dengan iterasi 300 dan setting nr=20, nc=20 dan WA=0.9 dan WF=0.2. Uji coba tersebut menunjukkan hasil jumlah fitur dan nilai parameter optimal tidak sama pada setiap fold, begitu juga nilai sensitifitas, spesifisitas dan akurasinya. Namun pencapaian fitness tertinggi pada iterasi ke 300 menghasilkan fitur dan parameter yang optimal. Sedangkan hasil akurasi dengan menggunakan algoritma genetika sebesar 89.07 dan menggunakan algoritma grid search menunjukkan hasil akurasi 87.81. pada uji coba tersebut menunjukkan algoritma genetika lebih baik dibandingkan algoritma
grid search.
Pada Tabel 4. nilai ujicoba GA dengan menggunakan iterasi 300, nr=20, nc=20 dan WA=0.9 dan WF=0.2 memperoleh jumlah fitur yang optimal. Jumlah fitur diperoleh dari rata-rata uji coba menggunakan 10-fold cross validation. Uji coba dilakukan hingga konvergen dengan parameter dan fitur optimal untuk setiap data set menyesuaikan karakteristik data set yang digunakan. Pada data iris mencapai nilai akurasi tertinggi dibandingkan data set lainnya.
Tabel 4. Rekapitulasi hasil uji coba data uci repository menggunakan algoritma Genetika
Nama Jumlah Fitur Fitur Terpilih Sensi tifitas Spesifisi tas Akur asi Sensi tifitas Spesifi sitas Akur asi German (kartu kredit) 24 14.3 92.31 90.06 85.07 91.66 90.04 89.07 Australian (Kartu kredit) 14 5.6 94.60 97.77 84.10 95.00 92.17 8623 Pima Indian Diabetes 8 4.2 94.98 97.77 86.33 95.83 93.01 90.20 Heart Disease 13 5.6 93.06 98.04 87.45 97.89 93.75 92.19 Breast Cancer 10 4.2 92.54 97.72 85.83 94.83 94.00 91.16 Ionosphere 34 19.8 92.31 93.06 89.07 92.83 90.10 87.23 Iris 4 3.2 92.06 95.45 96.83 92.33 89.23 94.20 Sonar 60 26.3 92.40 97.72 87.83 94.63 87.39 85.16 KESIMPULAN
Algoritma genetika mampu mendapatkan nilai fitur dan parameter optimal secara otomatis dengan hasil yang lebih tinggi. Sedangkan hasil akurasi dengan menggunakan algoritma genetika sebesar 89.07 dan menggunakan algoritma grid
search menunjukkan hasil akurasi 87.81. Uji coba dilakukan hingga konvergen dengan
parameter dan fitur optimal untuk setiap data set menyesuaikan karakteristik data set yang digunakan. Pada data iris mencapai nilai akurasi tertinggi dibandingkan data set lainnya. Pada uji coba tersebut menunjukkan algoritma genetika lebih baik dibandingkan algoritma grid search.
.
PUSTAKA
[1] Agrawal, R, T. Imielinski, and A. N. Swami. Database Mining: A Performance Perspective. IEEE Trans.vol 5. pp.914-925, 1993
[2] Kira, K., L.A. Rendell: The Feature Selection Problem: Traditional Methods And a
New algorithm. AAAI Press/The MIT Press pp 129-134, 1992
[3] Khotimah, Bain. Parameter Dengan Menggunakan Algoritma Genetika Pada Klasifikasi Fuzzy ARTMAP Berbobot (FAMB), 2010
[4] Herumurti, Darlis (2009). ”Klasifikasi Individu Penderita Osteoporosis dengan
Menggunakan Fuzzy ARTMAP Berbobot. Tesis, Jurusan Informatika, Pasca Sarjana, Institut Teknologi Surabaya
[5] Thomas Weise, Global Optimization Algorithms – Theory and Application, Book,
2009
[6] A. Baraldi, E. Alpaydin. Constructive Feedforward ART Clustering Network -Part I, IEEE Transactions on Neural Networks, 13(3), pp 645-661, 2002
[7] A. Baraldi, E. Alpaydin Constructive Feedforward ART Clustering Network -Part II, IEEE Transactions on Neural Networks, 13, pp 662-677, 2002
[8] Goldberg, D. E. Genetic algorithms in search optimization and machine learning. Reading, MA: Addison-Wesley, 1989
[9] Davis, L. Handbook of genetic algorithms. New York: Van Nostrand Reinhold, 1991
[10] Utami, N.D. Analisis Teknik Crossover Pada Penyelesaian Penjadwalan Praktikum
Dengan Algoritma Genetika, Skripsi, Fakultas Matematika dan Ilmu