SELEKSI FITUR DAN PARAMETER OPTIMAL DENGAN MENGGUNAKAN ALGORITMA GENETIKA PADA KLASIFIKASI FUZZY ARTMAP BERBOBOT

(1)

.

SELEKSI FITUR DAN PARAMETER OPTIMAL DENGAN

MENGGUNAKAN ALGORITMA GENETIKA PADA

KLASIFIKASI FUZZY ARTMAP BERBOBOT

Bain Khusnul Khotimah1

Universitas Trunojoyo, Bangkalan, Jawa Timur1

[email protected]

ABSTRAK

Klasifikasi fuzzy ARTMAP berbobot adalah metode baru dalam klasifikasi yang diperoleh dengan mengkombinasikan simplified fuzzy ARTMAP dan symmetric fuzzy ART ditambah pembobotan pheromone sesuai konsep koloni semut. Dimana algoritma ini mempunyai parameter yang optimal diantaranya pembobotan pheromon, pembobotan likenessIntensity dan nilai batas vigilance yang mempengaruhi kinerja klasifikasi. Sedangkan kinerja klasifikasi umumnya dipengaruhi oleh penggunaan fitur pada data untuk menghasilkan sebuah model, padahal tidak semua fitur tersebut relevan terhadap hasil klasifikasi. Apabila hal tersebut terjadi pada data yang memiliki ukuran dan dimensi yang sangat besar, maka membuat kinerja algoritma menjadi tidak efektif dan efisien, misalnya saja waktu pemrosesan menjadi lebih lama akibat banyak fitur yang harus diproses. Salah satu solusi yang digunakan untuk mengatasi masalah tersebut adalah dengan menggunakan seleksi fitur. Seleksi fitur adalah salah satu tahap praproses pada klasifikasi yang dilakukan dengan cara memilih fitur-fitur yang relevan terhadap data yang mempengaruhi hasil klasifikasi. Seleksi fitur digunakan untuk mengurangi dimensi data dan fitur yang tidak relevan, serta untuk meningkatkan efektifitas dan efisiensi kinerja dari algoritma klasifikasi. Algoritma genetika mampu mendapatkan nilai fitur dan parameter optimal secara otomatis dengan hasil yang lebih tinggi. Sedangkan hasil akurasi dengan menggunakan algoritma genetika sebesar 89.07 dan menggunakan algoritma grid search menunjukkan hasil akurasi 87.81. Uji coba dilakukan hingga konvergen dengan parameter dan fitur optimal untuk setiap data set menyesuaikan karakteristik data set yang digunakan. Pada data iris mencapai nilai akurasi tertinggi dibandingkan data set lainnya. Pada uji coba tersebut menunjukkan algoritma genetika lebih baik dibandingkan algoritma grid search.

Kata kunci:seleksi fitur, parameter optimal, fuzzy ARTMAP berbobot, algoritma genetika, algoritma grid search

PENDAHULUAN

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui [1]. Jika diberikan sekumpulan data yang terdiri dari beberapa fitur dan kelas, maka klasifikasi adalah menemukan model dari kelas tersebut sebagai fungsi dari fitur-fitur yang lain. Pada umumnya algoritma klasifikasi menggunakan semua fitur yang terdapat pada data untuk membangun sebuah model, padahal tidak semua fitur tersebut relevan terhadap hasil klasifikasi. Apabila hal tersebut terjadi pada data yang memiliki ukuran dan dimensi yang sangat besar, maka membuat kinerja algoritma menjadi tidak efektif dan efisien, misalnya saja waktu pemrosesan menjadi lebih lama akibat banyak fitur yang harus

(2)

. diproses. Salah satu solusi yang digunakan untuk mengatasi masalah tersebut adalah dengan menggunakan seleksi fitur. Seleksi fitur adalah salah satu tahap praproses pada klasifikasi yang dilakukan dengan cara memilih fitur-fitur yang relevan terhadap data yang mempengaruhi hasil klasifikasi. Seleksi fitur digunakan untuk mengurangi dimensi data dan fitur yang tidak relevan, serta untuk meningkatkan efektifitas dan efisiensi kinerja dari algoritma klasifikasi [2]. Pada Klasifikasi juga dipengaruhi oleh pemilihan parameter, karena dengan parameter optimal akan meningkatkan unjuk kaerja klasifikasi [3].

Metode klasifikasi yang digunakan pada klasifikasi ini adalah pengembangan dari metode fuzzy ARTMAP diperoleh dengan mengkombinasikan antara simplified

fuzzy ARTMAP dan symmetric fuzzy ART yang mempunyai fungsi aktifasi dan fungsi mach yang terpengaruh jumlah data di dalam node, hal ini menimbulkan ketidakadilan

terhadap node yang memiliki jumlah pattern lebih banyak. Untuk mengatasi masalah tersebut dilakukan modifikasi pembobotan dengan menambahkan konsep algoritma koloni semut pada fuzzy ARTMAP sehingga disebut FAM berbobot atau fuzzy ARTMAP berbobot. Prinsip algoritma ini mirip dengan penyelesaian kasus terpendek dimana setiap semut akan mengikuti jalan yang mengandung jumlah pheromon lebih banyak dibanding lainnya. Semakin dekat jalur yang dilalui semut maka semut yang lewat akan semakin banyak dan jejak pheromon yang ditinggalkan juga semakin banyak, begitu juga sebaliknya. Sehingga cluster node yang dihasilkan akan menyesuaikan dengan jumlah pattern dan dapat menampung pattern lebih banyak [4].

Permasalah dalam metode Fuzzy ARTMAP Berbobot adalah tergantung penggunaan fitur subset pada data dengan fitur yang banyak tinggi dan pemilihan parameter pada saat proses pembelajaran yang mempengaruhi kinerja klasifikasi. Sehingga penelitian ini akan melakukan seleksi fitur dan estimasi parameter dengan menggunakan algoritma genetika yang tujuannya dapat meningkatkan kinerja pada classifier. Karena Algoritma genetika sangat baik untuk menyelesaikan permasalahan optimasi dan melakukan

search point dengan mencari pola baru yang diharapkan memiliki nilai fitness yang

lebih baik dari seluruh kromosom dan dapat meningkatkan kinerja pada classifier (5).

METODE ART

Algoritma Fuzzy ARTMAP Berbobot merupakan pengembangan dari algoritma

ART yang prinsipnya menggunakan pembobotan. Dimana fungsi pembobotan W = {w1,

w2, …,wC} pada setiap Nuron N ={N1, N2, …, NC} yang yang menyatakan dan jumlah

pola dari X sejumlah data. ART-1 menggunakan inherently nonsymmetrical architecture untuk menghitung intrinsically symmetric fuzzy ART (S-Fuzzy ART) yang mengadopsi

symmetric activation dan match function, yaitu T(x,wj)=T(wj,x) dan T(x,wj)=M(x,wj)

[6]. Dengan Tiga fungsi utama adalah fungsi T (), M () and U (). Sedangkan NEWNODE(new) dalam algoritma tersebut adalah sebuah macro routine yang

mengalokasikan new node (template) untuk network, yaitu T (x, w) disebut sebagai

activation function, yang digunakan untuk mengukur derajat dari resemblance dari x

dengan w. wj w x w x T j j     ) , ( (1)

Dimana a adalah choice parameter, a > 0

M( x, wj) disebut match function, yang digunakan untuk menentukan seberapa jauh

(3)

. x w x w x M ( , _j)   j (2)

Fungsi ini digunakan sebagai conjunction untuk vigilance parameter

 

0,1, dimana



x wj





M , yang berarti resonansi. Vigilance merupakan parameter network

terpenting untuk menentukan resolusinya : larger vigilance value normally yields larger

number dari output nodes dan presisi yang bagus.

U ( x, wj) disebut update function, yang digunakan untuk mengupdate sebuah template

setelah resonansi dengan sebuah pola: ) ( ) 1 ( ) , (xw_j w_j x w_j U     (3)

dimana  adalah learning rate, 0 1. Nilai yang lebih tinggi dari  dihasilkan

dalam faster learning. Disebut sebagai fast learning dalam ART ketika = 1.

Operator  dalam persamaan (2.1) hingga (2.2) adalah bitwise AND operator, yaitu a

b = (a1 AND b1, a2AND b2, … acC AND bc) , dan || a|| adalah dirumuskan sebagai

berikut,



  D i i a a 1 (4)

Simmetric Fuzzy ART (S-Fuzzy ART)

Pada metode ART menggunakan dua bentuk penggabungan dari symmetric

activation dan match function adalah:

2 1 1 ) , ( ) , ( j j j w x w x M w x T     (5) atau

 



     D d D d d d D d d d j j w x w x w x M w x T 1 1 1 } , min{ ) , ( ) , ( (6)

Fuzzy ARTMAP Berbobot

Metode ini merupakan pengembangan dari SFAM dan fuzzy ARTMAP yang mana algoritma ini secara umum mengkombinasikan antara fuzzy ARTMAP dan

synmetric fuzzy ART serta ditambah dengan pembobotan node cluster berdasarkan

jumlah pola dan size dari node cluster tersebut. Ada beberapa hal yang perlu diperhatikan dalam fuzzy ARTMAP sebagai berikut dimana nilai fungsi dari aktifasi T() dan match (M) pada suatu node output tidak terpengaruh terhadap jumlah data yang ada dalam node terxebut, dengan kata lain jika ada dua node output yang memiliki bentuk dan ukuran yang sama, tetapi memiliki jumlah pattern yang ada tidak sama, maka nilai T() maka menimbulkan ketidakadilan terhadap node yang memiliki jumlah pattern yang lebih banyak [7]. Sehingga ide dasar fuzzy ARTMAP berbobot adalah mencari bentuk formula baru dari T() dan M() yang merupakan hasil relaksasi fungsi pada SFAM dan

S-fuzzy ART dengan mengalikan dengan parameter likenessintensity (Li). Serta

dijumlahkan dengan bobot pheromon dengan maksud memberi nilai lebih besar pada ukuran cluster node yang memiliki pattern lebih banyak.

(4)

. Proses pembobotan dalam algoritma ini mengadopsi sistem pheromon dan peluruhannya pada sistem koloni semut, dan penerapan jejak pheromon pada metode

ARTMAP terletak pada seberapa pertambahan size (pola baru sudah didalam cluster).

Jika tidak terjadi pertambahan size (pola baru sudah didalam cluster) maka tingkat kepekatan pheromon dalam node tersebut semakin besar walaupun terjadi peluruhan karena waktu. Akan tetapi, jika pola baru menyebabkan ukuran cluster node bertambah besar, maka tingkat peluruhan/evaporasi kepekatan pheromon juga semakin besar karena harus disebar ke ruang baru sehingga tingkat kepekatan pheromon menjadi berkurang [4]. Ilustrasi dari perubahan kepekatan pheromon seperti ditunjukkan pada Gambar 1.

Gambar 1. Size cluster node bertambah karena beresonansi dengan pola baru

Dari ilustrasi Gambar 1. jejak pheromon dapat ditulis dengan persamaan :

) 1 ( ) (   t w t w r j j (7)



( ( () ( ())) ( 1) || ( 1)|| ) 1 ( 1

)

1 (





_w _t_ t r t _elseif t w t j j j j j j

t

   



(8) Dimana :

r =ratio pertambahan size cluster node baru dengan size cluster node lama.

= constant pheromon yang ditinggalkan setiap terjadi update cluster node.

=constant evaporasi/peluruhan setiap terjadi update cluster node.

) 1 (t j

 = jejak pheromon jika terjadi resonansi antara pola dengan node output.

Pengembangan lainnya dari algoritma SFAM ini dengan menggabung antara nilai yang dihasilkan dari T() dan M() pada persamaan dengan nilai dari symmetric fuzzy

ARTMAP, dimana T() dan M() berbobot ditunjukkan pada persamaan berikut ini:

2 1 1 * * ) 1 ( ) , ( j j j j i w x w n w x w x T          (9) j j j j j i w x w w x w x M          ₂ 1 1 * * ) 1 ( ) , ( (10)

Nilai adalah bobot kesimetrisan yang jika nilainya  1berarti sama dengan

persamaan fuzzy ARTMAP ditambah pembobotan dan jika nilai  0maka prinsip

(5)

.

Algoritma Genetika

Algoritma genetika pertama kali diperkenalkan oleh John Holland dari Universitas Michigan (1975), Setiap masalah yang berbentuk adaptasi dapat

diformulasikan dalam terminologi genetika. Algoritma ini termasuk jenis

nonpolynomial (NP) yang secara khusus dapat di terapkan untuk memecahkan masalah

optimasi yang kompleks, sehingga baik untuk aplikasi yang memerlukan startegi pemecahan masalah secara adaptif [8]. Masalah dibangun dengan sebuah populasi yang terdiri dari individu-individu yang mempresentasikan sebuah solusi yang mungkin bagi persoalan yang ada. Individu dilambangkan dengan sebuah nilai fitness yang akan digunakan untuk mencari solusi terbaik bagi persoalan yang ada, dimana nilai fitness menggambarkan hasil solusi yang sudah dikodekan. Selama berjalan induk harus digunakan untuk reproduksi, pindah silang (crossover) dan mutasi untuk menciptakan keturunan sesuai Gambar 2. Algoritma genetika akan bekerja secara baik dengan proses evolusi pada populasi sampai mengalami konvergensi untuk mendapatkan solusi yang optimum sesuai Gambar 3. [8][9]

Seleksi Fitur dan Parameter menggunakan Algoritma Genetika

Algoritma genetika telah dikembangkan untuk proses pencarian solusi secara acak dengan mengembangkan populasi yang menyatakan sekumpulan solusi. Proses pencarian dilakukan berdasarkan teori evolusi genetika melalui seleksi, crossover dan mutasi gen untuk memperoleh individu yang terbaik. Pada proses ini digunakan proses seleksi fitur dan pemilihan parameter yang tujuannya untuk mempercepat waktu komputasi, dengan menggunakan algoritma genetika ditunjukkan pada Gambar 4.

Gambar 2. Proses mutasi dan crossover

(6)

.

Inisialisasi Parameter

Sebelum menganalisa fitness, maka perlu menganalisa parameter yang berpengaruh terhadap classifier diantaranya analisa fungsi pada metode fuzzy ARTMAP berbobot diantaranya RHO= vigilance untuk tingkat resonansi pada saat learning, PI =

PheromonIntensity untuk pembobotan nilai bias, dan LI = LikenessIntensity untuk

menentukan kisimetrisan yang menentukan jumlah node cluster yang terbentuk.

Fitness Function

Kromosom pada individu mewakili parameter fungsi fuzzy ARTMAP untuk menghasilkan nilai fitness. Nilai fitness dihitung pada setiap populasi kromosom dan diambil nilai fitness tertinggi pada setiap populasi [4]. Fitness yang digunakan untuk mengukur performansi klasifikasi.

fitness = Wax FAMB_accuracy + WFx

1 1       



nf i i ixF C (11) dimana:

Wa = Pembobotan kinerja klasifikasi (accuracy)

Wf = Pembobotan pada fitur yang terpilih

Ci = cost pada fitur yang terpilih

Fi = fitur yang terpilih

FAMB_acc = nilai akurasi pada klasifikasi

Proses perhitungan fitness dipengaruhi oleh jumlah fitur terpilih Fi dan nilai

akurasi dari klasifikasi. Sedangkan nilai bobot diset range nilai mulai dari 0-1, factor bobot pada akurasi klasifikasi dan factor bobot pada fitur digunakan untuk mencari kestabilan klasifikasi sampai memperoleh hasil yang paling optimum.

(7)

.

Gambar 4. Optimasi parameter menggunakan algoritma genetika

Desain Kromosom

Algoritma genetika digunakan untuk menentukan fitur dan estimasi parameter yang tujuannya untuk meningkatkan akurasi klasifikasi. Pendekatan fitur diperoleh dari hasil ekstraksi fitur dengan melambangkan fitur adalah f, sedangkan hasil analisa

parameter fungsi fuzzy ARTMAP berbobot terdiri dari parameter =vigilance (Rho), Pi

= pheromonintensity dan Li = likenessintensity. Nilai minimum dan maksimum pada parameter dibatasi oleh user. Kromosom gen diilustrasikan pada Gambar 3.2 dan

dinyatakan dalam bit string dengan ghenotype yang disimbolkan nf

f f g g1 ~ _menyatakan fitur,    n g

g1 ~ menyatakan nilai parameter vigilance, g ~pi gnpipi

1 _{menyatakan nilai}

parameter pi, nli

li li g

g ~1 _{menyatakan parameter li.}

nf f f g g1 ~ g_1 ~ g_n npi pi pi g g ~1 nli li li g g ~1

Gambar 5. Desain kromosom inisialisasi fitur dan parameter

Proses pengubahan ghenotype menjadi phenotype dinyatakan sebagai berikut:

xd p _p p_l p 1 2 min max min     (12)

(8)

. dimana :

p = phenotype pada bit string

minp= nilai minimum pada parameter

maxp= nilai maksimum pada parameter

d = nilai desimal pada bit string l = panjang bit string

Adapun langkah-langkah yang dilakukan dalam optimasi menggunakan algoritma genetika sebagai berikut:

1. Preprosesing Data: Input data yang digunakan adalah data UCI repository untuk mendapatkan data yang relevan perlu dilkukan normalisasi nilai attribut data

sehingga memiliki nilai pada range 0 – 1. Attr adalah data yang akan

dinormalisasikan. Attr (i) menunjukkan nilai attribut ke i dari data. Untuk menormalisasikan attribut ke i, dicari nilai minVal, yaitu nilai minimum attribut yang bersesuaian dari data pelatihan. Dicari juga maxVal, yaitu nilai maksimum attribut yang bersesuaian dari data pelatihan.

Val Val Val v vt min max min    (13) dimana:

v = nilai asli attr(i) vt= nilai skala attr(i)

maksval= upper bound pada nilai attr(i) minval = low bound pada nilai attr(i)

2. Mengubah genotype ke phenotype pada setiap nilai fitur dan parameter.

3. Feature subset. Setelah operasi genetika dengan mengubah masing-masing bagiankromosom fitur dari genotype ke dalam bentuk phenotype kemudian hasil fitur dapat diperoleh

4. Fungsi Fitness. Pada setiap kromosom menyatakan parameter dan fitur yang dipilih pada sejumlah dataset klasifikasi FAMB. Kemudian dihitung kinerja klasifier untuk mengevaluasi masing-masing kromosom untuk mengevaluasi fungsi fitness.

5. Menentukan jumlah iterasi. Iterasi dilakukan untuk mengevaluasi satu generasi untuk menghasilkan nilai fitness, begitu seterusnya sampai ke generasi berikutnya.

6. Operasi genetika. Dilakukan crossover 1-point dan mutasi pada individu yang

sudah terseleksi. Nilai individu terbaik diperoleh pada saat fitness berada posisi optimal mulai urutan pertama sampai generasi akhir. Kemudian fitness diambil pada kondisi konvergen (stabil) dan nilai individu terbaik berupa kromosom yag diperoleh kemudian didekodekan menjadi nilai real. Untuk menjaga agar individu bernilai fitness tertinggi tersebut tidak hilang selama evolusi, maka perlu dibuat satu atau beberapa kopinya. Prosedur ini dikenal sebagai elitisme.

PEMBAHASAN HASIL PENELITIAN Data Dan Skenario Uji Coba

Pada uji coba klasifikasi dilakukan pelatihan (training) untuk mendapatkan pemodelan dan jumlah fitur yang optimal. Sedangkan tahapan testing untuk mengukur pemodelan yang menghasilkan akurasi. Jumlah fitur terpilih akan mempengaruhi hasil akhir klasifikasi dengan menggunakan metode fuzzy ARTMAP berbobot. Uji coba dilakukan dengan menggunakan uji performansi 10-folds ross-validation untuk

(9)

. membandingkan hasil yang dicapai oleh metode FAMB berbasis GA atau GA-FAMB dan FAMB berbasis Grid search atau disebut GS-FAMB. Tujuan uji 10-folds

cross-validation untuk mengetahui hasil uji coba pada perbedaan partisi data. Proses uji coba

dengan membagi data menjadi 10 bagian, dimana setiap data digunakan untuk satu training maupun satu testing dengan proses saling bergantian. Uji coba dilakukan pada sebagian set data UCI machine learning repository pada Tabel 1. sesuai dengan alamat

http://www.ics.uci.edu/~mlearn-/databases. Media yang implementasi sistem yang

digunakan, antara lain: (a) perangkat keras CPU intel (R) core (TM) 2 duo CPU T7250 @ 2 GHz dan RAM 1 GB, (b) sistem operasi Windows XP (c) bahasa pemrograman

MATLAB.

Tabel 1. Data Uci Repository

No. Nama Jumlah

Kelas

Jumlah Record Nominal Fitur

Numeric Fitur

Total Fitur

1 German (kartu kredit) 2 1000 0 24 24

2 Australian (Kartu kredit)

2 690 6 8 14

3 Pima Indian Diabetes 2 760 0 8 8

4 Heart Disease 2 270 7 6 13

5 Breast Cancer 2 699 0 10 10

6 Ionosphere 2 351 0 34 34

7 Iris 3 150 0 4 4

8 Sonar 2 208 0 60 60

Tabel 2. Hasil Uji Coba Dengan Algoritma Genetika

Fold ke- Iterasi 1 (50) Iterasi 2 (100) Iterasi 3 (300) Fitur Terpilih Fitnes 1 Fitness 1 Fitness 1 1 35 33 31 26 ±1.3 85.30 85.02 85.67 2 45 43 46 23±1.6 93.85 92.45 84.10 3 34 30 32 20±.1.4 92.80 93.15 86.83 4 30 28 30 19±1.6 90.95 91.06 87.95 5 25 23 24 16±1.2 90.65 90.54 86.63 6 32 28 34 23±0.8 88.65 89.25 90.07 7 28 29 33 20±1.2 93.78 95.64 97.63 8 25 22 28 16±1.3 85.85 85.40 88.53 9 26 34 29 16±1.0 87.83 87.87 87.76 10 30 32 31 19±1.3 86.73 86.76 86.23

Tabel 3. Hasil Uji Coba dengan Algoritma Genetika dan Grid search

Algoritma Genetika Algoritma Grid search

Fold ke-Sensi tifitas Spesi fisitas Akur asi Fitur Terpilih Rho P I SeSensiti fffitas Spesi fisitas Akur asi Rho P I 1 98.23 91.66 95.10 26 0.211 0.041 0.441 97.12 91.66 90.16 0.041 0.441 0.241 2 96.77 93.00 93.55 23 0.016 0.017 0.214 97.77 94.56 90.23 0.017 0.214 0.006 3 95.77 96.83 92.10 20 0.298 0.013 0.480 95.77 95.83 92.83 0.013 0.480 0.198 4 94.04 95.98 90.55 19 0.306 0.375 0.662 93.04 93.65 89.90 0.375 0.662 0.306 5 94.72 95.83 90.05 16 0.024 0.022 0.166 93.72 95.83 88.83 0.002 0.166 0.054 6 93.72 92.83 88.05 23 0.015 0.020 0.178 93.72 95.83 87.53 0.010 0.178 0.025 7 95.45 91.43 86.18 20 0.024 0.223 0.261 93.45 95.83 85.83 0.023 0.261 0.064 8 93.72 91.20 85.05 16 0.140 0.039 0.332 92.72 95.83 85.73 0.039 0.332 0.240 9 95.45 90.60 85.05 16 0.153 0.00 0.238 95.45 87.09 84.83 0.00 0.238 0.053 10 100 91.30 85.01 19 0.123 0.010 0.340 93.13 86.30 82.30 0.010 0.340 0.193 Mean 95.31 93.06 89.07 94.75 93.24 87.81

(10)

.

Uji Kompleksitas Algoritma Genetika

Pada Hasil uji coba ditunjukkan pada Tabel 2. menunjukkan pembelajaran data set uci repository ionosphere pada iterasi 50, 100 dan 300 menunjukkan tingkat kestabilan dicapai pada nilai fitness ± 87. Tingkat kestabilan diperoleh pada saat algoritma GA mengalami kondisi konvergen dengan nilai optimal ± 87 dimana nilai tersebut tidak mengalami perubahan sampai akhir iterasi, begitu juga untuk data set yang lain. Dan nilai fitness tertinggi sebanding nilai rata-rata akurasi training pada masing-masing fold.

Pada Tabel 3. digunakan data ionosphere dengan menggunakan uji coba 10-cross validation dengan iterasi 300 dan setting nr=20, nc=20 dan WA=0.9 dan WF=0.2. Uji coba tersebut menunjukkan hasil jumlah fitur dan nilai parameter optimal tidak sama pada setiap fold, begitu juga nilai sensitifitas, spesifisitas dan akurasinya. Namun pencapaian fitness tertinggi pada iterasi ke 300 menghasilkan fitur dan parameter yang optimal. Sedangkan hasil akurasi dengan menggunakan algoritma genetika sebesar 89.07 dan menggunakan algoritma grid search menunjukkan hasil akurasi 87.81. pada uji coba tersebut menunjukkan algoritma genetika lebih baik dibandingkan algoritma

grid search.

Pada Tabel 4. nilai ujicoba GA dengan menggunakan iterasi 300, nr=20, nc=20 dan WA=0.9 dan WF=0.2 memperoleh jumlah fitur yang optimal. Jumlah fitur diperoleh dari rata-rata uji coba menggunakan 10-fold cross validation. Uji coba dilakukan hingga konvergen dengan parameter dan fitur optimal untuk setiap data set menyesuaikan karakteristik data set yang digunakan. Pada data iris mencapai nilai akurasi tertinggi dibandingkan data set lainnya.

Tabel 4. Rekapitulasi hasil uji coba data uci repository menggunakan algoritma Genetika

Nama Jumlah Fitur Fitur Terpilih Sensi tifitas Spesifisi tas Akur asi Sensi tifitas Spesifi sitas Akur asi German (kartu kredit) 24 14.3 92.31 90.06 85.07 91.66 90.04 89.07 Australian (Kartu kredit) 14 5.6 94.60 97.77 84.10 95.00 92.17 8623 Pima Indian Diabetes 8 4.2 94.98 97.77 86.33 95.83 93.01 90.20 Heart Disease 13 5.6 93.06 98.04 87.45 97.89 93.75 92.19 Breast Cancer 10 4.2 92.54 97.72 85.83 94.83 94.00 91.16 Ionosphere 34 19.8 92.31 93.06 89.07 92.83 90.10 87.23 Iris 4 3.2 92.06 95.45 96.83 92.33 89.23 94.20 Sonar 60 26.3 92.40 97.72 87.83 94.63 87.39 85.16 KESIMPULAN

Algoritma genetika mampu mendapatkan nilai fitur dan parameter optimal secara otomatis dengan hasil yang lebih tinggi. Sedangkan hasil akurasi dengan menggunakan algoritma genetika sebesar 89.07 dan menggunakan algoritma grid

search menunjukkan hasil akurasi 87.81. Uji coba dilakukan hingga konvergen dengan

parameter dan fitur optimal untuk setiap data set menyesuaikan karakteristik data set yang digunakan. Pada data iris mencapai nilai akurasi tertinggi dibandingkan data set lainnya. Pada uji coba tersebut menunjukkan algoritma genetika lebih baik dibandingkan algoritma grid search.

(11)

.

PUSTAKA

[1] Agrawal, R, T. Imielinski, and A. N. Swami. Database Mining: A Performance Perspective. IEEE Trans.vol 5. pp.914-925, 1993

[2] Kira, K., L.A. Rendell: The Feature Selection Problem: Traditional Methods And a

New algorithm. AAAI Press/The MIT Press pp 129-134, 1992

[3] Khotimah, Bain. Parameter Dengan Menggunakan Algoritma Genetika Pada Klasifikasi Fuzzy ARTMAP Berbobot (FAMB), 2010

[4] Herumurti, Darlis (2009). ”Klasifikasi Individu Penderita Osteoporosis dengan

Menggunakan Fuzzy ARTMAP Berbobot. Tesis, Jurusan Informatika, Pasca Sarjana, Institut Teknologi Surabaya

[5] Thomas Weise, Global Optimization Algorithms – Theory and Application, Book,

2009

[6] A. Baraldi, E. Alpaydin. Constructive Feedforward ART Clustering Network -Part I, IEEE Transactions on Neural Networks, 13(3), pp 645-661, 2002

[7] A. Baraldi, E. Alpaydin Constructive Feedforward ART Clustering Network -Part II, IEEE Transactions on Neural Networks, 13, pp 662-677, 2002

[8] Goldberg, D. E. Genetic algorithms in search optimization and machine learning. Reading, MA: Addison-Wesley, 1989

[9] Davis, L. Handbook of genetic algorithms. New York: Van Nostrand Reinhold, 1991

[10] Utami, N.D. Analisis Teknik Crossover Pada Penyelesaian Penjadwalan Praktikum

Dengan Algoritma Genetika, Skripsi, Fakultas Matematika dan Ilmu