• Tidak ada hasil yang ditemukan

BAB IV ANALISIS DAN PEMBAHASAN

2.4. Radial Basis Function Neural Network

Neural Network atau biasa disebut dengan jaringan syaraf tiruan adalah suatu sistem pemprosesan informasi yang memiliki karakteristik mirip dengan jaringan biologi.

kemampuan yang luar biasa mirip dengan jaringan syaraf otak pada manusia. Radial Basis Function Neural Network (RBFNN) merupakan jenis jaringan feed-forwad yang sangat popular. RBFNN tidak menggunakan aktivasi fungsi pada hidden layer tetapi menggunakan fungsi dasar radial.RBFNN memperkirakan fungsi yang diinginkan dengan menggunakan superposition of nonorthogonal,radially symmetric functions.

RBFNN dibangun untuk memperbaiki akurasi dan mengurangi kompleksitas waktu training. (Engelbrecht, 2007).

Jaringan RBF secara umum fungsinya sebagai tools perkiraan, mirip dengan Multilayer Perceptrons (MLP). Akan tetapi, RBF biasanya dalam mencapai convergence lebih cepat hanya dengan salah satu layer atau weight yang diperlukan.

Kinerja dari jaringan RBF tergantung dari banyak faktor. Dasar permasalahan dari RBF adalah memilih dengan tepat fungsi RBF seperti jumlah hidden layer.

Memutuskan banyaknya hidden layer memperbaiki cluster dan centerdari RBF.

Faktor lainnya disebut parameter dari RBF, yang juga berperan penting pada tinjauan akurasi dan kestabilan dalam perkiraan dasar RBF. Secara umum, langkah-langkah desain jaringan RBF memiliki dua langkah, yaitu :

1. Langkah pertama, di parameter RBF yaitu menentukan nomor center dengan lokasinya dan nomor RBF dengan arsitekturnya yang mana diperlukan untuk mengkalkulasikan keberhasilan yang diinginkan pada desain arsitektur jaringannya. Ini merupakan langkah yang penting untuk keberhasilan yang baik dalam perkiraan perkembangan jaringan RBF selanjutnya. Proses menentukan center dan bentuk dasar yang seharusnya untuk membangun desain RBF.

2. Langkah kedua, weights digunakan untuk bentuk kombinasi linier output dari hidden layer. Weights ditentukan selama masa training RBF. (Czarnowski &

Jedrzejowicz (2014).

Parameter dari RBF terdiri dari beberapa neuronsdi input layer, hidden layerdan output layer. Fungsi aktivasinya adalah fungsi basis dan fungsi linier pada lapisan output. Jaringan ini telah banyak digunakan secara intensif. RBF merupakan pemetaan fungsi tak linier multidimensional yang tergantung kepada jarak antara vektor input dan vektor center. Performa dari pengukuran yang baik ditinjau dari tiga

hal yang penting yaitu akurasi, kompleksitas dan konvergensi. Generalisasi merupakan aspek yang sangat penting dalam pembelajaran neural network. Akurasi pada RBFNN dipengaruhi oleh :

1. Nomor fungsi basis yang digunakan. Semakin banyak fungsi basis yang digunakan, akan semakin baik perkiraan fungsi target yang akan didapat.

Meskipun tak selalu fungsi basis dapat mengurangi kompleksitas komputasi.

2. Lokasi fungsi basis yang ditemukan oleh vektor center, untuk setiap fungsi basis. Fungsi basis harus menyebar sepenuhnya untuk seluruh ruang input.

3. Untuk sebagian fungsi, luas bidang yang bisa menampung tergantung besarnya jarak perbanyaknya center. Semakin besar luas, semakin banyak ruang input yang mewakili fungsi basis. (Engelbrecht, 2007)

Model RBFNN menggunakan fungsi basis sebagai fungsi aktivasi untuk setiap neuron pada hidden layer. Beberapa fungsi radial basis adalah sebagai berikut :

1. Fungsi Multikuadratik

Dengan ? merupakan norm Euclidean antara vector input x dengan pusat neuronhiddenµ, dimana:

? = ∥ ?− ? ∥

Fungsi aktivasi yang biasa digunakan dalam RBFNN adalah fungsi Gaussian. Hal ini dikarenakan fungsi Gaussian bersifat lokal yaitu nilai fungsi akan menuju nol (? → 0 ) jika nilai x menuju tak hingga (? → ∞) dan nilai fungsi menuju satu (? → 1) jika nilai x menuju nol (? → 0).

2.5 K-MeansCluster

Salah satu ciri model RBFNN adalah pada fungsi aktivasi yang dalam perhitungannya membutuhkan nilai pusat dan varianslapisan tersembunyi. Metode K-Means ini mengelompokkan data input menjadi beberapa kelompokatau kluster sehingga nilai pusat dan varians setiap kluster dapat dihitung. Pusat kluster adalah rata-rata (means) kluster tersebut.AlgoritmaK-Meansdigunakan sebagai alternatif metode clusteruntuk data dengan ukuran besar karena memiliki kecepatan yang lebih tinggi dibandingkan dengan metode hirarki. Algoritma ini terdiri-dari 2 (dua) fase yaitu sebagai berikut (Loohach dan Garg, 2012).

1. Fase pertama, user menentukan nilai pusat k secara random (acak), di mana jumlah K(cluster) sudah ditentukan terlebih dahulu. Untuk menempatkan tiap objek data ke dalam pusat terdekat. Beberapa fungsi perhitungan jarak dapat digunakan untuk menentukan jarak dari tiap objek terhadap pusat cluster. Ketika setiap data sudah ditempatkan ke dalam beberapa cluster, maka tahap pertama sudah dilengkapi dan pengelompokan sudah selesai.

2. Fase kedua, mengkalkulasi kembali rata-rata dari clusteryang telah diformulasikan sebelumnya. Proses iterasi (perulangan) ini akan dilanjutkan sampai fungsi kriteria menjadi minimum.

Alur Algoritma K-Meanssecara umum adalah sebagai berikut (Johnson & Winchern, 2007):

1. Tentukan kluster dengan nilai pusat.

2. Tempatkan setiap objek pada kelompok yang mempunyai jarak terdekat dengan pusat, hitung kembali nilai pusat baru.

3. Ulangi langkah 2 sampai nilai pusat lama sama dengan nilai pusat baru.

Flowchart cara kerja algoritma K-MeansClustering dapat dilihat pada Gambar 2.1 :

Gambar 2.1 Algoritma K-Means

Adapun proses dari algoritmaK-Meansadalah sebagai berikut (Looharch dan Garg, 2012):

1. Menentukan input. Yang menjadi inputdisini adalah jumlah dari cluster k (seperti: 2, 3, 4, dan seterusnya) dan database D = {d1, d2, ..., dn} yang mengandung n objek data.

2. Menentukan output. Yang menjadi outputdisini adalah himpunan dari cluster k.

3. Tahapan yang dilalui adalah sebagai berikut.:

a. Menentukan secara acak k objek data dari dataset D sebagai pusat clusterawal.

b. Ulangi langkah c dan d hingga tidak terjadi perubahan pada pusat cluster.

Start

c. Menghitung jarak dari tiap objek data di(1 ≤ i ≤ n) dan seluruh pusat cluster k yang dinotasikan dengan ci (1≤ Je ≤ k) dan menempatkan data dike dalam clusterterdekat.

d. Untuk setiap cluster cj (1≤ Je ≤ k), lakukan perhitungan kembali untuk pusat cluster. Sebelum algoritma K-Means konvergen, kalkulasi dari jarak dan pusat clusterterus dilakukan, di mana nilai variabel t merupakan jumlah proses iterasi pada algoritma K-Means. Jumlah perulangan t juga bergantung pada inisialisasi pusat cluster.

AlgoritmaK-Meansdinilai cukup efisien, yang ditunjukkan dengan kompleksitasnya O(tkn), dengan catatan nadalah banyaknya objek data, k adalah jumlah clusteryang dibentuk, dan tmenyatakan banyaknya iterasi. Biasanya, nilai kdan t jauh lebih kecil daripada nilai n. Selain itu, dalam iterasinya, algoritma ini akan berhenti sampai dalam kondisi optimum lokal. (William, 2015). Hal yang dianggap sebagai kelemahan algoritma ini adalah adanya keharusan menentukan banyaknya cluster yang akan dibentuk, hanya dapat digunakan dalam data yang mean-nya dapat ditentukan, dan tidak mampu menangani data yang mempunyai penyimpangan-penyimpangan (noisy datadan outlier). Menurut Berkhin (2015), algoritmaK-Meansjuga memiliki keterbatasan karena hanya dapat mengolah atribut numerik sedangkan sebuah basis data dapat berisi data-data teks, simbol, gambar, dan suara.

Dokumen terkait