Optimasi Metode Extreme Learning Machine Dalam Penentuan Kualitas Air Sungai Menggunakan Algoritme Genetika

(1)

Fakultas Ilmu Komputer

Optimasi Metode Extreme Learning Machine Dalam Penentuan Kualitas

Air Sungai Menggunakan Algoritme Genetika

Regina Anky Chandra1_{, Edy Santoso}2_{, Sigit Adinugroho}3

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1_{[email protected],}2_{[email protected],}3_{[email protected]}

Abstrak

Seiring dengan meningkatnya jumlah populasi manusia, sumber air bersih yang ada di bumi terus berkurang. Dampak yang diberikan akibat tercemarnya sumber air juga tidak dapat diremehkan. Beberapa diantaranya adalah menurunnya kadar oksigen yang ada di bumi dikarenakan tumbuhan tidak dapat berfotosintesis dengan baik, mengganggu kesuburan tanah, mematikan hewan-hewan yang hidup di dalam air dan masih banyak dampak lainnya. Salah satu sumber air di muka bumi ini berasal dari sungai. Untuk menjaga kualitas air agar tetap pada kondisi alamiahnya, perlu dilakukan pengukuran dan analisis terhadap air sungai tentang status mutu airnya. Pada penelitian ini digunakan 7 parameter pengukuran kualitas air sungai yang kemudian akan diklasifikasikan menjadi 3 kelas berbeda. Kelas klasifikasi dibagi menjadi tercemar ringan, tercemar sedang dan tercemar berat. Sedangkan metode yang digunakan untuk pengukuran dan analisis pada penelitian ini adalah metode Extreme Learning Machine

(ELM) dan Algoritme Genetika. Dalam penelitian ini, bobot awal yang digunakan pada proses training

dan testing ELM akan dioptimasi menggunakan Algoritma Genetika. Data training dan data testing yang digunakan, ditentukan oleh 5 fold yang telah dibentuk dari data awal yang berjumlah 150 data. Data tiap

fold akan diuji menjadi data testing secara bergantian. Berdasarkan hasil pengujian dari penelitian yang telah dilakukan, penelitian ini mampu meraih tingkat akurasi sebesar 88.0002%.

Kata kunci: kualitas air sungai, klasifikasi, prediksi, extreme learning machine (elm), algoritma genetika

Abstract

Along with the increasing number of human population, the source of clean water on earth continues to decrease. The impact given due to contamination of water sources is also not light. Some of them are the decrease in oxygen levels in the earth because plants can not photosynthesize well, disrupt soil fertility, kill animals that live in water and many other impacts. One of the water sources on earth is from the river. To maintain water quality in order to stay in its natural condition, it is necessary to measure and analyze the water quality status of river water. In this research used 7 parameters of river water quality measurement which will be classified into 3 different classes. Classification class is divided into lightly polluted, moderately polluted and heavily polluted. While the method used for the measurement and analysis in this study is the method of Extreme Learning Machine (ELM) and Genetic Algorithm. In this study, the input weight used in the ELM training and testing process will be optimized using Genetic Algorithm. Training and testing data used, determined by 5 fold that has been formed from the initial data which amounts to 150 data. The data of each fold will be tested into data testing alternately. Based on the results of testing of research that has been done, this research is able to achieve an accuracy of 88.0002%.

Keywords: river water quality, classification, prediction, extreme learning machine (elm), genetic algorithm

1. PENDAHULUAN

Air merupakan satu dari sekian banyak sumber daya alam yang banyak digunakan oleh makhluk hidup dan sudah menjadi kebutuhan pokok untuk bertahan hidup. Tidak ada bidang

(2)

bersih yang ada di bumi terus berkurang. Hal ini dikarenakan hilangnya sumber air akibat alih lahan pertanian dan pemukiman penduduk serta pencemaran air yang semakin buruk dan memprihatinkan dari hari ke hari. Akibatnya, banyak air yang tercemar dan susah sekali mencari sumber air bersih. Dampak yang diberikan akibat tercemarnya sumber air juga tidak ringan. Beberapa diantaranya adalah menurunnya kadar oksigen yang ada di bumi karena tumbuhan tidak bisa berfotosintesis dengan baik, mengganggu kesuburan tanah, mematikan hewan-hewan yang hidup di dalam air (Budiarta et al., 2016).

Penurunan kualitas air akan menurunkan dayaguna, hasil guna, produktivitas, daya dukung dan daya tampung dari sumberdaya air yang pada akhirnya akan menurunkan kekayaan sumber daya air. Salah satu sumber air di muka bumi ini berasal dari sungai. Tidak sedikit juga air sungai yang mengalami penurunan kualitas air. Untuk menjaga kualitas air agar tetap pada kondisi alamiahnya, perlu dilakukan pengelolaan dan pengendalian pencemaran air secara bijaksana. Hal ini dibutuhkan upaya pemantauan dan pengendalian pencemaran terhadap air sungai. Upaya yang dilakukan yaitu melakukan pengukuran dan analisis terhadap air sungai tentang status mutu air sebagaimana yang ditetapkan dalam Peraturan Pemerintah no 82 tahun 2001 (Azizah, 2016).

Jaringan Saraf Tiruan (JST) merupakan upaya untuk memodelkan pemrosesan informasi berdasarkan kemampuan sistem saraf manusia. Salah satu metode dalam JST adalah Extreme Learning Machine (ELM). ELM merupakan

salah satu metode di dalam jaringan saraf tiruan

feedforward dengan satu hiddenlayer atau lebih

dikenal dengan istilah Single Hidden Layer Feedforward Neural Network (SLFNs). Metode

ELM lebih unggul dalam proses learning speed,

serta mempunyai tingkat akurasi yang lebih baik dibandingkan dengan metode konvensional seperti Moving Average dan Exponential Smoothing, sehingga hasil prediksi yang

dihasilkan lebih optimal dan akurat (Agustina et al., 2010).

Algoritme Genetika (Genetic Algorithms), merupakan tipe Algoritme Evolusi yang paling populer dan banyak diterapkan pada masalah-masalah kompleks. Seiring berkembang pesatnya teknologi informasi, Algoritme Genetika juga semakin berkembang dengan diterapkannya berbagai macam modifikasi ke

dalam Algoritme Genetika. Karena

kemampuannya untuk menyelesaikan berbagai masalah kompleks, algoritme ini banyak digunakan di dalam berbagai bidang yang sering menghadapi masalah optimasi, serta permasalahan yang memiliki model matematika yang cukup rumit. Algoritme Genetika menghasilkan himpunan solusi optimal yang sangat berguna pada peyelesaian masalah dengan banyak obyektif (Mahmudy, 2015).

Untuk mengatasi kelemahan pada penelitiannya, Alencar et al. (2016) mengusulkan sebuah metode baru untuk memangkas neuron hidden layer menggunakan Algoritme Genetika. Pendekatan yang diusulkan, disebut GAP-ELM, memilih subset dari hidden neuron untuk mengoptimalkan

fungsi fitness multiobjective yang didapat dari

penggabungan antara akurasi dan jumlah neuron

yang dipangkas. Kinerja GAP-ELM lebih efisien ketika diterapkan pada beberapa dataset di dunia

nyata dibandingkan dengan metode SLFN lain dan metode pemangkasan terkenal yang disebut

Optimally Pruned ELM (OP-ELM). Pada

percobaan penelitiannya, mereka menyatakan bahwa GAP-ELM adalah alternatif yang valid

untuk permasalahan klasifikasi.

Berdasarkan uraian tersebut, penulis

mengajukan penelitian yang berjudul “Optimasi

Metode Extreme Learning Machine dalam

Penentuan Kualitas Air Sungai Menggunakan

Algoritme Genetika”. Penelitian ini

menggunakan Algoritme Genetika dikarenakan algoritme ini cukup fleksibel untuk dihibridisasikan dengan algoritme lainnya (Gen & Cheng, 1997 disitasi dalam Mahmudy, 2015). Beberapa penelitian membuktikan bahwa Algoritme Genetika yang dimodifikasi atau

di-hybrid sangat efektif untuk menghasilkan solusi

yang lebih baik (Mahmudy, Marian & Luong 2013e, 2013f, 2014 disitasi dalam Mahmudy 2015). Penelitian ini bertujuan untuk mengoptimalkan kinerja atau meningkatkan akurasi dari penelitian yang sebelumnya (Azizah, 2016) yang memiliki nilai akurasi sebesar 87.89%, agar prediksi yang dihasilkan lebih akurat.

2. AIR SUNGAI

(3)

untuk kesejahteraan manusia serta kehidupan yang ada di dalam sungai itu sendiri. Karena itu sungai merupakan salah satu ekosistem yang penting bagi manusia (Siahaan et al., 2011 disitasi dalam Budiarta et al., 2016, p2).

Pemanfaatan air harus dilakukan secara bijak dengan mempertimbangkan kepentingan generasi sekarang dan yang akan datang. Akan tetapi, seiring meningkatnya proses pembangunan di berbagai bidang dan laju pertumbuhan penduduk yang semakin pesat menyebabkan pemanfaatan air tidak lagi dilakukan dengan baik. Hal ini memberikan dampak buruk yang mempengaruhi sifat fisik dan sifat kimia air sehingga menurunkan kualitas air. Pengelolaan sumber daya air bertujuan menyediakan air dalam jumlah yang cukup dengan kualitas yang sesuai dengan tujuannya (Azizah, 2016).

Kualitas air merupakan istilah yang menggambarkan kesesuaian atau tingkat kecocokan air untuk penggunaan tertentu, misalnya: air minum, rumah tangga, perikanan, pengairan/irigasi, peternakan, industri, rekreasi dan sebagainya. Kualitas air dapat diketahui dengan melakukan pengujian tertentu terhadap air tersebut. Pengujian yang umumnya dilakukan adalah uji kimia, fisik, biologi, atau uji wujud air (bau dan warna). Pada penelitian ini, akan digunakan parameter fisika yaitu TSS, parameter kimia organik yang meliputi BOD, COD, DO, pH dan parameter kimia anorganik yang meliputi fenol, minyak dan lemak.

3. EXTREME LEARNING MACHINE

Extreme Learning Machine (ELM)

merupakan metode pembelajaran baru dari JST. Metode ini diperkenalkan oleh Huang (2004). ELM adalah jaringan syaraf tiruan feedforward

sederhana dengan satu hidden layer yang lebih

dikenal dengan istilah Single Hidden Layer Feedforward Neural Networks (SLFNs).

Metode ELM ini dibuat untuk mengurangi

kelemahan-kelemahan JST feedforward

terutama mengenai learning speed. JST feedforward memiliki learning speed rendah,

dikarenakan JST feedforward menggunakan

slow gradient based learning algorithm untuk

melakukan training dan semua parameter pada jaringan ditentukan secara iteratif dengan menggunakan metode pembelajaran tersebut.

Pada ELM parameter-parameter seperti

input weight dan hidden bias dipilih secara

random dari nilai tertentu, sehingga ELM

memiliki learning speed yang cepat dan mampu

menghasilkan good generalization performance.

Dengan random pada range tertentu, bisa

menghindari hasil prediksi yg tidak stabil (Huang et al., 2005).

Secara umum model jaringan syaraf tiruan yang menggunakan ELM sebagai metode pembelajarannya menurut Huang, et al.. dapat dilihat pada Gambar 1.

Gambar 1 Struktur ELM

Metode ELM mempunyai model matematis yang berbeda dari jaringan syaraf tiruan

feedforward. Model matematis dari ELM lebih

sederhana dan efektif. Struktur dari metode ELM bisa dilihat pada Gambar 1.

Langkah-langkah perhitungan dengan metode ELM ini dibedakan menjadi 2 proses, yaitu proses training dan proses testing.

3.1 Proses Training

Sebelum digunakan untuk proses prediksi, ELM harus melalui proses training terlebih

dahulu. Tujuan dari proses ini adalah mendapatkan output weight dengan tingkat kesalahan yang rendah. Langkah-langkah proses

training metode ELM yaitu sebagai berikut: 1. Inisialisasi input weight dan bias dengan

bilangan acak yang kecil.

2. Menghitung semua keluaran di hidden layer

dengan menggunakan fungsi aktivasi. Perhitungan keluaran hidden layer

ditunjukkan pada Persamaan 1.

𝐻𝑖𝑗 = (∑ 𝑥𝑖𝑘. 𝑤𝑗𝑘 𝑇 𝑛

𝑘=1

) + 𝑏𝑗 (1)

Keterangan:

𝐻𝑖𝑗 = Matriks keluaran hidden

layer. W

Input Layer

Hidden

Layer

Output

Layer



y

i

…

x

_i1

x

_i2

(4)

𝑖 = [1, 2, ..., N], dimana N adalah jumlah data.

𝑗 = [1, 2, ..., Ñ], dimana Ñ adalah jumlah hidden neuron.

𝑘 = Jumlah input neuron.

𝑤 = Bobot input dengan ukuran

ordo matriks, hidden neuron x input neuron.

𝑤𝑇 ₌ _Bobot _input _yang

di-transpose. 𝑥 = Data input.

𝑏 = Bias.

3. Setelah keluaran hidden layer (𝐻)

didapatkan, kemudian (𝐻) dihitung dengan

menggunakan fungsi aktivasi sigmoid biner yang ditunjukkan pada Persamaan 2.

𝑓(𝑥) =_{1 + 𝑒}1 _−𝑥 (2)

Keterangan:

𝑓(𝑥) = Fungsi aktivasi sigmoid

biner  2.71828183

𝑒 = Eksponensial

𝑥 = Data ke x.

4. Menghitung Matriks Moore-Penrose Generalized Inverse/ Moore-Penrose Pseudo Inverse (𝐻+) dari hasil keluaran hidden layer dengan fungsi aktivasi dengan

Persamaan 3.

𝐻+_{= (𝐻}𝑇_𝐻)−1_𝐻𝑇 ₍₃₎

Keterangan:

𝐻+ _{= Matriks}_{Moore-Penrose}

Generalized Inverse.

𝐻𝑇 _{= Matriks H yang telah di}

-transpose.

𝐻 = Matriks H hasil keluaran

hidden layer yang telah

diaktivasi.

(𝐻𝑇_𝐻)−1₌ _Inverse_{dari perkalian} matriks 𝐻𝑇_dengan_𝐻_.

5. Menghitung output weight dari hidden layer

ke output layer yang ditunjukkan pada

Persamaan 4.

𝛽 = 𝐻+_𝑇 ₍₄₎

Keterangan:

𝛽 = Matriks output weight dari hidden layer ke output layer.

𝐻+ ₌ _Matriks _{Moore-Penrose}

Generalized Inverse.

𝑇 = Matriks Target.

3.2 Proses Testing

Proses testing dilakukan berdasarkan input weight, bias, dan output weight yang sesuai dari

perhitungan training. Proses training bertujuan

untuk mengembangkan model ELM, sedangkan proses testing bertujuan untuk mengevaluasi

kemampuan ELM sebagai metode untuk memprediksi. Langkah-langkah proses testing

yaitu sebagai berikut:

1. Inisialisasi input weight dan bias yang

didapatkan pada perhitungan training.

2. Menghitung semua keluaran di hidden layer

dengan menggunakan fungsi aktivasi menggunakan Persamaan 1 dan 2.

3. Menggunakan hasil output weight dari hidden layer ke output layer dari proses training. Menghitung keluaran pada output layer yang merupakan hasil prediksi yang ditunjukkan pada Persamaan 5.

𝑦 = 𝐻𝛽 (5)

Keterangan:

𝑦 = Output hasil prediksi.

𝐻 = Keluaran hidden layer

dengan fungsi aktivasi.

𝛽 = Output weight.

4. ALGORITME GENETIKA

Algoritme genetika merupakan algoritme yang populer dan telah digunakan untuk menyelesaikan masalah-masalah optimasi yang bersifat kompleks di bidang fisika, biologi, ekonomi, sosiologi dan lain-lain. (Mahmudy, 2015). Algoritme genetika merupakan suatu metode yang menggunakan seleksi alam yang merupakan bagian utama dari prinsip evolusi sebagai dasar pemikiran untuk menyelesaikan suatu permasalahan. Prinsip ini dikemukakan oleh Charles Darwin, dimana tanpa menghiraukan prinsip dasar penurunan sifat, Darwin mengemukakan penggabungan kualitas induk pada generasi berikutnya, disamping itu bahwa individu yang mampu beradaptasi dengan lingkunganya akan mempunyai kesempatan hidup yang lebih besar.

(5)

paper yang berjudul “Adaption in Natural and Artificial System” mengunakan konsep dasar

algoritme genetika. Algoritme genetika bekerja dengan suatu populasi string dan melakukan proses pencarian nilai optimal secara parallel, dengan mengunakan operator genetika.

Algoritme genetika akan melakukan

rekombinasi antar individu. Algoritme genetika memiliki elemen dasar berupa string yang tersusun dari rangkaian substring (gen), yang masing-masing merupakan kode dari parameter dalam ruang solusi dimana suatu string

(kromosom) menyatakan kandidat solusi. Kumpulan string dalam populasi berkembang dari generasi ke generasi melalui operator genetika. Pada setiap iterasi, individu-individu (kromosom) dalam populasi itu akan dievolusi dan diseleksi untuk menentukan populasi pada generasi berikutnya. Populasi ini akan terus berulang sampai menemukan suatu parameter dengan nilai yang paling optimal sesuai dengan yang diinginkan

4.1 Representasi Kromosom

Gen adalah suatu sel dari suatu kromosom atau nilai yang terdapat dalam Algoritme Genetika ini dapat dibentuk oleh sebuah byte

bahkan tidak menutup kemungkinan suatu

string. Gen ini mewakili sebagian kecil dari

solusi permasalahan.

Individu dalam populasi disebut string, genotype atau kromosom-kromosom terdiri dari

unit-unit yang dinamakan gen, karakter,

decoder. Kromosom ini dapat mewakili suatu

solusi, dimana dapat diilustrasikan dalam Gambar 2 dibawah ini:

Gambar 2 Representasi kromosom

4.2 Inisialisasi

Tahap inisialisasi ini bertujuan untuk membangkitkan himpunan solusi baru secara acak yang terdiri dari sejumlah string kromosom dan ditempatkan pada penampungan yang disebut dengan populasi. Pada tahap ini miu (µ)

yang menyatakan ukuran populasi atau popsize

harus ditentukan. Panjang string kromosom (stringLen) dihitung berdasarkan presisi variabel

dan solusi yang dicari (Mahmudy, 2015).

4.3 Reproduksi

Reproduksi merupakan sebuah proses yang dilakukan untuk menghasilkan keturunan (offspring) yang berasal dari induk kromosom

yang dipilih secara random. Terdapat dua operator genetika dalam reproduksi yaitu

crossover dan mutasi.

• Crossover

Persilangan pada algoritme genetika melibatkan dua buah individu yang dipilih secara acak menjadi parent yang akan membentuk kromosom baru. Proses ini diawali dengan penentuan tingkat crossover (crossover rate / cr). Nilai ini menentukan rasio dari keturunan (offspring) yang dihasilkan dari proses crossover. Hasil offspring dari proses

crossover diperoleh dengan mengalikan cr dengan ukuran populasi (popsize). Pada Extended Intermediate Crossover, dipilih 2 parents untuk melakukan perhitungan crossover menggunakan Persamaan 6.

𝐶(1) = 𝑃(1) + 𝛼(P(2) − P(1))

𝐶(2) = 𝑃(2) + 𝛼(P(1) − P(2)) (6)

Keterangan:

𝐶 = Hasil/Offspring crossover. 𝑃 = Parent.

𝛼 = alpha, nilai dibangkitkan secara random.

• Mutasi

Pada proses mutasi digunakan 1 kromosom parent sebagai inputannya yang

diambil secara random dan memperhitungkan

inputan mutation rate-nya. Sistem melakukan

perulangan untuk menghasilkan offspring dari

hasil mutasi sejumlah mutation rate dikalikan

dengan jumlah populasi awal (popsize). Proses

mutasi menggunakan metode random mutation

dilakukan dengan memilih satu posisi atau titik dari suatu kromosom pada parent terpilih.

Kemudian nilai dari posisi kromosom terpilih akan dimutasi menggunakan Persamaan 7. Setelah proses selesai maka akan tampil individu dari hasil mutasi kromosom yang dipilih secara

random.

𝑥′(𝑖) = 𝑥′_{(𝑖) + 𝑟(𝑚𝑎𝑥}

𝑖− 𝑚𝑖𝑛𝑗) (7)

Keterangan:

𝑥′(𝑖) = Hasil/Offspring mutasi.

𝑟 = Nilai yang dibangkitkan secara random.

𝑚𝑎𝑥𝑖 = Nilai maksimal dari 1 kolom seluruh individu (kolom kromosom terpilih).

𝑚𝑖𝑛𝑗 = Nilai minimal dari 1 kolom seluruh individu (kolom kromosom terpilih). 123456789

987654321 Kromosom A

(6)

4.4 Evaluasi

Melakukan evaluasi pada data kromosom terhadap nilai fitness yang digunakan. Nilai fitness merupakan suatu ukuran baik tidaknya

suatu solusi yang dinyatakan sebagai satu individu, atau dengan kata lain nilai fitness

menyatakan nilai dari fungsi tujuan. Algoritme

genetika mempunyai tujuan untuk

memaksimalkan nilai fitness atau mencari nilai

fitness maksimal.

Pada Algoritme Genetika, suatu individu dievaluasi berdasarkan suatu nilai tertentu berdasarkan suatu fungsi tertentu sebagai ukuran nilai fitness-nya. Pada masalah

optimasi, jika solusi yang dicari adalah memaksimalkan fungsi h, maka nilai fitness

yang digunakan adalah nilai dari fungsi h

tersebut, yakni f = h. Sedangkan jika masalahnya

adalah meminimalkan fungsi h, maka fungsi h

tidak bisa digunakan secara langsung. Sehingga nilai fitness untuk masalah minimasi adalah f = 1/h, yang artinya semakin kecil nilai h, maka

semakin besar nilai f. Namun fungsi ini akan

bermasalah jika h bernilai 0, yang akan

mengakibatkan f bernilai tak hingga. Maka, h

perlu ditambah dengan sebuah bilangan. Sehingga rumus fitness bisa menghasilkan solusi

yang optimal. Fitness yang digunakan pada

penelitian ini ditunjukkan pada Persamaan 8.

𝒇(𝒙) = 𝐴𝑘𝑢𝑟𝑎𝑠𝑖𝑃𝑟𝑒𝑑𝑖𝑘𝑠𝑖𝐸𝐿𝑀 (8)

Di mana :

- 𝑥 adalah individu yang akan dihitung nilai

fitness-nya

4.5 Seleksi

Seleksi merupakan tahapan terakhir pada sekali proses evolusi yang dilakukan untuk memilih individu dari himpunan populasi dan

offspring yang akan dipertahankan hidup pada generasi berikutnya. Semakin besar nilai fitness

kromosom, maka semakin besar peluang kromosom tersebut terpilih. Hal ini dilakukan agar terbentuk generasi berikutnya yang lebih baik dari generasi sekarang (Mahmudy, 2015).

Metode seleksi yang digunakan dalam penelitian ini adalah metode seleksi elitism.

Metode seleksi elitism bekerja dengan cara mengumpulkan semua individu dalam populasi (parent) dan offspring dalam satu penampungan.

Kemudian melakukan sorting secara descending

(dari terbesar ke terkecil) pada nilai fitness nya.

Individu terbaik/tertinggi akan di ambil sesuai dengan jumlah populasi awal/popsize/miu (µ).

Individu terbaik dalam penampungan akan lolos untuk masuk dalam generasi berikutnya. Metode seleksi elitism menjamin individu yang terbaik

akan selalu lolos (Mahmudy, 2015).

5. METODE

Langkah-langkah komputasi pada penelitian ini dapat dilihat pada flowchart Gambar 3.

Gambar 3 Flowchart prediksi kualitas air sungai

Komputasi ELM akan terjadi di dalam proses evaluasi untuk menghasilkan nilai

fitness.

Popsize, ukuran

generasi, cr, mr

Seleksi Inisialisasi Kromosom Awal

Evaluasi Reproduksi for i = 1 to ukuran

generasi Mulai

Individu terbaik i

(7)

Gambar 4 Flowchart prediksi kualitas air sungai

6. HASIL DAN PEMBAHASAN

6.1 Pengujian Popsize

Pengujian popsize bertujuan untuk mengetahui ukuran populasi yang menghasilkan tingkat akurasi terbaik. Pengujian popsize pada penelitian ini akan dilakukan dengan 5 variasi

popsize yang berbeda. Variasi popsize yang digunakan adalah kelipatan 10, dimulai dari 10 hingga 50. Pada masing-masing variasi popsize akan dilakukan percobaan

sebanyak 7 kali percobaan. Karena pada perhitungan Algoritme Genetika dan Extreme Learning Machine banyak melibatkan variabel

yang dibangkitkan secara random,

mengakibatkan nilai yang dihasilkan setiap kali

running program akan berbeda, sehingga

dilakukan beberapa kali percobaan untuk diambil nilai rata-rata akurasi terbaiknya.

Parameter lain yang digunakan untuk mendukung pengujian ini, diantaranya adalah ukuran generasi dan kombinasi cr mr. Selama pengujian sebanyak 7 kali percobaan, pengujian

popsize dengan ukuran yang sama, nilai dari

kedua parameter tersebut tidak boleh berubah/diganti. Nilai parameter yang digunakan pada pengujian ini yaitu ukuran generasi = 100, cr = 0.4 dan mr = 0.2. Hasil

pengujian variasi popsize dapat dilihat pada

Gambar 5.

Gambar 5 Hasil pengujian popsize

Berdasarkan grafik hasil pengujian popsize

di atas, popsize 20 menghasilkan rata-rata

akurasi tertinggi, yaitu 86.6666. Pada grafik diatas ditunjukkan ketidakstabilan rata-rata akurasi, akan tetapi pada ukuran generasi 20-50 mulai ditunjukkan kestabilan rata-rata akurasinya. Pada penelitian ini dapat disimpulkan bahwa semakin besar popsize-nya,

akan semakin rendah rata-rata akurasi yang dihasilkan. Menurut Mahmudy (2015), semakin besar nilai dari popsize, akan memengaruhi

waktu komputasi dan menyebabkan kinerja Algoritme Genetika meningkat bahkan melakukan eksplorasi lebih luas lagi. Oleh karena itu, Algoritme Genetika memiliki kemungkinan untuk mengeksplorasi area yang tidak optimum.

6.2 Pengujian Ukuran Generasi

Pengujian ukuran generasi bertujuan untuk mengetahui ukuran generasi yang menghasilkan tingkat akurasi terbaik. Pengujian ukuran generasi pada penelitian ini akan dilakukan dengan 5 variasiukuran generasi yang berbeda. Variasi ukuran generasi yang digunakan adalah kelipatan 10, dimulai dari 10 hingga 50. Pada masing-masing variasi ukuran generasi akan dilakukan percobaan sebanyak 7 kali percobaan.

Parameter lain yang digunakan untuk mendukung pengujian ini, diantaranya adalah

popsize dan kombinasi cr mr. Selama pengujian sebanyak 7 kali percobaan, pengujian ukuran generasi dengan ukuran yang sama, nilai dari kedua parameter tersebut tidak boleh berubah/diganti. Nilai parameter yang digunakan pada pengujian ini yaitu popsize = 50,

83,3334 86,6666 86 85,3334

82,6666

77.523480.3809 79.2381 77,7144_77.1429

70 75 80 85 90

10 20 30 40 50

Pengujian

Popsize

Rata-rata Akurasi Terbaik Rata-rata Akurasi Total Extreme

Learning Machine

Mulai

Masukkan

Inisialisasi Parameter Awal (h, bias)

Proses

Training

Normalisasi

Selesai

Hasil Prediksi dan

akurasi Proses

(8)

cr = 0.4 dan mr = 0.2. Hasil pengujian variasi

popsize dapat dilihat pada Gambar 6.

Gambar 6 Hasil pengujian ukuran generasi

Berdasarkan grafik hasil pengujian ukuran generasi di atas, ukuran generasi 20 menghasilkan rata-rata akurasi tertinggi, yaitu 86.6668. Grafik diatas menunjukkan ketidakstabilan rata-rata akurasi. Pada ukuran generasi 10 hingga 40, rata-rata akurasi mengalami penurunan, sedangkan pada ukuran generasi 50 mulai ditunjukkan peningkatan rata-rata akurasinya. Semakin banyak ukuran generasinya bukan berarti solusi yang dihasilkan akan optimal. Pada jumlah tertentu (saat mulai stabil), ukuran generasi memiliki kemungkinan lebih tinggi dalam menghasilkan solusi yang optimal. Menurut Mahmudy (2015), semakin besar nilai dari ukuran generasi, akan

memengaruhi waktu komputasi dan

menyebabkan kinerja Algoritme Genetika meningkat bahkan melakukan eksplorasi lebih luas lagi. Oleh karena itu, Algoritme Genetika memiliki kemungkinan untuk mengeksplorasi area yang tidak optimum.

6.3 Pengujian Kombinasi cr dan mr

Pengujian kombinasi cr (crossover rate) dan

mr (mutation rate) bertujuan untuk mengetahui

ukuran kombinasi cr dan mr yang menghasilkan tingkat akurasi terbaik. Pengujian kombinasi cr dan mr pada penelitian ini akan dilakukan dengan 11 variasi kombinasi cr dan mr yang berbeda. Pada masing-masing variasikombinasi cr dan mr akan dilakukan percobaan sebanyak 7 kali percobaan.

Parameter lain yang digunakan untuk mendukung pengujian ini, diantaranya adalah

popsize dan ukuran generasi. Selama pengujian sebanyak 7 kali percobaan, pengujiankombinasi

cr dan mr dengan kombinasi yang sama, nilai dari kedua parameter tersebut tidak boleh berubah/diganti. Nilai parameter yang digunakan pada pengujian ini yaitu popsize = 20,

dan ukuran generasi = 20. Hasil pengujian variasi popsize dapat dilihat pada Gambar 7.

Gambar 7 Hasil pengujian kombinasi cr dan

mr

Berdasarkan grafik hasil pengujian kombinasi cr dan mr di atas, kombinasi cr = 0.5 dan mr = 0.5 menghasilkan rata-rata akurasi tertinggi, yaitu 88.0002. Pada grafik diatas ditunjukkan ketidakstabilan rata-rata akurasi. Semakin banyak ukuran generasinya bukan berarti solusi yang dihasilkan akan optimal. Pada jumlah tertentu (saat mulai stabil), kombinasi cr mr memiliki kemungkinan lebih tinggi dalam menghasilkan solusi yang optimal. Menurut Mahmudy, 2015, setiap permasalahan akan memiliki kombinasi nilai cr dan mr yang berbeda-beda. Nilai cr yang terlalu rendah akan mengakibatkan tidak ditemukannya solusi optimal dari permasalahan, sedangkan nilai mr yang terlalu rendah akan mengakibatkan konvergensi dini.

7. KESIMPULAN DAN SARAN

Metode ELM-GA dapat digunakan untuk menentukan kualitas air sungai. Pada penelitian ini, input weight/bobot awal dioptimasi

menggunakan Algoritme Genetika. Proses optimasi dilakukan dengan melakukan perhitungan menggunakan Algoritme Genetika. Pada tahap evaluasi, nilai fitness dihitung Pengujian Kombinasi cr dan mr

Rata-rata Akurasi Terbaik

(9)

menggunakan metode Extreme Learning Machine, dengan individu gabungan sebagai

bobot awal atau input weight-nya secara

bergantian.

Berdasarkan pengujian yang telah dilakukan pada bab sebelumnya, ketiga pengujian tersebut mempengaruhi waktu eksekusi dan nilai akurasi yang dihasilkan. Semakin besar popsize dan ukuran generasinya akan membutuhkan waktu eksekusi yang cukup lama. Banyaknya popsize dan generasi tidak selalu menghasilkan solusi yang optimal. Solusi optimal yang didapatkan oleh penelitian ini berdasarkan pengujian yang telah dilakukan, diantaranya parameter popsize dengan ukuran 20 dan nilai akurasi 86.6666%, parameter ukuran generasi sejumlah 20 dan nilai akurasi 86.6668% serta parameter kombinasi cr dan mr mendapatkan nilai akurasi 88.0002% dengan kombinasi cr = 0.5 dan mr = 0.5.

Akurasi pada penelitian ini mencapai 88.0002%, meningkat 0.1102% dari penelitian sebelumnya (Azizah, 2016) yang dapat menyentuh angka 87.89%.

Pada penelitian yang akan datang diharapkan akan dilakukan pengembangan atau penggabungan metode lain dengan ELM seperti

Optimally Pruned Extreme Learning Machine

(OPELM), Parallel Layer Extreme Learning Machine (PL-ELM), Radial Basis Function Extreme Learning Machine (RBF-ELM), dan

metode modifikasi ELM lain dapat digunakan pada penelitian selanjutnya untuk meningkatkan hasil klasifikasi.

Pada penelitian selanjutnya juga diharapkan peneliti dapat melakukan seleksi fitur untuk meningkatkan tingkat akurasi prediksi dalam penentuan kualitas air sungai. Seleksi fitur dapat

dilakukan untuk mengurangi jumlah

fitur/parameter yang tidak mempengaruhi tingkat akurasi atau menghapus beberapa data yang kurang atau tidak relevan.

DAFTARPUSTAKA

Agustina, Irwin Dwi, Wiwik Anggraeni, S.Si, M.Kom, dan Ahmad Mukhlason, S.Kom, M.Sc. 2010. Penerapan Metode Extreme Learning Machine untuk Peramalan Permintaan. Institut Teknologi Sepuluh Nopember. Surabaya.

Azizah, Alvia Nur. 2016. Penentuan Kualitas Air Sungai Menggunakan Metode Extreme Learning Machine. Fakultas Ilmu Komputer Universitas Brawijaya. Malang.

Budiarta, Aprilyan David, Rizqy Ajie Setiawan, Siska Putri Nuralisa dan Umi Hidayati. 2016. Kajian Kualitas Air Dengan Menggunakan Analisis Parameter Fisik Dan Kimia Pada Sungai Desa Wiyurejo Kecamatan Pujon Kabupaten Malang. Fakultas Ilmu Sosial Universitas Negeri Malang. Malang.

Huang, G.B., Zhu, Q.Y., dan Siew, C.K. 2004. Extreme Learning Machine : A New Learning Scheme of Feedforward neural Networks. Proceedings of International Joint Conference on Neural Networks. Budapest, Hungary, 25-29 Juli 2004. Singapura: Nanyang Avenue.