Fakultas Ilmu Komputer
Universitas Brawijaya
3788
Peramalan Jumlah Pemakaian Air di PT. Pembangkitan Jawa Bali Unit
Pembangkit Gresik Menggunakan Support Vector Regression
Novi Nur Putriwijaya1, Wayan Firdaus Mahmudy2
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1[email protected], 2[email protected]
Abstrak
Terdapat beberapa macam sumber daya yang sering dalam kegiatan sehari-hari manusia, salah satunya adalah air. PT. PJB UP Gresik memanfaatkan air sebagai katalis dalam memproduksi listrik dan kebutuhan operasional lainnya. Hal ini menyebabkan berkurangnya kuantitas air secara besar, sehingga memungkinkan kurangnya persediaan air di PT. PJB UP Gresik. Untuk mengantisipasi permasalahan tersebut, maka dibutuhkan suatu peramalan terhadap jumlah pemakaian air. Support Vector Regression
(SVR) digunakan untuk melakukan peramalan terhadap jumlah pemakaian air. Data yang digunakan diambil dari riwayat pemakaian air selama 7 bulan. Data uji yang digunakan sebanyak 49, yang diambil secara acak dari keseluruhan data. Untuk mengetahui parameter terbaik dalam membentuk model regresi, maka dilakukan pengujian dengan menghitung nilai Mean Average Percentage Error (MAPE). Dari hasil pengujian yang telah dilakukan, parameter optimal yang diperoleh yaitu jumlah data latih sebanyak 110 dengan rata-rata nilai MAPE 26.104, banyaknya iterasi 650 dengan rata-rata nilai MAPE 20.222, nilai parameter lambda senilai 6 dengan rata-rata nilai MAPE 19.058, nilai parameter epsilon senilai 0.001 dengan rata-rata nilai MAPE 19.049, nilai parameter cLr senilai 0.00001 dengan rata-rata nilai MAPE 19.676, nilai parameter C senilai 0.00006 dengan rata-rata nilai MAPE 20.018, dan nilai parameter sigma senilai 0.75 dengan rata-rata nilai MAPE 19.455. Hasil akhir akurasi dari peramalan yang dilakukan menggunakan MAPE menghasilkan rata-rata nilai MAPE 19.051 yang termasuk pada kategori baik.
Kata kunci: pemakaian air, peramalan, regresi, support vector regression, time-series Abstract
There are several kinds of resources that are often used in daily activities, one of which is water. PT. PJB UP Gresik utilizes water as a catalyst in producing electricity and other operational needs. This leads to a large reduction in the quantity of water, thus allowing a lack of water supply in PT.PJB UP Gresik. To anticipate the problem, it is necessary to forecast the amount of water usage. Support Vector Regression (SVR) is used to forecast the amount of water usage. The data used is taken from history of water usage for 7 months. Testing data used is 49, which is taken randomly from the whole data. To determine the best parameters in forming regression model, testing will be done by calculating Mean Average Percentage Error (MAPE). From the testing results that have been done, the optimal parameters obtained are the amount of training data is 110 with average MAPE value 26.104, number of iterations is 650 with average MAPE value 20.222, value of lambda is 6 with average MAPE value 19.058, value of epsilon is 0.001 with average MAPE value 19.049, value of cLr is 0.00001 with average MAPE value 19.676, value of C is 0.00006 with average MAPE value 20.018, and value of sigma is 0.75 with average MAPE value 19.455. The final result accuracy of forecasting conducted using MAPE with average MAPE value 19.051 that is included in the good category.
Keywords: water usage, forecasting, regression, support vector regression, time-series
1. PENDAHULUAN
Air berperan sangat penting bagi manusia dalam melakukan kegiatan sehari-hari. Pada
umumnya, kebutuhan air digunakan untuk perumahan, pertanian, niaga, industri, dan lingkungan. Kebutuhan air pada bidang industri digunakan untuk keperluan dalam mendinginkan mesin, proses dan operasi pabrik, pembangkitan
listrik, pemadaman api, dan sebagainya (Worthington, 2010). Kebutuhan air di bidang industri tentunya mempunyai peran yang sangat penting untuk berjalannya proses di dalam industri tersebut.
PT. Pembangkitan Jawa Bali Unit Pembangkit Gresik (PT. PJB UP Gresik) merupakan salah satu industri pembangkit listrik yang menggunakan air sebagai katalis dalam memproduksi listrik. Selain itu, air pada PT. PJB UP Gresik juga digunakan untuk kebutuhan operasional seperti air di masjid, toilet, taman, dan sebagainya.
Adanya pemakaian air dalam kuantitas besar merupakan penyebab jumlah ketersediaan air yang ada pada tangki penyimpanan mengalami pengurangan dengan sangat cepat. Selain itu, terjadinya kebocoran pipa pada bagian mesin produksi juga dapat menyebabkan perusahaan mengalami kekurangan air. Untuk mengisi ulang tangki penyimpanan air tentunya membutuhkan waktu yang lama karena kecepatan air yang diisikan ke dalam setiap tangki penyimpanan berbeda-beda.
Terdapat berbagai macam teknik perhitungan yang dapat digunakan untuk melakukan peramalan, salah satunya adalah
Support Vector Machine (SVM). Du, et al. (2013) menggunakan algoritma SVM untuk peramalan permintaan hasil produksi pertanian yang tidak tahan lama. Hampir semua jenis hasil produksi pertanian yang tidak tahan lama, seperti telur, susu, dan daging memiliki waktu penyimpanan yang sangat pendek serta mudah membusuk. Oleh karena itu, peramalan ini sangat dibutuhkan oleh penyedia dan penjual untuk memperkirakan permintaan atas hasil produksi agar dapat mengendalikan biaya penyimpanan. Namun beberapa variabel seperti pergantian iklim, kebutuhan pelanggan, dan sebagainya, dianggap sangat kompleks dan mudah berganti, sehingga menyebabkan terjadinya error pada hasil peramalan. SVM mengimplementasikan prinsip meminimalkan risiko struktural sehingga dapat meminimalkan batas atas penyamarataan error. SVM juga dapat mengatasi permasalahan over-fitting dan dapat mencapai penyamarataan hasil yang tinggi dalam menyelesaikan masalah peramalan. Selain itu, solusi yang dihasilkan oleh SVM nantinya bersifat unik dan optimal (Du, et al., 2013). Namun, SVM mempunyai kelemahan yaitu kurangnya transparansi dalam hasil. Karena mempunyai dimensi yang sangat tinggi, SVM mungkin tidak dapat menampilkan nilai sebagai
fungsi parameter (Karamizadeh, et al., 2014). Pada penelitian yang lain, Yu, et al., (2013) melakukan peramalan hasil penjualan surat kabar atau majalah dengan menggunakan algoritma Support Vector Regression (SVR). Peramalan ini sangat penting dilakukan oleh penerbit dalam mempersiapkan rencana pencetakan dan pendistribusian. Jumlah dari penjualan produk tersebut diasumsikan linear terhadap variabel-variabel yang relevan, misalkan demografis pelanggan atau jenis toko yang digunakan. Namun, asumsi seperti ini kurang tepat karena terdapat relasi non linear antara variabel penjelas dengan penjualan produk, sehingga algoritma SVR digunakan untuk mengatasi permasalahan tersebut. Algoritma SVR ini memiliki keunggulan terhadap pemodelan relasi non linear. Selain itu, SVR telah diketahui dapat meminimalkan risiko struktural untuk mendapatkan keseimbangan antara kompleksitas model dan akurasi prediksi dari model terhadap data latih (Yu, et al., 2013). Algoritma SVR memiliki kelebihan dibandingkan dengan metode yang lain. Kelebihan tersebut adalah kemampuan algoritma SVR untuk menangkap relasi non linear dalam ruang fitur, yang sangat efektif dalam proses melakukan analisis regresi (Qu & Zhang, 2016).
Berdasarkan referensi penelitian yang telah dilakukan oleh beberapa peneliti sebelumnya, algoritma SVR dapat digunakan untuk melakukan peramalan jumlah pemakaian air di PT. PJB UP Gresik. Data riwayat penggunaan air setiap harinya dapat digunakan untuk mendapatkan perkiraan jumlah pemakaian air pada keesokan harinya. Dari hasil peramalan yang didapatkan, kemungkinan terjadinya kekurangan air akan dapat diminimalkan sehingga dapat membantu meningkatkan jasa layanan yang ada pada PT. PJB UP Gresik.
2. METODE PENELITIAN
Support Vector Regression (SVR) merupakan algoritma tingkat lanjut dari Support Vector Machine (SVM) dalam pembahasan tentang regresi. SVM adalah sebuah learning machine yang mengimplementasikan tentang bagaimana meminimalkan risiko struktural untuk mendapatkan generalisasi yang tepat pada jumlah yang terbatas pada learning pattern. SVM dapat menggeneralisasikan struktur data
yang samar hanya dengan beberapa support vector (Basak, et al., 2007).
Misalkan terdapat data latih {(x1, y1), (x2,
y2), ..., (xm, ym)} X
R, dengan X menyatakanruang input patterns (seperti X = Rd). Tujuan dari
-SV regresi adalah menemukan fungsi f(x) yang paling banyak deviasi dari target yang didapat sebenarnya yi untuk semua data latih, dan pada
saat yang sama dengan sedatar mungkin. Dalam kata lain, tidak perlu untuk memperhatikan error
yang bernilai kurang dari , namun tidak akan menerima deviasi lebih dari nilai ini (Scholkopf & Smola, 2004). Fungsi regresi f(x) dinyatakan dalam bentuk persamaan umum yang ditunjukkan pada Persamaan 1, dimana f(x)
adalah nilai prediksi, b adalah nilai bias, w
adalah bobot, x adalah data, dan • adalah dot product di dalam X. b x w x f( ) • dengan wX,bR (1) Pada Persamaan 1, kedataran fungsidicari dengan meminimalkan nilai w, yaitu dengan meminimalkan bentuk Euclidean seperti yang ditunjukkan pada Persamaan 2, dimana adalah nilai deviasi. 2
2
1
w
Minimize
(2)
i i i iy
b
x
w
b
x
w
y
to
Subject
,
,
Asumsi pada Persamaan 2 adalah fungsi f
benar-benar ada yang mendekati semua pasangan (xi, yi) dengan presisi , atau semua
titik berada dalam rentang f(x).
Pada kenyataannya, ada beberapa titik yang mungkin berada di luar area f(x) sehingga perlu ditambahkan variabel slack
i,
i sebagai batasan baru untuk mengatasi kendala-kendala yang terdapat pada Persamaan 2. Dengan demikian, kedataran fungsi dapat dicari dengan menggunakan Persamaan 3.
l i i i C w Minimize 1 * 2 2 1
(3) 0 , , , i i i i i i i i y b x w b x w y to Subject
Konstanta C > 0 merupakan harga batas toleransi antara kedataran fungsi f dengan jumlah deviasi yang nilainya melebihi dari nilai
yang ditoleransi. Seperti yang disebut dengan
-insensitive loss function
yang dinyatakan dalam Persamaan 4.
:
0
lainnya
jika
(4)Setiap nilai kesalahan yang melebihi dari nilai akan dikenakan penalti sebesar C. Nilai C
merupakan konstanta yang digunakan untuk menentukan penukaran kedataran fungsi dengan
error pada saat proses learning.
Terdapat beberapa macam jenis kernel yang dapat digunakan di dalam SVR. Pada penelitian ini kernel yang digunakan adalah kernel Radial Basic Function (RBF). Langkah-langkah algoritma sequential learning untuk melakukan perhitungan fungsi pada SVR adalah sebagai berikut:
1. Melakukan inisialisasi pada nilai i dan i*
dengan memberikan nilai 0. Kemudian, menghitung matriks hessian menggunakan Persamaan 5, dimana Rij adalah matriks
hessian dengan baris i kolom j, 2 adalah
augmenting factor, dan l adalah banyaknya data latih yang digunakan.
2,
K xi xj
ij
R (5)
2. Untuk setiap data latih i, j = 1, 2, …, l, lakukan langkah-langkah berikut:
2.1 Menghitung nilai error menggunakan Persamaan 6, dimana Ei adalah nilai
error ke-i, yi adalah nilai aktual dari
data latih, dan i dan i* adalah nilai
Lagrange Multiplier.
l j ij j j i iy
R
E
1 *
(6)2.2 Melakukan perhitungan terhadap i
dan i* menggunakan Persamaan 7
dan 8, dengan
i dan*
i
adalah variabel tunggal yang merupakan perubahan nilai i dan i*,
adalahnilai epsilon, C adalah nilai kompleksitas, dan
adalah nilailearning rate.
*
, * , max min * i C i i E i (7)
Ei i C i
i min max , , (8) Nilai learning rate diperoleh dari Persamaan 9.𝛾 = 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑙𝑒𝑎𝑟𝑛𝑖𝑛𝑔 𝑟𝑎𝑡𝑒
2.3Mengubah nilai i dan i*
menggunakan Persamaan 10 dan 11.
* * * i i i
(10) i i i
(11)3. Apabila proses sudah mencapai pada jumlah iterasi yang sudah ditentukan atau sudah memenuhi nilai max
i*
dan
i max , maka algoritma selesai. Jika belum memenuhi syarat-syarat tersebut, maka ulangi kembali mulai dari langkah kedua.
4. Lakukan pengujian dengan menggunakan fungsi regresi seperti pada Persamaan 12.
l i i i i K x x x f 1 2 * ,
(12) 5. Selesai. 3. PERANCANGANData yang digunakan adalah data jumlah pemakaian air PLTGU di PT. PJB UP Gresik pada periode Januari 2017 sampai dengan Juli 2017, serta informasi jenis pemakaian air yang dilakukan. Data jumlah pemakaian air bersifat time series dan dicatat secara harian sebanyak empat kali, yaitu pada pukul 00.00, 06.00, 14.00, dan 21.00.
Pada peramalan jumlah pemakaian air dengan menggunakan SVR, peramalan dilakukan dengan membentuk model regresi, yang selanjutnya dilakukan pengujian. Pengujian dilakukan dengan menggunakan tingkat error. Tingkat error tersebut menyatakan akurasi dari model yang telah dibangun dengan bertujuan untuk menghasilkan nilai error yang serendah mungkin sehingga hasil peramalan yang didapatkan memiliki akurasi yang baik.
Sebelum memulai proses peramalan, perlu adanya tahap untuk menentukan nilai awal dari setiap parameter yang digunakan serta memasukkan data yang akan digunakan. Langkah berikutnya adalah melakukan normalisasi terhadap data, kemudian dilanjutkan dengan proses perhitungan dengan algoritma SVR sesuai dengan parameter yang telah didefinisikan di langkah awal dan data yang sudah ternormalisasi. Proses peramalan ini digambarkan dalam bentuk diagram alir yang ditunjukkan pada Gambar 1.
Gambar 1. Diagram Alir Proses Peramalan dengan SVR
4. PENGUJIAN DAN ANALISIS
Pengujian ini menggunakan data sebanyak 209 riwayat pemakaian air dengan rincian jumlah pemakaian air pada tiga hari sebelumnya dengan jumlah pemakaian air pada hari tersebut. Pada setiap pengujian yang dilakukan, akan dibandingkan nilai kesalahan yang terkecil sehingga dapat diketahui nilai yang terbaik pada setiap parameter. Dari nilai-nilai tersebut dapat digunakan untuk menyelesaikan permasalahan peramalan jumlah pemakaian air ini.
4.1.Hasil dan Analisis Uji Coba Variasi Jumlah Data Latih
Uji coba variasi jumlah data latih dilakukan untuk mendapatkan jumlah data latih yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan menggunakan variasi jumlah data latih kelipatan 10 mulai dari 50 sampai dengan 160, sedangkan jumlah data uji yang digunakan bernilai sama yaitu 49 yang diambil secara acak. Pada pengujian ini, iterasi yang digunakan sebanyak 500 kali dengan nilai parameter lambda = 15, epsilon =, cLR = 0.00001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 2.
Mulai Inisialisasi data, max iterasi, , , , C, dan cLR Normalisasi Data Sequential Learning Nilai peramalan jumlah pemakaian air
dan error rate
Selesai
Gambar 2. Grafik Hasil Uji Coba Variasi Jumlah Data Latih
Gambar 2 menunjukkan bahwa semakin banyak jumlah data latih yang digunakan, maka nilai MAPE pada data uji yang dihasilkan cenderung menurun. Hal tersebut dikarenakan di dalam SVR terdapat proses sequential learning
yang membutuhkan banyak data latih agar dapat memodelkan regresi peramalannya dengan baik untuk meramalkan data uji (Rusmalawati, et al., 2018). Pada grafik tersebut dapat dilihat nilai MAPE dari data latih sebanyak 50 menuju data latih sebanyak 110 mengalami penurunan dengan perbedaan yang cukup signifikan, namun dari data latih sebanyak 110 hingga 160 rata-rata nilai MAPE yang dihasilkan cenderung konstan. Hal ini menunjukkan bahwa data latih sebanyak 110 adalah jumlah data latih yang terbaik.
4.2.Hasil dan Analisis Uji Coba Banyaknya Iterasi
Uji coba banyaknya iterasi dilakukan untuk mendapatkan jumlah iterasi yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan menggunakan jumlah iterasi kelipatan 50 mulai dari 50 sampai dengan 700. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan nilai parameter sigma = 0.5, epsilon = 0.00001, cLR = 0.00001, C = 0.0001, dan lambda = 15. Hasil pengujian ditunjukkan pada Gambar 3.
Gambar 3. Grafik Hasil Uji Coba Banyaknya Iterasi
Gambar 3 menunjukkan bahwa rata-rata nilai MAPE yang terendah sebesar 20.222 yaitu
ketika dilakukan iterasi sebanyak 650 kali. Hasil uji coba iterasi ke-50 hingga iterasi ke-650 cenderung terjadi penurunan nilai MAPE. Hal ini dikarenakan semakin banyak iterasi yang dilakukan maka semakin lama proses pelatihan yang dilakukan pada model regresi. Pada uji coba ini, banyak iterasi yang dipilih ada sebesar 650.
4.3.Hasil dan Analisis Uji Coba Nilai Parameter Lambda
Uji coba nilai parameter lambda dilakukan untuk mendapatkan nilai parameter lambda yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan menggunakan nilai parameter lambda mulai dari 1 sampai dengan 10. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter epsilon = 0.00001, cLR = 0.00001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 4.
Gambar 4. Grafik Hasil Uji Coba Nilai Parameter Lambda
Gambar 4 menunjukkan bahwa semakin kecil besar lambda maka semakin besar nilai MAPE yang dihasilkan. Namun apabila nilai lambda terlalu besar, maka proses komputasi yang terjadi dalam pembuatan matriks hessian
menjadi semakin lama (Rusmalawati, et al., 2018). Dari uji coba dengan nilai lambda sebesar 1 hingga nilai lambda sebesar 6 terjadi penurunan nilai MAPE yang signifikan. Namun nilai MAPE cenderung stabil mulai dari nilai lambda bernilai 6 dan seterusnya. Hal ini menunjukkan bahwa nilai lambda yang dapat menghasilkan nilai dengan nilai MAPE terkecil yaitu pada nilai 6.
4.4.Hasil dan Analisis Uji Coba Nilai Parameter Epsilon
Uji coba nilai parameter epsilon dilakukan untuk mendapatkan nilai parameter epsilon yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter epsilon dengan
20 30 40 50 60 50 60 70 80 90 100 110 120 130 140 150 160 Ni lai M A PE
Jumlah Data Latih
Uji Coba Variasi Jumlah Data Latih
15 25 35 45 55 65 75 50 100 150 200 250 300 350 400 450 500 550 600 650 700 N ilai M A PE Banyaknya Iterasi
Uji Coba Banyaknya Iterasi
15 30 45 60 1 2 3 4 5 6 7 8 9 10 N ilai M A PE
Nilai Parameter Lambda
kelipatan 10-1 mulai dari 0.00000001 sampai
dengan 1. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, cLR = 0.00001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 5.
Gambar 5. Grafik Hasil Uji Coba Nilai Parameter Epsilon
Gambar 5 menunjukkan bahwa semakin besar nilai dari parameter epsilon yang digunakan maka semakin tinggi nilai MAPE yang dihasilkan. Dari uji coba dengan menggunakan nilai parameter epsilon sebesar 0.00000001 hingga 0.001 nilai MAPE yang dihasilkan cenderung konstan, dan terjadi kenaikan nilai MAPE dimulai dari 0.01hingga seterusnya. Nilai parameter epsilon digunakan untuk batasan pada kesalahan yang ditoleransi, sehingga semakin kecil nilai parameter epsilon maka semakin tepat model yang didapatkan (Chai, 2011). Namun semakin kecil nilai epsilon yang digunakan, dapat menyebabkan waktu komputasi yang lebih besar. Pada uji coba ini, nilai parameter epsilon yang dipilih adalah sebesar 0.001.
4.5.Hasil dan Analisis Uji Coba Nilai Parameter cLR
Uji coba nilai parameter cLR dilakukan untuk mendapatkan nilai parameter cLR yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter cLR kelipatan 0.000001 mulai dari 0.000001 sampai dengan 0.00005. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, epsilon = 0.001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 6.
Gambar 6. Grafik Hasil Uji Coba Nilai Parameter cLR
Gambar 6 menunjukkan bahwa semakin besar nilai parameter cLR maka semakin rendah nilai MAPE yang dihasilkan. Dari uji coba dengan menggunakan nilai parameter cLR
sebesar 0.000001 hingga 0.00001 nilai MAPE yang dihasilkan cenderung mengalami penurunan, dan terjadi kenaikan nilai MAPE dimulai dari 0.00002 hingga seterusnya. Nilai parameter cLR berguna sebagai penentu nilai gamma () yang digunakan untuk mengatur laju
learning. Jika nilai dari parameter semakin besar maka learning akan berjalan lebih cepat namun berkemungkinan besar untuk mengalami konvergensi dini (Rusmalawati, et al., 2018). Pada uji coba ini, nilai parameter cLR yang dipilih adalah sebesar 0.00001.
4.6.Hasil dan Analisis Uji Coba Nilai Parameter C
Uji coba nilai parameter C dilakukan untuk mendapatkan nilai parameter C yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter C kelipatan 0.00001 mulai dari 0.00001 sampai dengan 0.0003. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, epsilon = 0.001, cLR = 0.00001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 7.
Gambar 7. Grafik Hasil Uji Coba Nilai Parameter C 0 20 40 60 80 N ilai M A PE
Nilai Parameter Epsilon
Uji Coba Nilai Parameter Epsilon
10 30 50 70 90 Ni lai M A PE Nilai Parameter cLR
Uji Coba Nilai Parameter cLR
15 35 55 75 0,00001 0,00002 0,00003 0,000 04 0,00005 0,00006 0,00007 0,00008 0,000 09 0,0001 0,0002 0,0003 N ilai M A PE Nilai Parameter C
Gambar 7 menunjukkan bahwa semakin besar nilai parameter C yang digunakan maka semakin kecil nilai MAPE yang dihasilkan. Dari uji coba dengan nilai parameter sebesar 0.00001 hingga 0.00006 cenderung mengalami penurunan yang signifikan, namun nilai MAPE menjadi konstan dimulai dari 0.00007 hingga seterusnya. Nilai parameter C digunakan sebagai penentu besar penalti yang diberikan di dalam
learning (Putra, et al., 2018). Pada uji coba ini, nilai parameter C yang dipilih adalah sebesar 0.00006.
4.7.Hasil dan Analisis Uji Coba Nilai Parameter Sigma
Uji coba nilai parameter sigma dilakukan untuk mendapatkan nilai parameter sigma yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter sigma yaitu 0.0001, 0.00025, 0.0005, 0.00075, 0.001, 0.0025, 0.005, 0.0075, 0.01, 0.025, 0.05, 0.075, 0.1, 0.25, 0.5, 0.75, dan 1. Pada pengujian ini jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, epsilon = 0.001, cLR = 0.00001, dan C = 0.00006. Hasil pengujian ditunjukkan pada Gambar 8.
Gambar 8. Grafik Hasil Uji Coba Nilai Parameter Sigma
Gambar 8 menunjukkan bahwa semakin besar nilai sigma yang digunakan maka nilai MAPE yang dihasilkan semakin kecil. Sigma digunakan sebagai parameter dalam pemodelan regresi yang ada pada SVR. Jika nilai sigma terlalu kecil, maka dapat menyebabkan terjadinya overfit pada data latih. Namun apabila nilai sigma terlalu besar, maka akan berdampak pada waktu komputasi yang lebih lama. Pada uji coba ini, nilai parameter sigma yang dipilih adalah sebesar 0.75.
4.8.Pengujian dengan Parameter Terbaik
Pengujian parameter terbaik dilakukan setelah didapatkan nilai-nilai dari parameter yang dapat menghasilkan akurasi terbaik. Data latih untuk melakukan learning yang menghasilkan akurasi terbaik adalah 110. Banyaknya iterasi yang dilakukan adalah 650. Nilai lambda = 6, nilai epsilon = 0.001, nilai cLR
= 0.0001, nilai C = 0.0006, dan nilai sigma = 0.75. Hasil pengujian parameter terbaik ditunjukkan pada Tabel 1.
Tabel 1. Hasil Pengujian Parameter Terbaik
Percobaan ke- Nilai MAPE
1 17.666 2 20.865 3 19.602 4 15.855 5 20.616 6 19.178 7 19.601 8 19.702 9 17.615 10 19.806 Rata-rata 19.051 5. KESIMPULAN
Berdasarkan dari hasil uji coba parameter SVR pada permasalahan peramalan jumlah pemakaian air, diperoleh kesimpulan bahwa permasalahan peramalan jumlah pemakaian air dapat diselesaikan dengan menggunakan SVR. Parameter terbaik yang diperoleh dari hasil pengujian adalah jumlah data latih yang digunakan sebanyak 110, jumlah iterasi sebanyak 650, nilai parameter lambda sebesar 6, nilai parameter epsilon sebesar 0.001, nilai parameter cLR sebesar 0.00001, nilai parameter C sebesar 0.00006, dan nilai parameter sigma sebesar 0.75. Dengan menggunakan parameter terbaik tersebut, rata-rata nilai MAPE yang didapatkan sebesar 19.051.
DAFTAR PUSTAKA
Basak, D., Pal, S. & Patranabis, D. C., 2007.
Support Vector Regression.
Neural
Information Processing – Letters
and Reviews,
11(10), pp. 203-224.
Chai, Y., 2011. A Coal Mine Gas
Concentration Prediction Method
based
on
Particle
Swarm
Optimization
Support
Vector
Regression.
IEEE,
pp. 334-337.
18 20 22 24 26 N ilai M A PENilai Parameter Sigma