Peramalan Jumlah Pemakaian Air di PT. Pembangkitan Jawa Bali Unit Pembangkit Gresik Menggunakan Support Vector Regression

(1)

Fakultas Ilmu Komputer

Universitas Brawijaya

3788

Peramalan Jumlah Pemakaian Air di PT. Pembangkitan Jawa Bali Unit

Pembangkit Gresik Menggunakan Support Vector Regression

Novi Nur Putriwijaya1_{, Wayan Firdaus Mahmudy}2

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1_{[email protected],}2_{[email protected]}

Abstrak

Terdapat beberapa macam sumber daya yang sering dalam kegiatan sehari-hari manusia, salah satunya adalah air. PT. PJB UP Gresik memanfaatkan air sebagai katalis dalam memproduksi listrik dan kebutuhan operasional lainnya. Hal ini menyebabkan berkurangnya kuantitas air secara besar, sehingga memungkinkan kurangnya persediaan air di PT. PJB UP Gresik. Untuk mengantisipasi permasalahan tersebut, maka dibutuhkan suatu peramalan terhadap jumlah pemakaian air. Support Vector Regression

(SVR) digunakan untuk melakukan peramalan terhadap jumlah pemakaian air. Data yang digunakan diambil dari riwayat pemakaian air selama 7 bulan. Data uji yang digunakan sebanyak 49, yang diambil secara acak dari keseluruhan data. Untuk mengetahui parameter terbaik dalam membentuk model regresi, maka dilakukan pengujian dengan menghitung nilai Mean Average Percentage Error (MAPE). Dari hasil pengujian yang telah dilakukan, parameter optimal yang diperoleh yaitu jumlah data latih sebanyak 110 dengan rata-rata nilai MAPE 26.104, banyaknya iterasi 650 dengan rata-rata nilai MAPE 20.222, nilai parameter lambda senilai 6 dengan rata-rata nilai MAPE 19.058, nilai parameter epsilon senilai 0.001 dengan rata-rata nilai MAPE 19.049, nilai parameter cLr senilai 0.00001 dengan rata-rata nilai MAPE 19.676, nilai parameter C senilai 0.00006 dengan rata-rata nilai MAPE 20.018, dan nilai parameter sigma senilai 0.75 dengan rata-rata nilai MAPE 19.455. Hasil akhir akurasi dari peramalan yang dilakukan menggunakan MAPE menghasilkan rata-rata nilai MAPE 19.051 yang termasuk pada kategori baik.

Kata kunci: pemakaian air, peramalan, regresi, support vector regression, time-series Abstract

There are several kinds of resources that are often used in daily activities, one of which is water. PT. PJB UP Gresik utilizes water as a catalyst in producing electricity and other operational needs. This leads to a large reduction in the quantity of water, thus allowing a lack of water supply in PT.PJB UP Gresik. To anticipate the problem, it is necessary to forecast the amount of water usage. Support Vector Regression (SVR) is used to forecast the amount of water usage. The data used is taken from history of water usage for 7 months. Testing data used is 49, which is taken randomly from the whole data. To determine the best parameters in forming regression model, testing will be done by calculating Mean Average Percentage Error (MAPE). From the testing results that have been done, the optimal parameters obtained are the amount of training data is 110 with average MAPE value 26.104, number of iterations is 650 with average MAPE value 20.222, value of lambda is 6 with average MAPE value 19.058, value of epsilon is 0.001 with average MAPE value 19.049, value of cLr is 0.00001 with average MAPE value 19.676, value of C is 0.00006 with average MAPE value 20.018, and value of sigma is 0.75 with average MAPE value 19.455. The final result accuracy of forecasting conducted using MAPE with average MAPE value 19.051 that is included in the good category.

Keywords: water usage, forecasting, regression, support vector regression, time-series

1. PENDAHULUAN

Air berperan sangat penting bagi manusia dalam melakukan kegiatan sehari-hari. Pada

umumnya, kebutuhan air digunakan untuk perumahan, pertanian, niaga, industri, dan lingkungan. Kebutuhan air pada bidang industri digunakan untuk keperluan dalam mendinginkan mesin, proses dan operasi pabrik, pembangkitan

(2)

listrik, pemadaman api, dan sebagainya (Worthington, 2010). Kebutuhan air di bidang industri tentunya mempunyai peran yang sangat penting untuk berjalannya proses di dalam industri tersebut.

PT. Pembangkitan Jawa Bali Unit Pembangkit Gresik (PT. PJB UP Gresik) merupakan salah satu industri pembangkit listrik yang menggunakan air sebagai katalis dalam memproduksi listrik. Selain itu, air pada PT. PJB UP Gresik juga digunakan untuk kebutuhan operasional seperti air di masjid, toilet, taman, dan sebagainya.

Adanya pemakaian air dalam kuantitas besar merupakan penyebab jumlah ketersediaan air yang ada pada tangki penyimpanan mengalami pengurangan dengan sangat cepat. Selain itu, terjadinya kebocoran pipa pada bagian mesin produksi juga dapat menyebabkan perusahaan mengalami kekurangan air. Untuk mengisi ulang tangki penyimpanan air tentunya membutuhkan waktu yang lama karena kecepatan air yang diisikan ke dalam setiap tangki penyimpanan berbeda-beda.

Terdapat berbagai macam teknik perhitungan yang dapat digunakan untuk melakukan peramalan, salah satunya adalah

Support Vector Machine (SVM). Du, et al. (2013) menggunakan algoritma SVM untuk peramalan permintaan hasil produksi pertanian yang tidak tahan lama. Hampir semua jenis hasil produksi pertanian yang tidak tahan lama, seperti telur, susu, dan daging memiliki waktu penyimpanan yang sangat pendek serta mudah membusuk. Oleh karena itu, peramalan ini sangat dibutuhkan oleh penyedia dan penjual untuk memperkirakan permintaan atas hasil produksi agar dapat mengendalikan biaya penyimpanan. Namun beberapa variabel seperti pergantian iklim, kebutuhan pelanggan, dan sebagainya, dianggap sangat kompleks dan mudah berganti, sehingga menyebabkan terjadinya error pada hasil peramalan. SVM mengimplementasikan prinsip meminimalkan risiko struktural sehingga dapat meminimalkan batas atas penyamarataan error. SVM juga dapat mengatasi permasalahan over-fitting dan dapat mencapai penyamarataan hasil yang tinggi dalam menyelesaikan masalah peramalan. Selain itu, solusi yang dihasilkan oleh SVM nantinya bersifat unik dan optimal (Du, et al., 2013). Namun, SVM mempunyai kelemahan yaitu kurangnya transparansi dalam hasil. Karena mempunyai dimensi yang sangat tinggi, SVM mungkin tidak dapat menampilkan nilai sebagai

fungsi parameter (Karamizadeh, et al., 2014). Pada penelitian yang lain, Yu, et al., (2013) melakukan peramalan hasil penjualan surat kabar atau majalah dengan menggunakan algoritma Support Vector Regression (SVR). Peramalan ini sangat penting dilakukan oleh penerbit dalam mempersiapkan rencana pencetakan dan pendistribusian. Jumlah dari penjualan produk tersebut diasumsikan linear terhadap variabel-variabel yang relevan, misalkan demografis pelanggan atau jenis toko yang digunakan. Namun, asumsi seperti ini kurang tepat karena terdapat relasi non linear antara variabel penjelas dengan penjualan produk, sehingga algoritma SVR digunakan untuk mengatasi permasalahan tersebut. Algoritma SVR ini memiliki keunggulan terhadap pemodelan relasi non linear. Selain itu, SVR telah diketahui dapat meminimalkan risiko struktural untuk mendapatkan keseimbangan antara kompleksitas model dan akurasi prediksi dari model terhadap data latih (Yu, et al., 2013). Algoritma SVR memiliki kelebihan dibandingkan dengan metode yang lain. Kelebihan tersebut adalah kemampuan algoritma SVR untuk menangkap relasi non linear dalam ruang fitur, yang sangat efektif dalam proses melakukan analisis regresi (Qu & Zhang, 2016).

Berdasarkan referensi penelitian yang telah dilakukan oleh beberapa peneliti sebelumnya, algoritma SVR dapat digunakan untuk melakukan peramalan jumlah pemakaian air di PT. PJB UP Gresik. Data riwayat penggunaan air setiap harinya dapat digunakan untuk mendapatkan perkiraan jumlah pemakaian air pada keesokan harinya. Dari hasil peramalan yang didapatkan, kemungkinan terjadinya kekurangan air akan dapat diminimalkan sehingga dapat membantu meningkatkan jasa layanan yang ada pada PT. PJB UP Gresik.

2. METODE PENELITIAN

Support Vector Regression (SVR) merupakan algoritma tingkat lanjut dari Support Vector Machine (SVM) dalam pembahasan tentang regresi. SVM adalah sebuah learning machine yang mengimplementasikan tentang bagaimana meminimalkan risiko struktural untuk mendapatkan generalisasi yang tepat pada jumlah yang terbatas pada learning pattern. SVM dapat menggeneralisasikan struktur data

(3)

yang samar hanya dengan beberapa support vector (Basak, et al., 2007).

Misalkan terdapat data latih {(x1, y1), (x2,

y2), ..., (xm, ym)} X



R, dengan X menyatakan

ruang input patterns (seperti X = Rd). Tujuan dari

-SV regresi adalah menemukan fungsi f(x) yang paling banyak  deviasi dari target yang didapat sebenarnya yi untuk semua data latih, dan pada

saat yang sama dengan sedatar mungkin. Dalam kata lain, tidak perlu untuk memperhatikan error

yang bernilai kurang dari , namun tidak akan menerima deviasi lebih dari nilai ini (Scholkopf & Smola, 2004). Fungsi regresi f(x) dinyatakan dalam bentuk persamaan umum yang ditunjukkan pada Persamaan 1, dimana f(x)

adalah nilai prediksi, b adalah nilai bias, w

adalah bobot, x adalah data, dan • adalah dot product di dalam X. b x w x f( ) •  dengan wX,bR (1) Pada Persamaan 1, kedataran fungsidicari dengan meminimalkan nilai w, yaitu dengan meminimalkan bentuk Euclidean seperti yang ditunjukkan pada Persamaan 2, dimana  adalah nilai deviasi. 2

2

1 w

Minimize

(2)





















i i i i

y

b

x

w

b

x

w

y

to

Subject

,

Asumsi pada Persamaan 2 adalah fungsi f

benar-benar ada yang mendekati semua pasangan (xi, yi) dengan presisi , atau semua

titik berada dalam rentang f(x).

Pada kenyataannya, ada beberapa titik yang mungkin berada di luar area f(x)   sehingga perlu ditambahkan variabel slack



_i,



_i sebagai batasan baru untuk mengatasi kendala-kendala yang terdapat pada Persamaan 2. Dengan demikian, kedataran fungsi dapat dicari dengan menggunakan Persamaan 3.







   l i i i C w Minimize 1 * 2 2 1

_

(3)                  0 , , , i i i i i i i i y b x w b x w y to Subject









Konstanta C > 0 merupakan harga batas toleransi antara kedataran fungsi f dengan jumlah deviasi yang nilainya melebihi dari nilai

 yang ditoleransi. Seperti yang disebut dengan

-insensitive loss function



_ yang dinyatakan dalam Persamaan 4.















_

:

0 lainnya

jika







(4)

Setiap nilai kesalahan yang melebihi dari nilai akan dikenakan penalti sebesar C. Nilai C

merupakan konstanta yang digunakan untuk menentukan penukaran kedataran fungsi dengan

error pada saat proses learning.

Terdapat beberapa macam jenis kernel yang dapat digunakan di dalam SVR. Pada penelitian ini kernel yang digunakan adalah kernel Radial Basic Function (RBF). Langkah-langkah algoritma sequential learning untuk melakukan perhitungan fungsi pada SVR adalah sebagai berikut:

1. Melakukan inisialisasi pada nilai i dan i*

dengan memberikan nilai 0. Kemudian, menghitung matriks hessian menggunakan Persamaan 5, dimana Rij adalah matriks

hessian dengan baris i kolom j, 2 _adalah

augmenting factor, dan l adalah banyaknya data latih yang digunakan.

 





2

, 



K xi xj

ij

R (5)

2. Untuk setiap data latih i, j = 1, 2, …, l, lakukan langkah-langkah berikut:

2.1 Menghitung nilai error menggunakan Persamaan 6, dimana Ei adalah nilai

error ke-i, yi adalah nilai aktual dari

data latih, dan i dan i* adalah nilai

Lagrange Multiplier.













l j ij j j i i

y

R

E

1 *



(6)

2.2 Melakukan perhitungan terhadap i

dan i* menggunakan Persamaan 7

dan 8, dengan



i dan

*

i



adalah variabel tunggal yang merupakan perubahan nilai i dan i*,



adalah

nilai epsilon, C adalah nilai kompleksitas, dan



adalah nilai

learning rate.











*



, * , max min * i C i i E i          (7)











E_i _i C _i



i      min max   , ,  (8) Nilai learning rate diperoleh dari Persamaan 9.

𝛾 = 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑙𝑒𝑎𝑟𝑛𝑖𝑛𝑔 𝑟𝑎𝑡𝑒

(4)

2.3Mengubah nilai i dan i*

menggunakan Persamaan 10 dan 11.

* * * i i i





  (10) i i i









(11)

3. Apabila proses sudah mencapai pada jumlah iterasi yang sudah ditentukan atau sudah memenuhi nilai max



i* 



dan





_i 

max , maka algoritma selesai. Jika belum memenuhi syarat-syarat tersebut, maka ulangi kembali mulai dari langkah kedua.

4. Lakukan pengujian dengan menggunakan fungsi regresi seperti pada Persamaan 12.

 

_









    l i i i i K x x x f 1 2 * ,





(12) 5. Selesai. 3. PERANCANGAN

Data yang digunakan adalah data jumlah pemakaian air PLTGU di PT. PJB UP Gresik pada periode Januari 2017 sampai dengan Juli 2017, serta informasi jenis pemakaian air yang dilakukan. Data jumlah pemakaian air bersifat time series dan dicatat secara harian sebanyak empat kali, yaitu pada pukul 00.00, 06.00, 14.00, dan 21.00.

Pada peramalan jumlah pemakaian air dengan menggunakan SVR, peramalan dilakukan dengan membentuk model regresi, yang selanjutnya dilakukan pengujian. Pengujian dilakukan dengan menggunakan tingkat error. Tingkat error tersebut menyatakan akurasi dari model yang telah dibangun dengan bertujuan untuk menghasilkan nilai error yang serendah mungkin sehingga hasil peramalan yang didapatkan memiliki akurasi yang baik.

Sebelum memulai proses peramalan, perlu adanya tahap untuk menentukan nilai awal dari setiap parameter yang digunakan serta memasukkan data yang akan digunakan. Langkah berikutnya adalah melakukan normalisasi terhadap data, kemudian dilanjutkan dengan proses perhitungan dengan algoritma SVR sesuai dengan parameter yang telah didefinisikan di langkah awal dan data yang sudah ternormalisasi. Proses peramalan ini digambarkan dalam bentuk diagram alir yang ditunjukkan pada Gambar 1.

Gambar 1. Diagram Alir Proses Peramalan dengan SVR

4. PENGUJIAN DAN ANALISIS

Pengujian ini menggunakan data sebanyak 209 riwayat pemakaian air dengan rincian jumlah pemakaian air pada tiga hari sebelumnya dengan jumlah pemakaian air pada hari tersebut. Pada setiap pengujian yang dilakukan, akan dibandingkan nilai kesalahan yang terkecil sehingga dapat diketahui nilai yang terbaik pada setiap parameter. Dari nilai-nilai tersebut dapat digunakan untuk menyelesaikan permasalahan peramalan jumlah pemakaian air ini.

4.1.Hasil dan Analisis Uji Coba Variasi Jumlah Data Latih

Uji coba variasi jumlah data latih dilakukan untuk mendapatkan jumlah data latih yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan menggunakan variasi jumlah data latih kelipatan 10 mulai dari 50 sampai dengan 160, sedangkan jumlah data uji yang digunakan bernilai sama yaitu 49 yang diambil secara acak. Pada pengujian ini, iterasi yang digunakan sebanyak 500 kali dengan nilai parameter lambda = 15, epsilon =, cLR = 0.00001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 2.

Mulai Inisialisasi data, max iterasi, , , , C, dan cLR Normalisasi Data Sequential Learning Nilai peramalan jumlah pemakaian air

dan error rate

Selesai

(5)

Gambar 2. Grafik Hasil Uji Coba Variasi Jumlah Data Latih

Gambar 2 menunjukkan bahwa semakin banyak jumlah data latih yang digunakan, maka nilai MAPE pada data uji yang dihasilkan cenderung menurun. Hal tersebut dikarenakan di dalam SVR terdapat proses sequential learning

yang membutuhkan banyak data latih agar dapat memodelkan regresi peramalannya dengan baik untuk meramalkan data uji (Rusmalawati, et al., 2018). Pada grafik tersebut dapat dilihat nilai MAPE dari data latih sebanyak 50 menuju data latih sebanyak 110 mengalami penurunan dengan perbedaan yang cukup signifikan, namun dari data latih sebanyak 110 hingga 160 rata-rata nilai MAPE yang dihasilkan cenderung konstan. Hal ini menunjukkan bahwa data latih sebanyak 110 adalah jumlah data latih yang terbaik.

4.2.Hasil dan Analisis Uji Coba Banyaknya Iterasi

Uji coba banyaknya iterasi dilakukan untuk mendapatkan jumlah iterasi yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan menggunakan jumlah iterasi kelipatan 50 mulai dari 50 sampai dengan 700. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan nilai parameter sigma = 0.5, epsilon = 0.00001, cLR = 0.00001, C = 0.0001, dan lambda = 15. Hasil pengujian ditunjukkan pada Gambar 3.

Gambar 3. Grafik Hasil Uji Coba Banyaknya Iterasi

Gambar 3 menunjukkan bahwa rata-rata nilai MAPE yang terendah sebesar 20.222 yaitu

ketika dilakukan iterasi sebanyak 650 kali. Hasil uji coba iterasi ke-50 hingga iterasi ke-650 cenderung terjadi penurunan nilai MAPE. Hal ini dikarenakan semakin banyak iterasi yang dilakukan maka semakin lama proses pelatihan yang dilakukan pada model regresi. Pada uji coba ini, banyak iterasi yang dipilih ada sebesar 650.

4.3.Hasil dan Analisis Uji Coba Nilai Parameter Lambda

Uji coba nilai parameter lambda dilakukan untuk mendapatkan nilai parameter lambda yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan menggunakan nilai parameter lambda mulai dari 1 sampai dengan 10. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter epsilon = 0.00001, cLR = 0.00001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 4.

Gambar 4. Grafik Hasil Uji Coba Nilai Parameter Lambda

Gambar 4 menunjukkan bahwa semakin kecil besar lambda maka semakin besar nilai MAPE yang dihasilkan. Namun apabila nilai lambda terlalu besar, maka proses komputasi yang terjadi dalam pembuatan matriks hessian

menjadi semakin lama (Rusmalawati, et al., 2018). Dari uji coba dengan nilai lambda sebesar 1 hingga nilai lambda sebesar 6 terjadi penurunan nilai MAPE yang signifikan. Namun nilai MAPE cenderung stabil mulai dari nilai lambda bernilai 6 dan seterusnya. Hal ini menunjukkan bahwa nilai lambda yang dapat menghasilkan nilai dengan nilai MAPE terkecil yaitu pada nilai 6.

4.4.Hasil dan Analisis Uji Coba Nilai Parameter Epsilon

Uji coba nilai parameter epsilon dilakukan untuk mendapatkan nilai parameter epsilon yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter epsilon dengan

20 30 40 50 60 50 60 70 80 90 ₁₀₀ ₁₁₀ ₁₂₀ ₁₃₀ ₁₄₀ ₁₅₀ ₁₆₀ Ni lai M A PE

Jumlah Data Latih

Uji Coba Variasi Jumlah Data Latih

15 25 35 45 55 65 75 50 ₁₀₀ ₁₅₀ ₂₀₀ ₂₅₀ ₃₀₀ ₃₅₀ ₄₀₀ ₄₅₀ ₅₀₀ ₅₅₀ ₆₀₀ ₆₅₀ ₇₀₀ N ilai M A PE Banyaknya Iterasi

Uji Coba Banyaknya Iterasi

15 30 45 60 1 2 3 4 5 6 7 8 9 10 N ilai M A PE

Nilai Parameter Lambda

(6)

kelipatan 10-1_{mulai dari 0.00000001 sampai}

dengan 1. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, cLR = 0.00001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 5.

Gambar 5. Grafik Hasil Uji Coba Nilai Parameter Epsilon

Gambar 5 menunjukkan bahwa semakin besar nilai dari parameter epsilon yang digunakan maka semakin tinggi nilai MAPE yang dihasilkan. Dari uji coba dengan menggunakan nilai parameter epsilon sebesar 0.00000001 hingga 0.001 nilai MAPE yang dihasilkan cenderung konstan, dan terjadi kenaikan nilai MAPE dimulai dari 0.01hingga seterusnya. Nilai parameter epsilon digunakan untuk batasan pada kesalahan yang ditoleransi, sehingga semakin kecil nilai parameter epsilon maka semakin tepat model yang didapatkan (Chai, 2011). Namun semakin kecil nilai epsilon yang digunakan, dapat menyebabkan waktu komputasi yang lebih besar. Pada uji coba ini, nilai parameter epsilon yang dipilih adalah sebesar 0.001.

4.5.Hasil dan Analisis Uji Coba Nilai Parameter cLR

Uji coba nilai parameter cLR dilakukan untuk mendapatkan nilai parameter cLR yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter cLR kelipatan 0.000001 mulai dari 0.000001 sampai dengan 0.00005. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, epsilon = 0.001, C = 0.0001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 6.

Gambar 6. Grafik Hasil Uji Coba Nilai Parameter cLR

Gambar 6 menunjukkan bahwa semakin besar nilai parameter cLR maka semakin rendah nilai MAPE yang dihasilkan. Dari uji coba dengan menggunakan nilai parameter cLR

sebesar 0.000001 hingga 0.00001 nilai MAPE yang dihasilkan cenderung mengalami penurunan, dan terjadi kenaikan nilai MAPE dimulai dari 0.00002 hingga seterusnya. Nilai parameter cLR berguna sebagai penentu nilai gamma () yang digunakan untuk mengatur laju

learning. Jika nilai dari parameter  semakin besar maka learning akan berjalan lebih cepat namun berkemungkinan besar untuk mengalami konvergensi dini (Rusmalawati, et al., 2018). Pada uji coba ini, nilai parameter cLR yang dipilih adalah sebesar 0.00001.

4.6.Hasil dan Analisis Uji Coba Nilai Parameter C

Uji coba nilai parameter C dilakukan untuk mendapatkan nilai parameter C yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter C kelipatan 0.00001 mulai dari 0.00001 sampai dengan 0.0003. Pada pengujian ini, jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, epsilon = 0.001, cLR = 0.00001, dan sigma = 0.5. Hasil pengujian ditunjukkan pada Gambar 7.

Gambar 7. Grafik Hasil Uji Coba Nilai Parameter C 0 20 40 60 80 N ilai M A PE

Nilai Parameter Epsilon

Uji Coba Nilai Parameter Epsilon

10 30 50 70 90 Ni lai M A PE Nilai Parameter cLR

Uji Coba Nilai Parameter cLR

15 35 55 75 0,00001 0,00002 0,00003 0,000 04 0,00005 0,00006 0,00007 0,00008 0,000 09 0,0001 0,0002 0,0003 N ilai M A PE Nilai Parameter C

(7)

Gambar 7 menunjukkan bahwa semakin besar nilai parameter C yang digunakan maka semakin kecil nilai MAPE yang dihasilkan. Dari uji coba dengan nilai parameter sebesar 0.00001 hingga 0.00006 cenderung mengalami penurunan yang signifikan, namun nilai MAPE menjadi konstan dimulai dari 0.00007 hingga seterusnya. Nilai parameter C digunakan sebagai penentu besar penalti yang diberikan di dalam

learning (Putra, et al., 2018). Pada uji coba ini, nilai parameter C yang dipilih adalah sebesar 0.00006.

4.7.Hasil dan Analisis Uji Coba Nilai Parameter Sigma

Uji coba nilai parameter sigma dilakukan untuk mendapatkan nilai parameter sigma yang memberikan hasil solusi terbaik. Pengujian dilakukan dengan nilai parameter sigma yaitu 0.0001, 0.00025, 0.0005, 0.00075, 0.001, 0.0025, 0.005, 0.0075, 0.01, 0.025, 0.05, 0.075, 0.1, 0.25, 0.5, 0.75, dan 1. Pada pengujian ini jumlah data latih yang digunakan sebanyak 110 dengan melakukan iterasi sebanyak 650 dan nilai parameter lambda = 6, epsilon = 0.001, cLR = 0.00001, dan C = 0.00006. Hasil pengujian ditunjukkan pada Gambar 8.

Gambar 8. Grafik Hasil Uji Coba Nilai Parameter Sigma

Gambar 8 menunjukkan bahwa semakin besar nilai sigma yang digunakan maka nilai MAPE yang dihasilkan semakin kecil. Sigma digunakan sebagai parameter dalam pemodelan regresi yang ada pada SVR. Jika nilai sigma terlalu kecil, maka dapat menyebabkan terjadinya overfit pada data latih. Namun apabila nilai sigma terlalu besar, maka akan berdampak pada waktu komputasi yang lebih lama. Pada uji coba ini, nilai parameter sigma yang dipilih adalah sebesar 0.75.

4.8.Pengujian dengan Parameter Terbaik

Pengujian parameter terbaik dilakukan setelah didapatkan nilai-nilai dari parameter yang dapat menghasilkan akurasi terbaik. Data latih untuk melakukan learning yang menghasilkan akurasi terbaik adalah 110. Banyaknya iterasi yang dilakukan adalah 650. Nilai lambda = 6, nilai epsilon = 0.001, nilai cLR

= 0.0001, nilai C = 0.0006, dan nilai sigma = 0.75. Hasil pengujian parameter terbaik ditunjukkan pada Tabel 1.

Tabel 1. Hasil Pengujian Parameter Terbaik

Percobaan ke- Nilai MAPE

1 17.666 2 20.865 3 19.602 4 15.855 5 20.616 6 19.178 7 19.601 8 19.702 9 17.615 10 19.806 Rata-rata 19.051 5. KESIMPULAN

Berdasarkan dari hasil uji coba parameter SVR pada permasalahan peramalan jumlah pemakaian air, diperoleh kesimpulan bahwa permasalahan peramalan jumlah pemakaian air dapat diselesaikan dengan menggunakan SVR. Parameter terbaik yang diperoleh dari hasil pengujian adalah jumlah data latih yang digunakan sebanyak 110, jumlah iterasi sebanyak 650, nilai parameter lambda sebesar 6, nilai parameter epsilon sebesar 0.001, nilai parameter cLR sebesar 0.00001, nilai parameter C sebesar 0.00006, dan nilai parameter sigma sebesar 0.75. Dengan menggunakan parameter terbaik tersebut, rata-rata nilai MAPE yang didapatkan sebesar 19.051.

DAFTAR PUSTAKA

Basak, D., Pal, S. & Patranabis, D. C., 2007.

Support Vector Regression.

Neural

Information Processing – Letters

and Reviews,

11(10), pp. 203-224.

Chai, Y., 2011. A Coal Mine Gas

Concentration Prediction Method

based

on

Particle

Swarm

Optimization

Support

Vector

Regression.

IEEE,

pp. 334-337.

18 20 22 24 26 N ilai M A PE

Nilai Parameter Sigma

(8)

Du, X. F., Leung, S. C., Zhang, J. L. & Lai,

K., 2013. Demand Forecasting of

Perishable Farm Products Using

Support

Vector

Machine.

International Journal of Systems

Science,

44(3), pp. 556-567.

Karamizadeh, S., Abdullah, S. M. & Halimi,

M., 2014. Advantage and Drawback

of

Support

Vector

Machine

Functionality.

International

Conference

on

Computer,

Communication,

and

Control

Technology,

pp. 63-65.

Magara, Y. & Morishita, T., 2007. Water

Supplies For Cities and Industry.

International Journal of Water

Resources,

4(1), pp. 30-34.

Narvekar, M. & Fargose, P., 2015. Daily

Weather Forecasting using Artificial

Neural

Network.

International

Journal of Computer Applications,

121(22), pp. 9-13.

Putra, N. A., Setiawan, B. D. & Adikara, P.

P., 2018. Peramalan Harga Saham

Menggunakan

Support

Vector

Regression

Dengan

Algoritme

Genetika.

Jurnal Pengembangan

Teknologi

Informasi

dan

Ilmu

Komputer,

2(1), pp. 209-216.

Qu, H. & Zhang, Y., 2016. A New Kernel of

Support Vector Regression for

Forecasting High-Frequency Stock

Returns.

Mathematical Problems in

Engineering,

pp. 1-9.

Rusmalawati, V., Furqon, M. T. & Indriati,

2018. Peramalan Harga Saham

Menggunakan

Metode

Support

Vector Regression (SVR) Dengan

Particle Swarm Optimization (PSO).

Jurnal Pengembangan Teknologi

Informasi dan Ilmu Komputer,

2(5),

pp. 1980-1990.

Scholkopf, B. & Smola, A. J., 2004. A

tutorial on support vector regression.

Statistics and Computing,

14(3), pp.

199-222.

Tung, H. & Wong, M., 2009. Financial Risk

Forecasting

With

Nonlinear

Dynamics and Support Vector

Regression.

Journal

of

the

Operational

Research

Society,

60(5), pp. 685-695.

Worthington, A. C., 2010. Commercial And

Industrial

Water

Demand

Estimation:

Theoretical

And

Methodological

Guidelines

for

Applied

Economics

Research.

Estudios de Economia Aplicada,

28(2), pp. 1-27.

Yu, X., Qi, Z. & Zhao, Y., 2013. Support

Vector

Regression

For

Newspaper/Magazine

Sales

Forecasting.

Procedia Computer

Science,

Volume 17, pp. 1055-1062.