• Tidak ada hasil yang ditemukan

Prediksi Harga Batu Bara Menggunakan Support Vector Regression (SVR)

N/A
N/A
Protected

Academic year: 2018

Membagikan "Prediksi Harga Batu Bara Menggunakan Support Vector Regression (SVR)"

Copied!
7
0
0

Teks penuh

(1)

Fakultas Ilmu Komputer

6603

Prediksi Harga Batu Bara Menggunakan

Support Vector Regression

(SVR)

Olivia Bonita1, Lailil Muflikhah2, Ratih Kartika Dewi3

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1oliviabnta@gmail.com, 2lailil@ub.ac.id, 3ratihkartikad@ub.ac.id

Abstrak

Prediksi terhadap harga batu bara diperlukan sebagai penunjang bagi industri pemakai batu bara ketika pembelian batu bara.

Hasil prediksi dapat digunakan untuk penyusunan anggaran

berikutnya.

Penelitian ini menggunakan Support Vector Regression (SVR) untuk memprediksi harga batu bara. SVR diterapkan melalui tahapan normalisasi data, menghitung matriks hessian, pencarian nilai α dengan sequential learning, dan perhitungan fungsi regresi. Kernel yang digunakan pada tahap matriks hessian mampu menentukan akurasi hasil prediksi, maka pada penelitian ini kernel Gaussian RBF dan kernel ANOVA diterapkan supaya dapat dianalisis pengaruhnya. Untuk memperoleh hasil prediksi dengan akurasi yang baik, dilakukan pengujian terhadap setiap parameter dan dievaluasi menggunakan mean absolute percentage error (MAPE). Pengujian memberikan rata-rata nilai MAPE sebesar 9,64% dengan kernel Gaussian RBF dan 8,38% dengan kernel ANOVA, dimana ini dikategorikan sangat baik pada 48 data latih untuk menguji 12 data uji dan parameter optimal sebesar ε 0,00001; cLR 0,01; C 0,5; λ 0,5 pada kernel Gaussian dan 1 pada ANOVA. SVR memberikan hasil paling optimal saat memprediksi harga 1 bulan berikutnya. Hasil prediksi dari kedua kernel memiliki perbedaan yang tidak terlalu besar, tetapi kernel ANOVA bekerja lebih baik pada data harga batu bara.

Kata kunci: harga batu bara, prediksi, support vector regression, gaussian RBF, ANOVA, mean absolute percentage error

Abstract

Coal price prediction is needed as support for coal user industrial to buy coal. Prediction result can be used to make next budgeting. This research uses Support Vector Regression (SVR) method to predict coal price. SVR is applied through data normalization, hessian matrix calculation, α searching through sequential learning, and regression function calculation. Kernel for hessian matrix stage can determine accuracy of prediction, so in this research Gaussian RBF kernel and ANOVA kernel are used and analyzed the effects. To obtain predictive results with good accuracy, testing of each parameter is performed and evaluated by mean absolute percentage error (MAPE). The average of MAPE for testing are 9,64% with Gaussian RBF kernel and 8,38% with ANOVA kernel, which are categorized good, on 48 training data for 12 testing data and optimal parameters are ε 0,00001; cLR

0.01; C 0.5; λ 0.5 with Gaussian RBF kernel and 1 with ANOVA kernel. SVR gives the most optimal result when predicting the next month price. The predicted results of the two kernels are not too different, but the ANOVA kernel works better on this coal price data.

Keywords: coal price, prediction, support vector regression, gaussian RBF, ANOVA, mean absolute percentage error

1. PENDAHULUAN

Suatu perusahaan pasti akan menyusun rencana pengeluaran berikutnya agar anggaran perusahaan yang tersedia dapat dipakai dengan maksimal (Chatfield, 2001). Demikian pula dengan perusahaan atau industri yang akan menggunakan batu bara. Kebutuhan akan perkiraan harga pada daftar rencana dapat

(2)

Penelitian sebelumnya oleh Bo Zhang dan Junhai Ma (2011) tentang prediksi indeks harga batu bara menggunakan teknik partial least-square memberikan hasil prediksi dengan kesalahan minimum sebesar 0.3% dan maksimum sebesar 9.7% pada sampel harga selama 20 hari sebelumnya dan memprediksi harga hari selanjutnya. Tetapi partial least-square biasanya digunakan untuk permasalahan linear dan berdasarkan penelitian yang dilakukan oleh Saluza (2016), data time series yang melibatkan waktu beberapa tahun cenderung bersifat tidak statis karena kemungkinan adanya fluktuasi.

Pada penelitian ini, metode machine learning yang diusung adalah Support Vector Regression (SVR). SVR adalah model analisis data untuk regresi yang mampu menyelesaikan data nonlinear. SVR menghasilkan akurasi yang baik jika dibandingkan dengan Artificial Neural Network (ANN) (Balabin & Lomakina, 2011). Hal ini dijabarkan pada penelitian oleh Mustakim yang melakukan prediksi terhadap produksi minyak kelapa sawit. Dari penelitian tersebut menghasilkan nilai MSE sebesar 6% dengan kernel Radial Basis Function (RBF) pada metode SVR dan 9% pada ANN dengan hidden neuron 20 (Mustakim, et al., 2016).

Hasil performa SVR diperoleh berdasarkan penentuan nilai parameter dan kernel yang digunakan. Terdapat beberapa kernel untuk kasus regresi nonlinear dan masing-masing kernel akan memberikan akurasi yang berbeda (Nurunnahar, et al., 2017). Penelitian ini akan menganalisis dua kernel Radial Basis Function (RBF), yaitu Gaussian dan ANOVA supaya didapatkan hasil performa yang lebih optimal. Pemilihan kernel ANOVA untuk prediksi harga batu bara dilakukan karena pada penelitian SVR sebelumnya untuk meramalkan cuaca oleh Rasel (2017), ANOVA memberikan hasil lebih baik dari pada kernel Gaussian dan polinomial.

2. SUPPORT VECTOR REGRESSION

Support Vector Regression (SVR) merupakan metode dari machine learning yang diterapkan pada permasalahan regresi dan memberikan keluaran bernilai kontinu. Metode SVR ini dapat bekerja pada permasalahan linear dan nonlinear dengan menggunakan konsep daerah ε-insensitive sebagai fungsi symmetrical loss. Besarnya nilai ԑ menentukan toleransi kesalahan antara nilai hasil prediksi dari masukan dan nilai yang keluar sebenarnya dan

mempengaruhi jumlah support vector (Awad & Khanna, 2015). Proses pelatihan dan pengujian SVR dapat dilakukan menggunakan sequential SVR dengan langkah-langkah sebagai berikut (Vijayakumar & Wu, 1999). 1. Inisialisasi parameter SVR, iterasi

maksimum, dan nilai awal αi dan αi* sebesar 0.

2. Hitung matriks hessian (Rij) dengan Persamaan 1, dimana K(xi,xj) adalah fungsi kernel dan λ adalah variabel skalar.

𝑅

𝑖𝑗

= (𝐾(𝑥

𝑖

, 𝑥

𝑗

) + 𝜆

2

)

(1)

Keluaran dari matriks hessian kemudian dimasukkan pada Persamaan 2 untuk mencari nilai γ yang berfungsi mengontrol kecepatan proses learning, dimana cLR adalah konstanta learning rate

.

𝛾 =

𝑚𝑎𝑥⁡(𝑅𝑖𝑗)𝑐𝐿𝑅

(2)

3. Pada setiap data latih, lakukan perhitungan nilai error (Ei) dengan Persamaan 3, perubahan nilai Lagrange multiplier dengan Persamaan 4 dan 5, dan nilai Lagrange dan C adalah nilai kompleksitas.

4. Ulangi langkah ketiga sampai iterasi maksimum yang ditentukan atau telah mencapai konvergensi dengan syarat

𝑚𝑎𝑥(|𝛿𝛼𝑖∗|) < 𝜀 dan𝑚𝑎𝑥(|𝛿𝛼𝑖|) < 𝜀

.

5. Hitung fungsi regresi untuk memberikan

hasil prediksi seperti pada Persamaan 8 dengan perkalian antara nilai Lagrange multiplier terakhir yang dihasilkan dan matriks hessian.

𝑓(𝑥) = ∑ (𝛼𝑙𝑖=1 𝑖∗− 𝛼𝑖)(𝐾(𝑥𝑖, 𝑥𝑗) + 𝜆2)

(8)

3. FUNGSI KERNEL

(3)

1. Kernel Gaussian RBF

𝐾(𝑥𝑖, 𝑥𝑗) = 𝑒𝑥𝑝(−‖𝑥𝑖−⁡𝑥𝑗‖ 2

2𝜎2 ), 𝜎⁡ > 0

(9)

2.

Kernel ANOVA

𝐾(𝑥𝑖, 𝑥𝑗) = (∑ 𝑒𝑥𝑝 (−𝛾(𝑥𝑖− 𝑥𝑗)2))𝑑(10) Keterangan :

σ = kovarian γ= gamma

d = degree x = data

4. PERANCANGAN

4.1 Data Penelitian

Data pada penelitian ini adalah data harga batu bara acuan yang dikeluarkan pemerintah setiap bulannya melalui situs Kementrian ESDM. Data harga yang digunakan sebanyak 108 data yang diambil pada rentang waktu bulan Januari 2009 hingga Desember 2017. Harga batu bara ini memiliki satuan USD.

4.2 Pemodelan SVR

Perancangan sistem untuk memprediksi harga batu bara dengan Support Vector Regression (SVR) dimulai dengan menginisialisasi nilai-nilai parameter SVR dan kernel serta data latih dan data uji. Fitur data latih dan uji adalah harga batu bara acuan yang disusun secara sekuensial berurutan. Data latih dan data uji dinormalisasi untuk mempermudah perhitungan. Selanjutnya proses pelatihan menggunakan sequential learning terhadap data latih. Sequential learning dilakukan hingga iterasi maksimum. Pada tahap pemetaan matriks hessian, kernel Gaussian RBF dan kernel ANOVA diimplementasikan. Setelah sequential learning selesai dan memberikan nilai αi* dan αi terbaru, fungsi regresi dihitung terhadap data uji supaya didapatkan hasil nilai prediksi harga. Hasil prediksi tiap penggunaan kernel kemudian dievaluasi dan dibandingkan menggunakan Mean Absolute Percentage Error (MAPE). Secara garis besar, perancangan alur SVR ditampilkan pada Gambar 1.

Gambar 1 Diagram Alir SVR

5. PENGUJIAN DAN ANALISIS

Setelah SVR diterapkan, dilakukan pengujian untuk mengetahui akurasi hasil prediksi. Terdapat 6 pengujian yang dilakukan, yaitu pengujian nilai parameter SVR, pengujian nilai parameter kernel, pengujian jumlah iterasi sequential learning, pengujian jumlah data latih, pengujian jumlah fitur, dan pengujian fungsi kedua kernel. Pengujian nilai parameter dan jumlah iterasi menggunakan 84 data latih dan 12 data uji berfitur 3. Fitur diisi dengan harga 3 bulan sebelumnya yang disusun secara sekuensial. Nilai parameter, jumlah iterasi, jumlah fitur, dan jumlah data latih optimal yang telah diperoleh kemudian diiuji pada pengujian fungsi kernel.

5.1

Pengujian Nilai Parameter SVR

Pengujian parameter SVR dilakukan pada parameter λ (lambda), ԑ (epsilon), cLR (learning rate), dan C (kompleksitas). Nilai yang diuji pada tiap parameter telah ditentukan. Pada pengujian nilai λ, nilai 0,5 (kernel RBF) dan 1 (kernel ANOVA) memberikan nilai MAPE terkecil dan jika nilai λ bertambah maka nilai MAPE akan semakin besar karena proses pembelajaran yang terlalu cepat seperti pada

Normalisasi Data

Pelatihan SVR Mulai

Inisialisasi data latih, data uji, parameter SVR&kernel

Pengujian Fungsi Regresi

Hasil prediksi, Nilai MAPE

(4)

grafik Gambar 2. Pengujian ԑ dilakukan dari nilai 0,0000001 hingga 0,1 dengan kelipatan 10. Nilai 0,00001 pada kernel RBF dan 0,001 memberikan nilai MAPE terkecil seperti yang ditunjukan pada Gambar 3. ԑ yang kecil akan menambah jumlah support vector dan membuat pembelajaran dilakukan lebih seksama (Chen, et al., 2013). Pengujian cLR menggunakan nilai sebesar 0,00001 hingga 0,01 dengan kelipatan 10 seperti pada Gambar 4. Nilai cLR optimal untuk memprediksi harga batu bara adalah 0,01. Pada pengujian C, didapatkan nilai optimal untuk memprediksi harga batu bara sebesar 0,5. Nilai parameter C yang terlalu kecil akan membuat nilai pinalti kecil sehingga kesalahan yang ditoleransi akan semakin banyak dan akurasi berkurang seperti pada grafik yang ditampilkan pada Gambar 5 (Awad & Khanna, 2015).

Gambar 2 Grafik Hasil Pengujian Parameter λ

Gambar 3 Grafik Hasil Pengujian Parameter ε

Gambar 4 Grafik Hasil Pengujian Parameter cLR

Gambar 5 Grafik Hasil Pengujian Parameter C

5.2 Pengujian Nilai Parameter Kernel

Selain parameter SVR, parameter σ pada kernel RBF, degree dan γ pada kernel ANOVA memberikan pengaruh terhadap pemetaan data. Pada pengujian σ nilai 0,3 memberikan nilai MAPE terkecil seperti ditunjukkan pada Gambar 7. Nilai σ yang terlalu besar atau terlalu kecil akan membuat persebaran data tidak merata atau terlalu banyak noise sehingga kesalahan semakin besar (Chen, et al., 2013).

Gambar 6 Grafik Hasil Pengujian σ

Hasil Pengujian Parameter λ

RBF ANOVA

Hasil Pengujian Parameter ε

RBF ANOVA

(5)

Selanjutnya pada kernel ANOVA, pengujian degree memberikan nilai optimal sebesar 3 dengan MAPE sebesar 7,97%. Sedangkan pada pengujian γ diperoleh nilai optimal sebesar 5. Nilai γ yang terlalu kecil akan membuat pemetaan terlalu halus sehingga tidak menangkap pola yang penting (Berk, et al., 2014).

Gambar 7 Grafik Hasil Pengujian degree

Gambar 8 Grafik Hasil Pengujian γ

5.3 Pengujian Jumlah Iterasi

Pengujian jumlah iterasi memberikan hasil iterasi optimal sebesar 1000. Semakin banyak iterasi yang dilakukan maka error rate cenderung semakin kecil karena proses pembelajaran data semakin baik.

Gambar 9 Grafik Hasil Pengujian Jumlah Iterasi

5.4 Pengujian Jumlah Fitur Data

Pada pengujian jumlah fitur, jumlah yang diuji sebesar 2 hingga 7. Fitur berjumlah 3 memberikan hasil MAPE terkecil. Pada prediksi harga batu bara, jumlah fitur yang besar tidak memberikan error rate yang kecil, hal ini dikarenakan terjadi curse of dimension, dimana semakin banyak fitur atau dimensi membuat nilai kesalahan semakin besar (Awad & Khanna, 2015).

Gambar 10 Grafik Hasil Pengujian Jumlah Fitur

5.5 Pengujian Jumlah Data Latih

Pengujian ini bertujuan untuk menentukan jumlah data latih optimal. Jumlah yang diuji adalah 24, 48, 72, dan 84 untuk 12 data uji. Berdasarkan pengujian yang telah dilakukan melalui 10 kali percobaan pada tiap jumlah, data latih sebesar 48 memberikan rata-rata MAPE yang kecil pada kedua kernel. Data latih yang banyak belum tentu membuat nilai MAPE semakin kecil seperti pada Gambar 11, hal ini disebabkan SVR mengalami curse of dimension (Awad & Khanna, 2015).

Hasil Pengujian Parameter γ

(6)

Gambar 11 Grafik Hasil Pengujian Jumlah Data Latih

5.6 Pengujian Fungsi Kernel

Pengujian fungsi kernel dilakukan dengan menggunakan nilai parameter optimal. Pengujian tiap kernel dilakukan sebanyak 10 kali percobaan dengan data yang diambil acak. Rata-rata MAPE yang diperoleh saat menggunakan 48 data latih untuk pengujian 12 data ditampilkan pada Tabel 1.

Tabel 1 Hasil Pengujian Fungsi Kernel

Kernel Rata MAPE

Gaussian 9,64

ANOVA 8,38

Selain itu dilakukan pula pengujian rentang waktu prediksi. Waktu prediksi yang diuji adalah 1, 3, 6, 9, dan 12 bulan ke depan. Masing-masing bulan dilakukan 5 kali percobaan. Berikut hasil rata-rata MAPE pengujian rentang waktu prediksi pada Tabel 2.

Tabel 2 Hasil Pengujian Rentang Waktu Prediksi Prediksi

Berdasarkan pengujian fungsi kernel dan pengujian rentang waktu prediksi, kernel ANOVA cenderung memberikan hasil prediksi lebih baik pada data harga batu bara dan semakin lama waktu prediksi maka error rate cenderung lebih besar.

6. KESIMPULAN

Berdasarkan hasil pengujian dan analisis yang dilakukan pada penelitian prediksi harga batu bara menggunakan SVR ini, diperoleh

kesimpulan bahwa permasalahan prediksi harga batu bara dapat diselesaikan dengan menerapkan metode Support Vector Regression (SVR), baik dengan kernel Gaussian RBF dan kernel ANOVA pada tahap pemetaan. Selain itu, pengujian parameter memberikan nilai optimal λ sebesar 0,5 untuk kernel Gaussian RBF dan 1 untuk kernel ANOVA , ε sebesar 0,00001, cLR sebesar 0,01, dan C sebesar 0,5 dengan 48 data latih berfitur 3. Hasil MAPE rata-rata yang diperoleh pada penggunaan nilai parameter optimal sebesar 9,64% untuk penggunaan kernel Gaussian RBF dan 8,38% untuk penggunaan kernel ANOVA yang dikategorikan sangat baik. Hasil prediksi SVR dengan kernel Gaussian RBF atau pun kernel ANOVA memberikan nilai MAPE yang cukup berragam tetapi kernel ANOVA cenderung bekerja lebih baik pada data harga batu bara.

7. DAFTAR PUSTAKA

Awad, M. & Khanna, R., 2015. Efficient Learning Machine: Theories, Concepts, Applications for Engineers and System Designer. s.l.:Apress Media.

Balabin, R. M. & Lomakina, E. I., 2011. Support vector machine regression (SVR/LS-SVM)—an alternative to neural networks (ANN) for analytical chemistry? Comparison of nonlinear methods on near infrared (NIR) spectroscopy data. Analyst, Issue 8, pp. 1703-1712.

Berk, R. et al., 2014. Using Regression Kernels to Forecast A Failure to Appear in Court. Pennsylvania: uNiversity of Pennsylvania.

Chatfield, C., 2001. Time-Series Forecasting. London: CRC Press.

Chen, W., Hong, Y., Jun, D. & Jiulong, J., 2013. Research on Parameter Selection of Support Vector Regression. Applied Mechanics and Material, Volume 344, pp. 219-225.

Mustakim, Buono, A. & Hermadi, I., 2016. Performance Comparison Between Support Vector Regression and Artificial Neural Network for Prediction of Oil Palm Prediction. Jurnal Ilmu Komputer dan Informasi (Journal of Computer Science and Information), 9(1), pp. 1-8.

Nurunnahar, S., Talukdar, D. B., Rasel, R. I. & Sultana, N., 2017. A Short Term Wind Hasil Pengujian Jumlah Data Latih

(7)

Speed Forecasting Using SVR and BP-ANN: A Comparative Analysis. Bangladesh, s.n.

Rasel, R. I., Sultana, N. & Meesad, P., 2017. An Application of Data Mining and Machine Learning for Weather Forecasting. Cham, Springer.

Saluza, I., 2016. Peramalan Kunjungan Wisatawan ke Palembang: Pemodelan Data Time Series Linear vs Nonliniear. Konferensi Nasional Teknologi Informasi dan Aplikasinya, Volume 4. Vijayakumar, S. & Wu, S., 1999. Sequential

Support Vector Classifier and Regression.

Gambar

Gambar 1 Diagram Alir SVR
grafik Gambar 2. Pengujian ԑ nilai 0,0000001 hingga 0,1 dengan kelipatan 10. Nilai 0,00001 pada kernel RBF dan 0,001 memberikan nilai MAPE terkecil seperti yang ditunjukan pada Gambar 3
Gambar 7 Grafik Hasil Pengujian degree
Gambar 11 Grafik Hasil Pengujian Jumlah Data Latih

Referensi

Dokumen terkait

Dapat dilihat juga pada gambar tersebut bahwa hasil prediksi dengan fungsi kernel linear lebih baik daripada kernel polinomial sesuai dengan nilai error dan koefisien

Berdasarkan dengan data real kondisi perusahaan, kedua fungsi RBF dan Polynomial kernel tersebut menghasilkan jumlah data yang benar dan salah yang sama dalam prediksi

Dalam SVR beberapa parameter yang dapat diubah sesuai dengan dataset yaitu kernel yang digunakan, nilai C dan nilai gamma, untuk menentukan parameter mana yang dapat melakukan

Kernel SVR terbaik dari kombinasi percobaan ini adalah Radial Basis Function (RBF) dengan koefisien determinasi (R 2 ) sebesar 95% dan nilai error galat (MSE) sebesar 6% terdapat

Berdasarkan dengan data real kondisi perusahaan, kedua fungsi RBF dan Polynomial kernel tersebut menghasilkan jumlah data yang benar dan salah yang sama dalam prediksi

Gambar tersebut menunjukkan bahwa secara umum dengan menggunakan fungsi kernel RBF nilai prediksi dasarian awal musim hujan sudah memiliki pola yang mendekati

Hasil model prediksi yang paling baik dari percobaan terhadap data inflasi menurut kelompok komoditi dengan menggunakan metode SVR (Support Vector Regression) yaitu model

dilihat dari grafik bahwa semakin banyak jumlah data latih yang digunakan akan menghasilkan nilai MAPE yang semakin kecil meskipun terjadi peningkatan yang tidak