Prediksi Indeks Harga Konsumen (IHK) Kelompok Perumahan, Air, Listrik, Gas Dan Bahan Bakar Menggunakan Metode Support Vector Regression

(1)

Fakultas Ilmu Komputer

Universitas Brawijaya

3856

Prediksi Indeks Harga Konsumen (IHK) Kelompok Perumahan, Air,

Listrik, Gas Dan Bahan Bakar Menggunakan Metode

Support Vector

Regression

Krishnanti Dewi1_{, Putra Pandu Adikara}2_{, Sigit Adinugroho}2

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1_{[email protected],}2_{[email protected],}3_{[email protected]}

Abstrak

Salah satu indikator yang paling sering digunakan untuk mengukur tingkat inflasi adalah Indeks Harga Konsumen (IHK). Berdasarkan metadata indeks harga konsumen yang diterbitkan oleh Bank Indonesia pada tahun 2016, kelompok perumahan, air, listrik, gas dan bahan bakar adalah kelompok IHK yang memiliki persentase proporsi biaya hidup yang paling tinggi dari kelompok IHK lainnya, yaitu sebesar 25,37%. Pada penelitian ini IHK akan diprediksi dengan menggunakan metode Support Vector Regression (SVR). Tahapan metode SVR yang dilakukan meliputi normalisasi data, menghitung matriks Hessian dengan menggunakan fungsi kernel Radial Basis Function (RBF), melakukan proses sequential learning, menghitung fungsi regresi untuk mendapatkan hasil prediksi dan melakukan evaluasi hasil prediksi dengan metode Mean Absolute Percentage Error (MAPE). Hasil pengujian menunjukkan nilai MAPE minimum yang diperoleh sebesar 2,399% dengan nilai

parameter σ = 50; λ = 1; cLR = 0,0005; ε = 0,0005; C = 1000; jumlah data training 36 untuk 12 data testing dengan iterasi sebanyak 100. Rata-rata hasil prediksi yang diperoleh adalah sebesar 112,19605 dengan rata-rata selisih antara data aktual dengan hasil prediksi sebesar 1,52645.

Kata kunci:

prediksi, indeks harga konsumen (IHK),

support vector regression

(SVR),

radial

basis function

(RBF),

mean absolute percentage error

(MAPE)

Abstract

One of the most commonly used indicators to measure the inflation rate is Consumer Price Index (CPI). Based on the consumer price index metadata published by Bank Indonesia in 2016, housing, water, electricity, gas and fuel group is the CPI group which has the highest proportion of living cost from other CPI groups, which is 25.37 %. In this research, CPI will be predicted by using Support Vector Regression (SVR) method. The stages of the SVR method include normalization of data, calculates Hessian matrix by using Radial Basis Function (RBF) kernel function, sequential learning process, calculate the regression function to get predicted results and evaluates predicted results with Mean Absolute Percentage Error (MAPE). The test results show the minimum MAPE value obtained by 4.271% with the parameter value σ = 50; λ = 1; cLR = 0.0005; ε = 0.0005; C = 1000; the number of training data is 36 for 12 testing data with 100 iterations. The average of predicted results obtained is 112.19605 with the average of the difference between the actual data and the predicted result is 1.52645.

Keywords:

prediction, consumer price index (CPI), support vector regression (SVR), radial

basis function (RBF), mean absolute percentage error (MAPE)

1. PENDAHULUAN

Indeks Harga Konsumen merupakan salah satu indikator yang paling sering digunakan untuk mengukur tingkat inflasi. Secara

(2)

Pusat Statistik, 2017).

Perkembangan inflasi IHK di Indonesia dalam kurun waktu 10 tahun terakhir lebih dipengaruhi oleh lonjakan kenaikan inflasi administered price dan volatile food

(Tim

Pengendalian Inflasi Daerah, 2014)

. Salah satu kelompok IHK barang dan jasa yang tergolong dalam administered price adalah kelompok perumahan, air, listrik, gas dan bahan bakar. Berdasarkan metadata indeks harga konsumen (IHK) yang diterbitkan oleh Bank Indonesia pada tahun 2016, kelompok perumahan, air, listrik, gas dan bahan bakar adalah kelompok IHK yang memiliki persentase proporsi biaya hidup yang paling tinggi dari kelompok IHK lainnya, yaitu sebesar 25,37% sehingga dapat dikatakan bahwa kelompok perumahan, air, listrik, gas dan bahan bakar memiliki peranan yang sangat penting dalam perekonomian negara dan sangat berpengaruh pada angka inflasi.

Untuk mempermudah proses pengambilan keputusan dalam mengantisipasi terjadinya inflasi, diperlukan sebuah metode yang dapat menghasilkan nilai prediksi yang mendekati hasil aktual. Support Vector Regression (SVR) merupakan salah satu metode yang dapat digunakan untuk memecahkan kasus regresi dan data time series dengan mencari persamaan yang akan menghasilkan nilai kesalahan paling kecil (Suranart, Kiattisin, & Leelasantitham, 2014). Kelebihan dari metode SVR adalah kemampuannya untuk memanfaatkan data non-linear secara implisit melalui penerapan fungsi kernel. Fungsi kernel bertujuan untuk memetakan vektor input ke ruang fitur berdimensi tinggi. SVR dapat mengatasi masalah overfitting lebih baik dibandingkan dengan model proses training regresi biasa sehingga menghasilkan performasi yang bagus (Maharesi, 2013).

Beberapa penelitian telah membuktikan kemampuan SVR yang lebih baik dari metode lainnya dalam memprediksi berbagai jenis kasus, diantaranya adalah prediksi jumlah produksi minyak kelapa sawit di Provinsi Riau dengan membandingkan metode ANN dan SVR. Prediksi dilakukan dengan menggunakan data time series tahun 2005-2013. Dari percobaan yang dilakukan, SVR menghasilkan model terbaik dibandingkan dengan ANN dengan MSE sebesar 6% sedangkan ANN menghasilkan MSE 9% (Mustakim, Buono, & Hermadi, 2016).

Metode SVR juga mendapatkan akurasi

yang lebih baik pada prediksi harga emas yang dilakukan oleh Suranart, Kiattisin, & Leelasantitham (2014) dibandingkan dengan metode ANN dan RBF Network. Prediksi dilakukan terhadap harga emas milik KitcoMetal Inc. periode Juni 2008 sampai November 2013 dengan menggunakan metode SVR, ANN dan RBF Network kemudian membandingkan hasil ujinya dengan MSE dan MAPE. Hasil penelitian menunjukkan bahwa metode SVR memiliki akurasi yang paling baik dibandingkan 2 metode lainnya dengan nilai MSE 227,006 dan MAPE 1,140% sedangkan RBF menghasilkan nilai MSE 1.859,390 dan MAPE 3,307 dan ANN menghasilkan nilai MSE 12.674,347 dan MAPE 7,737%.

Berdasarkan uraian latar belakang permasalahan serta studi melalui penelitian-penelitian sebelumnya maka melalui penelitian-penelitian ini dilakukan prediksi terhadap indeks harga konsumen kelompok perumahan, air, listrik, gas dan bahan bakar dengan menggunakan metode Support Vector Regression (SVR).

2. TINJAUAN PUSTAKA

2.1 Indeks Harga Konsumen

Indeks Harga Konsumen (IHK) adalah perbandingan antara harga suatu paket komoditas dari suatu kelompok barang atau jasa (market basket) yang dikonsumsi rumah tangga (household) dalam kurun waktu tertentu (Badan Pusat Statistik, 2017). Perhitungan IHK dilakukan untuk mencatat perubahan harga beli di tingkat konsumen (purchasing cost) dari sekelompok tetap barang dan jasa yang umum dikonsumsi oleh masyarakat (Bank Indonesia, 2016). Hasil perhitungan IHK adalah sebuah indeks tunggal yang dapat mengukur seluruh tingkat harga yang dicatat secara bulanan. Dari indeks tersebut kemudian dapat dilakukan perhitungan persentase perubahan yang dianalisis sehingga dapat menghasilkan persentase tingkat inflasi.

(3)

berdasarkan kelompok pengeluaran barang dan jasa, IHK juga dikelompokkan menjadi 3 kelompok penilaian yang bertujuan untuk mempermudah Pemerintah dan Bank Indonesia dalam memberikan respon kebijakan dari hasil pencatatan IHK dan perhitungan tingkat inflasi. 3 kelompok penilaian tersebut adalah Inflasi Inti, Inflasi Komponen Bergejolak (volatile food inflation) dan Inflasi Komponen Harga yang Diatur Pemerintah (administered inflation) (Tim Pengendalian Inflasi Daerah, 2014).

2.2 Support Vector Regression (SVR)

Support Vector Regression (SVR) merupakan pengembangan dari Support Vector Machine (SVM) yang dikhususkan untuk kasus regresi. Ide dasar SVM adalah memetakan data pelatihan dari ruang masukan ke ruang fitur dimensi yang lebih tinggi melalui fungsi dan kemudian membangun sebuah hyperplane terpisah dengan margin maksimum di ruang fitur. SVR bertujuan untuk membuat garis pemisah yang dekat dengan sebanyak mungkin data kemudian memperkecil jarak antar garis pemisah dengan data. SVR tidak hanya mampu mengatasi masalah data linier tetapi juga dapat digunakan untuk mengatasi data yang bersifat non linier. SVR untuk data non linier dapat diformulasikan pada Persamaan 1.

𝑓(𝑥) = ∑ (𝑎𝑙𝑖=1 𝑖∗− 𝑎𝑖)(𝐾(𝑥𝑖, 𝑥) + 𝜆2) (1)

𝑎𝑖∗ dan 𝑎𝑖 merupakan nilai variable Lagrange

multiplier, 𝐾(𝑥_𝑖, 𝑥) adalah fungsi kernel yang digunakan dan 𝜆 adalah variabel skalar.

Pada data non linier, SVR mengubah vektor input ke dimensi yang lebih tinggi melalui fungsi kernel. Dengan menggunakan fungsi kernel, hubungan linier dalam ruang fitur tersebut dapat ditemukan. Terdapat tiga fungsi kernel dalam SVR, yaitu linear, polynomial dan Gaussian Radial Basis Function (RBF). Fungsi kernel RBF merupakan fungsi kernel yang paling sering digunakan (Mustakim, Buono, & Hermadi, 2016). Formulasi dari tiga jenis fungsi kernel tersebut adalah:

1. LinearKernel

dan σ adalah sebuah nilai parameter SVR yang

harus didefinisikan terlebih dahulu secara tepat. Nilai variable Lagrange multiplier 𝑎_𝑖∗ dan

𝑎𝑖 dapat ditemukan dengan melakukan proses

sequential learning dengan langkah-langkah sebagai berikut.

yi = nilai aktualdata ke-i

δαi*, δαi = perubahan nilai αi*dan αi ε = epsilon

C = kompleksitas

γ = laju pembelajaran

Nilai γ dapat ditemukan dengan menggunakan Persamaan 11 dengan terlebih dahulu menghitung matriks Hessian R melalui Persamaan 10.

[𝑅]𝑖𝑗= 𝐾(𝑥𝑖, 𝑥𝑗) + 𝜆2 (10)

𝛾 =_{max (matriks ℎ𝑒𝑠𝑠𝑖𝑎𝑛)}𝑐𝐿𝑅 (11) Pada penelitian ini, fungsi kernel yang digunakan adalah fungsi kernel RBF.

2.3 Normalisasi dan Denormalisasi Data

Normalisasi data merupakan proses pengolahan data yang bertujuan untuk menormalisasikan standar data agar berada pada jarak tertentu. Sedangkan denormalisasi data adalah proses mengembalikan nilai normalisasi menjadi nilai aktual.

(4)

mencari nilai minimal dan maksimal pada setiap data (Patro & Sahu, 2015). Normalisasi dan denormalisasi Min-Max diformulasikan pada Persamaan 12 dan Persamaan 13.

𝑥′ ₌ (𝑥−𝑥𝑚𝑖𝑛)

(𝑥𝑚𝑎𝑥−𝑥𝑚𝑖𝑛) (12) 𝑥 = 𝑥𝑚𝑖𝑛+ (𝑥′(𝑥𝑚𝑎𝑥− 𝑥𝑚𝑖𝑛)) (13)

𝑥 adalah data aktual, 𝑥′ adalah data hasil normalisasi, 𝑥_𝑚𝑖𝑛dan 𝑥_𝑚𝑎𝑥 adalah data terendah dan data tertinggi dari keseluruhan data.

2.4 Mean Absolute Percentage Error (MAPE)

Mean Absolute Percetage Error (MAPE) merupakan metode yang dapat digunakan untuk mengukur tingkat akurasi. MAPE dipilih untuk pengujian akurasi karena dapat memberikan hasil yang relatif akurat. Persamaan MAPE ditunjukkan pada Persamaan 14 (Nugroho & Purqon, 2015).

𝑀𝐴𝑃𝐸 = _𝑛1∑ |𝑦′𝑖−𝑦𝑖

𝑦𝑖 | 𝑥 100

𝑙

𝑖−1 (14)

Dimana 𝑛 adalah jumlah data, 𝑦′ merupakan hasil prediksi, 𝑦 adalah nilai aktual dan 𝑙 adalah banyaknya dimensi data.

Penggunaan MAPE pada evaluasi hasil prediksi dapat menghindari pengukuran akurasi terhadap besarnya nilai aktual dan nilai prediksi. Kriteria nilai MAPE ditunjukkan pada Tabel 1 (Chang, Wang, & Liu, 2007).

Tabel 1. Kriteria Nilai MAPE

Nilai MAPE Kriteria

< 10% Sangat Baik

10% – 20% Baik

20% – 50% Cukup

> 50% Buruk

3. MODEL PENELITIAN

3.1. Model Support Vector Regression (SVR)

Proses SVR diawali dengan menentukan nilai parameter-parameter SVR kemudian melakukan normalisasi data. Selanjutnya dilakukan proses learning menggunakan data training. Proses training SVR meliputi perhitungan jarak antar data training, perhitungan matriks Hessian dengan kernel RBF dan perhitungan sequential learning yang akan diulangi hingga mencapai batas iterasi

maksimum yang telah ditentukan. Proses learning akan menghasilkan model regresi yang kemudian digunakan dalam melakukan prediksi. Model regresi yang telah didapat akan dicoba pada data testing untuk mengetahui seberapa baik model tersebut dengan melakukan evaluasi menggunakan MAPE. Diagram alir proses SVR ditampilkan pada Gambar 1.

Gambar 1. Diagram Alir Metode SVR

3.2. Data Penelitian

(5)

4. PENGUJIAN DAN ANALISIS

Terdapat 3 pengujian yang dilakukan dalam penelitian ini, yaitu pengujian rentang nilai parameter SVR, pengujian jumlah iterasi untuk proses sequential learning dan pengujian variasi jumlah data training.

4.1 Pengujian Rentang Nilai Parameter SVR

Pengujian rentang nilai dilakukan untuk setiap parameter SVR, yaitu σ (sigma), λ (lambda), cLR (constanta learning rate), ε (epsilon) dan ∁ (complexity). Pada pengujian paremeter σ dapat diketahui bahwa rentang nilai yang lebih besar dapat menghasilkan persebaran data yang tepat sehingga mampu menghasilkan prediksi yang baik melalui rentang σ = 50 – 100. Pengujian parameter λ menunjukkan nilai rentang yang lebih besar mampu menghasilkan nilai error yang rendah tetapi apabila terlalu besar error rate kembali meningkat. Rentang λ ideal yang didapatkan berdasarkan pengujian ialah berada pada rentang 1 – 5. Pada pengujian parameter cLR minimum karena nilai parameter lainnya juga berpengaruh terhadap error rate yang dihasilkan sehingga nilai rentang parameter ε terbaik yang dapat diperoleh ialah berada pada rentang 0,0005 – 0,001. Sedangkan untuk parameter C cenderung konstan ketika diberi nilai yang besar, yaitu mulai dari 500-1000. Grafik hasil pengujian rentang nilai parameter SVR ditunjukkan pada Gambar 2-6.

Gambar 2. Grafik Uji Coba Batas Parameter σ

Gambar 3. Grafik Uji Coba Batas Parameter λ

Gambar 4. Grafik Uji Coba Batas Parameter cLR

Gambar 5. Grafik Uji Coba Batas Parameter 𝜀

0.000 Hasil Pengujian Parameter σ

0 Hasil Pengujian Parameter 𝑐𝐿𝑅

11.3 Hasil Pengujian Parameter 𝜀

11.35

(6)

Gambar 6. Grafik Uji Coba Batas Parameter C

4.2 Pengujian Jumlah Iterasi

Pengujian jumlah iterasi dilakukan untuk mengetahui banyaknya iterasi yang menghasilkan hasil prediksi yang paling optimal. Jumlah iterasi optimum dievaluasi berdasarkan rata-rata nilai MAPE terbaik setelah dilakukan tiga kali percobaan dengan jumlah iterasi menggunakan kelipatan 10 dan kelipatan 5 dengan menggunakan parameter SVR terbaik dari hasil pengujian rentang nilai parameter SVR yang telah dilakukan. Hasil pengujian menunjukkan bahwa semakin besar jumlah iterasi maka error rate dapat semakin berkurang karena kemampuan SVR dalam melakukan observasi pola data semakin meningkat. Gambar 7 menampilkan grafik uji coba jumlah iterasi dan dapat terlihat bahwa rata-rata error rate minimum dihasilkan pada iterasi 100.

Gambar 7. Grafik Uji Coba Jumlah Iterasi

4.3 Pengujian Variasi Jumlah Data Training

Pengujian variasi jumlah data training dilakukan untuk mengetahui jumlah variasi data training yang optimum untuk menghasilkan prediksi yang baik.Berdasarkan hasil pengujian jumlah data training, semakin besar jumlah data training yang digunakan belum tentu dapat menghasilkan prediksi yang semakin baik.Nilai parameter dan pola data sangat mempengaruhi metode SVR dalam mendapatkan hasil prediksi. Apabila terjadi perubahan pola data, maka nilai parameter juga harus mengikuti. Variasi jumlah data training terbaik berdasarkan hasil pengujian ialah dengan menggunakan 36 data training untuk 12 data testing. Gambar 8 adalah grafik hasil uji coba variasi jumlah data training.

Gambar 8. Grafik Uji Coba Variasi Jumlah Data

Training

5. KESIMPULAN

Berdasarkan hasil penelitian, dapat disimpulkan bahwa:

1. Metode Support Vector Regression (SVR) dapat diterapkan pada masalah prediksi indeks harga konsumen kelompok perumahan, air, listrik, gas dan bahan bakar dengan cara melakukan normalisasi data, melakukan pemilihan data training dan data testing serta pemilihan fitur berupa data bulan sebelumnya secara sekuensial kemudian menghitung matriks Hessian untuk memetakan vektor input ke ruang fitur dimensi yang lebih tinggi dengan menggunakan kernel Radial Basis Function (RBF) lalu melakukan proses sequential learning dan menghitung fungsi regresi.

2. Pengaruh parameter-parameter SVR terhadap prediksi indeks harga konsumen kelompok perumahan, air, listrik, gas dan bahan bakar beragam. Rentang nilai parameter σ dan C yang tinggi cenderung memberikan hasil prediksi yang baik. Rentang nilai

parameter λ,ε dan cLR yang tinggi juga

cenderung memberikan hasil prediksi yang baik namun apabila terlalu tinggi nilai MAPE yang dihasilkan dapat kembali meningkat.

3. Berdasarkan pengujian yang telah dilakukan, didapatkan MAPE minimum sebesar 2,399% dengan nilai parameter

σ = 50; λ = 1; cLR = 0,0005; ε = 0,0005;

C = 1000; jumlah data training 36 dan data testing 12 serta iterasi sebanyak 100. Rata-rata hasil prediksi yang diperoleh adalah sebesar 112,19605 dengan rata-rata selisih antara data

0

10 50 100 500 1000 5000

(7)

aktual dengan hasil prediksi sebesar 1,52645. Berdasarkan kriteria MAPE pada Tabel 2.2, nilai MAPE yang < 10% masuk ke dalam kategori sangat baik sehingga metode SVR dapat dinyatakan sangat baik untuk memprediksi indeks harga konsumen kelompok perumahan, air, listrik, gas dan bahan bakar.

Untuk penelitian selanjutnya dapat ditambahkan metode optimasi untuk mengoptimalkan nilai parameter-parameter SVR serta melakukan pengujian dengan fungsi kernel yang berbeda untuk meningkatkan akurasi.

6. DAFTAR PUSTAKA

Badan Pusat Statistik, 2017. Metadata Indikator Inflasi. [Online] Available at: https://sirusa.bps.go.id/sirusa/index.php /indikator/570

[Accessed November 12 2017].

Bank Indonesia, D. S., 2016. Metadata Indeks Harga Konsumen (IHK), Jakarta: Bank Indonesia.

Chang, P.-C., Wang, Y.-W. & Liu, C.-H., 2007. The Development of a Weighted Evolving Fuzzy Neural Network for PCB Sales Forecasting. Elsevier, 32(Expert Systems with Applications), pp. 86-96.

Kumar, N., 2014. Using Support Vector Machines Effectively. [Online] Available at:

https://neerajkumar.org/writings/svm/ [Accessed 30 November 2017].

Maharesi, R., 2013. Penggunaan Support Vector Regression (SVR) pada Prediksi Return Saham Syariah BEI. Bandung, Proceeding PESAT (Psikologi, Ekonomi, Sastra, Arsitektur & Teknik Sipil).

Mustakim, Buono, A. & Hermadi, I., 2016. Performance Comparison Between Support Vector Regression and

Artificial Neural Network for Prediction of Oil Palm Production. Journal of Computer Science and Information, 9(1).

Nugroho, N. A. & Purqon, A., 2015. Analisis 9 Saham Sektor Industri di Indonesia Menggunakan Metode SVR. Bandung, Seminar Kontribusi Fisika (SKF) 2015. Patro, S. G. K. & Sahu, K. K., 2015.

Normalization: A Preprocessing Stage. International Advanced Research Journal in Science, Engineering and Technology, 2(3).

Suranart, K., Kiattisin, S. & Leelasantitham, A., 2014. Analysis of Comparisons for Forecasting Gold Price using Neural Network, Radial Basis Function Network and Support Vector Regression. The 4th Joint International Conference on Information and Communication Technology, Electronic and Electrical Engineering (JICTEE). Tim Pengendalian Inflasi Daerah, 2014. Buku

Petunjuk TPID. Jakarta: Tim Pelaksana Kelompok Kerja Nasional TPID. Wu, C.-H., Ho, J.-M. & Lee, D. T., 2004.