348 SELEKSI NILAI CENTER RADIAL BASIS FUNCTION NEURAL NETWORK
MENGGUNAKAN K-MEANS PADA DATA TIME SERIES
Mirza Yogy Kurniawan, Fathul Hafidh, dan Al Fath Riza Kholdani
Fakultas Teknologi Informasi, Universitas Islam Kalimantan Email:[email protected] ABSTRAK
Peramalan time series mengambil data rentet waktu yang sudah berjalan. Tujuannya adalah mengamati atau memodelkan data series yang sudah ada untuk memperkirakan nilai data selanjutnya yang dapat diprediksi secara akurat. Radial Basis Function Neural Network (RBFNN) adalah salah satu model dari Jaringan Saraf Tiruan Feed Forward. Dalam penerapannya RBFNN memerlukan beberapa parameter yang harus ditaksir, salah satunya adalah nilai tengah. Clustering dengan metode K-Means digunakan untuk menentukan nilai tengah pada tahap awal perhitungan algoritma RBFNN agar dapat menghasilkan prediksi degan nilai kesalahan yang lebih rendah. Prediksi rentet waktu dengan menggunakan RBFNN dan K-means mampu menghasilkan prediksi yang memiliki nilai kesalahan lebih rendah dibandingkan dengan prediksi dengan hanya RBFNN saja dengan nilai 0.0389 berbanding dengan 0.13901.
Kata Kunci :K-Means, nilai tengah, RBFNN, rentet waktu ABSRACT
Time series forecasting retrieve time series on lapsed time. The goal is to observe or model the series of data that already exist for estimating the value of further data which can be predicted accurately. Radial Basis Function Neural Network (RBFNN) is one of the models of Feed Forward Neural Networks. In application RBFNN requires several parameters that must be estimated, one of which is a center value. Clustering with K-Means method used to determine the center value in the early stages RBFNN calculation algorithm in order to generate predictions degan lower error value. Time series prediction using RBFNN and K- means capable of producing a prediction error that has a value lower than that predicted by just RBFNN only to the value of 0.0389 compared with 0.13901.
Keywords :center value, K-Means, RBFNN, time series PENDAHULUAN
Tenaga listrik perlu diproduksi dengan sesuai antara pembangkitan dengan permintaan daya. Jika daya yang dibangkitkan melebihi dari kebutuhan konsumen maka akan muncul persoalan pemborosan energi, ditambah lagi bahwa tenaga listrik tidak bisa disimpan dalam skala besar. Namun apabila daya yang dibangkitkan kurang dan tidak memenuhi kebutuhan konsumen maka akan menimbulkan seringnya terjadi pemadaman (Mulyadi, 2006).
Agar dicapai kesesuaian antara pembangkitan dan permintaan daya maka sebelum dilakukan pembangkitan PLN melakukan prediksi dengan Metode Koefisien Beban, namun metode ini masih memiliki error yang cukup besar yaitu antara 4%-5% yang tentunya menghasilkan kerugian yang cukup besar bagi PLN. Sebagai metode alternatif algoritma
349 berbasis neural network telah dikenal dan dipakai luas sebagai algoritma prediksi data rentet- waktu. (Sari, 2013)
Fauset (1994) menyatakan bahwa Jaringan Saraf Tiruan (JST) atau Artificial Neural Network adalah salah satu sistem pemroses informasi yang memiliki karakteristik kinerja tertentu yang mirip dengan jaringan syaraf biologi. JST menurut Nasapi (2014) mampu digunakan untuk melakukan peramalan rentet waktu (time series).
Plummer (2000), menyatakan bahwa peramalan time series atau prediksi time series, mengambil data series yang sudah eksis yang bertujuan adalah mengamati atau memodelkan data series yang eksis untuk memperkirakan nilai data selanjutnya yang dapat diprediksi secara akurat.
RBFNN adalah salah satu model dari Jaringan Saraf Tiruan Feed Forward. Dalam penerapannya RBFNN memerlukan beberapa parameter yang harus ditaksir. Agar mendapatkan hasil yang baik diperlukan kombinasi yang tepat antara jumlah input, jumlah node pada hidden layer, nilai tengah, dan standar deviasi dari variabel input pada setiap node.
(Setiawan, 2006)
Metode k-mean cluster adalah salah satu metode dari beberapa metode unsupervision pada pemodelan RBFNN dan metode k-mean adalah salah satu bentuk metode pemetaan pada dirinya sendiri (Self Organizing map) yang juga dikembangkan dalan pemodelan NN.
Apabila sudah didapatkan performa jumlah node yang optimal berdasarkan algoritma k- mean, maka dilakukan update bobot dengan fungsi aktivasi Gauss dan selanjutnya mensimulasikan output jaringan dengan menyelesaikan sistem persamaan linear dengan metode least square. (Xu, 2009)
Tujuan penelitian ini adalah untuk mengurangi tingkat kesalahan prediksi rentet waktu RBFNN dengan menerapkan clustering K-means pada proses pemilihan nilai tengah.
METODE PENELITIAN
Dalam penelitian ini sampel data yang digunakan adalah data pemakaian listrik bulanan di wilayah Kalselteng. Data-data ini digunakan sebagai data latih sekaligus sebagai data uji bagi sistem prediksi time series yang mana 12 bulan awal digunakan digunakan sebagai data latih dan data berikutnya dijadikan data uji sebagai pembanding antara hasil prediksi dan kenyataan.
Model RBFNN diterapkan untuk melakukan prediksi pemakaian listrik dengan ditambahkan K-Means pada proses pemilihan data centernya, seperti digambarkan sebagai berikut:
350 Gambar 1 Metode yang diusulkan
PEMBAHASAN
Program ini direkomendasikan untuk dijalankan dengan menggunakan perangkat keras (hardware) yang mempunyai spesifikasi berikut:
1. Prosesor Minimal Intel Pentium Dual Core atau AMD.
2. Memory minimal 2 GB.
3. Harddisk minimal 100 GB.
4. Monitor dengan resolusi 1024 x 768 pixel.
5. Keyboard dan Mouse.
Adapun perangkat lunak yang digunakan untuk menjalankan aplikasi ini adalah lingkungan sistem operasi minimal Microsoft Windows XP sampai dengan Windows 10.
Aplikasi yang digunakan untuk membuat program ini adalah Delphi 7 dengan database Microsoft Access 2010.
Gambar 2 Form Preprocessing dan K-Means
351 Form ini menampilkan hasil preprocessing dari data yang sudah dipilih pengguna pada form sebelumnya. Pada form ini jika pengguna ingin melakukan proses K-Means maka pengguna dapat menekan tombol PROSES, apabila pengguna ingin melewatkan proses K- Means dapat langsung menuju proses berikutnya dengan menekan tombol SKIP.
Jika pengguna memilih untuk melewatkan proses K-Means maka nilai center untuk proses RBFNN pada form berikutnya akan dipilih secara acak. Jika pengguna melakukan K- Means terlebih dahulu maka nilai center untuk proses RBFNN dipilih berdasarkan centroid hasil K-Means.
Gambar 3 Form Prediksi Time Series
Form ini memiliki banyak tab untuk menampilkan proses perhitungan RBFNN tahap demi tahap. Pada tab data, program menampilkan data yang akan diproses oleh RBFNN.
Gambar 4 Form Prediksi Time Series Tab MSE
352 Tab ini menampilkan nilai error kuadrat untuk setiap perhitungan RBFNN yang kemudian disatukan menjadi nilai Mean Square Error (MSE) yang merupakan parameter pengukuran performa dari metode RBFNN.
Gambar 5 Form Prediksi Time Series Tab Hasil
Tab ini menampilkan hasil prediksi RBFNN yang meliputi hasil ternormalisasi dan hasil yang sudah didenormalisasi.Pada penelitian ini akan dibandingkan hasil prediksi rentet waktu menggunakan RBFNN dengan yang menggunakan kombinasi dari RBFNN dan K- Means. RBFNN tanpa K-Means akan menggunakan nilai acak dari data untuk digunakan sebagai nilai center sedangkan untuk K-Means akan menghasilkan nilai centroid yang diharapkan lebih representatif untuk dijadikan sebagai nilai center pada proses RBFNN.Performa RBFNN dapat diukur salah satunya dengan rata-rata kuadrat dari nilai selisih (Mean Square Error/MSE) antara nilai terprediksi dan nilai sesungguhnya.
Data pada table 1 menampilkan rata-rata dari selisih hasil prediksi tanpa K-Means dengan prediksi dengan K-Means. Hasil prediksi dengan K-means mampu mendekati nilai sebenarnya dengan selisih rata-rata 110.885,5 dibandingkan dengan prediksi tanpa K-Meas dengan 120.556,05 dan MSE yang lebih baik dengan 0.0389 dibandingkan dengan 0.13901.
Secara presentase, error dari prediksi K-Means pun unggul dengan 10.01 dibandingkan dengan 10.92.
353 Tabel 1 Data Hasil Prediksi
Random Dengan K-Means
Prediksi- Pemakai an (Random )
Prediksi- Pemakai an (K- Means)
Prediksi - Pemaka ian (%) (Rando m)
Prediksi - Pemakai an (%) (K- Means) Bln
Pemaka
ian Prediksi MSE Prediksi MSE
01
1,060,7 39.00
952,511.4 0
0.182 10
989,153.
47
0.043 17
108,227.
60
71,585.5 3
10.20
6.75
02
955,633 .00
923,419.6 3
0.170 89
985,104.
93
0.042 30
32,213.3 7
29,471.9 3
3.37
3.08
03
1,068,2 70.00
943,442.1 3
0.161 01
985,270.
33
0.041 47
124,827.
87
82,999.6 7
11.69
7.77
04
1,092,0 34.00
908,813.8 8
0.152 35
983,480.
92
0.040 68
183,220.
12
108,553.
08
16.78
9.94
05
1,131,7 17.00
930,507.7 1
0.144 93
980,994.
72
0.039 91
201,209.
29
150,722.
28
17.78
13.32
06
1,119,8 54.00
971,723.2 6
0.138 02
982,370.
84
0.039 17
148,130.
74
137,483.
16
13.23
12.28
07
1,107,8 80.00
1,044,895.
04
0.132 19
987,311.
10
0.038 46
62,984.9 6
120,568.
90
5.69
10.88
08
1,099,2 10.00
1,028,897.
29
0.126 49
986,696.
66
0.037 78
70,312.7 1
112,513.
34
6.40
10.24
09
1,085,3 58.00
948,026.7 5
0.121 17
986,740.
46
0.037 12
137,331.
25
98,617.5 4
12.65
9.09
10
1,153,6 50.00
988,215.6 4
0.116 92
993,234.
78
0.036 48
165,434.
36
160,415.
22
14.34
13.91
11
1,118,9 99.00
1,010,857.
50
0.112 90
994,278.
49
0.035 87
108,141.
50
124,720.
51
9.66
11.15
12
1,133,8 32.00
1,029,193.
19
0.109 21
1,000,85 7.11
0.035 27
104,638.
81
132,974.
89
9.23
11.73
1,093,9 31.33
973,375.2 8
0.139 01
987,957.
82
0.038 97
120,556.
05
110,885.
50
10.92
10.01
Prediksi RBFNN dengan nilai center yang diambil secara acak bisa saja memiliki hasil yang lebih akurat dibandingkan dengan RBFNN dengan nilai center yang merupakan centroid dari K-Means, namun hasilnya tidak reliable karena tergantung pada hasil pengacakan nilai, sedangkan dengan K-Means nilai center lebih terarah sehingga mampu menghasilkan prediksi yang lebih baik.
354 KESIMPULAN
Prediksi rentet waktu dengan menggunakan RBFNN dan K-means mampu menghasilkan prediksi yang lebih akurat dibandingkan dengan prediksi dengan RBFNN saja dengan nilai error rata-rata 110.885,5 dibandingkan dengan 120.556,05 dan MSE yang lebih baik dengan 0.0389 dibandingkan dengan 0.13901. Secara presentase, error dari prediksi K- Means pun unggul dengan 10.01 dibandingkan dengan 10.92.
DAFTAR PUSTAKA
Fausett, L. (1994). Fundamentals of Neural Networks Architectures Algorithms, and Applications. London: Prentice Hall, Inc.
Nasapi, M., Santoso, I., & Effendi, M. (2014). Peramalan Permintaan Susu Pasteurisasi Menggunakan Metode Jaringan Syaraf Tiruan dan Time Series.
Plummer, E. A. (2000). Time Series Forecasting with Feed-Forward Neural Networks : Guidelines and Limitation. Wyoming.
Sari, D. R. (2013). Analisa Algoritma Backpropagation dengan Metode Gradien Descent untuk Beban Listrik Jangka Pendek. Media SainS, 81-89.
Setiawan, K. (2006). Paradigma Sistem Cerdas. Surabaya: Bayu Media.
Xu, R. (2009). Clustering. New Jersey: Wiley IEEE Press.