57 PENGGUNAAN ARTIFICIAL NEURAL NETWORK (ANN) UNTUK
MEMODELKAN KEBUTUHAN ENERGI UNTUK TRANSPORTASI
Using of Artificial Neural Network in Modelling Transportation Energy Demand Ulil Hamida
Sekolah Tinggi Manajemen Industri Jakarta Tanggal Masuk: (12/7/2014)
Tanggal Revisi: (19/7/2014) Tanggal disetujui: (1/8/2014)
ABSTRAK
Tingkat konsumsi energi khususnya BBM (Bahan Bakar Minyak) di Indonesia cenderung meningkat dari tahun ke tahun. Peramalan tingkat konsumsi energi dapat dilakukan untuk mendapatkan formulasi kebijakan energi yang tepat. Variabel yang diperkirakan mempengaruhi peningkatan konsumsi adalah peningkatan jumlah penduduk, peningkatan GDP, dan pertumbuhan mobilitas/transportasi. Penelitian ini bertujuan membangun arsitektur model ANN untuk meramalkan tingkat konsumsi energi untuk transportasi, menganalisis dan membandingkan kelebihan pemakaian ANN dibandingkan tools yang lain dan memperoleh model peramalan tingkat konsumsi energi pada sektor transportasi di Indonesia. Data penelitian diperoleh dari Dirjen Sumber Daya Mineral Kementerian Pertambangan dan Energi. Penelitian dilakukan dengan penentuan neuron yang diperlukan pada arsitektur ANN. Dari penelitian diperoleh bahwa jumlah neuron pada hidden layer yang memberikan nilai MSE terkecil adalah 15 neuron. Berdasarkan hal tersebut, maka arsitektur yang digunakan untuk melakukan training pada jaringan ANN untuk peramalan energi adalah 15-1. Proporsi pembagian data 11-5 (training-validasi) merupakan proporsi yang memberikan MSE minimum baik pada saat training maupun validasi. Model ANN memberikan rata-rata kesalahan kuadrat (MSE) yang dihasilkan ANN adalah 0,0027386. Hasil tersebut lebih baik dibandingkan MSE yang dihasilkan dari regresi majemuk yaitu 17,158226. Model ANN yang dihasilkan digunakan untuk melakukan peramalan konsumsi energi hingga 2015. Dari hasil peramalan tersebut, konsumsi energi selalu meningkat. Sebagai saran, untuk mengurangi kesalahan yang dihasilkan akibat overfitting ini pada penelitian selanjutnya perlu digunakan data yang lebih banyak.
Kata Kunci: peramalan energi transportasi, ANN, regresi linier ABSTRACT
The level of energy consumption, especially fuel oil in Indonesia has increased from year to year. Forecasting energy consumption level can be one of the bases to get a proper energy policy formulation. Variables that affect the increase in consumption are population, GDP, and growth of transportation. This study aimed to build the architecture of ANN model to forecast energy consumption for transport. This study also analyzed and compared the advantages of using ANN to other tools regression linier. Data were obtained from the Director General of Mineral Resources, Ministry of Mines and Energy. The research result showed that the number of neurons in the hidden layer that gived the smallest MSE value was 15 neurons. Under these conditions, the architecture used to conduct training on the network ANN for forecasting energy was 15-1. Usage of proportion 11-5 (training-validation) gived the minimum MSE either during training or validation. ANN model gived mean squared error (MSE) 0.0027386. The result was better than the MSE resulting from multiple regression 17.158226. The resulting ANN models used for forecasting energy consumption up to 2015. ANN weakness is overfitting. To reduce overfitting, in further research, using more data is necessary.
58
I. PENDAHULUAN Latar Belakang
Dewasa ini, issue tentang konservasi energi merupakan topik di semua negara. Hal ini tentunya disebabkan karena berbagai kepentingan yang melibatkan energi dan
pengaruhnya yang sangat signifikan
terhadap perekonomian suatu negara. Konsumsi energi dipengaruhi oleh beberapa variabel seperti : ekonomi, demografi, iklim (polusi), harga energi, politik, keamanan, dan sebagainya. Banyak negara di dunia termasuk Indonesia mulai merancang kebijakan publik untuk mengantisipasi kenungkinan krisis energi di masa depan dan mengurangi polusi yang semakin parah. Kehidupan manusia modern sangatlah mustahil dipisahkan dari energi, karena faktor melekat energi dengan teknologi. Peramalan tingkat konsumsi energi dapat menjadi salah satu basis untuk mendapatkan formulasi kebijakan energi yang tepat.
Tingkat konsumsi energi khususnya BBM (bahan bakar minyak) di Indonesia mempunyai kecenderungan meningkat dari tahun ke tahun. Segmentasi konsumsi energi terdiri dari industri, transportasi, rumahan/kantor, dan lain-lain. Variabel
yang diperkirakan mempengaruhi
peningkatan konsumsi adalah peningkatan jumlah penduduk, peningkatan GDP, dan pertumbuhan mobilitas/transportasi.
Pemakaian energi untuk sektor
transportasi di Indonesia sangat besar sekitar 1/3 dari total kebutuhan energi tiap tahunnya. Penerapan kebijakan energi yang
tepat memerlukan dukungan sistem
informasi terkait dengan kebutuhan sektoral. Pemodelan untuk meramalkan tingkat konsumsi energi telah banyak dilakukan di berbagai negara, namun penggunaan ANN baru berkembang lima tahun terakhir.
Berbagai kelebihan yang dimiliki
pemodelan ANN antara lain :
- Tidak memerlukan banyak asumsi,
karena data dapat digunakan secara langsung (apa adanya).
- Dapat memodelkan sistem secara non-linear dengan baik sehingga dapat digunakan secara fleksibel.
- Mampu memberikan model yang
mendekati sistem nyata. Permasalahan
Permasalahan pada penelitian ini adalah penggunaan artificial neural network (ANN) dalam mengetahui model dalam
penggunaan energi untuk kebutuhan
transportasi. Tujuan Penelitian
Penelitian ini bertujuan untuk
membangun arsitektur model ANN untuk meramalkan tingkat konsumsi energi untuk
transportasi, menganalisis dan
membandingkan kelebihan pemakaian ANN
dibandingkan tools yang lain dan
memperoleh model peramalan tingkat konsumsi energi pada sektor transportasi di Indonesia.
II. METODOLOGI PENELITIAN Metodologi yang digunakan pada penelitian ini adalah: studi pustaka, pengumpulan data energi dari Dirjen
Sumber Daya Mineral Kementerian
Pertambangan dan Energi. Langkah
selanjutnya adalah perancangan model ANN untuk peramalan setiap faktor dan untuk permalan energi, implementasi dengan program Matlab, dan diakhiri dengan langkah pengujian dan pembandingan metode regresi linier.
Artificial Neural Network
Artificial neural network atau lazim juga hanya disebut neural network adalah sebuah model yang terdiri dari neuron
59
buatan yang saling berkoneksi dan memiliki karakteristik yang mengitimasi suatu jaringan syaraf biologis. Karnidta (2006) menyatakan bahwa node dalam ANN didasari oleh representasi matematis yang
disederhanakan dari neuron yang
sebenarnya. Karakteristik ANN yang ditiru dari jaringan syaraf biologis adalah kemampuan belajar yang dimiliki manusia. Kemampuan ini adalah faktor utama yang membedakan sistem saraf tiruan dari aplikasi sistem pakar (expert system). Sistem pakar diprogram untuk membuat kesimpulan (inference) berdasarkan data
atau pengetahuan dari lingkungan,
sedangkan sistem saraf tiruan dapat
menyesuaikan bobot node sebagai
tanggapan atas input dan mungkin pada output yang diinginkan.
ANN telah banyak digunakan dalam area yang luas dengan banyak tujuan. Kumar & Haynes (2003) mengidentifikasi beberapa aplikasi ANN yaitu:
- Estimasi/prediksi (aproksimasi fungsi, peramalan)
- Pengenalan pola (klasifikasi, diagnosis dan analisis diskriminan)
- Klustering (pengelompokan tanpa
adanya pengetahuan sebelumnya) Optimasi (pencarian solusi terhadap model linier dan non linier yang melibatkan variabel kontinyu/diskrit)
Jaringan yang dapat dibentuk ANN
bermacam-macam, dari yang paling
sederhana hanya berupa satu neuron (single
neuron), lalu meningkat lebih rumit menjadi neuron majemuk (multiple neurons) dalam
satu lapis (single layer), hingga jaringan yang lebih rumit yaitu multiple neurons dalam multiple layers. Kemampuan jaringan tersebut berbeda-beda. Semakin rumit suatu jaringan, maka persoalan yang dapat diselesaikan menjadi lebih luas. Namun
kerumitan jaringan tersebut juga
menimbulkan persoalan tersendiri yaitu kebutuhan proses training dan simulasi yang lebih lama. Struktur jaringan dapat dilihat pada gambar 1.
Gambar 1. Jaringan ANN Multilayer (Fauset, 1994)
Pada umumnya, lapisan (layer) dalam suatu jaringan dibedakan menjadi 3 macam yaitu input layer, hidden layer dan output layer. Penjelasan setiap input tersebut diuraikan di bawah ini:
a. Input Layer
Input layer merupakan layer yang menerima input langsung dari lingkungan. Umumnya jumlah input layer disesuaikan dengan jumlah input.
b. Hidden Layers
Hidden layers merupakan layer-layer yang berada di antara input layer dan output layer (lihat gambar 1). Pada arsitektur ANN dengan 2 layer, maka hidden layers tidak ada. Jumlah neuron pada hidden layers bervariasi. Jumlah neuron dan jumlah layer pada hidden layers agar dapat menghasilkan solusi yang memiliki kesalahan minimum
Hidden Layer
Input Layer Output Layer
...
...
..
...
...
..
...
...
..
...
...
..
...
...
..
...
...
..
60
merupakan bagian utama dalam penelitian ANN.
c. Output layer
Output layer merupakan layer yang menghasilkan output akhir dari suatu jaringan ANN. Jumlah neuron pada layer ini disesuaikan dengan jumlah output yang diinginkan.
Karnidta (2006) menggolongkan
pendekatan dasar dalam paradigma belajar di ANN menjadi dua, yaitu supervised learning dan unsupervised learning.
1. Supervised learning
Pada pembelajaran supervised learning, selain memerlukan input diperlukan juga output untuk input tersebut. Pembelajaran
yang dilakukan bertujuan untuk
mendapatkan jaringan ANN yang mampu menghasilkan output yang sesuai dengan output yang diinginkan. Perbedaan antar output dari jaringan dan output yang diinginkan digunakan untuk mengkalkulasi koreksi pada bobot jaringan syaraf. Contoh dari supervised learning adalah perceptron, backpropagation, dan lain-lain.
2. Unsupervised learning
Pendekatan unsupervised learning
merupakan teknik belajar dengan cara
neuron-neuron dalam networks
mengorganisasikan dirinya untuk
menghasilkan kategori dimana kumpulan
input akan termasuk didalamnya. Dalam
pendekatan ini tidak ada nilai target yang ditetapkan. Contoh dari tipe belajar ini adalah Kohonen self-organizing feature
maps dan Hamming/competitive networks.
Pemodelan
Berdasarkan studi pustaka dihasilkan bahwa faktor-faktor yang berpengaruh pada konsumsi energi adalah faktor ekonomi dan demografi yang ada pada suatu daerah. Oleh karena itu terdapat tiga faktor yang
dikemukakan memiliki keterkaitan dengan energi yaitu Perubahan jumlah penduduk (POP), Pendapatan Nasional (GDP/GNP), dan Jarak tempuh rata-rata Veh-km. Tiga faktor tersebut menjadi input pada jaringan. Sebagai output dari jaringan tersebut adalah konsumsi energi.
Gambar 2. Pemodelan Kebutuhan Energi dengan ANN
Pemodelan ANN yang digunakan dapat dituliskan sbb :
N M
Y = αo + ∑ αjƒ
{
∑ αij E obs,i + βoj}
j=1 i=1Y = perkiraan kebutuhan energi di sektor transportasi ( dalam juta barrel/tahun)
E obs = kebutuhan energi untuk transportasi (juta barrel/tahun) M = jumlah neuron layer input
N = jumlah neuron layer tersembunyi f = fungsi transfer sigmoid untuk
layar tersembunyi
Pemodelan dengan tujuan peramalan menggunakan ’feed forward model’ di mana input merupakan data kebutuhan energi transportasi dan output adalah peramalan
61
Sedangkan layar tersembunyi digunakan untuk memroses informasi.
Kelemahan pemodelan ANN adalah adanya kemungkinan over fitting, bila penngunaan data untuk training, testing dan validasi tidak sebanding (proportional). Hal ini dapat dihindari dengan menggunakan k-fold validasi silang.
Kelemahan berikutnya adalah sifat ANN yang black box thinking, yaitu hubungan antara variabel input dan output tidak dijelaskan penyebabnya. Sedangkan perbedaan pokok antara ANN dengan model regresi adalah kemampuan ANN untuk menghitung bobot setiap data dalam layar yang tersembunyi dan digunakan terus pada layar selanjutnya untuk mendapatkan output. Model regresi hanya dapat
menentkan koefisien dari variabel
independen.
Proses validasi k-fold dilakukan sbb : 1. Bagilah data yang tersedia menjadi
bagian untuk training, validasi dan testing,
2. pilihlah arsitektur dan parameter training,
3. training model yang dipilih
menggunakan data yang sudah
ditentukan,
4. evaluasi model menggunakan data validasi,
5. ulangi langkah 2 s/d 4 dengan menggunakan arsitektur dan parameter yang berbeda,
6. pilihlah arsitektur terbaik dari proses training dan validasi,
7. implementasikan arsitektur jaringan yang dipilih dengan data testing.
III. HASIL DAN PEMBAHASAN
Pengolahan data dilakukan dengan menggunakan perangkat lunak Mathlab
yang menyediakan fasilitas modul Artificial
Neural Network.
Langkah pertama dalam pengolahan data adalah dengan melakukan normalisasi pada data yang dimiliki untuk mendapatkan input yang memiliki rentang dari -1 hingga 1 sebagai syarat dari input pada ANN. Normalisai ini diterapkan untuk seluruh data baik GDP, populasi maupun konsumsi kendaraan.
Mencari Jumlah Neuron yang Tepat untuk Hidden Layer
Setelah normalisasi input, langkah selanjutnya adalah mencari jumlah neuron yang tepat untuk digunakan pada hidden layer di jaringan ANN. Caranya adalah dengan mencoba satu persatu jaringan dengan hidden layer 1 hingga hidden layer ke 16.
Pencarian tersebut menghasilkan data pada tabel 1.
Tabel 1. Pencarian Jumlah Hidden Layer Jumlah
Neuron pada Hidden
Layer
Epoch MSE Training MSE Validasi 1 100 0.0585 0.3217 2 100 0.0224 0.3192 3 100 7.1534e-004 1.9170 4 100 0.0015 3.0728 5 77 3.0508e-014 0.4550 6 20 4.1566e-016 0.6502 7 51 1.5116e-011 0.6502 8 15 2.9646e-014 1.6060
62 Jumlah Neuron pada Hidden Layer
Epoch MSE Training MSE Validasi 9 36 5.3392e-015 1.8359 10 12 1.2117e-015 0.7816 11 13 3.3981e-013 2.1212 12 8 6.3419e-012 0.5101 13 7 8.5215e-016 1.0169 14 20 6.5482e-014 0.8095 15* 8 5.7255e-015 0.4086 16 7 5.4985e-015 1.6423
Dari data tersebut diperoleh bahwa jumlah neuron pada hidden layer yang memberikan nilai MSE terkecil adalah 15 neuron. Berdasarkan hal tersebut maka arsitektur yang digunakan untuk melakukan training pada jaringan ANN untuk peramalan energi adalah 15-1.
Langkah ini juga digunakan untuk melakukan peramalan GDP, populasi dan konsumsi kendaraan dengan hasil seperti tercantum pada Tabel 2.
Tabel 2. Arsitektur Pemodelan Energi dengan ANN
Peramalan Jumlah Neuron Optimal
GDP 5
Populasi 3
Konsumsi kendaraan (VEH-KM)
1
Mencari Perbandingan Data Training dan Data Validasi
Untuk menghindari kondisi overfitting yang dihasilkan dari pemodelan ANN, maka digunakan metode k-fold yang salah satunya adalah dengan membagi data training dan data validasi.
Data yang diperoleh dari pencarian perbandingan yang tepat tercantum pada tabel 3.
Tabel 3. Pencarian Perbandingan Data Training dan Data Validasi yang Tepat
Jumla Data Training Jumlah Data Validasi Epoch MSE Training MSE Validasi 10 6 10 3.0438e-012 0.5127 11* 5 8 5.7255e-015 0.4086 12 4 6 2.4219e-015 0.7086 13 3 5 2.7139e-012 0.7250
Simulasi yang telah dilakukan
memberikan hasil bahwa terdapat perbedaan MSE jika proporsi jumlah data yang digunakan untuk mentraining ANN dengan jumlah data yang digunakan untuk melakukan validasi. Dari hasil yang diperoleh, didapatkan bahwa proporsi 11-5 (training-validasi) merupakan proporsi yang memberikan MSE minimum baik pada saat training maupun validasi.
Melakukan Training pada Data Training Setelah ditemukan jumlah neuron yang tepat dan perbandingan jumlah data validasi dan training yang tepat, kemudian dilakukan training pada data energi, GDB, populasi, dan konsumsi kendaraan (VEH-KM). Hasil training tersebut tercantum pada gambar 3 dan hasil validasi tercantum pada gambar 4.
63 - target
+ output ANN
Gambar 3. Hasil Training Kebutuhan Energi
- target + output ANN
Gambar 4. Hasil Validasi Kebutuhan Energi Melakukan Peramalan Energi 5 tahun ke Depan dengan Menggunakaan Jaringan Hasil Training
Setelah data training digunakan untuk menentukan jaringan ANN yang digunakan, maka jaringan tersebut kemudian digunakan untuk meramalkan konsumsi energi untuk lima tahun ke depan.
Hasil peramalan tersebut dapat dilihat pada tabel 4 dan gambar 5.
Tabel 4. Data dan Peramalan Kebutuhan Energi Menggunakan ANN
Tahun Populasi GDP Veh-km Kebutuh an Energi 1990 179.49 129.47 0.8942 216.2 1991 181.97 134.56 1.3129 232.54 1992 184.65 143.37 1.8664 253.99 1993 187.55 157.36 2.5592 280.02 1994 190.64 176.59 3.3697 291.18 1995 193.91 197.29 4.2451 298.8 1996 197.31 208.37 5.1136 389.03 1997 200.7 209.55 5.9057 317.42 1998 203.73 215.87 6.574 350 1999 205.68 221.57 7.1018 408.62 2000 206.27 224.98 7.498 436.35 2001 207.15 226.84 7.7831 451.31 2002 209.56 227.82 7.9833 463.4 2003 212.96 228.33 8.1206 473.04 2004 216.7 228.59 8.2133 478.49 2005 220.47 228.73 8.2758 479.04 2006 224.15 228.8 8.3175 477.68 2007 227.69 228.84 8.3452 479.51 2008 231.06 228.86 8.3632 487.77 2009 234.25 228.87 8.3755 501.79 2010 237.23 228.87 8.3832 516.24 2011 240.01 228.87 8.3885 524.93 2012 242.58 228.87 8.3922 526.31 2013 244.94 228.87 8.3943 523.05 2014 247.1 228.87 8.3959 518.29 2015 249.07 228.87 8.3967 513.73
Gambar 5. Hasil Peramalan Energi dengan menggunakan ANN
64
Pengujian dan Pembandingan dengan Metode Regresi
Sebagai tahap pengujian, hasil
peramalan dengan pendekatan ANN
kemudian dibandingkan dengan peramalan dengan metode regresi yang menghasilkan perbandingan sebagai berikut:
Gambar 6. Perbandingan Model ANN dengan Regresi Linier
Dari data tersebut, jika dihitung rata-rata kesalahan kuadratnya (MSE) diperoleh hasil bahwa MSE yang dihasilkan ANN adalah 0,0027386, sedangkan MSE yang dihasilkan dari regresi majemuk adalah 17,158226.
Tabel 5. Perbandingan MSE Regresi Linier dan ANN Jumlah data MSE Regresi Majemuk MSE ANN 16 17.158226 0.0027386
Berdasarkan hasil tersebut berarti diperoleh bahwa ANN memiliki kinerja yang lebih baik dibandingkan dengan regresi majemuk pada penelitian peramalan energi ini.
IV. KESIMPULAN DAN SARAN Kesimpulan
1. Model untuk peramalan energi dengan
menggunakan metode ANN
menggunakan input tiga variabel yaitu
GDB, populasi dan konsumsi
kendaraan (VEH-KM).
2. MSE yang dihasilkan ANN adalah 0,0027386, sedangkan MSE yang dihasilkan dari regresi majemuk adalah 17,158226. Hal ini menjadikan ANN memiliki kinerja yang lebih baik dibandingkan dengan regresi majemuk pada penelitian peramalan energi ini.
3. Model ANN yang dihasilkan
digunakan untuk melakukan
peramalan konsumsi energi hingga 2015. Dari hasil peramalan tersebut, konsumsi energi selalu meningkat. Saran
ANN memiliki kelemahan yang sangat harus diperhatikan yaitu overfitting. Untuk mengurangi kesalahan yang dihasilkan akibat overfitting ini data yang digunakan harus cukup banyak. Selain itu untuk peramalan jangan sampai meramalkan untuk jangka waktu yang lama. Saran lain untuk mengurangi overfitting ini adalah update jaringan dengan melakukan training jika terdapat data baru.
V. DAFTAR PUSTAKA
Fitrisia. Adiwijaya. Rakhmatsyah, A. 2010.
Prediksi Produksi BAN GT3
Menggunakan Jaringan Syaraf
Tiruan Resilient Propagation dan Weight-Elimination. Makalah dalam
Konferensi Nasional Sistem dan
Informatika. Bali: STIMIK
STIKOM Bali. 0 100 200 300 400 500 600 700 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Data Real Regresi Majemuk ANN
65
Kadir, A. 2011. Sistem Informasi
Manajemen. Yogyakarta: Andi
Publisher.
Karnidta, Sherlie. 2006. Penerapan Model
Artificial Neural Network untuk
Meramalkan dan Melakukan
Analisis Sensitifitas Variabel
Makroekonomi dalam Sistem
Peringatan Dini Krisis Mata Uang.
Tugas Sarjana Teknik Industri, Institut Teknologi Bandung.
Kumar, K. Haynes, J.D. 2003. Forecasting credit ratings using an ANN and statistical techniques, International
Journal of Business Studies, 11, 91-108.
Mastur, I. Hadi, Lumenta. 2005.
Implementasi Jaringan Syaraf Tiruan untuk Mengidentifikasi Pola Desain Berdasarkan Preferensi Pelanggan Menggunakan Kansei Engineering System. TEKNOIN Vol.10 p.
197-208.
Murat, Y.S. Ceylan, H. 2006. Use of artificial neural network for transport energy demand modeling. Energy
Policy vol 34, Elsevier.
Pao, H. 2006. Modeling and Forecasting the Energy Consumption in Taiwan Using Artificial Neural Networks.
The journal of American Academy of Business, Cambridge, Vol. 8