Implementasi Gabungan Metode Bayesian dan Backpropagation untuk Peramalan Jumlah Pengangguran Terbuka di Indonesia

(1)

Fakultas Ilmu Komputer

Universitas Brawijaya

330

Implementasi Gabungan Metode Bayesian dan Backpropagation untuk

Peramalan Jumlah Pengangguran Terbuka di Indonesia

Yure Firdaus Arifin1_{, Dian Eka Ratnawati}2_{, Putra Pandu Adikara}3

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1_{[email protected],}2_{[email protected],}3_{[email protected]}

Abstrak

Salah satu masalah pokok yang dihadapi negara Indonesia adalah pengangguran. Penyebab terjadinya pengangguran antara lain adalah jumlah lapangan kerja yang tersedia lebih kecil dari jumlah lulusan/pencari kerja. Tidak sebandingnya jumlah lapangan kerja dengan jumlah lulusan/pencari kerja tersebut yang menyebabkan tingginnya tingkat pengangguran di Indonesia. Tingkat pengangguran yang tinggi berdampak langsung maupun tidak langsung terhadap kemiskinan, kriminalitas, dan masalah-masalah sosial. Akan tetapi pada kenyataannya berdasarkan hasil survei BPS dari tahun 2014 ke 2015 tingkat pengangguran terbuka di Indonesia justru menunjukkan peningkatan. Dengan meramalkan/memprediksi jumlah pengangguran, dapat membantu pemerintah Indonesia dalam membuat perencanaan program pemerintah ataupun kebijakan-kebijakan yang terkait tentang lapangan pekerjaan. Selain itu, data hasil prediksi dapat digunakan untuk mengukur seberapa berhasilkah program pemerintah yang telah dilaksanakan pada tahun sebelumnya.

Metode Backpropagation adalah salah satu metode yang dapat digunakan untuk memprediksi. Pada penelitian ini dilakukan optimasi nilai inisialisasi bobot pada Backpropagation menggunakan metode Bayesian yang merupakan modifikasi dari Kalman Filter. Berdasarkan hasil pengujian yang telah dilakukan dalam penelitian ini nilai Average Forecasing Error Rate (AFER) yang terendah adalah 2,1003%. Dari hasil pengujian tersebut metode gabungan Bayesian dan Backpropagation memiliki tingkat akurasi yang lebih baik dari pada metode Backpropagation dengan inisialisasi random yang memiliki nilai AFER terendah 2,5793% tetapi membutuhkan jumlah iterasi yang lebih banyak. Sistem prediksi jumlah pengangguran terbuka di Indonesia dengan metode gabungan Bayesian dan

Backpropagation pada penelitian ini dapat melakukan prediksi beberapa tahun kedepan secara langsung

tetapi hasil yang paling optimal adalah prediksi pada tahun pertama sedangkan pada tahun-tahun berikutnya hasil prediksi semakin tidak akurat.

Kata kunci: backpropagation, bayesian, kalman filter, time series Abstract

One of the major problems that Indonesia has is unemployment. It happens because of the low number of the job vacancy meets the high number of the graduate and job seeker. The unbalanced number of the job vacancy to the graduate and job seeker causes an increasing in the unemployment rate in Indonesia. The high rate of unemployment will inevitably give a direct or indirect impact to the poverty, crime, and other social issues. However, according to the survey conducted by BPS, Indonesia’s unemployment rate was even increasing from the year of 2014 to 2015. It would really help the Indonesian government to make planning, program, or policy related to the job vacancy by being able to predict the number of unemployment. In addition, the data result from the prediction could be used as the measurement of the success of government’s previous programs.

Backpropagation is one of the methods that used to predict. This research works on the optimation of weights initialization in Backpropagation using Bayesian method that is a modification of the Kalman filter. According to the test result done in this research, the lowest value of Average Forecasting Error Rate (AFER) is 2,1003%. From that result, the combination method between Backpropagation and Bayesian has better accuracy rate than Backpropagation method with random initialization that has 2,5793% lowest value of AFER, but need a lot of iterasion. The sistem of this research can predict some future of years immediately but the most optimal result is the first year while in subsequent years the result of the prediction is more inaccurate.

(2)

Fakultas Ilmu Komputer, Universitas Brawijaya

Keywords: backpropagation, bayesian, kalman filter, time series

1. PENDAHULUAN

Tingginya tingkat pengangguran akan berdampak langsung maupun tidak langsung terhadap kemiskinan, kriminalitas, dan masalah-masalah sosial. Akan tetapi pada kenyataannya berdasarkan hasil survei BPS dari tahun 2014 ke 2015 tingkat pengangguran terbuka di Indonesia justru menunjukkan peningkatan. Jumlah pengangguran terbuka pada Agustus 2014 yaitu 7,24 juta orang, pada Agustus 2015 mencapai

7,56 juta orang. Dengan

meramalkan/memprediksi jumlah pengangguran, dapat membantu pemerintah Indonesia dalam membuat perencanaan program pemerintah ataupun kebijakan-kebijakan yang terkait tentang lapangan pekerjaan. Selain itu, data hasil dari prediksi nantinya dapat digunakan untuk mengukur seberapa berhasilkah program pemerintah yang telah dilaksanakan pada tahun sebelumnya.

Prediksi merupakan proses memperkirakan sesuatu secara sistematis yang akan terjadi pada masa depan berdasarkan data informasi dari masa lalu dan sekarang yang dimiliki, sehingga mendapatkan hasil perkiraan yang mendekati hasil nyatanya. Terdapat dua teknik dalam memprediksi yaitu teknik prediksi kualitatif dan teknik prediksi kuantitatif. Teknik prediksi kualitatif merupakan prediksi yang hasilnya ditentukan pada individu yang menyusunnya berdasarkan pemikiran yang bersifat opini, pengetahuan dan pengalaman dari penyusunnya. Teknik kuantitatif merupakan prediksi yang hasilnya berdasarkan metode yang dipergunakan dalam prediksi tersebut (Berutu, 2013).

Salah satu metode yang dapat digunakan untuk memprediksi yaitu jaringan saraf tiruan. Jaringan saraf tiruan adalah sistem pemrosesan informasi yang didesain seperti cara kerja otak manusia dalam menyelesaikan masalah dengan melakukan proses belajar melalui perubahan bobot sinapsisnya. Jaringan saraf tiruan dapat melakukan pengenalan terhadap kegiatan berbasis data masa lalu. Data masa lalu dapat dipelajari oleh jaringan saraf tiruan sehingga memiliki kemampuan untuk memberikan keputusan terhadap data yang belum pernah dipelajari. Salah satu algoritma pada jaringan saraf tiruan yang dapat diterapkan dengan baik untuk peramalan adalah Backpropagation (K. S. Kusumadewi, 2004).

Pada penelitian sebelumnya yang telah dilakukan oleh Nadir Murru dan Rosaria Rossini yaitu menerapkan metode Bayesian untuk inisialisasi bobot pada algoritma

Backpropagation untuk pengenalan karakter

(character recognition). Pendekatan Bayesian yang menerapkan Kalman filter modifikasi digunakan untuk inisialisasi bobot pada

Backpropagation. Bayesian merupakan sebuah

teori kondisi probabilitas yang memperhitungkan probabilitas suatu kejadian bergantung pada kejadian lain (Yahdin, 2008). Pada penelitian tersebut mereka membandingkan hasil metode gabungan

Bayesian dan Backpropagation yaitu

menggunakan Random Weights Initialization

(RI) dan Bayesian Weights Initialization (BI).

Hasilnya metode BI menghasilkan persentasi tingkat akurasi yang lebih tinggi dibandingkan dengan RI. Mereka juga membandingkan metode BI dengan beberapa motode lain yang telah dilakukan oleh peneliti lainnya. Hasilnya metode BI adalah yang paling optimal untuk menyelesaikan masalah yang kompleks (Murru & Rossini, 2016).

Pada penelitian ini dilakukan prediksi jumlah pengangguran terbuka di Indonesia menggunakan gabungan metode Bayesian dan Backpropagation. Metode Bayesian pada penelitian ini merupakan modifikasi dari

Kalman filter yang dilakukan pada saat proses

inisialisasi bobot. Penelitian ini mempunyai tujuan pencapaian yaitu untuk mengimplementasikan metode Bayesian dan

Backpropagation dalam memprediksi jumlah

pengangguran terbuka di Indonesia serta untuk mengetahui bagaimana hasil dari gabungan kedua metode tersebut berdasarkan hasil pengujian.

2. DASAR TEORI 2.1. Backpropagation

Backpropagation (runut balik) adalah

algoritma pembelajaran terawasi dan digunakan oleh perceptron dengan banyak lapisan untuk merubah bobot-bobot yang terhubung dengan

neuron-neuron yang ada pada lapisan

tersembunyinya (K. S. Kusumadewi, 2004). Pada jaringan Backpropagation, setiap

unit/neuron yang berada pada lapisan input

(3)

lapisan tersembunyi (hidden layer). Setiap

unit/neuron yang ada pada lapisan tersembunyi

(hidden layer) terhubung dengan setiap unit yang ada pada lapisan output. Jaringan ini memiliki banyak lapisan (multilayer network).

Saat jaringan Backpropagation diberikan pola input sebagai pola pelatihan (training), maka pola tersebut menuju unit-unit pada lapisan tersembunyi untuk selanjutnya diteruskan pada unit-unit pada lapisan output. Unit-unit pada lapisan output akan memberikan respon sebagai output jaringan saraf tiruan. Ketika hasil output tidak sesuai dengan yang diharapkan atau target, maka output akan disebarkan mundur (backward) pada lapisan tersembunyi (hidden layer) kemudian dari lapisan tersembunyi (hidden layer) dilanjutnya menuju ke lapisan input. Arsitektur jaringan

Backpropagation ditunjukkan pada Gambar 2.1

(Agustin & Prahasto, 2012).

Pelatihan jaringan Backpropagation terdiri dari 3 tahapan yaitu Umpan maju (feedforward), Umpan mundur (Backpropagation), dan update bobot. Secara rinci proses algoritma pelatihan pada jaringan Backpropagation dapat diuraikan sebagai berikut:

Langkah0 : Inisialisasi nilai bobot, menentukan konstanta laju pelatihan (α/alpha), menentukan teleransi/target error atau jumlah maksimum iterasi/epoch.

Langkah 1 : Ketika kondisi berhenti belum dicapai, maka dilakukan langkah ke-2 hingga langkah ke-9.

Langkah 2 : Untuk setiap pasangan pola pelatihan, dilakukan langkah ke-3 sampai langkah ke-8.

Langkah 3 : [Tahap I: Umpan maju (feedforwand)]. Setiap unit input menerima sinyal dan meneruskannya ke unit tersembunyi di atasnya.

Langkah 4 : Masing-masing unit pada lapisan tersembunyi dikalikan dengan bobotnya dan dijumlahkan serta ditambahkan dengan biasnya. Langkah 5 : Masing-masing unit output (yk,

k=1,2,3,...m) dikalikan dengan

bobot dan dijumlahkan serta ditambahkan dengan biasnya. Langkah 6 : [Tahap II: Umpan mundur

(backpropagation)]. Setiap unit

output (yk, k=1,2,3,...m) menerima pola target tk sesuai dengan pola

input pada saat pelatihan dan

kemudian kesalahan/error lapisan

output (δk) dihitung. δk dikirim ke lapisan di bawahnya dan digunakan untuk menghitung besarnya koreksi bobot dan bias

(∆Wjk dan ∆Wok ) antara lapisan tersembunyi dengan lapisan

output.

Langkah 7 : Setiap unit pada lapisan tersembunyi (dari unit ke-1 hingga ke-p; i=1…n; k=1…m) dilakukan perhitungan kesalahan/error untuk lapisan tersembunyi (δj). δj kemudian digunakan untuk menghitung besar koreksi bobot dan bias (∆Vji dan ∆Vjo) antara lapisan input dan lapisan tersembunyi.

Langkah 8 : [Tahap III: Update bobot dan bias]. Setiiap unit output (yk,

k=1,2,3,…,m) dilakukan update

bias dan bobotnya (j=0,1,2,...p) sehingga menghasilkan bobot dan bias baru, demikian juga untuk setiap unit tersembunyi mulai dari unit 1 sampai dengan unit

ke-p.

Langkah 9 : Uji kondisi berhenti (akhir iterasi).

Gambar 2.1. Arsitektur jaringan

Backpropagation

2.2. Bayesian

Teori Bayesian merupakan sebuah teori kondisi probabilitas yang memperhitungkan probabilitas suatu kejadian bergantung pada kejadian lain. Pada dasarnya, teorema tersebut mengatakan bahwa kejadian di masa depan dapat diprediksi dengan syarat kejadian sebelumnya telah terjadi. Statement teori Bayes ditunjukkan pada Persamaan 2.1. P(A/B) adalah probabilitas gabungan kejadian A dan B. Dengan membagi kedua sisi dengan P(B), maka akan didapat persamaan yang ditunjukkan pada

(4)

Fakultas Ilmu Komputer, Universitas Brawijaya Persamaan 2.2. Secara umum teorema Bayes dapat dituliskan dalam bentuk yang ditunjukkan pada Persamaan 2.3. (Lukman, 2013).

∑ 𝑃(𝐵│𝐴𝑖)𝑃(𝐴𝑖)𝑖 (2.3)

2.3. Kalman Filter

Kalman filter banyak diterapkan dalam

berbagai aplikasi. Fungsi dari Kalman filter adalah sebagai estimator dalam berbagai sistem yang digunakan. Kalman filter memiliki model yang sederhana sehingga mudah diterapkan pada berbagai sistem. Kalman filter

memperhitungkan noise yang diestimasi pada seluruh cangkupan frekuensi sehingga Kalman

filter dapat digunakan sebagai estimator tanpa

perlu memperhitungkan noise yang terjadi pada sistem secara detail terlebih dahulu. Kalman

filter dapat digunakan untuk melakukan estimasi

sistem yang linear. Dalam perkembangannya, untuk sistem yang lebih kompleks dengan persamaan matematis yang linier, Kalman filter dapat dimodifikasi agar dapat mengestimasi sistem yang non-linier. Ada beberapa contoh modifikasi Kalman filter yaitu Extended Kalman

Filter (EKF), Uncented Kalman Filter (UCF),

dan Franctional Kalman Filter (FKF) (Murru & Rossini, 2016).

Kalman Filter merupakan suatu metode

estimasi variabel keadaan dari sistem dinamik stokastik linear diskrit yang meminimumkan nilai kovariansi error estimasi. Metode Kalman

filter pertama kali diperkenalkan oleh Rudolph

E. Kalman pada tahun 1960 melalui papernya yang terkenal tentang suatu penyelesaian rekursif pada masalah filtering data diskrit yang

linear (Welch & Bishop, 2006). Kalman filter

merupakan suatu pendekatan teknis untuk menaksir fungsi parameter dalam peramalan deret berkala (time series). Keunggulan dari metode Kalman filter adalah kemampuannya dalam mengestimasi suatu keadaan berdasarkan data yang minim. Data minim yang dimaksudkan merupakan data pengukuran (alat ukur) karena Kalman filter adalah suatu metode yang menggabungkan model dan pengukuran. Data pengukuran terbaru menjadi bagian yang penting dari algoritma Kalman filter karena data terbaru akan digunakan untuk mengoreksi hasil prediksi sehingga hasil estimasinya selalu mendekati kondisi yang sebenarnya (Masduqi & Apriliani, 2008).

2.3. Gabungan Bayesian dan

Backpropagation

Pada penelitian sebelumnya yang telah dilakukan oleh Nadir Murru dan Rosaria Rossini yaitu menerapkan metode Bayesian untuk inisialisasi bobot pada algoritma

Backpropagation untuk pengenalan karakter

(character recognition). Pendekatan Bayesian yang menerapkan Kalman filter modifikasi digunakan untuk inisialisasi bobot pada

Backpropagation (Murru & Rossini, 2016).

Metode Kalman filter merupakan suatu metode yang dapat dipergunakan untuk mengestimasi variabel state dari sistem dinamik stokastik linier yang terkorupsi oleh white noise Gaussian. Variabel state dari suatu sistem dapat diestimasi oleh Kalman filter dengan memodelkan sistem tersebut terlebih dahulu (Palega, Wardoyo, & Wiryadinata, 2013).

Pada penelitian tersebut mereka membandingkan hasil metode gabungan

Bayesian dan Backpropagation yaitu

menggunakan Random Weights Initialization

(RI) dan Bayesian Weights Initialization (BI).

Hasilnya metode BI menghasilkan persentasi tingkat akurasi yang lebih tinggi dibandingkan dengan RI. Mereka juga membandingkan metode BI dengan beberapa motode lain yang telah dilakukan oleh peneliti lainnya. Hasilnya metode BI adalah yang paling optimal untuk menyelesaikan masalah yang kompleks. Inisialisasi bobot menggunakan pendekatan

Bayesian dan modifikasi Kalman filter pada

penelitian ini ditunjukkan pada Persamaan 2.4, 2.5, 2.6, 2.7, dan 2,8 (Murru & Rossini, 2016).

Wt = (Qt-1 + Rt-1)-1 (Qt-1 wt + Rt-1 mt) (2.4) wt+1 = Wt (2.5) mt+1 = random(-1,1) (2.6) Qt+1 = (Qt-1 + Rt-1)-1 (2.7) Rt+1 = random(-1,1) (2.8) Keterangan:

Wt : bobot teroptimasi untuk Backpropagation wt : prior estimation mt : measurement

Qt : matrik kovarian dari wt Rt : matrik kovarian dari mt

Prior estimation (wt)dan measurement (mt) adalah matrik simetris berordo 9 karena pada penelitian ini menggunakan unit sebanyak 9 baik pada lapisan input (input layer) maupun lapisan tersembunyi (hidden layer). Pada penelitian ini inisialisasi nilai matrik prior estimation (w0)dan

(5)

dengan range (-h,h). Nadir Murru dan Rosaria Rossini pada penelitiannya membatasi nilai t untuk mempercepat proses komputasi dan untuk mencegah nilai bobot yang dihasilkan mendekati 0. Mereka menentukan tmax = 2, pada penelitian ini diterapkan hal yang sama sehingga hasil dari

W2 adalah nilai bobot yang telah teroptimasi untuk digunakan pada algoritma

Backpropagation pada lapisan input ke hidden

(V).

3. METODE

Penelitian ini menggunakan metode gabungan Bayesian dan Backpropagation dimana metode Bayesian digunakan untuk inisialisasi bobot V pada jaringan

Backpropagation. Diagram alir metode

gabungan ditunjukkan pada Gambar 3.1 sedangkan arsitektur jaringan yang digunakan pada penelitian ini ditunjukkan pada Gambar 3.2.

Gambar 3.1 Diagram alir sistem

Gambar 3.2 Arsitektur jaringan

3.1. Normalisasi Data

Data yang digunakan dalam penelitian ini adalah data dari Badan Pusat Statistik tentang jumlah pengangguran terbuka di Indonesia dari tahun 1986 sampai 2016. Pada penelitian ini data dinormalisasi ke range 0,1 sampai 0,9 dengan rumus yang ditunjukkan pada Persamaan 3.1 (S. Kusumadewi, 2003). 𝑥′ =0,8(𝑥−𝑎) 𝑏−𝑎 + 0,1 (3.1) Keterangan: a : nilai minimum b : nilai maksimum

3.2. Inisialisasi Bobot Menggunakan

Bayesian

Pada penelitian ini nilai bobot V

diinisialisasi menggunakan metode Bayesian dengan langkah-langkah yang ditunjukkan pada Gambar 3.3.

Gambar 3.3 Diagram alir metode Bayesian Keterangan:

1. Menentukan tmax pada sistem, pada penelitian ini tmax = 2.

2. Inisialisasi matrik w0 dan m0 dengan nilai random antara -h sampai h.

(6)

Fakultas Ilmu Komputer, Universitas Brawijaya 3. Menghitung Qt yang merupakan matrik

kovarian dari wt dan Rt yang merupakan matrik kovarian dari mt.

4. Menghitung bobot Wt menggunakan Persamaan 2.4.

5. Jika t = tmax maka simpan bobot Wt, jika tidak maka update nilai wt, mt, Qt, dan

Rt berturut-turut menggunakan Persamaan 2.5, 2.6, 2.7, dan 2.8, kemudian t = t+1 dan kembali ke proses ke-3.

3.3. Metode Backpropagation

Metode Backpropagation digunakan untuk proses training data. Langkah-langkah pada metode Backpropagation ditunjukkan pada Gambar 3.4.

Gambar 3.4 Diagram alir metode

Backpropagation

Keterangan:

1. Menentukan maksimum iterasi dan target MSE.

2. Inisialisasi bobot dan bias menggunakan bilangan acak kecil.

3. Mengambil data latih dari database yang telah dinormalisasi.

4. Melakukan propagasi maju kemudian menghitung MSE.

5. Jika nilai MSE kurang dari sama dengan

MSE target atau jumlah iterasi sama

dengan jumlah maksimum iterasi maka simpan bobot, jika tidak maka lakukan propagasi mundur.

6. Mengitung perubahan bobot lalu

update bobot.

7. Iterasi bertambah 1 kemudian kembali ke langkah ke-4.

4. HASIL PENGUJIAN DAN ANALISIS 4.1. Pengujian Learning Rate (alpha) Terhadap Nilai AFER

Pengujian ini bertujuan untuk mengetahui bagaimana pengaruh nilai learning rate (alpha) terhadap nilai AFER. Learning rate adalah parameter jaringan dalam mengendalikan proses penyesuaian bobot. Untuk pengujian ini variabel yang diberi nilai tetap adalah tmax = 2 dan h = 1, uji coba dilakukan sebanyak 5 kali dengan jumlah maksimum iterasi 20000, training menggunakan 10 pola data dan prediksi pada tahun 2016a. Tabel hasil pengujian ditunjukkan pada Tabel 4.1 dan grafik hasil pengujian ditunjukkan pada Gambar 4.1.

Tabel 4.1 Hasil pengujian learning rate (alpha) terhadap nilai AFER

alpha AFER (%) 0,1 6,9332 0,2 6,2637 0,3 5,5869 0,4 5,0245 0,5 4,6543 0,6 4,4691 0,7 4,4107 0,8 4,4177 0,9 4,4504

(7)

Gambar 4.1 Grafik hasil pengujian Learning

Rate (alpha) Terhadap Nilai AFER

Berdasarkan grafik hasil skenario pengujian 2 pada Gambar 4.1 menunjukkan nilai AFER terendah terjadi ketika alpha = 0,7 sedangkan nilai AFER tertinggi terjadi ketika alpha = 0,1, grafik tersebut menunjukkan bahwa pada penelitian ini semakin kecil nilai alpha maka semakin besar hasil nilai AFER. Nilai alpha berfungsi sebagai pengendali pada proses penyesuaian bobot. Hasil dari pengujian ini menunjukkan bahwa nilai alpha sangat mempengaruhi tingkat akurasi dari hasil prediksi. Pada pengujian ini dengan jumlah iterasi 20000 dan 10 pola data latih, nilai alpha yang paling optimal adalah 0,7, maka untuk skenario pengujian berikutnya nilai alpha akan digunakan 0,7.

4.2. Pengujian Variabel Tmax Terhadap Nilai

AFER

Pengujian ini bertujuan untuk mengetahui bagaimana pengaruh nilai variabel tmax terhadap nilai AFER. Variabel tmax digunakan untuk menentukan batas iterasi pada saat inisialisasi bobot V menggunakan metode Bayesian. Untuk pengujian ini variabel yang diberi nilai tetap adalah alpha= 0,7 dan h = 1, uji coba dilakukan sebanyak 5 kali dengan jumlah maksimum iterasi 20000, training menggunakan 10 pola data dan prediksi pada tahun 2016a. Tabel hasil pengujian ditunjukkan pada Tabel 4.2 dan grafik hasil pengujian ditunjukkan pada Gambar 4.2.

Tabel 4.2 Hasil pengujian variabel Tmax Terhadap Nilai AFER

tmax AFER (%) 2 4,6662 4 4,6731 6 4,6981 8 4,6932 10 4,6683 tmax AFER (%) 12 4,6688 14 4,6733 16 4,6843 18 4,6993

Gambar 4.2 Grafik hasil pengujian variabel tmax terhadap nilai AFER

Berdasarkan grafik hasil skenario pengujian 3 pada Gambar 4.2 menunjukkan bahwa nilai

AFER terendah adalah ketika nilai tmax = 2 dan nilai AFER tertinggi adalah ketika nilai tmax = 18, tetapi perbedaan rata-rata nilai AFER dari pengujian ini sangat kecil. Berdasarkan hasil tersebut maka dapat dikatakan pada penelitian ini pengaruh nilai variabel tmax tidak terlalu besar terhadap hasil prediksi karena pada inisialisasi bobot V menggunakan metode Bayesian proses iterasi selanjutnya tetap akan dilakukan perhitungan matrik kovarian sehingga perbedaan hasil inisialisasi bobot pada satu iterasi dengan iterasi lainnya tidak terlalu besar. Jadi dapat disimpulkan pada pengujian ini nilai variabel tmax yang optimal adalah 2, maka untuk skenario pengujian selanjutnya akan digunakan nilai tmax = 2.

4.3. Pengujian Variabel h Terhadap Nilai AFER

Pengujian ini bertujuan untuk mengetahui bagaimana pengaruh nilai variabel h terhadap nilai AFER. Variabel h adalah batas nilai (range) random pada inisialisasi nilai prior estimation

(w) dan measurement (m) ketika proses

inisialisasi bobot V menggunakan metode Bayesian. Untuk pengujian ini variabel yang diberi nilai tetap adalah alpha= 0,7 dan tmax = 2, uji coba dilakukan sebanyak 5 kali dengan jumlah maksimum iterasi 20000, training menggunakan 10 pola data dan prediksi pada tahun 2016a. Tabel hasil pengujian ditunjukkan

(8)

Fakultas Ilmu Komputer, Universitas Brawijaya pada Tabel 4.3 dan grafik hasil pengujian ditunjukkan pada Gambar 4.3.

Tabel 4.3 Hasil pengujian variabel h terhadap nilai AFER h AFER (%) 0,6 4,6949 0,8 4,7114 1 4,7212 1,2 4,7345 1,4 4,7412 1,6 4,7497

Gambar 4.3 Grafik hasil pengujian variabel h terhadap nilai AFER

AFER terendah adalah ketika nilai h= 0,6 dan nilai rata-rata AFER tertinggi adalah ketika nilai

h = 1,6, tetapi perbedaan nilai AFER dari pengujian ini sangat kecil. Hal tersebut terjadi karena semakin besar nilai h maka variasi akan semakin besar sehingga menghasilkan nilai bobot yang semakin besar pula dan menyebabkan nilai AFER semakin besar. Pada pengujian ini nilai h yang optimal adalah 0,6, maka untuk skenario pengujian selanjutnya akan digunakan nilai h= 0,6.

4.4. Pengujian Pengaruh Jumlah Pola Data

Training Terhadap Nilai AFER

Pengujian ini bertujuan untuk mengetahui apakah jumlah pola data training dan bentuk distribusi data mempengaruhi nilai AFER. Untuk pengujian ini nilai variabel yang tetap adalah

alpha = 0.7, tmax = 2, h = 0,6, maksimum iterasi = 20000, dan tahun prediksi adalah 2016a. Hasil pengujian ini ditunjukkan pada Tabel 4.4 dan grafik hasil pengujian ditunjukkan pada Gambar 4.4.

Tabel 4.4 Hasil pengujian pengaruh jumlah pola data training terhadap nilai AFER Jumlah Pola

Data Data Training AFER (%) 10 2011a – 2015b 3.2216 15 2008b – 2015b 2.2448 20 2006a – 2015b 7.0553 25 2002 – 2015b 7,8518 30 1997 – 2015b 8,2191

Gambar 4.4 Grafik hasil pengujian pengaruh jumlah pola data training terhadap nilai AFER

AFER terendah adalah ketika jumlah pola data training= 15 dan nilai rata-rata AFER tertinggi adalah ketika jumlah pola data training = 30. Pola data yang digunakan untuk training pada pengujian ini adalah data terdekat dari tahun yang akan diprediksi. Jadi dapat disimpulkan pada pengujian ini bentuk distribusi data yang dilatih sangat berpengaruh terhadap hasil prediksi, semakin banyak variasi data maka tingkat akurasi semakin rendah. Pada pengujian ini jumlah pola data training yang optimal adalah 15, maka untuk skenario pengujian selanjutnya jumlah pola data training

menggunakan 15 pola data.

4.5. Pengujian Jumlah Iterasi dan

Perbandingan Inisialisasi Random dengan Inisialisasi Bayesian

Pengujian ini bertujuan untuk mengetahui pengaruh jumlah iterasi serta membandingkan kecepatan dan tingkat akurasi sistem antara inisialisasi bobot secara random dengan inisialisasi Bayesian. Hasil perbandingan waktu diambil pada saat training sedangkan AFER diambil pada saat testing. Nilai variabel yang digunakan dalam pengujian ini adalah alpha = 0.7, tmax = 2, dan jumlah pola data = 15. Data yang digunakan untuk training adalah tahun 2008b sampai 2015b sedangkan untuk tahun

(9)

prediksi adalah 2016a. Hasil pengujian dintunjukkan pada Tabel 4.5 serta grafik pada Gambar 4.5.

Tabel 4.5 Hasil pengujian jumlah iterasi dan perbandingan inisialisasi Random dengan

inisialisasi Bayesian (Random) Jumlah Iterasi Random Waktu (milidetik) AFER (%) 1000 609 4,2596 2000 1266 3,2063 5000 3078 2,6209 10000 6141 2,5793 15000 9156 2,7336 20000 12266 2,9056 50000 30813 3,5636 75000 45937 3,8270 100000 61125 4,0144

Tabel 4.6 Hasil pengujian jumlah iterasi dan perbandingan inisialisasi Random dengan

inisialisasi Bayesian (Bayesian) Jumlah Iterasi Bayesian Waktu (milidetik) AFER (%) 1000 703 6,1292 2000 1719 4,2450 5000 4234 2,4509 10000 7516 2,1003 15000 9250 2,1197 20000 15438 2,2448 50000 37312 3,0517 75000 46094 3,6718 100000 76828 3,8609

Gambar 4.5 Grafik hasil pengujian jumlah iterasi dan perbandingan inisialisasi random

dengan inisialisasi Bayesian terhadap waktu

training

Gambar 4.6 Grafik hasil pengujian jumlah iterasi dan perbandingan inisialisasi random

dengan inisialisasi Bayesian terhadap nilai

AFER

Berdasarkan Grafik hasil pengujian jumlah iterasi dan perbandingan inisialisasi random dengan inisialisasi Bayesian terhadap waktu

training pada Gambar 4.5 menujukkan bahwa

semakin besar jumlah iterasi maka waktu proses

training akan semakin besar. Selisih waktu

proses training pada sistem antara inisialisasi

random dengan inisialisasi menggunakan metode Bayesian sangat kecil. Dari 9 uji coba, inisialisasi random selalu lebih cepat dari pada inisialisasi Bayesian meskipun selisihnya sangat kecil.

Berdasarkan hasil pengujian jumlah iterasi dan perbandingan inisialisasi random dengan inisialisasi Bayesian terhadap nilai AFER pada Gambar 4.6 menujukkan bahwa hasil prediksi pada jumlah iterasi 1000 dan 2000 inisialisasi

random lebih akurat dari pada inisialisasi Bayesian, tetapi pada iterasi 5000 sampai

100000 inisialisasi Bayesian lebih akurat, hal tersebut terjadi karena nilai inisialisasi bobot

random lebih besar dari pada inisialisasi Bayesian sehingga proses pelatihan inisialisasi random lebih cepat tetapi tingkat ketelitian

inisialisasi Bayesian lebih tinggi dan memerlukan jumlah iterasi yang lebih banyak untuk mencapai hasil optimal. Jumlah iterasi yang paling optimal adalah 10000 karena nilai

AFER terendah dari kedua metode adalah pada

saat iterasi ke 10000. Jadi dapat disimpulkan pada pengujian ini inisialisasi Bayesian

mempunyai tingkat akurasi lebih tinggi dari pada inisialisasi random dengan jumlah iterasi diatas 5000..

(10)

Fakultas Ilmu Komputer, Universitas Brawijaya

4.6. Pengujian Prediksi Beberapa Jangka Waktu Ke Depan

Pengujian ini melakukan prediksi dengan jangka waktu 5 tahun sekaligus yaitu tahun 2016a dengan 3 macam data latih yaitu 15 pola adalah tahun 2006b sampai 2013b, 20 pola adalah tahun 2003 sampai 2013b, dan 25 pola adalah tahun 1998 sampai 2013b. Pengujian ini dilakukan dengan cara data hasil prediksi pada tahun pertama digunakan untuk memprediksi tahun kedua begitu juga seterusnya. Hasil dari prediksi 5 tahun ke depan akan dibandingkan dengan hasil prediksi jangka waktu 1 tahun ke depan. Pengujian ini dilakukan sampai iterasi ke 10000 dengan menggunakan variabel alpha = 0,7, tmax = 2, dan h = 0,6. Pengujian ini bertujuan untuk mengetahui apakah sistem ini dapat digunakan untuk memprediksi beberapa jangka waktu ke depan. Pada pengujian ini hasil prediksi akan dibandingkan dengan data asli yang ditunjukkan pada Tabel 4.7 serta grafik yang ditunjukkan pada Gambar 4.7 dan 4.8.

Tabel 4.7 Hasil pengujian prediksi beberapa jangka waktu ke depan

Jumlah Pola Hasil 1 Tahun Kedepan 5 Tahun Ke depan 15 Hasil Prediksi 7174869 7587810 AFER (%) 2,1003 7,4282 20 Hasil Prediksi 7543560 8023116 AFER (%) 6,8852 12,4508 25 Hasil Prediksi 7593353 8078095 AFER (%) 7,4958 13,0467

Gambar 4.7 Grafik hasil pengujian prediksi beberapa jangka waktu ke depan

Gambar 4.7 Grafik hasil pengujian prediksi beberapa jangka waktu ke depan (AFER)

Berdasarkan grafik hasil pengujian prediksi beberapa jangka waktu ke depan pada Gambar 4.7 dan 4.8 menunjukkan bahwa sistem prediksi pada penelitian ini dapat digunakan untuk memprediksi 5 tahun ke depan secara langsung tetapi tingkat akurasi dari hasil prediksi lebih rendah dibandingkan dengan prediksi jangka waktu 1 tahun, hal tersebut terjadi karena data hasil prediksi pada tahun pertama digunakan untuk memprediksi tahun berikutnya. Dari hasil pengujian ini dapat disimpulkan bahwa sistem prediksi pada penelitian ini dapat digunakan untuk memprediksi beberapa tahun ke depan secara langsung tetapi hasil yang paling optimal adalah pada tahun pertama sedangkan tahun-tahun berikutnya akan semakin tidak akurat.

5. KESIMPULAN

Berdasarkan hasil dari penelitian yang telah dilakukan tentang sistem prediksi jumlah pengangguran terbuka di Indonesia menggunakan gabungan metode Bayesian dan

Backpropagation, dapat diambil kesimpulan

sebagai berikut:

1. Sistem prediksi jumlah pengangguran terbuka di Indonesia dapat diimplementasikan menggunakan gabungan metode Bayesian dan Backpropagation dengan melalui beberapa proses. Proses yang pertama adalah inisialisasi bobot menggunakan metode Bayesian yang merupakan modifikasi Kalman filter. Setelah diperoleh bobot untuk inisialisasi maka dilakukan proses training menggunakan metode Backpropagation yang meliputi 3 tahap yaitu propagasi maju (Feedforward), propagasi mundur (Backpropagation), dan

update bobot. Dari proses training akan

mendapatkan bobot optimum, bobot tersebut digunakan untuk memprediksi dengan cara

(11)

menerapkan tahap propagasi maju (Feedforward).

2. Berdasarkan hasil pengujian yang telah dilakukan dalam penelitian ini nilai Average

Forecasing Error Rate (AFER) yang

terendah adalah 2,1003%. Sistem prediksi jumlah pengangguran terbuka di Indonesia pada penelitian ini dapat melakukan prediksi beberapa jangka waktu tahun kedepan secara langsung, tetapi hasil yang paling optimal adalah pada tahun pertama sedangkan pada tahun-tahun berikutnya hasil prediksi akan semakin tidak akurat.

3. Berdasarkan hasil pengujian pada penelitian ini, perbandingan antara inisialisasi random dengan inisialisasi Bayesian adalah waktu komputasi lebih cepat inisialisasi random tetapi dari kedua metode tersebut memiliki rata-rata selisih yang sangat kecil yaitu sekitar 500 milidetik, sedangkan untuk tingkat akurasi pada jumlah iterasi diatas 5000 inisialisasi Bayesian lebih akurat dari pada inisialisasi random sehingga proses komputasi lebih lama.

6. DAFTAR PUSTAKA

Agustin, M., & Prahasto, T. (2012). Penggunaan Jaringan Syaraf Tiruan Backpropagation Untuk Seleksi Penerimaan Mahasiswa Baru Pada Jurusan Teknik Komputer Di Politeknik Negeri Sriwijaya. Jurnal Sistem Informasi

Bisnis, 2, 89–97.

Berutu, S. S. (2013). Peramalan Penjualan

Dengan Metode Fuzzy Time Series Ruey Chyn Tsaur. Universitas Diponegoro.

Kusumadewi, K. S. (2004). Analisis Jaringan Saraf Tiruan dengan Metode

Backpropagation Untuk Mendeteksi Gangguan Psikologi. Media Informatika,

2, 1–14.

Kusumadewi, S. (2003). Artificial Intelligence

(Teknik dan Aplikasinya). Yogyakarta:

Graha Ilmu.

Lukman, A. (2013). Algoritma Bayesian Network Untuk Simulasi Prediksi Pemenang PILKADA Menggunakan MSBNx. Jurnal Informatika Multimedia

(JIM) STIMED NUSA PALAPA, 2(1).

Masduqi, A., & Apriliani, E. (2008). Estimation of Surabaya River Water Quality Using Kalman Filter Algorithm. IPTEK, The