PROPOSAL TESIS SM 092306
FARIDA AMINA
NRP 1211201203
DOSEN PEMBIMBING
Prof. Dr. Mohammad Isa Irawan, M.T.
PROGRAM MAGISTER JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2014
ABSTRAK
Masalah kemiskinan merupakan salah satu persoalan mendasar yang menjadi pusat
perhatian pemerintah di negara manapun. Hampir setiap tahunnya terjadi peningkatan jumlah
penduduk miskin. Menurut BPS, penduduk miskin adalah penduduk yang memiliki rata-rata
pengeluaran per kapita per bulan dibawah Garis Kemiskinan. Namun, apabila kita melihat
realita dalam kehidupan masyarakat, dapat diasumsikan bahwa terdapat beberapa indikator
lain yang berkaitan dengan jumlah penduduk miskin, diantaranya adalah nilai PDRB, inflasi,
ekspor-impor, luas panen padi dan palawija, jumlah industri manufaktur besar dan sedang,
jumlah pengangguran, serta jumlah penduduk. Pemilihan indikator-indikator tersebut didasari
pada kenyataan bahwa adanya keterkaitan langsung dengan tingkat pendapatan penduduk.
Untuk itu, dalam penelitian ini, guna mengetahui indikator yang lebih berkaitan dengan jumlah
penduduk miskin di Kalimantan Selatan, digunakan metode PCA dan regresi berganda.
Indikator-indikator yang berhubungan erat dengan jumlah penduduk miskin di Kalimantan
Selatan yaitu PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran,
pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata
perkapita sebulan untuk kelompok buah. Koefisien regresi yang positif pada setiap variabel
bebas menunjukkan bahwa jumlah penduduk miskin akan semakin tinggi jika
indikator-indikator tersebut semakin tinggi. Namun prediksi menggunakan JST backpropagation
dengan metode PCA dan regresi berganda dibandingkan dengan data sebenarnya, maka
keakurasiannya berupa MAPE sebesar 3,36 %. Sedangkan hasil prediksi data time series
dengan data sebenarnya menghasilkan MAPE sebesar 2,24 %.
Kata kunci :
jaringan syaraf tiruan backpropagation, kemiskinan, metode PCA, regresi
berganda, prediksi.
Kemiskinan Pengeluaran Rata-Rata Perkapita Sebulan PDRB Inflasi Ekspor Luas panen
tanaman padi & palawija Industri
manufaktur besar & sedang Pengangguran Penduduk total
L
A
T
A
R
B
E
L
A
K
A
N
G
Perumusan Masalah
Berdasarkan latar belakang yang ada, maka perumusan masalah dalam penelitian
ini dapat diberikan sebagai berikut:
1. Apa saja indikator yang lebih berkaitan dengan jumlah penduduk miskin di
Kalimantan Selatan menggunakan metode PCA dan analisis regersi berganda?
2. Bagaimana memprediksi jumlah penduduk miskin diKalimantan Selatan pada tahun
2012 setiap bulannya menggunakan jaringan syaraf tiruan backpropagation?
Batasan Masalah
Untuk membatasi kajian agar lebih spesifik dan terarah, maka penelitian ini dibatasi
pada pembahasan sebagai berikut:
1. Data yang digunakan merupakan data bulanan dari tahun 2002-2011.
2. Pemilihan indikator yang dijadikan input dalam jaringan syaraf tiruan menggunakan
metode PCA dan analisis regersi berganda.
3. Algoritma pembelajaran jaringan syaraf tiruan yang digunakan adalah
Backpropagation.
Tujuan Penelitian
Dari perumusan masalah maka dapat dirumuskan tujuan penelitian ini sebagai
berikut:
1. Mengetahui indikator apa saja yang lebih berkaitan dengan jumlah penduduk miskin
di Kalimantan Selatan menggunakan metode PCA dan analisis regersi berganda.
2. Memprediksi jumlah penduduk miskin di Kalimantan Selatan pada bulan tahun 2012
setiap bulannya menggunakan jaringan syaraf tiruan backpropagation.
Manfaat Penelitian
Manfaat penelitian yang diperoleh dari penelitian ini adalah sebagai berikut:
1. Menetapkan APBD dengan lebih menitikberatkan pada beberapa indikator yang
berkaitan dengan jumlah penduduk miskin.
2. Mengevaluasi kebijakan pemerintah yang sudah ada terhadap kemiskinan.
Sebagai bahan acuan dalam pengambilan kebijakan penanggulangan kemiskinan
selanjutnya.
KAJIAN PUSTAKA DAN DASAR TEORI
• Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran per kapita per bulan dibawah Garis Kemiskinan. GKM merupakan nilai pengeluaran kebutuhan minimum makanan yang disetarakan dengan 2.100 kilo kalori per kapita per hari.
• Pengeluaran per kapita pengeluaran yang dikeluarkan per orangnya, biasanya dihitung untuk pengeluaran selama sebulan.
• Produksi tersebut diukur dalam nilai tambah (value added) yang diciptakan oleh sektor-sektor ekonomi di wilayah bersangkutan yang secara total dikenal sebagai Produk Domestik Bruto (PDB). PDB disajikan dalam dua konsep harga, yaitu harga berlaku dan harga konstan. Penghitungan pertumbuhan ekonomi menggunakan konsep harga konstan (constant prices) dengan tahun dasar tertentu untuk mengeliminasi faktor kenaikan harga. Saat ini BPS menggunakan tahun dasar 2000. • Makna inflasi adalah persentase tingkat kenaikan harga sejumlah barang dan jasa yang secara
umum dikonsumsi rumah tangga.
• Data ekspor-impor disajikan untuk memberikan informasi mengenai kinerja perdagangan luar negeri Indonesia. Data yang disajikan mencakup volume maupun nilai, termasuk data yang dirinci menurut komoditi (jenis barang dan kelompok barang), negara tujuan/asal negara, dan pelabuhan muat/bongkar barang.
• Produksi pada dasarnya merupakan hasil kali luas panen dengan produktivitas per hektare lahan, sehingga seberapa besar produksi suatu wilayah sangat tergantung berapa luas panen pada tahun yang bersangkutan atau berapa tingkat produktivitasnya.
• Konsep pengangguran yang digunakan adalah mereka yang sedang mencari pekerjaan, yang mempersiapkan usaha, yang tidak mencari pekerjaan karena merasa tidak mungkin mendapatkan pekerjaan, dan yang sudah punya pekerjaan tetapi belum mulai bekerja dan pada waktu yang bersamaan mereka tak bekerja (jobless).
JARINGAN SYARAF TIRUAN
Jaringan Syaraf Tiruan (Artificial Neural Network) adalah pemrosesan sistem informasi pada karakteristik tertentu dalam keadan yang berhubungan dengan jaringan syaraf biologi. Jaringan syaraf tiruan dibangun berdasarkan generalisasi dari model matematika pada manusia atau syaraf biologi, didasarkan pada asumsi :
1. Pemrosesan informasi terjadi pada banyak element yang disebut neuron. 2. Sinyal berjalan diantara neuron yang terkoneksi jaringan.
3. Masing masing jaringan koneksi dihubungkan dengan bobot, yang mana didalam jaringan syaraf khusus, melipatgandakan transmisi sinyal.
4. Masing masing neuron mempergunakan fungsi aktifasi (biasanya nonlinier) ke jaringan inputnya untuk menentukan sinyal output.
Jaringan syaraf dikarakteristikkan oleh (1) polanya terkoneksi diantara neuron (disebut arsitektur), (2) metode untuk menentukan bobot dari koneksi (disebut training atau learning, algoritma), dan (3) fungsi aktifasi.
Anggap sebuah neuron Y, dilustrasikan pada Gambar 2.1 , ia menerima
input dari neuron X1, X2 dan X3. Aktifasi pada neuron ini adalah x1,x2
dan x3
tentunya. Bobot dari hubungan antara X1, X2 dan X3 ke neuron Y adalah w1, w2
dan w3. net input, y_in, ke neuron Y adalah jumlah dari bobot sinyal dari neuron
X1, X2 dan X3, yaitu:
y_in = w
1x
1+ w
2x
2+ w
3x
3Gambar 2.1 Jaringan syaraf sederhana (Fausett, 1994)
X1 X2 X3 Y1 W1 W2 W3
Arsitektur
Jaringan syaraf tiruan multi-layer dengan satu layer pada unit hidden (unit Z)
ditunjukkan pada gambar 2.2. Unit-unit output (unit Y) dan unit hidden juga memiliki bias.
Bias pada unit output Y
kdilambangkan dengan w
ok, bias pada unit hidden Z
jdilambangkan
dengan v
oj. Pada fase feedforward hanya satu arah informasi yang mengalir dari operasi.
Selama fase backpropagation pada proses learning, sinyal dikirimkan pada arah sebaliknya.
Fungsi Aktivasi
Salah satu tipe fungsi aktivasi yang paling banyak digunakan adalah
fungsi sigmoid biner, yang mempunyai interval (0 , 1) dan didefinisikan
sebagai berikut:
x
x
f
exp
1
1
1dan dengan
x
f
x
f
x
f
1'
11
1Fungsi ini diilustrasikan pada gambar
METODA PENELITIAN
Tahapan Penelitian
a. Pengumpulan Data
Data yang digunakan dalam penelitian ini adalah data tahun 2002 – 2011 yaitu sebagai berikut: 1. Jumlah penduduk miskin.
2. Pengeluaran rata-rata perkapita sebulan untuk kelompok makanan yang terdiri dari 13 kelompok, yaitu: a. Padi-padian,
b. Umbi-umbian, c. Ikan,
d. Daging,
e. Telur dan susu, f. Sayur-sayuran, g. Buah-buahan, h. Minyak dan lemak, i. Bahan minuman, j. Konsumsi lainnya, k. Makanan jadi,
l. Minuman beralkohol, m. Tembakau dan sirih.
3. Pengeluaran rata-rata perkapita sebulan untuk kelompok non makanan yang terdiri dari 8 kelompok, yaitu:
a. Perumahan, bahan bakar, penerangan dan air, b. Aneka barang dan jasa,
c. Pendidikan, d. Kesehatan,
e. Pakaian,alas kaki dan tutup kepala, f. Barang yang tahan lama,
g. Pajak pemakaian dan premi asuransi, h. Keperluan pesta dan upacara.
4. Produk Domestik Regional Bruto (PDRB) yang terbagi menjadi Atas Dasar Harga Berlaku (ADHK) dan Atas Dasar Harga Konstan 2000 (ADHK) pada setiap sektornya sejumlah 9 sektor, yaitu:
a. PDRB Sektor Bangunan,
b. PDRB Sektor Industri Pengolahan, c. PDRB Sektor Jasa-Jasa,
d. PDRB Sektor Keuangan, Persewaan dan Jasa Perusahaan, e. PDRB Sektor Listrik, Gas dan Air Bersih,
f. PDRB Sektor Pengangkutan dan Komunikasi, g. PDRB Sektor Perdagangan, Hotel dan Restoran, h. PDRB Sektor Pertambangan dan Penggalian, i. PDRB Sektor Pertanian.
5. Inflasi yang terdiri dari 7 kelompok, yaitu:
a. Kelompok bahan makanan,
b. Kelompok makanan jadi, minuman, rokok, dan tembakau,
c. Kelompok perumahan, air, listrik, gas, dan bahan bakar,
d. Kelompok sandang,
e. Kelompok kesehatan,
f. Kelompok pendidikan, rekreasi, dan olahraga,
g. Kelompok transpor, komunikasi, dan jasa keuangan.
6. Ekspor menurut komiditi terbagi menjadi 5 komiditi, yaitu:
a. Kelapa sawit,
b. Karet alam,
c. Produk kayu,
d. Produk perikanan,
e. Produk tambang.
7. Luas panen tanaman padi dan palawija perbulan yang terdiri dari:
a. Padi,
b. Jagung,
c. Kedelai,
d. Kacang tanah,
e. Kacang hijau,
f. Ubi kayu,
g. Ubi jalar.
8. Jumlah industri manufaktur besar dan sedang.
9. Jumlah pengangguran.
b. Data Preprocessing/Normalisasi Data
Sebelum data input dan target yang diimplementasikan ke dalam jaringan saraf tiruan
harus terlebih dahulu melalui preprosesing data berupa penskalaan yaitu normalisasi data.
Tujuannya agar jaringan saraf dapat mengenali data yang akan menjadi masukan
bobot-bobotnya. Data akan bernilai antara 0 sampai 1, hal ini sesuai dengan fungsi aktivasi yang
akan digunakan.
𝑁 =
(𝐷 − 𝐷𝑘)
(𝐷𝑏 − 𝐷𝑘)
Keterangan:
N = Data yang sudah ternormalisasi,
D = Data yang akan dinormalisasi,
Dk = Data terkecil dari sekumpulan data,
Db = Data terbesar dari sekumpulan data.
c. Fungsi Aktivasi
Fungsi aktivasi yang digunakan pada setiap neuron adalah fungsi sigmoid
x
x
f
exp
1
1
d. Perancangan Arsitektur Jaringan
Arsitektur jaringan terdiri dari input layer sejumlah n neuron, hidden layer sejumlah p neuron, output layer terdiri dari 1 neuron yaitu jumlah penduduk miskin. Jumlah input ditentukan dengan metode PCA, sedangkan jumlah hidden ditentukan dengan cara trial
and error, dalam arti hasil pembelajaran yang tercepat dan terbaik yang akan menentukan
jumlah hidden layer tersebut.
e. Training/Pelatihan Jaringan Syaraf Tiruan
Proses pelatihan jaringan syaraf tiruan menggunakan 96 dari 120 data dengan
arsitektur neural network yang berbeda-beda. Setiap arsitektur neural network akan
menghasilkan bobot pelatihan yang terakhir yang akan digunakan sebagai bobot awal
saat melakukan pengujian.
f. Pengujian Jaringan Syaraf Tiruan
Proses pengujian jaringan syaraf tiruan menggunakan 24 dari 120 data. Pada
proses pengujian akan dihasilkan arsitektur jaringan yang terbaik berdasarkan nilai
kriteria informasi yang dihasilkan. Setelah dilakukan training dan testing pola-pola
yang dilatih, akan diperoleh hasil bahwa test terhadap pola-pola tersebut benar
(akurat). Rata–rata error jaringan pada proses testing adalah:
𝑀𝑆𝐸 =
𝑦 − 𝑦
′ 𝑛𝑖=1
𝑁
dengan
y = nilai hasil prediksi
y’ = nilai aktual data
N = jumlah nilai testing
g. Data Postprocessing/Denormalisasi
Data postprosessing adalah pengubahan dari data hasil jaringan syaraf tiruan
yang mempunyai range antara 0 sampai 1 menjadi data seperti nilai aslinya.
𝑃 = 𝑂 × 𝐷𝑏 − 𝐷𝑘 + 𝐷𝑘
P = Data postprosessing atau data yang sudah denormalisasi,
O = Data output jaringan,
Db = Data terbesar dari sekumpulan data,
Dk = Data terkecil dari sekumpulan data
Diagram Proses Penelitian Pengumpulan Data Mulai Normalisasi Data/ Data Preprocessing Perancangan Arsitektur JST Pembuatan Program
dengan MATLAB Pelatihan/ Training
Pengujian/ Testing Peramalan/ Prediction Denormalisasi Data/ Data Postprocessing Selesai Analisa dan Pembahasan Pemilihan Data Input
dengan PCA dan analisis regresi
Pengumpulan Data
Proses pertama yang dilakukan dalam penyelesaian penelitian ini setelah semua data sekunder didapatkan adalah interpolasi data yang bersifat tahunan menjadi data bulanan. Interpolasi dilakukan dengan program Eviews 7, yaitu:
1. Linear - match last,digunakan untuk data jumlah penduduk, jumlah penduduk miskin,
pengeluaran rata-rata perkapita sebulan untuk kelompok makanan dan non makanan, jumlah industri manufaktur besar dan sedang, dan jumlah pengangguran.
2. Quadratic match sum, digunakan untuk data PDRB dan nilai ekspor.
Pemilihan Data
Pada pengumpulan data sebelumnya, dicari semua data yang diasumsikan berpengaruh pada prediksi jumlah penduduk miskin. Kemudian dilakukan uji multikolinieritas dan terbukti bahwa nilai VIF masih ada yang lebih dari 10.
Oleh karena itu sebelum memprediksi, dilakukan metode pemilihan variabel dari 62 data variabel yang ada direduksi sehingga hanya beberapa data yang dianggap mewakili data – data lainnya agar tidak terjadi multikolinieritas antar variabel bebas. Jumlah data yang dipakai berdasarkan pada jumlah komponen yang memiliki nilai eigen dan variansi terbesar. Dari 62 data yang ada, terbentuk 11 komponen yang memiliki nilai eigen lebih dari 1 dengan nilai eigen terkecil 1,010 dan yang terbesar 39,932. Metode pemilihan yang digunakan adalah Principal Analysis Component (PCA).
Variabel yang memiliki nilai tertinggi pada masing – masing komponen dilihat dari rotated component
matrix yang merupakan hasil rotasi sebanyak 10 kali terhadap analisis korelasi component matrix
yaitu:
1. PDRB sektor jasa-jasa atas dasar harga konstan 2000, 2. Pengeluaran rata-rata perkapita sebulan untuk buah, 3. Nilai ekspor produk perikanan,
4. Luas panen ubi jalar,
5. Luas panen kacang tanah,
6. Inflasi kelompok makanan jadi, minuman, rokok, dan tembakau, 7. Jumlah pengangguran,
8. Pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, 9. Inflasi kelompok sandang
10. Inflasi kelompok pendidikan, rekreasi, dan olahraga, 11. Inflasi kelompok kesehatan.
Pendefinisian Variabel
Pemilihan model regresi terbaik pada penelitian ini menggunakan metode Stepwise.
Persamaan regresi linier berganda yang terbentuk adalah
𝑦 = −71339.476 + 1.107𝑥
1+ 0.092𝑥
2+ 0.151𝑥
3+0.435𝑥
4Keterangan:
𝑦 =
Penduduk Miskin
𝑥
1= PDRB sektor jasa – jasa atas dasar harga konstan
𝑥
2= Pengangguran
𝑥
3= Pengeluaran rata-rata perkapita sebulan untuk barang tahan lama
𝑥
4=
Pengeluaran rata-rata perkapita sebulan untuk kelompok buah
Interpretasi model regresi tersebut yaitu:
1. Koefisien regresi yang positif pada setiap variabel bebas menunjukkan bahwa jumlah penduduk miskin
akan semakin tinggi jika PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran,
pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata perkapita
sebulan untuk kelompok buah semakin tinggi,
2. Jika untuk satu variabel bebas berubah sebesar 1 satuan pada saat variabel bebas lainnya tetap maka
pengaruhnya terhadap jumlah penduduk miskin adalah meningkat 1,107 satuan jika PDRB sektor jasa –
jasa atas dasar harga konstan meningkat 1 satuan, meningkat 0,092 satuan jika jumlah pengangguran
meningkat 1 satuan, meningkat 0,151 satuan jika pengeluaran rata-rata perkapita sebulan untuk barang
tahan lama meningkat 1 satuan, dan meningkat 0,435 satuan jika pengeluaran rata-rata perkapita sebulan
untuk kelompok buah meningkat 1 satuan.
Metode Regresi Linier Berganda
Untuk menentukan model regresi linier berganda terbaik, digunakan metode stepwise yang merupakan gabungan dari metode forward dan backward dengan bantuan program SPSS 15. Pada model tersebut, dilakukan pengujian berupi uji asumsi klasik sebagai berikut:
1. Uji multikolinieritas
Dengan melihat tabel coefficients, apabila nilai VIF melebihi 10 dan nilai Tolerance kurang dari 0,1, maka terjadi multikolinearitas antar variabel bebas. Hasil SPSS menunjukkan bahwa nilai VIF 4 variabel bebas tersebut kurang dari 10 yaitu 𝑥1 = 2,531, 𝑥2 = 1,167, 𝑥3 = 2,261 dan 𝑥4 = 1,127. Begitu pula
dengan nilai tolerance semua variabel bebas lebih dari 0,1. Sehingga tidak terjadi gejala multikolieritas.
2. Uji heteroskedastisitas
Uji heteroskedastisitas dengan metode glejser menunjukkan jika asymp sig. pada masing-masing variabel independen > 5%, yaitu sebesar 0,823; 0,951; 0,359; 0,937, sehingga tidak terjadii heteroskedastisitas.
3. Uji autokorelasi
Berdasarkan uji Lagrange multiplier dengan nilai residual dari persamaan regresi menjadi variabel terikat, sedangkan 4 variabel bebas ditambah dengan 1 variabel bebas hasil transformasi residual, didapatkan 𝑋2
hitung (2,904) < 𝑋2tabel(7,815). Sehingga model regresi tersebut terbebas dari
autokorelasi. 4. Uji normalitas
Dari normal P-P plot of regression standardized residual, semua titik mendekati sumbu diagonal. Hasil uji Kolmogrov-Smirnov jua menunjukkan asym sig. 0,1555 < 0,05. Sehingga semua data variabel mempunyai distribusi normal.
5. Uji linieritas
Berdasarkan uji ANOVA (overall F test), semua model regresi memiliki hasil yang signifikan yaitu sebesar 0,000 < 𝛼(0,05) sehingga model berbentuk linier.
Prediksi Jumlah Penduduk Miskin
a. Perancangan dan Implementasi Arsitektur JST Backpropagation
Dalam makalah ini, penulis membagi data masing-masing untuk tahapan training dan testing, yaitu 80% untuk training dan 20% untuk testing. Dari total 120 data yang ada (12 bulan × 10 tahun), maka terdapat 96 data untuk training dan 24 data untuk testing.
Sedangkan untuk data prediksi, penulis tetap menggunakan data tahun 2002-2011, sehingga data untuk prediksi terdiri dari 120 data.
Adapun parameter arsitektur yang oeneliti gunakan dalam penelitian ini adalah sebagai berikut: 1. Jumlah Neuron :
a. Layar Input : 96 (training), 24 (testing), 120 (prediksi) b. Layar Hidden 1 : 100
c. Layar Hidden 2 : 10 d. Layar Output : 1 2. Fungsi Aktivasi: Sigmoid Biner
a. Layar Input : logsig b. Layar Hidden 1 : logsig c. Layar Hidden 2 : logsig d. Layar Output : logsig 3. Setting Parameter: a. Maks. Epoch : 10000 b. Error (Goal) : 0.0001 c. Momentum : 0.9 d. Rasio penurunan LR: 0.7 e. Rasio penaikkan LR : 1.05 4. Algoritma Training : trainrp
Arsitektur yang telah dirancang kemudian disimulasikan menggunakan Matlab R2010a dan dievaluasi dengan melihat nilai persentase keakurasiannya dengan persamaan:
𝑃 = 𝑄
Jumlah hidden layer 1 dan 2 merupakan hasil pengujian beberapa hidden layer yang tidak
jauh berbeda dengan jumlah variabel input untuk hidden layer 1. Hasil evaluasi arsitektur
untuk data training pada 4 variabel bebas dan 1 variabel tak bebas adalah sebagai berikut
Tabel 4.1 Hasil evaluasi arsitektur data training
Parameter
y
x
1x
2x
3x
4Learning
rate
0,03
0,03
0,03
0,03
0,04
Maks.
Epoch
18
22
41
68
32
Durasi
(detik)
0
0
1
1
0
MAE
0.0091813 0.00719761 0.0077511 0.00776508 0.00755
MBE
0.00203972
-
-1.36E-03 0.0006447 0.00058201 0.00128
MSE
1.27E-04
7.70E-05 9.13E-05
9.92E-05
9.73E-
05
RMSE
0.0112826 0.00877492 0.0095527 0.0099624 0.00987
R
20.99698
0.998437 0.993779
0.997575 0.99867
Akurasi
Untuk mendapatkan learning rate yang akurat memprediksi nilai data, dilakukan penambahan learning rate dalam setiap pengulangan training hingga mendapatkan nilai akurasi 100%. Kemudian dengan learning rate yang telah didapatkan, dilakukan pengujian prediksi dengan data testing.
Tabel 4.2 Hasil evaluasi arsitektur data testing
Parameter y x1 x2 x3 x4 Learning rate 0,03 0,03 0,03 0,03 0,04 Maks. Epoch 21 21 97 16 23 Durasi (detik) 0 0 2 0 0 MAE 0.0106621 0.0072426 0.00669424 0.01551 0.00624 MBE 0.00885945 0.0009843 0.00032622 -0.0125 0.00018 -MSE 1.57E-04 8.96E-05 9.99E-05 3.10E-04 1.00E-04 RMSE 0.0125418 0.0094663 0.00999267 0.01761 0.01 R2
0.990404 0.996883 0.997603 0.89181 0.99767 Akurasi
b. Validasi Arsitektur JST Backpropagation
Validasi dilakukan untuk melihat tingkat kevalidan hasil prediksi menggunakan arsitektur yang telah dirancang. Validasi dilakukan dengan cara memprediksi data tahun 2012 menggunakan data tahun 2002–2011 dari dua metode JST backpropagation, yaitu dengan memprediksi masing-masing variabel input hasil metode PCA dan dimasukkan ke persamaan regresi, sedangkan metode lain berdasarkan variabel input jumlah penduduk miskin dari bulan ke bulan pada tahun 2002-2011. Kemudian kedua hasil prediksi tersebut dibandingkan dengan data sebenarnya jumlah penduduk miskin tahun 2012.
Tabel 4.3 Hasil evaluasi arsitektur data prediksi
Parameter y x1 x2 x3 x4 Learning rate 0,03 0,03 0.03 0,03 0,04 Maks. Epoch 16 26 55 97 44 Durasi (detik) 0 1 1 2 1 MAE 0.0111728 0.00580241 0.0076439 0.00669424 0.00717 MBE 0.00723505 0.00224596 0.0007024 0.00032622 0.00024 MSE 1.62E-04 5.88E-05 9.96E-05 9.99E-05 9.98E-05 RMSE 0.0127281 0.00766917 0.0099813 0.00999267 0.00999 R2 0.995878 0.998784 0.992594 0.997603 0.99864
Tabel 4.4 Data hasil prediksi PCA dan regresi tahun 2012
Bulan
x
1x
2x
3x
4y
1
264926.34 102563.11 61396.27 4983.16 242808
2
265838.3 103811.58 61084.57 5085.56 243930
3
266659.84 105223.69 60577.63 5167.41 244929
4
267365.32 107030.75 59840.23 5283.11 245815
5
268041.21 109004.26 58918.86 5554.11 246723
6
268664.99 110855.15 57783.51 5996.31 247605
7
268839.72 113057.4 56749.63 6656.56 248132
8
269079.69 115586.53 56645.86 7149.77 248829
9
269447.73 118216.3
56812 7627.12 249711
10
269593.85 120925.43 57228.13 9134.71 250841
11
269714.15 124162.74 58152.66 11632.96 252498
12
269717.44 127460.79 58913.68 11018.81 252653
Nilai y didapatkan dari memasukkan ke persamaan regresinya. Kemudian hasil prediksi jumlah
penduduk miskin dari variabel input data tahun 2002-2011 adalah
Tabel 4.5 Data hasil prediksi dari variabel input time series jumlah penduduk miskin tahun 2002 – 2011 dan data sebenarnya tahun 2012
Bulan Data Prediksi Data Sebenarnya
1 246127 250568 2 248358 251649 3 249451 252730 4 250300 253811 5 250948 254892 6 250616 255973 7 251650 257054 8 251340 258135 9 251343 259216 10 252304 260297 11 253169 261378 12 253333 262459
Dari tabel 4.14 dan 4.15 dapat dihitung perbandingan akurasi data hasil prediksi JST backpropagation, baik dengan metode PCA dan regresi, maupun dengan time series data jumlah penduduk miskin. Bila metode PCA dan regresi dibandingkan dengan data sebenarnya, maka keakurasiannya berupa MAPE sebesar 3,36 %. Sedangkan hasil prediksi data time series dengan data sebenarnya menghasilkan MAPE sebesar 2,24 %. Hal ini berarti keakurasian lebih tinggi dengan metode time series. Bila dilihat dari hasil prediksi tiap bulannya, kedua metode meramalkan jumlah penduduk miskin tertinggi terjadi pada bulan Desember 2012.
Bulan Data Prediksi metode PCA dan regresi
Data Prediksi time series 1 253026 255572 2 253522 255926 3 253771 256030 4 253656 256466 5 253548 256448 6 253249 256411 7 253370 256648 8 253271 256774 9 252969 256802 `10 252970 257061 11 252844 257166 12 252709 257270
Kemudian dari kedua metode tersebut digunakan untuk memprediksi
jumlah penduduk miskin tahun 2013.
Hasil dari kedua metode tersebut adalah
Tabel 4.6 Data hasil prediksi metode PCA-regresi dan time series jumlah penduduk
miskin tahun 2013 Bulan Data Prediksi metode PCAdan regresi
Data Prediksi time
series 1 253026 255572 2 253522 255926 3 253771 256030 4 253656 256466 5 253548 256448 6 253249 256411 7 253370 256648 8 253271 256774 9 252969 256802 `10 252970 257061 11 252844 257166 12 252709 257270
Berdasarkan hasil dan pembahasan pada Bab 4, dapat ditarik kesimpulan sebagai berikut:
1. Dalam penentuan variabel terbaik yang dapat menggambarkan variabel tak bebas dapat dicari dengan kombinasi antara metode PCA dan regresi berganda.
2. Variabel terbaik yang dapat berhubungan erat dengan jumlah penduduk miskin di Kalimantan Selatan adalah PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran, pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata perkapita sebulan untuk kelompok buah.
3. Koefisien regresi yang positif pada setiap variabel bebas menunjukkan bahwa jumlah
penduduk miskin akan semakin tinggi jika PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran, pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata perkapita sebulan untuk kelompok buah semakin tinggi.
4. Pada kasus jumlah penduduk miskin di Kalimantan Selatan, keakurasian metode prediksi dengan PCA dan regresi lebih kecil dibandingkan prediksi dengan time series JST
backpropagation.
Berdasarkan hasil penelitian diharapkan untuk penelitian selanjutnya dapat dipilih data sekunder yang lebih lengkap agar tidak perlu ada interpolasi data guna keakuratan hasil peramalan. Selain itu, dapat pula dicari metode lain yang lebih baik dalam pemilihan variabel dan model regresi terbaik yang lebih tepat dalam menggambarkan data sesuai dengan kasus yang diambil untuk digunakan dalam peramalan. Algoritma JST yang lain dapat pula dicoba untuk melakukan prediksi.
K
E
S
I
M
P
U
L
A
N
DAFTAR PUSTAKA