PROPOSAL TESIS SM FARIDA AMINA NRP DOSEN PEMBIMBING Prof. Dr. Mohammad Isa Irawan, M.T.

(1)

PROPOSAL TESIS SM 092306

FARIDA AMINA

NRP 1211201203

DOSEN PEMBIMBING

Prof. Dr. Mohammad Isa Irawan, M.T.

PROGRAM MAGISTER JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER

SURABAYA 2014

(2)

ABSTRAK

Masalah kemiskinan merupakan salah satu persoalan mendasar yang menjadi pusat

perhatian pemerintah di negara manapun. Hampir setiap tahunnya terjadi peningkatan jumlah

penduduk miskin. Menurut BPS, penduduk miskin adalah penduduk yang memiliki rata-rata

pengeluaran per kapita per bulan dibawah Garis Kemiskinan. Namun, apabila kita melihat

realita dalam kehidupan masyarakat, dapat diasumsikan bahwa terdapat beberapa indikator

lain yang berkaitan dengan jumlah penduduk miskin, diantaranya adalah nilai PDRB, inflasi,

ekspor-impor, luas panen padi dan palawija, jumlah industri manufaktur besar dan sedang,

jumlah pengangguran, serta jumlah penduduk. Pemilihan indikator-indikator tersebut didasari

pada kenyataan bahwa adanya keterkaitan langsung dengan tingkat pendapatan penduduk.

Untuk itu, dalam penelitian ini, guna mengetahui indikator yang lebih berkaitan dengan jumlah

penduduk miskin di Kalimantan Selatan, digunakan metode PCA dan regresi berganda.

Indikator-indikator yang berhubungan erat dengan jumlah penduduk miskin di Kalimantan

Selatan yaitu PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran,

pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata

perkapita sebulan untuk kelompok buah. Koefisien regresi yang positif pada setiap variabel

bebas menunjukkan bahwa jumlah penduduk miskin akan semakin tinggi jika

indikator-indikator tersebut semakin tinggi. Namun prediksi menggunakan JST backpropagation

dengan metode PCA dan regresi berganda dibandingkan dengan data sebenarnya, maka

keakurasiannya berupa MAPE sebesar 3,36 %. Sedangkan hasil prediksi data time series

dengan data sebenarnya menghasilkan MAPE sebesar 2,24 %.

Kata kunci :

jaringan syaraf tiruan backpropagation, kemiskinan, metode PCA, regresi

berganda, prediksi.

(3)

Kemiskinan Pengeluaran Rata-Rata Perkapita Sebulan PDRB Inflasi Ekspor Luas panen

tanaman padi & palawija Industri

manufaktur besar & sedang Pengangguran Penduduk total

L

A

T

A

R

B

E

L

A

K

A

N

G

(4)

Perumusan Masalah

Berdasarkan latar belakang yang ada, maka perumusan masalah dalam penelitian

ini dapat diberikan sebagai berikut:

1. Apa saja indikator yang lebih berkaitan dengan jumlah penduduk miskin di

Kalimantan Selatan menggunakan metode PCA dan analisis regersi berganda?

2. Bagaimana memprediksi jumlah penduduk miskin diKalimantan Selatan pada tahun

2012 setiap bulannya menggunakan jaringan syaraf tiruan backpropagation?

Batasan Masalah

Untuk membatasi kajian agar lebih spesifik dan terarah, maka penelitian ini dibatasi

pada pembahasan sebagai berikut:

1. Data yang digunakan merupakan data bulanan dari tahun 2002-2011.

2. Pemilihan indikator yang dijadikan input dalam jaringan syaraf tiruan menggunakan

metode PCA dan analisis regersi berganda.

3. Algoritma pembelajaran jaringan syaraf tiruan yang digunakan adalah

Backpropagation.

(5)

Tujuan Penelitian

Dari perumusan masalah maka dapat dirumuskan tujuan penelitian ini sebagai

berikut:

1. Mengetahui indikator apa saja yang lebih berkaitan dengan jumlah penduduk miskin

di Kalimantan Selatan menggunakan metode PCA dan analisis regersi berganda.

2. Memprediksi jumlah penduduk miskin di Kalimantan Selatan pada bulan tahun 2012

setiap bulannya menggunakan jaringan syaraf tiruan backpropagation.

Manfaat Penelitian

Manfaat penelitian yang diperoleh dari penelitian ini adalah sebagai berikut:

1. Menetapkan APBD dengan lebih menitikberatkan pada beberapa indikator yang

berkaitan dengan jumlah penduduk miskin.

2. Mengevaluasi kebijakan pemerintah yang sudah ada terhadap kemiskinan.

Sebagai bahan acuan dalam pengambilan kebijakan penanggulangan kemiskinan

selanjutnya.

(6)

KAJIAN PUSTAKA DAN DASAR TEORI

• Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran per kapita per bulan di

bawah Garis Kemiskinan. GKM merupakan nilai pengeluaran kebutuhan minimum makanan yang disetarakan dengan 2.100 kilo kalori per kapita per hari.

• Pengeluaran per kapita pengeluaran yang dikeluarkan per orangnya, biasanya dihitung untuk pengeluaran selama sebulan.

• Produksi tersebut diukur dalam nilai tambah (value added) yang diciptakan oleh sektor-sektor ekonomi di wilayah bersangkutan yang secara total dikenal sebagai Produk Domestik Bruto (PDB). PDB disajikan dalam dua konsep harga, yaitu harga berlaku dan harga konstan. Penghitungan pertumbuhan ekonomi menggunakan konsep harga konstan (constant prices) dengan tahun dasar tertentu untuk mengeliminasi faktor kenaikan harga. Saat ini BPS menggunakan tahun dasar 2000. • Makna inflasi adalah persentase tingkat kenaikan harga sejumlah barang dan jasa yang secara

umum dikonsumsi rumah tangga.

• Data ekspor-impor disajikan untuk memberikan informasi mengenai kinerja perdagangan luar negeri Indonesia. Data yang disajikan mencakup volume maupun nilai, termasuk data yang dirinci menurut komoditi (jenis barang dan kelompok barang), negara tujuan/asal negara, dan pelabuhan muat/bongkar barang.

• Produksi pada dasarnya merupakan hasil kali luas panen dengan produktivitas per hektare lahan, sehingga seberapa besar produksi suatu wilayah sangat tergantung berapa luas panen pada tahun yang bersangkutan atau berapa tingkat produktivitasnya.

• Konsep pengangguran yang digunakan adalah mereka yang sedang mencari pekerjaan, yang mempersiapkan usaha, yang tidak mencari pekerjaan karena merasa tidak mungkin mendapatkan pekerjaan, dan yang sudah punya pekerjaan tetapi belum mulai bekerja dan pada waktu yang bersamaan mereka tak bekerja (jobless).

(7)

JARINGAN SYARAF TIRUAN

Jaringan Syaraf Tiruan (Artificial Neural Network) adalah pemrosesan sistem informasi pada karakteristik tertentu dalam keadan yang berhubungan dengan jaringan syaraf biologi. Jaringan syaraf tiruan dibangun berdasarkan generalisasi dari model matematika pada manusia atau syaraf biologi, didasarkan pada asumsi :

1. Pemrosesan informasi terjadi pada banyak element yang disebut neuron. 2. Sinyal berjalan diantara neuron yang terkoneksi jaringan.

3. Masing masing jaringan koneksi dihubungkan dengan bobot, yang mana didalam jaringan syaraf khusus, melipatgandakan transmisi sinyal.

4. Masing masing neuron mempergunakan fungsi aktifasi (biasanya nonlinier) ke jaringan inputnya untuk menentukan sinyal output.

Jaringan syaraf dikarakteristikkan oleh (1) polanya terkoneksi diantara neuron (disebut arsitektur), (2) metode untuk menentukan bobot dari koneksi (disebut training atau learning, algoritma), dan (3) fungsi aktifasi.

(8)

Anggap sebuah neuron Y, dilustrasikan pada Gambar 2.1 , ia menerima

input dari neuron X1, X2 dan X3. Aktifasi pada neuron ini adalah x1,x2

dan x3

tentunya. Bobot dari hubungan antara X1, X2 dan X3 ke neuron Y adalah w1, w2

dan w3. net input, y_in, ke neuron Y adalah jumlah dari bobot sinyal dari neuron

X1, X2 dan X3, yaitu:

y_in = w

1

x

1

+ w

2

x

2

+ w

3

x

3

Gambar 2.1 Jaringan syaraf sederhana (Fausett, 1994)

X1 X2 X3 Y1 W1 W2 W3

(9)

Arsitektur

Jaringan syaraf tiruan multi-layer dengan satu layer pada unit hidden (unit Z)

ditunjukkan pada gambar 2.2. Unit-unit output (unit Y) dan unit hidden juga memiliki bias.

Bias pada unit output Y

k

dilambangkan dengan w

ok

, bias pada unit hidden Z

j

dilambangkan

dengan v

oj

. Pada fase feedforward hanya satu arah informasi yang mengalir dari operasi.

Selama fase backpropagation pada proses learning, sinyal dikirimkan pada arah sebaliknya.

(10)

Fungsi Aktivasi

Salah satu tipe fungsi aktivasi yang paling banyak digunakan adalah

fungsi sigmoid biner, yang mempunyai interval (0 , 1) dan didefinisikan

sebagai berikut:

 

_{ }

x

f







exp

1

dan dengan

 

x

f

 

x



f

 

x



f

₁

'



₁

1 

₁

Fungsi ini diilustrasikan pada gambar

(11)

METODA PENELITIAN

Tahapan Penelitian

a. Pengumpulan Data

Data yang digunakan dalam penelitian ini adalah data tahun 2002 – 2011 yaitu sebagai berikut: 1. Jumlah penduduk miskin.

2. Pengeluaran rata-rata perkapita sebulan untuk kelompok makanan yang terdiri dari 13 kelompok, yaitu: a. Padi-padian,

b. Umbi-umbian, c. Ikan,

d. Daging,

e. Telur dan susu, f. Sayur-sayuran, g. Buah-buahan, h. Minyak dan lemak, i. Bahan minuman, j. Konsumsi lainnya, k. Makanan jadi,

l. Minuman beralkohol, m. Tembakau dan sirih.

(12)

3. Pengeluaran rata-rata perkapita sebulan untuk kelompok non makanan yang terdiri dari 8 kelompok, yaitu:

a. Perumahan, bahan bakar, penerangan dan air, b. Aneka barang dan jasa,

c. Pendidikan, d. Kesehatan,

e. Pakaian,alas kaki dan tutup kepala, f. Barang yang tahan lama,

g. Pajak pemakaian dan premi asuransi, h. Keperluan pesta dan upacara.

4. Produk Domestik Regional Bruto (PDRB) yang terbagi menjadi Atas Dasar Harga Berlaku (ADHK) dan Atas Dasar Harga Konstan 2000 (ADHK) pada setiap sektornya sejumlah 9 sektor, yaitu:

a. PDRB Sektor Bangunan,

b. PDRB Sektor Industri Pengolahan, c. PDRB Sektor Jasa-Jasa,

d. PDRB Sektor Keuangan, Persewaan dan Jasa Perusahaan, e. PDRB Sektor Listrik, Gas dan Air Bersih,

f. PDRB Sektor Pengangkutan dan Komunikasi, g. PDRB Sektor Perdagangan, Hotel dan Restoran, h. PDRB Sektor Pertambangan dan Penggalian, i. PDRB Sektor Pertanian.

(13)

5. Inflasi yang terdiri dari 7 kelompok, yaitu:

a. Kelompok bahan makanan,

b. Kelompok makanan jadi, minuman, rokok, dan tembakau,

c. Kelompok perumahan, air, listrik, gas, dan bahan bakar,

d. Kelompok sandang,

e. Kelompok kesehatan,

f. Kelompok pendidikan, rekreasi, dan olahraga,

g. Kelompok transpor, komunikasi, dan jasa keuangan.

6. Ekspor menurut komiditi terbagi menjadi 5 komiditi, yaitu:

a. Kelapa sawit,

b. Karet alam,

c. Produk kayu,

d. Produk perikanan,

e. Produk tambang.

(14)

7. Luas panen tanaman padi dan palawija perbulan yang terdiri dari:

a. Padi,

b. Jagung,

c. Kedelai,

d. Kacang tanah,

e. Kacang hijau,

f. Ubi kayu,

g. Ubi jalar.

8. Jumlah industri manufaktur besar dan sedang.

9. Jumlah pengangguran.

(15)

b. Data Preprocessing/Normalisasi Data

Sebelum data input dan target yang diimplementasikan ke dalam jaringan saraf tiruan

harus terlebih dahulu melalui preprosesing data berupa penskalaan yaitu normalisasi data.

Tujuannya agar jaringan saraf dapat mengenali data yang akan menjadi masukan

bobot-bobotnya. Data akan bernilai antara 0 sampai 1, hal ini sesuai dengan fungsi aktivasi yang

akan digunakan.

𝑁 =

(𝐷 − 𝐷𝑘)

(𝐷𝑏 − 𝐷𝑘)

Keterangan:

N = Data yang sudah ternormalisasi,

D = Data yang akan dinormalisasi,

Dk = Data terkecil dari sekumpulan data,

Db = Data terbesar dari sekumpulan data.

c. Fungsi Aktivasi

Fungsi aktivasi yang digunakan pada setiap neuron adalah fungsi sigmoid

 

_{ }

x

f







exp

1

(16)

d. Perancangan Arsitektur Jaringan

Arsitektur jaringan terdiri dari input layer sejumlah n neuron, hidden layer sejumlah p neuron, output layer terdiri dari 1 neuron yaitu jumlah penduduk miskin. Jumlah input ditentukan dengan metode PCA, sedangkan jumlah hidden ditentukan dengan cara trial

and error, dalam arti hasil pembelajaran yang tercepat dan terbaik yang akan menentukan

jumlah hidden layer tersebut.

(17)

e. Training/Pelatihan Jaringan Syaraf Tiruan

Proses pelatihan jaringan syaraf tiruan menggunakan 96 dari 120 data dengan

arsitektur neural network yang berbeda-beda. Setiap arsitektur neural network akan

menghasilkan bobot pelatihan yang terakhir yang akan digunakan sebagai bobot awal

saat melakukan pengujian.

f. Pengujian Jaringan Syaraf Tiruan

Proses pengujian jaringan syaraf tiruan menggunakan 24 dari 120 data. Pada

proses pengujian akan dihasilkan arsitektur jaringan yang terbaik berdasarkan nilai

kriteria informasi yang dihasilkan. Setelah dilakukan training dan testing pola-pola

yang dilatih, akan diperoleh hasil bahwa test terhadap pola-pola tersebut benar

(akurat). Rata–rata error jaringan pada proses testing adalah:

𝑀𝑆𝐸 =

𝑦 − 𝑦

′ 𝑛

𝑖=1

𝑁

dengan

y = nilai hasil prediksi

y’ = nilai aktual data

N = jumlah nilai testing

(18)

g. Data Postprocessing/Denormalisasi

Data postprosessing adalah pengubahan dari data hasil jaringan syaraf tiruan

yang mempunyai range antara 0 sampai 1 menjadi data seperti nilai aslinya.

𝑃 = 𝑂 × 𝐷𝑏 − 𝐷𝑘 + 𝐷𝑘

P = Data postprosessing atau data yang sudah denormalisasi,

O = Data output jaringan,

Db = Data terbesar dari sekumpulan data,

Dk = Data terkecil dari sekumpulan data

(19)

Diagram Proses Penelitian Pengumpulan Data Mulai Normalisasi Data/ Data Preprocessing Perancangan Arsitektur JST Pembuatan Program

dengan MATLAB Pelatihan/ Training

Pengujian/ Testing Peramalan/ Prediction Denormalisasi Data/ Data Postprocessing Selesai Analisa dan Pembahasan Pemilihan Data Input

dengan PCA dan analisis regresi

(20)

 Pengumpulan Data

Proses pertama yang dilakukan dalam penyelesaian penelitian ini setelah semua data sekunder didapatkan adalah interpolasi data yang bersifat tahunan menjadi data bulanan. Interpolasi dilakukan dengan program Eviews 7, yaitu:

1. Linear - match last,digunakan untuk data jumlah penduduk, jumlah penduduk miskin,

pengeluaran rata-rata perkapita sebulan untuk kelompok makanan dan non makanan, jumlah industri manufaktur besar dan sedang, dan jumlah pengangguran.

2. Quadratic match sum, digunakan untuk data PDRB dan nilai ekspor.

(21)

 Pemilihan Data

Pada pengumpulan data sebelumnya, dicari semua data yang diasumsikan berpengaruh pada prediksi jumlah penduduk miskin. Kemudian dilakukan uji multikolinieritas dan terbukti bahwa nilai VIF masih ada yang lebih dari 10.

Oleh karena itu sebelum memprediksi, dilakukan metode pemilihan variabel dari 62 data variabel yang ada direduksi sehingga hanya beberapa data yang dianggap mewakili data – data lainnya agar tidak terjadi multikolinieritas antar variabel bebas. Jumlah data yang dipakai berdasarkan pada jumlah komponen yang memiliki nilai eigen dan variansi terbesar. Dari 62 data yang ada, terbentuk 11 komponen yang memiliki nilai eigen lebih dari 1 dengan nilai eigen terkecil 1,010 dan yang terbesar 39,932. Metode pemilihan yang digunakan adalah Principal Analysis Component (PCA).

(22)

Variabel yang memiliki nilai tertinggi pada masing – masing komponen dilihat dari rotated component

matrix yang merupakan hasil rotasi sebanyak 10 kali terhadap analisis korelasi component matrix

yaitu:

1. PDRB sektor jasa-jasa atas dasar harga konstan 2000, 2. Pengeluaran rata-rata perkapita sebulan untuk buah, 3. Nilai ekspor produk perikanan,

4. Luas panen ubi jalar,

5. Luas panen kacang tanah,

6. Inflasi kelompok makanan jadi, minuman, rokok, dan tembakau, 7. Jumlah pengangguran,

8. Pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, 9. Inflasi kelompok sandang

10. Inflasi kelompok pendidikan, rekreasi, dan olahraga, 11. Inflasi kelompok kesehatan.

(23)

Pendefinisian Variabel

Pemilihan model regresi terbaik pada penelitian ini menggunakan metode Stepwise.

Persamaan regresi linier berganda yang terbentuk adalah

𝑦 = −71339.476 + 1.107𝑥

₁

+ 0.092𝑥

₂

+ 0.151𝑥

₃

+0.435𝑥

₄

Keterangan:

𝑦 =

Penduduk Miskin

𝑥

₁

= PDRB sektor jasa – jasa atas dasar harga konstan

𝑥

₂

= Pengangguran

𝑥

₃

= Pengeluaran rata-rata perkapita sebulan untuk barang tahan lama

𝑥

₄

=

Pengeluaran rata-rata perkapita sebulan untuk kelompok buah

Interpretasi model regresi tersebut yaitu:

1. Koefisien regresi yang positif pada setiap variabel bebas menunjukkan bahwa jumlah penduduk miskin

akan semakin tinggi jika PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran,

pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata perkapita

sebulan untuk kelompok buah semakin tinggi,

2. Jika untuk satu variabel bebas berubah sebesar 1 satuan pada saat variabel bebas lainnya tetap maka

pengaruhnya terhadap jumlah penduduk miskin adalah meningkat 1,107 satuan jika PDRB sektor jasa –

jasa atas dasar harga konstan meningkat 1 satuan, meningkat 0,092 satuan jika jumlah pengangguran

meningkat 1 satuan, meningkat 0,151 satuan jika pengeluaran rata-rata perkapita sebulan untuk barang

tahan lama meningkat 1 satuan, dan meningkat 0,435 satuan jika pengeluaran rata-rata perkapita sebulan

untuk kelompok buah meningkat 1 satuan.

(24)

Metode Regresi Linier Berganda

Untuk menentukan model regresi linier berganda terbaik, digunakan metode stepwise yang merupakan gabungan dari metode forward dan backward dengan bantuan program SPSS 15. Pada model tersebut, dilakukan pengujian berupi uji asumsi klasik sebagai berikut:

1. Uji multikolinieritas

Dengan melihat tabel coefficients, apabila nilai VIF melebihi 10 dan nilai Tolerance kurang dari 0,1, maka terjadi multikolinearitas antar variabel bebas. Hasil SPSS menunjukkan bahwa nilai VIF 4 variabel bebas tersebut kurang dari 10 yaitu 𝑥1 = 2,531, 𝑥2 = 1,167, 𝑥3 = 2,261 dan 𝑥4 = 1,127. Begitu pula

dengan nilai tolerance semua variabel bebas lebih dari 0,1. Sehingga tidak terjadi gejala multikolieritas.

2. Uji heteroskedastisitas

Uji heteroskedastisitas dengan metode glejser menunjukkan jika asymp sig. pada masing-masing variabel independen > 5%, yaitu sebesar 0,823; 0,951; 0,359; 0,937, sehingga tidak terjadii heteroskedastisitas.

3. Uji autokorelasi

Berdasarkan uji Lagrange multiplier dengan nilai residual dari persamaan regresi menjadi variabel terikat, sedangkan 4 variabel bebas ditambah dengan 1 variabel bebas hasil transformasi residual, didapatkan 𝑋2

hitung (2,904) < 𝑋2tabel(7,815). Sehingga model regresi tersebut terbebas dari

autokorelasi. 4. Uji normalitas

Dari normal P-P plot of regression standardized residual, semua titik mendekati sumbu diagonal. Hasil uji Kolmogrov-Smirnov jua menunjukkan asym sig. 0,1555 < 0,05. Sehingga semua data variabel mempunyai distribusi normal.

5. Uji linieritas

Berdasarkan uji ANOVA (overall F test), semua model regresi memiliki hasil yang signifikan yaitu sebesar 0,000 < 𝛼(0,05) sehingga model berbentuk linier.

(25)

_{Prediksi Jumlah Penduduk Miskin}

a. Perancangan dan Implementasi Arsitektur JST Backpropagation

Dalam makalah ini, penulis membagi data masing-masing untuk tahapan training dan testing, yaitu 80% untuk training dan 20% untuk testing. Dari total 120 data yang ada (12 bulan × 10 tahun), maka terdapat 96 data untuk training dan 24 data untuk testing.

Sedangkan untuk data prediksi, penulis tetap menggunakan data tahun 2002-2011, sehingga data untuk prediksi terdiri dari 120 data.

Adapun parameter arsitektur yang oeneliti gunakan dalam penelitian ini adalah sebagai berikut: 1. Jumlah Neuron :

a. Layar Input : 96 (training), 24 (testing), 120 (prediksi) b. Layar Hidden 1 : 100

c. Layar Hidden 2 : 10 d. Layar Output : 1 2. Fungsi Aktivasi: Sigmoid Biner

a. Layar Input : logsig b. Layar Hidden 1 : logsig c. Layar Hidden 2 : logsig d. Layar Output : logsig 3. Setting Parameter: a. Maks. Epoch : 10000 b. Error (Goal) : 0.0001 c. Momentum : 0.9 d. Rasio penurunan LR: 0.7 e. Rasio penaikkan LR : 1.05 4. Algoritma Training : trainrp

Arsitektur yang telah dirancang kemudian disimulasikan menggunakan Matlab R2010a dan dievaluasi dengan melihat nilai persentase keakurasiannya dengan persamaan:

𝑃 = 𝑄

(26)

Jumlah hidden layer 1 dan 2 merupakan hasil pengujian beberapa hidden layer yang tidak

jauh berbeda dengan jumlah variabel input untuk hidden layer 1. Hasil evaluasi arsitektur

untuk data training pada 4 variabel bebas dan 1 variabel tak bebas adalah sebagai berikut

Tabel 4.1 Hasil evaluasi arsitektur data training

Parameter

y

x

1

x

2

x

3

x

4

Learning

rate

0,03

0,04

Maks.

Epoch

18

22

41

68

32 Durasi

(detik)

0

1

0 MAE

0.0091813 0.00719761 0.0077511 0.00776508 0.00755

MBE

0.00203972

-

-1.36E-03 0.0006447 0.00058201 0.00128

MSE

1.27E-04

7.70E-05 9.13E-05

9.92E-05

9.73E-

05 RMSE

0.0112826 0.00877492 0.0095527 0.0099624 0.00987

R

2

_0.99698

_{0.998437 0.993779}

_{0.997575 0.99867}

Akurasi

(27)

Untuk mendapatkan learning rate yang akurat memprediksi nilai data, dilakukan penambahan learning rate dalam setiap pengulangan training hingga mendapatkan nilai akurasi 100%. Kemudian dengan learning rate yang telah didapatkan, dilakukan pengujian prediksi dengan data testing.

Tabel 4.2 Hasil evaluasi arsitektur data testing

Parameter y x1 x2 x3 x4 Learning rate 0,03 0,03 0,03 0,03 0,04 Maks. Epoch 21 21 97 16 23 Durasi (detik) 0 0 2 0 0 MAE _{0.0106621 0.0072426 0.00669424 0.01551 0.00624} MBE _0.00885945 _{0.0009843 0.00032622 -0.0125 0.00018} -MSE _1.57E-04 _8.96E-05 _9.99E-05 3.10E-₀₄ 1.00E-₀₄ RMSE _{0.0125418 0.0094663 0.00999267 0.01761} _0.01 R2

0.990404 0.996883 0.997603 0.89181 0.99767 Akurasi

(28)

b. Validasi Arsitektur JST Backpropagation

Validasi dilakukan untuk melihat tingkat kevalidan hasil prediksi menggunakan arsitektur yang telah dirancang. Validasi dilakukan dengan cara memprediksi data tahun 2012 menggunakan data tahun 2002–2011 dari dua metode JST backpropagation, yaitu dengan memprediksi masing-masing variabel input hasil metode PCA dan dimasukkan ke persamaan regresi, sedangkan metode lain berdasarkan variabel input jumlah penduduk miskin dari bulan ke bulan pada tahun 2002-2011. Kemudian kedua hasil prediksi tersebut dibandingkan dengan data sebenarnya jumlah penduduk miskin tahun 2012.

Tabel 4.3 Hasil evaluasi arsitektur data prediksi

Parameter y x1 x2 x3 x4 Learning rate _0,03 _0,03 _0.03 _0,03 _0,04 Maks. Epoch ₁₆ ₂₆ ₅₅ ₉₇ ₄₄ Durasi (detik) ₀ ₁ ₁ ₂ ₁ MAE _{0.0111728 0.00580241 0.0076439 0.00669424 0.00717} MBE _{0.00723505 0.00224596 0.0007024 0.00032622 0.00024} MSE _1.62E-04 _5.88E-05 _9.96E-05 _{9.99E-05 9.98E-05} RMSE _{0.0127281 0.00766917 0.0099813 0.00999267 0.00999} R2 _0.995878 _{0.998784 0.992594} _{0.997603 0.99864}

(29)

Tabel 4.4 Data hasil prediksi PCA dan regresi tahun 2012

Bulan

_x

₁

_x

₂

_x

₃

_x

₄

_y

1 _{264926.34 102563.11 61396.27 4983.16 242808}

2 _{265838.3 103811.58 61084.57 5085.56 243930}

3 _{266659.84 105223.69 60577.63 5167.41 244929}

4 _{267365.32 107030.75 59840.23 5283.11 245815}

5 _{268041.21 109004.26 58918.86 5554.11 246723}

6 _{268664.99 110855.15 57783.51 5996.31 247605}

7 _{268839.72 113057.4 56749.63 6656.56 248132}

8 _{269079.69 115586.53 56645.86 7149.77 248829}

9 _{269447.73 118216.3}

_{56812 7627.12 249711}

10 _{269593.85 120925.43 57228.13 9134.71 250841}

11 _{269714.15 124162.74 58152.66 11632.96 252498}

12 _{269717.44 127460.79 58913.68 11018.81 252653}

Nilai y didapatkan dari memasukkan ke persamaan regresinya. Kemudian hasil prediksi jumlah

penduduk miskin dari variabel input data tahun 2002-2011 adalah

(30)

Tabel 4.5 Data hasil prediksi dari variabel input time series jumlah penduduk miskin tahun 2002 – 2011 dan data sebenarnya tahun 2012

Bulan Data Prediksi Data Sebenarnya

1 246127 250568 2 248358 251649 3 249451 252730 4 250300 253811 5 250948 254892 6 250616 255973 7 251650 257054 8 251340 258135 9 251343 259216 10 252304 260297 11 253169 261378 12 253333 262459

Dari tabel 4.14 dan 4.15 dapat dihitung perbandingan akurasi data hasil prediksi JST backpropagation, baik dengan metode PCA dan regresi, maupun dengan time series data jumlah penduduk miskin. Bila metode PCA dan regresi dibandingkan dengan data sebenarnya, maka keakurasiannya berupa MAPE sebesar 3,36 %. Sedangkan hasil prediksi data time series dengan data sebenarnya menghasilkan MAPE sebesar 2,24 %. Hal ini berarti keakurasian lebih tinggi dengan metode time series. Bila dilihat dari hasil prediksi tiap bulannya, kedua metode meramalkan jumlah penduduk miskin tertinggi terjadi pada bulan Desember 2012.

(31)

Bulan Data Prediksi metode PCA dan regresi

Data Prediksi time series 1 253026 255572 2 253522 255926 3 253771 256030 4 253656 256466 5 253548 256448 6 253249 256411 7 253370 256648 8 253271 256774 9 252969 256802 `10 252970 257061 11 252844 257166 12 252709 257270

Kemudian dari kedua metode tersebut digunakan untuk memprediksi

jumlah penduduk miskin tahun 2013.

Hasil dari kedua metode tersebut adalah

Tabel 4.6 Data hasil prediksi metode PCA-regresi dan time series jumlah penduduk

miskin tahun 2013 Bulan Data Prediksi metode PCA

dan regresi

Data Prediksi time

series 1 253026 255572 2 253522 255926 3 253771 256030 4 253656 256466 5 253548 256448 6 253249 256411 7 253370 256648 8 253271 256774 9 252969 256802 `10 252970 257061 11 252844 257166 12 252709 257270

(32)

Berdasarkan hasil dan pembahasan pada Bab 4, dapat ditarik kesimpulan sebagai berikut:

1. Dalam penentuan variabel terbaik yang dapat menggambarkan variabel tak bebas dapat dicari dengan kombinasi antara metode PCA dan regresi berganda.

2. Variabel terbaik yang dapat berhubungan erat dengan jumlah penduduk miskin di Kalimantan Selatan adalah PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran, pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata perkapita sebulan untuk kelompok buah.

3. Koefisien regresi yang positif pada setiap variabel bebas menunjukkan bahwa jumlah

penduduk miskin akan semakin tinggi jika PDRB sektor jasa – jasa atas dasar harga konstan, jumlah pengangguran, pengeluaran rata-rata perkapita sebulan untuk barang tahan lama, dan pengeluaran rata-rata perkapita sebulan untuk kelompok buah semakin tinggi.

4. Pada kasus jumlah penduduk miskin di Kalimantan Selatan, keakurasian metode prediksi dengan PCA dan regresi lebih kecil dibandingkan prediksi dengan time series JST

backpropagation.

Berdasarkan hasil penelitian diharapkan untuk penelitian selanjutnya dapat dipilih data sekunder yang lebih lengkap agar tidak perlu ada interpolasi data guna keakuratan hasil peramalan. Selain itu, dapat pula dicari metode lain yang lebih baik dalam pemilihan variabel dan model regresi terbaik yang lebih tepat dalam menggambarkan data sesuai dengan kasus yang diambil untuk digunakan dalam peramalan. Algoritma JST yang lain dapat pula dicoba untuk melakukan prediksi.

K

E

S

I

M

P

U

L

A

N

(33)

DAFTAR PUSTAKA

Al-Foul, B. M. A. (2012), Forecasting Energy Demand in Jordan Using Artificial Neural Networks,

Topics in Middle Eastern and African EconomiesVol. 14, hal. 473-478, Sharjah.

BPS (2012), Berita Resmi Statistik, Profil Kemiskinan Di Indonesia September 2011, No. 06/01/Th. XV,

2 Januari 2012, Jakarta.

Fausett, L. (1994), Fundamentals Neural Networks, Architectures, Algorithms, and Applications,

Prentice-Hall, USA.

Kheirkhah, A., dkk (2012), Improved Estimation of Electricity Demand Function by Using of Artificial

Neural Network, Principal Component Analysis and Data Envelopment Analysis, Computers and

Industrial Engineering 64, hal. 425-441, Iran.

Kusumadewi, S. (2004), Membangun Jaringan Syaraf Tiruan Menggunakan MATLAB & Excel Link,

Graha Ilmu, Yogyakarta.

Noori, R., dkk (2011), “Assessment of Input Variables Determination on The SVM Model Performance

Using PCA, Gamma test, and Forward Selection Techniques for Monthly Stream Flow

Prediction”, Journal of Hydrology 401, hal. 177–189, Iran.

Ulfah, F.M. (2011), Penerapan Jaringan Syaraf Tiruan RBF dan Metode PCA dalam Memprediksi Risiko

(34)