GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENT
ANALYSIS
(GWRPCA) PADA PEMODELAN PENDAPATAN ASLI DAERAH
DI JAWA TENGAH
SKRIPSI
Disusun Oleh :
NURMALITA SARI
240102120008
DEPARTEMEN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
i
GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENT
ANALYSIS
(GWRPCA) PADA PEMODELAN PENDAPATAN ASLI DAERAH
DI JAWA TENGAH
Oleh
Nurmalita Sari
24010212120008
Sebagai Salah Satu Syarat untuk Memperoleh Gelar
Sarjana Sains pada Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
i
v
Puji syukur penulis ucapkan atas kehadirat Allah SWT yang telah
melimpahkan kasih dan karunia-Nya, sehingga penulis dapat menyelesaikan tugas
akhir yang berjudul
Geographically Weighted Regression Principal Component
Analysis
(
)
. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada:
1. Ibu Dra. Dwi Ispriyanti, M.Si selaku Ketua Departemen Statistika Fakultas
Sains dan Matematika Universitas Diponegoro.
2. Bapak Hasbi Yasin, S.Si, M.Si sebagai pembimbing I dan Bapak Alan
Prahutama, S.Si, M.Si sebagai pembimbing II yang telah memberikan
bimbingan dan pengarahan dalam penulisan laporan ini.
3. Bapak dan Ibu dosen Departemen Statistika Fakultas Sains dan Matematika
Universitas Diponegoro yang telah memberikan ilmu yang bermanfaat.
4. Semua pihak yang tidak dapat disebutkan satu per satu yang telah
mendukung penulis menyelesaikan penulisan laporan ini.
Penulis menyadari bahwa penulisan tugas akhir ini masih jauh dari sempurna.
Oleh karena itu, kritik dan saran yang membangun sangat penulis harapkan.
Semarang, Agustus 2016
v
ABSTRAK
s Regresi Linier Berganda merupakan metode untuk memodelkan
hubungan antara sebuah variabel respon dengan dua atau lebih variabel bebas.
Geographically Weighted Regression
(GWR) merupakan pengembangan dari
model regresi dimana setiap lokasi pengamatan mempunyai nilai parameter
regresi yang berbeda-beda akibat adanya efek heterogenitas spasial.
Regression
Principal Component Analysis
(RPCA) merupakan gabungan dari metode PCA
dan regresi untuk menghilangkan efek multikolinieritas pada model regresi.
Geographically Weighted Regression Principal Component Analysis
(GWRPCA)
merupakan gabungan dari metode PCA dan GWR apabila terjadi heterogenitas
spasial dan multikolinieritas lokal. Estimasi parameter untuk model GWR dan
GWRPCA menggunakan metode
Weighted Least Square
(WLS). Pembobotan
menggunakan fungsi kernel
fixed gaussian
melalui pemilihan
bandwidth
yang
optimum sebesar 0,08321242 dengan kriteria
Cross Validation
(CV) minimum
sebesar 3,009035. Dalam PCA didapatkan variabel-variabel yang mempengaruhi
Pendapatan Asli Daerah (PAD) di Jawa Tengah tahun 2012 dan 2013 dapat
diwakili oleh PC1
yang mampu menerangkan total varian data 71,4%. GWRPCA
merupakan model terbaik untuk memodelkan PAD di kabupaten dan kota di Jawa
Tengah dibandingkan model RPCA karena memiliki nilai
Akaike Information
Criterion
(AIC) terkecil dan R
2
terbesar.
vi
ABSTRACT
Linear Regression Analysis is a method for modeling the relation
between a response variable with two or more independent variables.
Geographically Weighted Regression (GWR) is a development of the regression
model where each observation location has different regression parameter values
because of the effects of spatial heterogenity. Regression Principal Component
Analysis (PCA) is a combination of PCA and are used to remove the effect of
multicolinearity in regression. Geographically Weighted Regression Principal
Component Analysis (GWRPCA) is a combination of PCA and GWR if spatial
heterogenity and local multicolinearity occured. Estimation parameters for the
GWR and GWRPCA using Weighted Least Square (WLS). Weighting use fixed
gaussian kernel function through selection of the optimum bandwidth is
0,08321242 with minimum Cross Validation (CV) is 3,009035. There are some
variables in PCA that affect locally-generated revenue in Central Java on 2012
and 2013, which can be represented by PC1
that explained the total variance data
about 71,4%. GWRPCA is a better model for modeling locally-generated revenue
for the districts and cities in Central Java than RPCA because it has the the
smallest Akaike Information Criterion (AIC) and the largest R
2
.
.
!"" #
A
$%A
&'('H
)*)+),H
- .-/-0J
1 21. 333333333333333333333333333333333333333333333333333333333333333333333333333333333333333 "H
- .-/-04 5 0G
5 6 -H
-0 3333333333333333333333333333333333333333333333333333333333333333333333333 ""7-8 -4 50
G
- 08-9 333333333333333333333333333333333333333333333333333333333333333333333333333333333333 "! -:6 89 -7 333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333v
-:6 89 -;8 3333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333 !" 2-<8 -9I
6I
3333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333 !"" 2-<8 -9G
- /:-9 33333333333333333333333333333333333333333333333333333333333333333333333333333333333333x
" 2-<8 -98 - :5. 3333333333333333333333333333333333333333333333333333333333333333333333333333333333333333333x
" " 2-<8 -9.-/4I
9-0 33333333333333333333333333333333333333333333333333333333333333333333333333333333333x
" "" :-:I
4 5 0 2-H
1 .1- 0=3= .)> ) ?:@*) A),B 333333333333333333333333333333333333333333333333333333333333333333333333 = =3C 9 D+DE),/)E) *)F 3333333333333333333333333333333333333333333333333333333333333333333 G =3H :)>)E),/)E ) *) F3333333333333333333333333333333333333333333333333333333333333333333333 G =3I 8 DJ D),4@, @* ">"), 33333333333333333333333333333333333333333333333333333333333333333333 K :-:LL 8 L0
J
-1-04 1 68 -bc cc
dedef
Kaiser-Mayer-Olkin
ghij keeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee fl dededMeasure Sampling of Adequancy
gim nkeeeeeeeeeeeeeeeeeeee fo depPrincipal Component Analysis
gq rn keeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee fs detGeographically Weighted Regression
gG
u v k eeeeeeeeeeeeeeeeeeeeeeee fw detef xyz c{ |y cq |}|{ ~z ~}i ~G
u veeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee d deted hoor
c |t
m |y c | eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee dd detep q ~m
c c |n
Bandwidth
|n
q ~ zm
eeeeeeeeeeeeeeeeeeeeeeeeee dd delGeographically Weighted Regression Principal Component
Analysis
gG
u v q rnkeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee dtdelef q ~ c |h~y~y |c|i ~
G
uvq rn eeeeeeeeeeeeeeeeeeee do deled q ~ c |q|}y c|q |} |{ ~z~}i~G
u v q r n eeeeeeeeee d7
deo q ~{ c c |i~ ~} |c eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee dw de7
q ~ | |z|ny c | ~}| gq nkeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee pf de8
|zor
|zor y
|n
i~m
~ |r
cq n eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee pf de8
efJ
{ | q ~ eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee pf de8
ed v ~z }c yc |~}| eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee pd de8
ep ~|| |~ }| eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee pd de8
et qv eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee pp de8
el q | ||~} | eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee pt nIII
ixj jjGI
q x x I
n x
x
ÙÚ
A
ÛÜA
ÝÞA
ßBA
Ýx
ù ùú
A
ûüA
ýüAB
þÿH
r
ùt
ùr
ù ùù ù ù
ù ù ù
J w
! ù " ù ù
n
# ù $$ ù ù
I
% &
m
ù ùn
% ùr
'r
r
n
() #*
+
7
ù ù $x
, ,,-
A
./A
01A
2 340A
5H
676869:68 ;,<69=> ?6@ 6A B?C,
J
6w
6J
6w
6DE9 F6 G@6 G H9IJ=I >>>>>>>>>>>>>>>>>>>>>>>>>>>>>> K7
:68 ;,<69I> ?6@ 6A B?C,J
6w
6J
6w
6DE9 F6 G@6 G H9IJ= L>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> KM :68 ;,<69L > ?6@ 6A B?C,J
6w
6J
6w
6DE9 F6 G@6 G H9IJ=Iy
69F? ,N@ 69 C6< O69 KP :68 ;,<69Q> ?6@ 6A B?C,J
6w
6J
6w
6DE9 F6 G@6 G H9IJ=Ly
69F? ,N@ 69 C6< O697
J :68 ;,<69R> :E@6 OD,@ , OSTT< C,96@S 6U H;6t
En
C6n
Sot
6C,J
66w
DE9F6 G >>>>>>7
= :68 ;,<69K>Vutput
B96 7 ,N,s
W EF<EN,:,9 ,E<XE< F6 9 C6 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>7
I :68 ;,<69Y>Z [,\orm
6 7 ,t
6s
Error
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>7
L :68 ;,<69M>Z [,] Et
Ero
FE9 ,t
6s
^;6 N,6 7 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>7
Q :68 ;,<69P>J
6<6 OEuclidean
;6 C6^E@,6 ;:T O6N,S 6U H;6Et
n
C6n
Sot
6 >>>>>>>>>7
R :68 ;,<69=J>_T9@T GS T8 ;T9 E9? ,6FT96 7`6@ <, ONA E8 UTUT@aH9 FN ,SErn
E7a,
x
ECb6 HNN,69;6 C6Sot
6^Em
66r
n
FCEn
F6n
` En
FFun
6O6n
Bandwidth
N EU EN 6r
JcIJRQ=YR;6 C6;Em
T CE76n
G
dW >>>>>>>>>>>>78
:68 ;,<69==>eN@,8 6N ,A6<68 E@E<`T CE7
G
dW;6 C6A B?C,J
6w
6DE9F6 G >>>>79
:68 ;,<69=I>\ ,76 ,fI
a;6 C6f6 < ,6U E7XEU 6N`T CE7G
dW>>>>>>>>>>>>>>>>>>>>>>>>>>>>>8
J :68 ;,<69=L>Z [,S E gHO H;6n
?6t
6 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>8
= :68 ;,<69=Q>Vutput
Principal Component Analysis
hA_Bi>>>>>>>>>>>>>>>>>>>>>>>>>>>>8
I :68 ;,<69=R>Vutput
WA_ B>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>8
L :68 ;,<69=K>?6@ 6A B?` E9 FFH9 6O69A_ B >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>8
Q :68 ;,<69=Y>Z [,]Et
Ero
FE9 ,t
6s
^;6 ,N 6 7m
En
FFun
6 O6n
j6r
, 6U E7A_k
x
l mnop ql ro stuvwx syx z{xp qx s|s}l o ~x so oy rl |p xxy s~ l{ |
rn
| lx
|o lo sqo o{o qot
|n
wlooq|s~o s |s ~~so o sBandwidth
| | ort qo oq|px |os w vvvv89
nop ql ro svy lp ol orop|y|rx |
G
w}lJ
oow
|s~o z vvvvv9
nop ql ro stvx |G
w }lJ
oow
|s~o z vvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvv9
nop ql ro svx |G
w }lJ
oow
|s~o z os~y
}l y oso ro s vvvvv9
nop ql ro svutput
|n
~lon
lpot
| ls
x |G
w vvvvvvvvvvvvvvvvvvvvvvvvvv9
nop ql ro sv{x |l l |n
} |t
|rm
lso ln xo qo o|p x |o s }lJ
ow
oåæåç æèéêëê ìíê ì î æï ê ìðêí åñ ìòíó ì óìôõè åê îó öêì åæìòëó ÷ê ìòíêì íõèæ÷êîó ê ìéêèêø êèóêïæ÷ ùøêèó êïæ÷éæè îæïñ éú
ûæï æèêç ê ç æìæ÷óéó ê ì éæ÷ê ë öó÷ê íñ íê ì åæìò æìêó ç æìòòñ ìê ê ì üýþÿý ÿ ý îê ÷ê ëîêéñ ìðêõ÷æë ê
zliqoh
ý.
(2015)
yang menggunakan perbandingan metode Regresi Komponen Utama dengan
Regresi Ridge untuk menganalisis faktor-faktor yang mempengaruhi Pendapatan
Asli Daerah (PAD) di Jawa Tengah. Dalam penelitian tersebut diperoleh hasil
bahwa jumlah penduduk, retribusi daerah, belanja daerah, PDRB atas harga
konstan, PDRB atas harga berlaku, dan pajak mempengaruhi PAD di Jawa
Tengah. Selain itu, hasil analisis terhadap faktor-faktor yang mempengaruhi PAD
menunjukkan bahwa terdapat masalah multikolinieritas sehingga perlu
penanganan menggunakan metode regresi komponen utama dan regresi ridge.
Perbandingan antara kedua metode menghasilkan bahwa Regresi Komponen
Utama (
Regression Principal Component Analysis
) lebih baik digunakan untuk
menganalisis faktor-faktor yang mempengaruhi PAD di Jawa Tengah
dibandingkan metode regresi ridge.
Selain itu, pada model regresi diasumsikan bahwa nilai parameter regresi
akan selalu tetap (konstan). Sehingga parameter regresi disebut juga dengan
parameter global. Artinya parameter regresi akan mempunyai nilai yang sama
untuk setiap wilayah pengamatan. Apabila diduga ada pengaruh unsur wilayah
dalam model regresi, maka metode regresi akan kurang tepat dilakukan.
! !" !! # $ !%! & %! ' !" ! %! $!%!( ) !! $, !$ 8
Fotheringham
et al.
, 2002). Untuk memberikan hasil penaksiran parameter
yang berbeda pada lokasi berbeda dibutuhkan fungsi pembobot dengan
bandwidth
optimum yang sesuai dengan kondisi data. Peran pembobot dalam GWR menjadi
penting, karena nilai pembobot mewakili letak data observasi antara satu dengan
lainnya.
GH I J KLHMH NL O P HQ LIL MRQ L SH NTH I R URT V WHV LHQ K HQHM MRIJHI HQ LV LV UHTNX Y ZUH TNXY NRYKH WHNMHVHQH\\ RNRYX J RIL NHVVWHVL HQKH IM[QNLTXQLIL RYL NHVQ X THQO
eHQ H\ V H N[ MRNXK R [ IN[ T MRI JH NHV L M HVHQ H\ \ RNRY X JRIL NHV V WHVL HQ KHI M[QNLTXQLILRYL NHV Q X THQ WHKH WRM XK RQH I ]RIKH WHNH I ^V QL _H RYH \ KL h Hd H i RIJH\ GHLN[ K RIJH I MRIJJ[ IH THI j klmnopqr sott u vkrmqwkx y kmnkz zrl{ | nr{ sr pot }l~p l{ k{w {otu zr z f ]^ gO PHV L Q KHYL H IHQ LV L V ] ^ HKHQH\ WRMXK RQ HI TXMWX IRI [NHMH WHKH cH YLH SRQZcHYLH SRQ SRSHV GH IJ MRM W R IJH Y[\L ] ^ _ WHKHM HV L IJ ZMHV L IJ Q X THV L K RIJH I M RIJJ[IH TH I WRM SX SX NKH I o{ x rxwq X WNL M[MO
2. Bagaimana membentuk variabel-variabel baru (komponen utama) yang tidak
berkorelasi sehingga dapat mewakili atau menggantikan variabel-variabel
yang berpengaruh terhadap Pendapatan Asli Daerah (PAD) di Jawa Tengah
menggunakan metode
Ķ¸¹ ¶Å Ž · Æɹ½Æ¾½»º ¿Ê· Ë»· ƶÆÂÌ Æº ¿ÀŽ Å(RPCA)?
3. Bagaimana pemodelan Pendapatan Asli Daerah (PAD) di Jawa Tengah
menggunakan metode
µ¶·¸¹º»¼½¾º ¿¿ À Á¶½¸ ¼Â¶Ã Ä ¶¸¹ ¶ÅŽ· Æ É ¹½Æ¾½ »º¿Ê· Ë»· ƶÆÂÌƺ ¿ÀŽ Å
(GWRPCA)?
4. Berdasarkan studi kasus yang diteliti, metode manakah antara RPCA dan
GWRPCA yang lebih efektif?
©ªÍ ήϮ ®¯°®®± ®²
6
menggunakan metode RPCA dan GWRPCA dengan matriks pembobot
Ð ÑÒÓ ÓÔ ÑÕ,
ÖÔ Ó ×ÒÑØÙ
,
ÙÚÛÜ ÕÙÕÝÔ ÑÞ, dan
Ý ØÔ ß ÒÖÙ.
àáâ ã
uju
äåæçåçl
èè äåt
Berdasarkan rumusan masalah, tujuan yang ingin dicapai dalam penelitian
ini adalah sebagai berikut:
1. Menentukan model Pendapatan Asli Daerah (PAD) di Jawa Tengah
menggunakan metode
G
Ù Ü ÐØ ÑÛéÔß ÑÞÞêëÙÔ Ðé ÝÙìí Ù ÐØÙ Ó ÓÔÜ Õ(GWR).
2. Mereduksi banyaknya variabel-variabel yang berpengaruh terhadap
Pendapatan Asli Daerah (PAD) di Jawa Tengah yang saling berkorelasi
menjadi sedikit variabel baru (komponen utama) dengan metode
íÙÐØÙ Ó ÓÔÜ Õî ØÔÕßÔÛ ÑÞ
C
ÜïÛÜ ÕÙ ÕÝ ÓðÕÑÞê ÓÔÓ(RPCA).
3. Menentukan model Pendapatan Asli Daerah (PAD) di Jawa Tengah dengan
memperhatikan variasi spasial menggunakan metode
G
ÙÜ ÐØ ÑÛéÔßÑÞ ÞêëÙÔ Ðé Ý ÙìíÙ ÐØÙ Ó ÓÔÜ Õî ØÔÕßÔ Û ÑÞ