MIXED GEOGRAPHICALLY WEIGHTED MULTIVARIATE
LINEAR MODEL
1
Memi Nor Hayati,2Purhadi
1Jurusan Statistika FIMPA Universitas Mulawarman Samarinda 2Jurusan Statistika FMIPA Institut Teknologi Sepuluh November Surabaya
Alamat e-mail : meminorhayati@yahoo.com
ABSTRAK
Model linier multivariat adalah model linier dengan variabel respon lebih dari satu.
Geographically Weighted Multivariate Linier Model (GWMLM) merupakan
pengembangan dari model linier multivariat, dimana variabel respon lebih dari dari satu dan informasi lokasi diketahui. Pada model linier multivariat hanya dihasilkan penaksir parameter yang berlaku secara global, sedangkan dalam GWMLM dihasilkan penaksir parameter model yang bersifat lokal untuk setiap titik pengamatan atau lokasi dimana data tersebut diperoleh. Akan tetapi, pada kenyataannya tidak semua variabel prediktor dalam GWMLM mempunyai pengaruh secara lokal. Beberapa variabel prediktor berpengaruh secara global, sedangkan yang lainnya dapat mempertahankan pengaruhnya secara lokal. Oleh karena itu dikembangkan suatu metode Mixed
Geographically Weighted Multivariate Linier Model (MGWMLM) yang merupakan
gabungan dari model linier multivariat dan GWMLM. Hasil penelitian menunjukkan bahwa penaksiran parameter MGWMLM dapat dilakukan dengan metode Weighted
Least Square (WLS). Pemilihan bandwidth optimum digunakan metode Cross Validation (CV). Pengujian kesesuaian model regresi multivariat dan MGWMLM
didekati dengan distribusi F begitu juga pada pengujian parameter MGWMLM secara serentak, sedangkan pengujian parameter MGWMLM secara parsial baik untuk parameter global dan parameter lokal menggunakan distribusi t.
Kata Kunci : Geographically Weighted Multivariate Linier Model, Mixed
Geographically Weighted Multivariate Linier Model, Weighted Least Square, Cross Validation, fungsi kernel Gaussian.
PENDAHULUAN
Metode regresi merupakan salah satu metode statistika yang paling umum digunakan. Metode regresi merupakan metode yang digunakan untuk memodelkan hubungan antara variabel respon dengan variabel prediktor. Salah satu metode yang digunakan dalam menaksir parameter model regresi adalah metode Ordinary Least Square (OLS) dengan asumsi error identik (homoscedasticity) dan independen (non autokorelasi) yang harus dipenuhi untuk mendapatkan taksiran parameter model
untuk semua data [3]. Hal inilah yang menyebabkan ketidaksesuaian model pada data spasial yang memiliki dependensi spasial dan atau heterogenitas spasial [1].
Apabila analisis yang dilakukan dengan metode regresi menunjukkan
error tidak identik dan atau terjadi
autokorelasi, maka hal ini mengindikasikan bahwa parameter model regresi dipengaruhi oleh faktor lain, dalam hal ini adalah faktor geografis. Oleh karena itu dalam analisis data spasial faktor geografis merupakan faktor
penting dalam penentuan pembobot yang digunakan [5].
Geographically Weighted Regression
(GWR) merupakan salah satu metode yang dapat digunakan untuk menganalisis data yang memiliki heterogenitas spasial. Metode GWR menggunakan faktor geografis sebagai variabel prediktor yang dapat mempengaruhi variabel respon [4]. Model GWR merupakan pengembangan dari model regresi linier, yang mana dalam model regresi linier hanya dihasilkan penaksir parameter yang berlaku secara global, sedangkan dalam model GWR dihasilkan penaksir parameter model yang bersifat lokal untuk setiap lokasi pengamatan. Dalam berbagai bidang ilmu, metode GWR banyak digunakan oleh peneliti untuk menganalisis data spasial, karena metode GWR ini dapat digunakan untuk mengetahui pengaruh variabel prediktor terhadap variabel respon baik secara global maupun secara lokal dengan mempertimbangkan faktor lokasi sebagai pembobot untuk menaksir parameter model [6][7].
Pada kenyataannya seringkali tidak semua variabel prediktor dalam model GWR berpengaruh secara lokal. Terkadang, beberapa variabel prediktor berpengaruh secara global, sedangkan yang lainnya dapat mempertahankan pengaruh lokal atau spasialnya. Oleh karena itu, selanjutnya model GWR dikembangkan menjadi model Mixed
Geographically Weighted Regression
(MGWR) [4]. Model MGWR adalah gabungan dari model regresi linier global dengan model GWR, sehingga pada model MGWR akan dihasilkan penaksir parameter yang sebagian bersifat global dan sebagian lainnya bersifat lokal sesuai dengan lokasi pengamatan data. Pendekatan yang digunakan untuk menaksir parameter model MGWR dapat dilakukan dengan metode Weighted Least
Square (WLS) sama seperti halnya pada
model GWR [4].
Jika pada GWMLM tidak semua variabel prediktornya mempunyai pengaruh secara lokal, sebagian berpengaruh secara global, maka GWMLM dapat dikembangkan menjadi
Mixed Geographically Weighted
Multivariate Linier Model (MGWMLM).
Pada MGWMLM beberapa koefisien pada GWMLM diasumsikan konstan untuk seluruh lokasi pengamatan sedangkan yang lain bervariasi sesuai lokasi pengamatan data. MGWMLM merupakan gabungan dari Model Linier Multivariat dengan GWMLM, sehingga dengan MGWMLM akan dihasilkan penaksir parameter yang sebagian bersifat global dan sebagian yang lain bersifat lokal sesuai dengan lokasi pengamatan. Namun belum pernah ditemukan referensi yang membahas penaksir parameter MGWMLM demikian juga dengan statistik uji yang digunakan untuk mengukur signifikansi parameternya. Oleh karena itu penulis tertarik untuk membahas tentang penaksir parameter MGWMLM dengan metode WLS dan untuk mendapatkan bentuk statistik uji dari MGWMLM digunakan metode Maximum Likelihood
Ratio Test (MLRT).
METODE PENELITIAN
Metode dan tahapan yang dilakukan untuk mencapai tujuan dalam penelitian ini adalah sebagai berikut:
1. Menaksir parameter MGWMLM 1.1 Memformulasikan
MGWMLM seperti pada persamaan
1.2 Menentukan fungsi pembobot 1.3 Menentukan variabel
prediktor global Xg dan variabel prediktor lokal Xl
1.4 Membentuk MGWMLM ke dalam model GWMLM
1.5 Menaksir parameter variabel prediktor lokal dengan menggunakan metode WLS seperti pada GWMLM.
1.6 Menaksir parameter variabel prediktor global dengan menggunakan metode OLS 1.7 Mensubstitusikan penaksir
parameter variabel prediktor global ke dalam penaksir parameter variabel prediktor lokal pada langkah ke (1.5) untuk memperoleh estimator parameter yang baru.
2. Pengujian hipotesis pada MGWMLM
2.1 Melakukan pengujian kesesuaian model antara regresi multivariat dengan MGWMLM
2.2 Melakukan pengujian secara serentak parameter MGWMLM
2.3 Melakukan pengujian secara parsial parameter variabel prediktor global
2.4 Melakukan pengujian secara parsial parameter variabel prediktor lokal HASIL PENELITIAN Penaksiran Parameter lh
u vi, i
dan gh MGWMLMPenaksiran parameter pada
MGWMLM dilakukan dengan
mengidentifikasi manakah yang merupakan variabel prediktor lokal dan variabel prediktor global terlebih dahulu, dapat dinyatakan sebagai berikut:
,
h l lh i i g gh h y X u v X (1)Langkah awal ialah menuliskan MGWMLM dalam bentuk GWMLM sebagai berikut:
,
h h g gh l lh i i h y y X X u v (2)Teknik penaksiran parameter yang digunakan untuk menaksir parameter MGWMLM ialah seperti dalam GWMLM, sehingga lh
u vi, i
dapat
ditentukan sebagai berikut:
0 1 1 ˆ , ˆ , ˆ , ˆ , , , T lh i i h i i h i i bh i i T T l i i l l i i h u v u v u v u v u v u v y X W X X W (3) Misalkan
1 1 2
T li i i ib x x x x merupakan elemen baris ke-i dari matriks
l
X . Maka nilai prediksi untuk yh pada
u vi, i diperoleh dengan:
1 ˆ T ˆ , T T , T , ih li lh i i li l i i l l i i h y x u v x X W u v X X W u v y Untuk seluruh pengamatan dapat dinyatakan sebagai berikut:
1 2 ˆ ˆ ˆ ˆ T h h h nh l h y y y y S y dengan
1 1 1 1 1 1 1 2 2 2 2 2 1 , , , , , , T T T l l l l T T T l l l l l T T T ln l n n l l n n x u v u v x u v u v x u v u v X W X X W X W X X W S X W X X W (4)Selanjutnya, mensubstitusikan element dari ˆlhu vi, i
dalam MGWMLM dan
dengan pendekatan OLS, diperoleh penaksir untuk gh sebagai berikut: ( 1), ( 2), 1 ˆ ˆ ˆ ˆ T gh b h b h ph T T T T g l l g g l l yh X I S I S X X I S I S (5) Apabila ˆgh pada persamaan (5)
disubstitusikan ke persamaan (3) maka akan diperoleh penaksir untuk koefisien lokal pada lokasi u vi, i pada respon ke-h adalah:
1 1 ˆ , , , ˆ , , T T lh i i l i i l l i i h T T l i i l l i i h g gh u v u v u v y u v u v y X W X X W X W X X W X (6) Sehingga fitted-value dari respon ke-h pada koefisien lokal dari n lokasi pengamatan ialah:
ˆ ˆ h l h l h g gh y y y S S X maka, nilai fitted-value dari respon ke-h untuk n lokasi pengamatan adalah:
1 2 1 1 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ T h h h nh h g gh l h g gh g gh l h l g gh T T T T l h l g g l l g g l l h T T T T l l g g l l g g l l h h y y y y y y y y y y y X S X X S I S X S I S X X I S I S X X I S I S S I S X X I S I S X X I S I S S (7) dimana: T 1 T T T l l g g l l g g l l S S I S X X I S I S X X I S I S (8) sedangkan
1 T T g g g g g S X X X X (9)Berdasarkan pada metode WLS diperoleh penaksir parameter lh
u vi, i
persamaan (6) dan gh
persamaan (5), maka penaksir untukBl
u vi, i
dan Bgadalah: 1 1 1 1 2 2 1 1 ˆ ˆ ˆ ˆ T T T T T T g l l g g l l g T T T T g g l l g g l l g gq T T T T g l l g g l l q T T g l l g g y y y X I S I S X X I S I S X I S I S X X I S I S B X I S I S X X I S I S X I S I S X X T T l l I S I S Y (10)
1 2 1 1 1 1 2 2 1 ˆ , ˆ , ˆ , ˆ , ˆ , , ˆ , , ˆ , , T l i i l i i l i i lq i i T T T l i i l l i i g g T T l i i l l i i g g T T l i i l l i i q g gq u v u v u v u v u v u v y u v u v y u v u v y B X W X X W X X W X X W X X W X X W X 1
ˆ
, , T T l u vi i l l u vi i g g X W X X W Y X B (11) dengan: Yn q y1 y2 ... yq. Penaksir Parameter Matriks
Varians-Kovarian Σ MGWMLM
Penaksir parameter matriks varians-kovarian error ΣMGWMLM diperoleh
dengan terlebih dahulu memperhatikan sifat kelokalan MGWMLM. Pada MGWMLM penaksiran parameter untuk tiap pengamatan ke-i dan respon ke-h adalah seperti pada persamaan (7) dan dari persamaan ini diperoleh:
ˆ ˆ ( ) h h h h h h y y y y y S I S sehingga nilai dari jumlah kuadrat error untuk respon ke-h adalah:
ˆ T ˆ h h h T h h T T h h SSE y y y y I S I S I S I S (12)persamaan (12) dapat dimodifikasi dengan memperhatikan E
ˆh dan
varians error-nya, sehingga didapatkan penaksir 2
h
yang tak bias ialah:
2 ˆ h h T SS E tr I S I S (13) dan untuk dan penaksir hh* yang takbias ialah:
*
* ˆ h h h h T SSE E tr I S I S (14)Sedangkan untuk SSE Eh h* dapat
ditentukan dengan menggunakan persamaan (12) sebagai berikut:
* * * * ˆ Tˆ h h h h T h h T T h h SSE E y y y y I S I S I S I S (15)Nilai SSPE pada persamaan dapat juga ditentukan dengan:
ˆ ˆ . T T T T T SSPE E E Y Y Y Y I S Y I S Y Y I S I S Y (16)sehingga penaksir parameter matriks varians-kovarian error Σ MGWMLM diperoleh dengan:
ˆ MGWMLM T T T SSPE n rank tr Σ X Y I S I S Y I S I S (17) Pengujian Hipotesis MGWMLM Pada MGWMLM pengujianhipotesisnya dilakukan dengan menggunakan metode MLRT. Pengujian hipotesis dalam MGWMLM yang pertama dilakukan ialah uji kesesuaian koefisien parameter secara serentak dari model regresi linier multivariat dengan MGWMLM, selanjutnya pengujian hipotesis secara serentak pada MGWMLM dan juga pengujian hipotesis secara parsial parameter variabel global dan parameter variabel lokal pada MGWMLM.
Pengujian Kesesuaian MGWMLM
Pengujian hipotesis kesesuaian
MGWMLM dilakukan dengan
membandingkan antara model regresi linier multivariat dengan MGWMLM dengan hipotesis sebagai berikut:
0
H :kh u vi, i kh,k0,1, 2,..., danb h1, 2,...,q
(MGWMLM tidak berbeda dengan model regresi linier multivariat)
1
H : minimal ada satu kh
u vi, i
kh(MGWMLM berbeda dengan model regresi linier multivariat)
Uji rasio likelihood dilakukan berdasarkan pada selisih matriks error antara model linear multivariat dengan MGWMLM yang dibagi dengan SSPE dari MGWMLM sebagai berikut:
2 1 1 2 1 2 1 2 1 T T T * T u T n p u , u n p u F ~ F u u Y I H Y Y I S I S Y Y I S I S Y (18)dengan menggunakan tingkat signifikansi (α) maka keputusan yang diambil ialah
0
H ditolak jika nilai 2 1 1 2 * ; , 1 u n p u u F F
atau dapat dikatakan minimal ada satu
,
kh u vi i kh
atau MGWMLM berbeda dengan model regresi linier multivariat.
Pengujian Hipotesis Serentak
MGWMLM
Setelah dilakukan pengujian kesesuaian MGWMLM, maka langkah selanjutnya akan dilakukan uji serentak pada MGWMLM. Pengujian serentak parameter MGWMLM ditujukan untuk mengetahui signifikansi variabel-variabel prediktor pada MGWMLM secara serentak. Pengujian serentak pada MGWMLM dilakukan dengan hipotesis sebagai berikut:
0 1 2 ( 1), ( 2),
H :h u vi, i h u vi, i ... bh u vi, i b hb hph0
1
H : minimal ada satu parameter yang
tidak sama dengan nol
Uji rasio likelihood dilakukan dengan cara membandingkan SSPE dibawah H0
(SSPE
H0 ) yang dibagi dengan SSPE dari MGWMLM (SSPE
H1 ) sebagai berikut: 2 2 1 1 2 2 2 1 2 * , 2 1 2 2 ~ T T l l T u u T u u u u F F u u Y I S I S Y Y I S I S Ydengan menggunakan tingkat signifikansi (α) maka keputusan yang diambil ialah
0
H ditolak jika nilai 2 2 1 1 2 2 * , 2 u u u u F F atau
dapat dikatakan minimal ada satu parameter yang tidak sama dengan nol.
Pengujian Hipotesis Parsial
MGWMLM
Selain melakukan pengujian serentak, dalam MGWMLM juga akan dilakukan pengujian parsial parameter MGWMLM untuk mengetahui variabel global dan lokal yang berpengaruh signifikan terhadap variabel respon. Pengujian signifikansi suatu variabel global
1
k
x b k p dilakukan dengan
hipotesis sebagai berikut: H0: kh 0
H1: kh 0
untuk h1, 2,...,q dan
b 1 k p
Pengujian tingkat signifikansi parameter variabel global kh ialah dengan cara
mencari penaksir kh yang yang
berdistribusi normal dengan rata-rata kh
dan matrik varians-kovarian ˆkh yaitu
ˆ T 1
MGWMLM g g Σ X X , sehingga diperoleh:
ˆ ~ ˆ g kh kh n rank kh t SE Xnilai standar error (SE) dari ˆkh adalah sebagai berikut:
ˆkh kk
SE g .
Nilai SE dari ˆkh digunakan untuk menguji tingkat signifikansi kh dengan statistik uji t dan dibawah H0 untuk
0 kh diperoleh:
ˆ ˆ kh g kh t SE dengan
b 1 k p
dibawah H0, tg akan mengikuti distribusi t dengan derajat bebas
nrank Xg
, dengan menggunakantingkat signifikansi (α) maka, keputusan yang diambil ialah H0 ditolak jika nilai
; 2 g g n rank t t X .
Pengujian hipotesis selanjutnya yakni untuk mengetahui variabel lokal yang berpengaruh signifikan terhadap respon
dalam MGWMLM. Pengujian
signifikansi suatu variabel lokal
1
k
x k b dilakukan dengan hipotesis sebagai berikut:
H0: kh
u vi, i
0H1: kh
u vi, i
0untuk h1, 2,...,q dan
1 k b
Pengujian tingkat signifikansi parameter variabel lokal kh
u vi, i
ialah dengan cara mencari penaksir kh
u vi, i
yang yang berdistribusi normal dengan rata-rata kh
u vi, i
dan matrikvarians-kovarian ˆkhu vi, i yaitu
ˆ 1
, T MGWMLM l u vi i l Σ X W X , sehingga diperoleh:
ˆ , , ~ ˆ , l kh i i kh i i n rank kh i i u v u v t SE u v Xnilai standar error (SE) dari ˆkhu vi, i
adalah sebagai berikut:
ˆ ,
kh i i kk
SE u v m .
dimana mkk adalah elemen diagonal
ke-k+1 dari matrik
ˆ 1
, T MGWMLM l u vi i l Σ X W X .Nilai SE dari ˆkhu vi, i digunakan untuk menguji tingkat signifikansi
,
kh u vi i
dengan statistik uji t dan dibawah H0 untuk kh
u vi, i
0 diperoleh:
ˆ , ˆ , kh i i l kh i i u v t SE u v dengan
1 k b
dibawah H0, tl akan mengikuti distribusi
t dengan derajat bebas
nrank
Xg
, dengan menggunakan tingkat signifikansi (α) maka, keputusan yang diambil ialah0
H ditolak jika nilai
; 2 l l n rank t t X . KESIMPULAN
Berdasarkan hasil analisa data dan pembahasan, dapat diambil beberapa kesimpulan sebagai berikut:
1. Metode MGWMLM adalah suatu metode pemodelan yang menggabungkan Model Linier Multivariat dengan GWMLM. Asumsi yang digunakan pada MGWMLM ini adalah vektor error
berdistribusi normal
multivariat dengan mean vektor nol dan matriks varians-kovarian Σ di setiap lokasi
u v . Penaksirani, i
parameter pada MGWMLM ini dilakukan dengan pendekatan WLS sehingga diperoleh penaksir parameter beta global dan lokal. 2. Pengujian kesesuaian koefisienparameter secara serentak dari model regresi linier multivariat dengan MGWMLM didekati dengan distribusi F. Pengujian hipotesis secara serentak pada MGWMLM juga didekati dengan distribusi F, sedangkan pengujian hipotesis secara parsial parameter variabel global dan parameter variabel lokal pada MGWMLM menggunakan uji t.
DAFTAR PUSTAKA
[1] Anselin, L. dan Getis, A. (1992),
Spatial Statistical Analysis and
Geographic Information Systems, The
Annals of Regional Science 26(1): 1992.
[2] Christensen, R. (1991), Linier Model
Multivariate, Time Series and Spatial Data, Springer-Verlag, New York.
[3] Draper, N.R. dan Smith, H. (1992),
Analisis Regresi Terapan, Edisi
Kedua, PT Gramedia Pustaka Utama, Jakarta.
[4] Fotheringham, A.S, Brundson, C dan Charlton, M. (2002), Geographically
Weighted Regression: the Analysis of Spatially Varying Relationships, John
Wiley & Sons Ltd, England.
[5] LeSage, J.P. (1997), Regression Analysis of Spatial Data, Journal
Regoinal and Policy, Vol. 27, No. 2,
hal. 83-84.
[6] Leung, Y., Mei, C.L dan Zhang, W.X. (2000a), Statistic Tests for Spatial Non-Stationarity Based on the Geographically Weighted Regression Model, Journal Environment and Planning A, Vol. 32, hal. 9-32.
[7] (2000b),
Testing for Spatial Autocorrelation among the Residuals of the Geographically Weighted Regression"
Environment andPlanning A, Vol. 32,
hal. 871-890.
[8] Mei, C.L., Wang, N., & Zhang, W.X., (2006), “Testing the importance of the explanatory variables in a mixed geographically weighted regression model”, Environment and Planning A, vol. 38, hal. 587-598.