MIXED GEOGRAPHICALLY WEIGHTED MULTIVARIATE LINEAR MODEL

(1)

MIXED GEOGRAPHICALLY WEIGHTED MULTIVARIATE

LINEAR MODEL

1

Memi Nor Hayati,2Purhadi

1_{Jurusan Statistika FIMPA Universitas Mulawarman Samarinda} 2_{Jurusan Statistika FMIPA Institut Teknologi Sepuluh November Surabaya}

Alamat e-mail : [email protected]

ABSTRAK

Model linier multivariat adalah model linier dengan variabel respon lebih dari satu.

Geographically Weighted Multivariate Linier Model (GWMLM) merupakan

pengembangan dari model linier multivariat, dimana variabel respon lebih dari dari satu dan informasi lokasi diketahui. Pada model linier multivariat hanya dihasilkan penaksir parameter yang berlaku secara global, sedangkan dalam GWMLM dihasilkan penaksir parameter model yang bersifat lokal untuk setiap titik pengamatan atau lokasi dimana data tersebut diperoleh. Akan tetapi, pada kenyataannya tidak semua variabel prediktor dalam GWMLM mempunyai pengaruh secara lokal. Beberapa variabel prediktor berpengaruh secara global, sedangkan yang lainnya dapat mempertahankan pengaruhnya secara lokal. Oleh karena itu dikembangkan suatu metode Mixed

Geographically Weighted Multivariate Linier Model (MGWMLM) yang merupakan

gabungan dari model linier multivariat dan GWMLM. Hasil penelitian menunjukkan bahwa penaksiran parameter MGWMLM dapat dilakukan dengan metode Weighted

Least Square (WLS). Pemilihan bandwidth optimum digunakan metode Cross Validation (CV). Pengujian kesesuaian model regresi multivariat dan MGWMLM

didekati dengan distribusi F begitu juga pada pengujian parameter MGWMLM secara serentak, sedangkan pengujian parameter MGWMLM secara parsial baik untuk parameter global dan parameter lokal menggunakan distribusi t.

Kata Kunci : Geographically Weighted Multivariate Linier Model, Mixed

Geographically Weighted Multivariate Linier Model, Weighted Least Square, Cross Validation, fungsi kernel Gaussian.

PENDAHULUAN

Metode regresi merupakan salah satu metode statistika yang paling umum digunakan. Metode regresi merupakan metode yang digunakan untuk memodelkan hubungan antara variabel respon dengan variabel prediktor. Salah satu metode yang digunakan dalam menaksir parameter model regresi adalah metode Ordinary Least Square (OLS) dengan asumsi error identik (homoscedasticity) dan independen (non autokorelasi) yang harus dipenuhi untuk mendapatkan taksiran parameter model

untuk semua data [3]. Hal inilah yang menyebabkan ketidaksesuaian model pada data spasial yang memiliki dependensi spasial dan atau heterogenitas spasial [1].

Apabila analisis yang dilakukan dengan metode regresi menunjukkan

error tidak identik dan atau terjadi

autokorelasi, maka hal ini mengindikasikan bahwa parameter model regresi dipengaruhi oleh faktor lain, dalam hal ini adalah faktor geografis. Oleh karena itu dalam analisis data spasial faktor geografis merupakan faktor

(2)

penting dalam penentuan pembobot yang digunakan [5].

Geographically Weighted Regression

(GWR) merupakan salah satu metode yang dapat digunakan untuk menganalisis data yang memiliki heterogenitas spasial. Metode GWR menggunakan faktor geografis sebagai variabel prediktor yang dapat mempengaruhi variabel respon [4]. Model GWR merupakan pengembangan dari model regresi linier, yang mana dalam model regresi linier hanya dihasilkan penaksir parameter yang berlaku secara global, sedangkan dalam model GWR dihasilkan penaksir parameter model yang bersifat lokal untuk setiap lokasi pengamatan. Dalam berbagai bidang ilmu, metode GWR banyak digunakan oleh peneliti untuk menganalisis data spasial, karena metode GWR ini dapat digunakan untuk mengetahui pengaruh variabel prediktor terhadap variabel respon baik secara global maupun secara lokal dengan mempertimbangkan faktor lokasi sebagai pembobot untuk menaksir parameter model [6][7].

Pada kenyataannya seringkali tidak semua variabel prediktor dalam model GWR berpengaruh secara lokal. Terkadang, beberapa variabel prediktor berpengaruh secara global, sedangkan yang lainnya dapat mempertahankan pengaruh lokal atau spasialnya. Oleh karena itu, selanjutnya model GWR dikembangkan menjadi model Mixed

Geographically Weighted Regression

(MGWR) [4]. Model MGWR adalah gabungan dari model regresi linier global dengan model GWR, sehingga pada model MGWR akan dihasilkan penaksir parameter yang sebagian bersifat global dan sebagian lainnya bersifat lokal sesuai dengan lokasi pengamatan data. Pendekatan yang digunakan untuk menaksir parameter model MGWR dapat dilakukan dengan metode Weighted Least

Square (WLS) sama seperti halnya pada

model GWR [4].

Jika pada GWMLM tidak semua variabel prediktornya mempunyai pengaruh secara lokal, sebagian berpengaruh secara global, maka GWMLM dapat dikembangkan menjadi

Mixed Geographically Weighted

Multivariate Linier Model (MGWMLM).

Pada MGWMLM beberapa koefisien pada GWMLM diasumsikan konstan untuk seluruh lokasi pengamatan sedangkan yang lain bervariasi sesuai lokasi pengamatan data. MGWMLM merupakan gabungan dari Model Linier Multivariat dengan GWMLM, sehingga dengan MGWMLM akan dihasilkan penaksir parameter yang sebagian bersifat global dan sebagian yang lain bersifat lokal sesuai dengan lokasi pengamatan. Namun belum pernah ditemukan referensi yang membahas penaksir parameter MGWMLM demikian juga dengan statistik uji yang digunakan untuk mengukur signifikansi parameternya. Oleh karena itu penulis tertarik untuk membahas tentang penaksir parameter MGWMLM dengan metode WLS dan untuk mendapatkan bentuk statistik uji dari MGWMLM digunakan metode Maximum Likelihood

Ratio Test (MLRT).

METODE PENELITIAN

Metode dan tahapan yang dilakukan untuk mencapai tujuan dalam penelitian ini adalah sebagai berikut:

1. Menaksir parameter MGWMLM 1.1 Memformulasikan

MGWMLM seperti pada persamaan

1.2 Menentukan fungsi pembobot 1.3 Menentukan variabel

prediktor global X_g dan variabel prediktor lokal Xl

1.4 Membentuk MGWMLM ke dalam model GWMLM

(3)

1.5 Menaksir parameter variabel prediktor lokal dengan menggunakan metode WLS seperti pada GWMLM.

1.6 Menaksir parameter variabel prediktor global dengan menggunakan metode OLS 1.7 Mensubstitusikan penaksir

parameter variabel prediktor global ke dalam penaksir parameter variabel prediktor lokal pada langkah ke (1.5) untuk memperoleh estimator parameter yang baru.

2. Pengujian hipotesis pada MGWMLM

2.1 Melakukan pengujian kesesuaian model antara regresi multivariat dengan MGWMLM

2.2 Melakukan pengujian secara serentak parameter MGWMLM

2.3 Melakukan pengujian secara parsial parameter variabel prediktor global

2.4 Melakukan pengujian secara parsial parameter variabel prediktor lokal HASIL PENELITIAN Penaksiran Parameter lh



u vi, i



 dan gh   MGWMLM

Penaksiran parameter pada

MGWMLM dilakukan dengan

mengidentifikasi manakah yang merupakan variabel prediktor lokal dan variabel prediktor global terlebih dahulu, dapat dinyatakan sebagai berikut:



,



h l lh i i g gh h y X u v X       (1)

Langkah awal ialah menuliskan MGWMLM dalam bentuk GWMLM sebagai berikut:



,



h h g gh l lh i i h y y X  X u v       (2)

Teknik penaksiran parameter yang digunakan untuk menaksir parameter MGWMLM ialah seperti dalam GWMLM, sehingga _lh



u v_i, _i



 dapat

ditentukan sebagai berikut:

            0 1 1 ˆ _, ˆ _, ˆ _, ˆ _, , , T lh i i h i i h i i bh i i T T l i i l l i i h u v u v u v u v u v u v y              X W X X W     (3) Misalkan



1 1 2



T li i i ib x  x x  x 

merupakan elemen baris ke-i dari matriks

l

X . Maka nilai prediksi untuk yh pada

u v_i, _i diperoleh dengan:  



 



1   ˆ T ˆ _, T T _, T _, ih li lh i i li l i i l l i i h y x  u v x X W u v X  X W u v y    

Untuk seluruh pengamatan dapat dinyatakan sebagai berikut:

1 2 ˆ ˆ ˆ ˆ T h h h nh l h y _y y  y _ S y   dengan  





   





   





  1 1 1 1 1 1 1 2 2 2 2 2 1 , , , , , , T T T l l l l T T T l l l l l T T T ln l n n l l n n x u v u v x u v u v x u v u v            _ _       X W X X W X W X X W S X W X X W     (4)

Selanjutnya, mensubstitusikan element dari ˆ_lhu v_i, _i

 dalam MGWMLM dan

dengan pendekatan OLS, diperoleh penaksir untuk _gh  sebagai berikut:         ( 1), ( 2), 1 ˆ ˆ ˆ ˆ T gh b h b h ph T T T T g l l g g l l yh   _  _          _X I S I S X _ X I S I S    (5) Apabila ˆgh  pada persamaan (5)

disubstitusikan ke persamaan (3) maka akan diperoleh penaksir untuk koefisien lokal pada lokasi u v_i, _i pada respon ke-h adalah:          





1 1 ˆ _, _, _, ˆ , , T T lh i i l i i l l i i h T T l i i l l i i h g gh u v u v u v y u v u v y            _ _  X W X X W X W X X W X      (6) Sehingga fitted-value dari respon ke-h pada koefisien lokal dari n lokasi pengamatan ialah:





ˆ ˆ h l h l h g gh y y y     S S X      

(4)

maka, nilai fitted-value dari respon ke-h untuk n lokasi pengamatan adalah:

 





                      1 2 1 1 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ T h h h nh h g gh l h g gh g gh l h l g gh T T T T l h l g g l l g g l l h T T T T l l g g l l g g l l h h y y y y y y y y y y y                     _   _    _ _    _ _   _   _    X S X X S I S X S I S X X I S I S X X I S I S S I S X X I S I S X X I S I S S               (7) dimana:     _T  1   _T  T T l l g g l l g g l l       _   _   S S I S X X I S I S X X I S I S (8) sedangkan





1 T T g g g g g   S X X X X (9)

Berdasarkan pada metode WLS diperoleh penaksir parameter lh



u vi, i





persamaan (6) dan _gh

 persamaan (5), maka penaksir untukB_l



u v_i, _i



dan B_g

adalah:                             1 1 1 1 2 2 1 1 ˆ ˆ ˆ ˆ T T T T T T g l l g g l l g T T T T g g l l g g l l g gq _T _T T T g l l g g l l q T T g l l g g y y y        _ _      _ _        _{ } _    _ _  _ _      _ _{ }     _{ } _  _{ } _   _ _ _  _ _ _          _   _   X I S I S X X I S I S X I S I S X X I S I S B X I S I S X X I S I S X I S I S X X   _       T  T l l   I S I S Y (10)            





   





   





1 2 1 1 1 1 2 2 1 ˆ _, ˆ _, ˆ _, ˆ _, ˆ , , ˆ , , ˆ , , T l i i l i i l i i lq i i T T T l i i l l i i g g T T l i i l l i i g g T T l i i l l i i q g gq u v u v u v u v u v u v y u v u v y u v u v y                           _ _   __ __    _ _   _ _   _  _       _       B X W X X W X X W X X W X X W X X W X              1  



_ˆ



, , T T l u vi i l l u vi i g g    __X W X__ X W Y X B (11) dengan: Y_{n q} y₁ y₂ ... y_q.   

Penaksir Parameter Matriks

Varians-Kovarian Σ MGWMLM

Penaksir parameter matriks varians-kovarian error ΣMGWMLM diperoleh

dengan terlebih dahulu memperhatikan sifat kelokalan MGWMLM. Pada MGWMLM penaksiran parameter untuk tiap pengamatan ke-i dan respon ke-h adalah seperti pada persamaan (7) dan dari persamaan ini diperoleh:

 

ˆ ˆ ( ) h h h h h h y y y y y        S I S  _ _   

sehingga nilai dari jumlah kuadrat error untuk respon ke-h adalah:











 



ˆ T ˆ h h h T h h T T h h SSE y y y y         _  _{ }  _    I S I S I S I S       (12)

persamaan (12) dapat dimodifikasi dengan memperhatikan E

 

ˆ_h

 dan

varians error-nya, sehingga didapatkan penaksir 2

h

 yang tak bias ialah:



 







2 ˆ h h _T SS E tr     I S I S (13) dan untuk dan penaksir _hh* yang tak

bias ialah:



 





*



* ˆ h h h h T SSE E tr     I S I S (14)

Sedangkan untuk SSE E_h _h* dapat

ditentukan dengan menggunakan persamaan (12) sebagai berikut:











 



* * * * ˆ Tˆ h h h h T h h T T h _h SSE E y y y y        _  _{ }  _    I S I S I S I S       (15)

Nilai SSPE pada persamaan dapat juga ditentukan dengan:



 



           ˆ ˆ . T T T T T SSPE          E E Y Y Y Y I S Y I S Y Y I S I S Y (16)

sehingga penaksir parameter matriks varians-kovarian error  Σ MGWMLM diperoleh dengan:

(5)

         





ˆ MGWMLM T T T SSPE n rank tr        Σ X Y I S I S Y I S I S ₍₁₇₎ Pengujian Hipotesis MGWMLM Pada MGWMLM pengujian

hipotesisnya dilakukan dengan menggunakan metode MLRT. Pengujian hipotesis dalam MGWMLM yang pertama dilakukan ialah uji kesesuaian koefisien parameter secara serentak dari model regresi linier multivariat dengan MGWMLM, selanjutnya pengujian hipotesis secara serentak pada MGWMLM dan juga pengujian hipotesis secara parsial parameter variabel global dan parameter variabel lokal pada MGWMLM.

Pengujian Kesesuaian MGWMLM

Pengujian hipotesis kesesuaian

MGWMLM dilakukan dengan

membandingkan antara model regresi linier multivariat dengan MGWMLM dengan hipotesis sebagai berikut:





0

H :_kh u v_i, _i _kh,k0,1, 2,..., danb h1, 2,...,q

(MGWMLM tidak berbeda dengan model regresi linier multivariat)

1

H : minimal ada satu kh



u vi, i



kh

(MGWMLM berbeda dengan model regresi linier multivariat)

Uji rasio likelihood dilakukan berdasarkan pada selisih matriks error antara model linear multivariat dengan MGWMLM yang dibagi dengan SSPE dari MGWMLM sebagai berikut:

     



   



     2 1 1 2 1 2 1 2 1 T T T * T u T n p u , u n p u F ~ F u u                          Y I H Y Y I S I S Y Y I S I S Y (18)

dengan menggunakan tingkat signifikansi (α) maka keputusan yang diambil ialah

0

H ditolak jika nilai   2 1 1 2 * ; , 1 u n p u u F F        _ _  _ _   

atau dapat dikatakan minimal ada satu



,



kh u vi i kh

  atau MGWMLM berbeda dengan model regresi linier multivariat.

Pengujian Hipotesis Serentak

MGWMLM

Setelah dilakukan pengujian kesesuaian MGWMLM, maka langkah selanjutnya akan dilakukan uji serentak pada MGWMLM. Pengujian serentak parameter MGWMLM ditujukan untuk mengetahui signifikansi variabel-variabel prediktor pada MGWMLM secara serentak. Pengujian serentak pada MGWMLM dilakukan dengan hipotesis sebagai berikut:

     

0 1 2 ( 1), ( 2),

H :h u vi, i h u vi, i  ... bh u vi, i b hb hph0

1

H : minimal ada satu parameter yang

tidak sama dengan nol

Uji rasio likelihood dilakukan dengan cara membandingkan SSPE dibawah H0

(SSPE

 

H₀ ) yang dibagi dengan SSPE dari MGWMLM (SSPE

 

H₁ ) sebagai berikut:           2 2 1 1 2 2 2 1 2 * , 2 1 2 2 ~ T T l l T u u T u u u u F F u u                                Y I S I S Y Y I S I S Y

dengan menggunakan tingkat signifikansi (α) maka keputusan yang diambil ialah

0

H ditolak jika nilai   2 2 1 1 2 2 * , 2 u u u u F F            atau

dapat dikatakan minimal ada satu parameter yang tidak sama dengan nol.

Pengujian Hipotesis Parsial

MGWMLM

Selain melakukan pengujian serentak, dalam MGWMLM juga akan dilakukan pengujian parsial parameter MGWMLM untuk mengetahui variabel global dan lokal yang berpengaruh signifikan terhadap variabel respon. Pengujian signifikansi suatu variabel global

(6)



1



k

x b  k p dilakukan dengan

hipotesis sebagai berikut: H0: kh 0

H1: kh 0

untuk h1, 2,...,q dan



b  1 k p



Pengujian tingkat signifikansi parameter variabel global kh ialah dengan cara

mencari penaksir kh yang yang

berdistribusi normal dengan rata-rata kh

dan matrik varians-kovarian ˆkh yaitu







_ˆ _T 1



MGWMLM g g   Σ X X , sehingga diperoleh:

 

  ˆ ~ ˆ g kh kh n rank kh t SE      X

nilai standar error (SE) dari ˆkh adalah sebagai berikut:

 

ˆ

kh kk

SE   g .

Nilai SE dari ˆkh digunakan untuk menguji tingkat signifikansi kh dengan statistik uji t dan dibawah H₀ untuk

0 kh   diperoleh:

 

ˆ ˆ kh g kh t SE    dengan



b  1 k p



dibawah H₀, tg akan mengikuti distribusi t dengan derajat bebas

 



nrank Xg



, dengan menggunakan

tingkat signifikansi (α) maka, keputusan yang diambil ialah H0 ditolak jika nilai

    ; 2 g g n rank t t__ _       X .

Pengujian hipotesis selanjutnya yakni untuk mengetahui variabel lokal yang berpengaruh signifikan terhadap respon

dalam MGWMLM. Pengujian

signifikansi suatu variabel lokal



1



k

x  k b dilakukan dengan hipotesis sebagai berikut:

H0: kh



u vi, i



0

H1: kh



u vi, i



0

untuk h1, 2,...,q dan



1 k b



Pengujian tingkat signifikansi parameter variabel lokal _kh



u v_i, _i



ialah dengan cara mencari penaksir _kh



u v_i, _i



yang yang berdistribusi normal dengan rata-rata kh



u vi, i



dan matrik

varians-kovarian ˆ_khu v_i, _i yaitu  







_ˆ 1



, T MGWMLM l u vi i l   Σ X W X , sehingga diperoleh:      





  ˆ _, _, ~ ˆ _, l kh i i kh i i n rank kh i i u v u v t SE u v      X

nilai standar error (SE) dari ˆ_khu v_i, _i

adalah sebagai berikut:

 



ˆ _,



kh i i kk

SE  u v  m .

dimana mkk adalah elemen diagonal

ke-k+1 dari matrik  







_ˆ 1



, T MGWMLM l u vi i l   Σ X W X .

Nilai SE dari ˆ_khu v_i, _i digunakan untuk menguji tingkat signifikansi

 , 

kh u vi i

 dengan statistik uji t dan dibawah H0 untuk kh



u vi, i



0 diperoleh:    





ˆ _, ˆ _, kh i i l kh i i u v t SE u v    dengan



1 k b



dibawah H0, tl akan mengikuti distribusi

t dengan derajat bebas



nrank

 

Xg



, dengan menggunakan tingkat signifikansi (α) maka, keputusan yang diambil ialah

0

H ditolak jika nilai

    ; 2 l l n rank t t__ _       X . KESIMPULAN

Berdasarkan hasil analisa data dan pembahasan, dapat diambil beberapa kesimpulan sebagai berikut:

1. Metode MGWMLM adalah suatu metode pemodelan yang menggabungkan Model Linier Multivariat dengan GWMLM. Asumsi yang digunakan pada MGWMLM ini adalah vektor error

(7)

 



 berdistribusi normal

multivariat dengan mean vektor nol dan matriks varians-kovarian Σ di setiap lokasi



u v . Penaksiran_i, _i



parameter pada MGWMLM ini dilakukan dengan pendekatan WLS sehingga diperoleh penaksir parameter beta global dan lokal. 2. Pengujian kesesuaian koefisien

parameter secara serentak dari model regresi linier multivariat dengan MGWMLM didekati dengan distribusi F. Pengujian hipotesis secara serentak pada MGWMLM juga didekati dengan distribusi F, sedangkan pengujian hipotesis secara parsial parameter variabel global dan parameter variabel lokal pada MGWMLM menggunakan uji t.

DAFTAR PUSTAKA

[1] Anselin, L. dan Getis, A. (1992),

Spatial Statistical Analysis and

Geographic Information Systems, The

Annals of Regional Science 26(1): 1992.

[2] Christensen, R. (1991), Linier Model

Multivariate, Time Series and Spatial Data, Springer-Verlag, New York.

[3] Draper, N.R. dan Smith, H. (1992),

Analisis Regresi Terapan, Edisi

Kedua, PT Gramedia Pustaka Utama, Jakarta.

[4] Fotheringham, A.S, Brundson, C dan Charlton, M. (2002), Geographically

Weighted Regression: the Analysis of Spatially Varying Relationships, John

Wiley & Sons Ltd, England.

[5] LeSage, J.P. (1997), Regression Analysis of Spatial Data, Journal

Regoinal and Policy, Vol. 27, No. 2,

hal. 83-84.

[6] Leung, Y., Mei, C.L dan Zhang, W.X. (2000a), Statistic Tests for Spatial Non-Stationarity Based on the Geographically Weighted Regression Model, Journal Environment and Planning A, Vol. 32, hal. 9-32.

[7] (2000b),

Testing for Spatial Autocorrelation among the Residuals of the Geographically Weighted Regression"

Environment andPlanning A, Vol. 32,

hal. 871-890.

[8] Mei, C.L., Wang, N., & Zhang, W.X., (2006), “Testing the importance of the explanatory variables in a mixed geographically weighted regression model”, Environment and Planning A, vol. 38, hal. 587-598.