Estimasi Parameter Model Geographically Weighted Ordinal Logistic Regression (GWOLR)

(1)

Prosiding Seminar Nasional Matematika dan Pendidikan Matematika UMS 2015 552

ESTIMASI PARAMETER MODEL GEOGRAPHICALLY WEIGHTED ORDINAL

LOGISTIC REGRESSION (GWOLR)

Syilfi1, Vita Ratnasari2

Mahasiswa Jurusan Statistika Institut Teknologi Sepuluh Nopember (ITS)1, Dosen Jurusan Statistika Institut Teknologi Sepuluh Nopember (ITS)2

fifi.salima@gmail.com1, vitaratna70@gmail.com2

ABSTRAK. Analisis regresi logistik ordinal merupakan analisis regresi yang digunakan untuk memodelkan hubungan antara variabel respon yang bersifat kategorik dan berskala ordinal dengan satu atau lebih variabel prediktor. Metode ini merupakan salah satu jenis analisis regresi global, dimana

parameter dalam model digunakan secara global untuk semua lokasi.

Sementara itu, fakta di lapangan menunjukkan bahwa terdapat banyak kejadian yang bergantung pada lokasi geografis. Jika masing-masing koefisien regresi logistik ordinal bergantung pada lokasi geografis dimana data tersebut diamati,

maka digunakan model Geographically Weighted Ordinal Logistic Regression

(GWOLR). GWOLR merupakan gabungan antara regresi logistik ordinal dan

Geographically Weighted Regression (GWR). Estimasi parameter dalam

model GWOLR menggunakan metode maksimum likelihood terboboti, yaitu

dengan memaksimumkan fungsi ln-likelihood terboboti. Pembobot yang

digunakan dalam fungsi ln-likelihood terboboti adalah faktor letak geografis

yaitu garis lintang selatan dan garis bujur timur pada masing-masing lokasi pengamatan. Faktor ini memiliki nilai yang berbeda untuk setiap lokasi yang menunjukkan sifat lokal pada model GWOLR, sehingga setiap lokasi pengamatan mempunyai nilai parameter regresi logistik ordinal yang berbeda-beda.

Kata Kunci: GWOLR; MLE terboboti; letak geografis.

1. PENDAHULUAN

(2)

Prosiding Seminar Nasional Matematika dan Pendidikan Matematika UMS 2015 553 Untuk variabel respon yang bersifat kategori telah dikembangkan model Geographically Weighted Logistic Regression (GWLR) oleh Atkinson, German,Sear dan Clark [2]. GWLR merupakan bentuk kombinasi dari model GWRdan model regresi logistik. Atkinson et al. [2] menggunakan model GWLRdengan variabel respon biner untuk menjelaskan ketergantungan pada lokasigeografis dari hubungan antara erosi sungai (ada atau tidak adanya erosi) denganbeberapa variabel yang mempengaruhi erosi di sungai Dyfi Afon, West Wales.Hasil yang diperoleh menunjukkan bahwa praktek-praktek manajemen yangberbeda harus dilaksanakan pada lokasi yang berbeda di sepanjang sungai yangdiamati. Model GWLR dapat juga dikembangkan untuk variabel respon berskalaordinal, yaitu model Geographically Weighted Ordinal Logistic Regression(GWOLR).

2. METODEPENELITIAN

2.1 Model Regresi Logistik Ordinal

Model regresi logistik termasuk dalam model linear umum (Generalized Linear Models). Model yang digunakan untuk regresi logistik ordinal adalah model logit kumulatif (Cumulative Logit Models). Misalkan variabel respon Y memiliki G buah kategori berskala ordinal dan

x

_i menyatakan vektor variabel prediktor pada pengamatan ke-i,

1 2

T

i  xi xi xip

x L dengan i1, 2, 3,..., ,n maka model regresi logistik ordinal dapat dinyatakan sebagai :







|



logit | ln

1 |

i i T

i i g i

i i

P Y g P Y g

P Y g



  

   _ _ 

  _ _ _ _

 

x

x x β

x (1)

Misal



_g

 

x

_i



P Y



_i



g

|

x

_i



menyatakan peluang variabel respon pada pengamatan ke-i mempunyai kategori ke-g terhadap

x

_i, maka



_i

|

_i





_i

1|

_i





_i

2 |

_i





_i

|

_i



P Y



g

x



P Y



x



P Y



x

 

L

P Y



g

x

 

1 i 2 i g i





x



x

 

L

x

Sehingga peluang untuk masing-masing kategori respon dapat dinyatakan sebagai:

 



|





|





1|



g i

P Y

i

g

i

P Y

i

g

i

P Y

i

g

i



x



x





x



 

x

(2)

Jika dimisalkan variabel respon mempunyai 4 buah kategori



G



4 ,



maka model regresi logistik ordinal yang terbentuk adalah (Agresti, 2002):









1

1|

logit 1| ln

1 1|

i i T

i i i

i i

P Y P Y

P Y



  

   _ _ 

  _ _ _ _

 

x

x x β

x









2

2 |

logit 2 | ln

1 2 |

i i T

i i i

i i

P Y P Y

P Y



  

   _ _ 

  _ _ _ _

 

x

x x β

(3)









3

3 |

logit 3 | ln

1 3 |

i i T

i i i

i i

P Y P Y

P Y



  

   _ _ 

  _ _ _ _

 

x

x x β

x

dengan





1 1

1|

,

1

T i T i i i

e

P Y

e

   







x β xβ

x





2 2

2 |

1

T i T i i i

e

P Y

e

   







xβ xβ

x

dan





3 3

3 |

1

T i T i i i

e

P Y

e

   







x β x β

x

. Sehingga didapatkan peluang untuk masing-masing kategori respon sebagai berikut :

Peluang kategori pertama

 









1 i

P Y

i

1|

i

P Y

i

1|

i



x



x





x

1 1

1

T i T i

e

   





xβ xβ

Peluang kategori kedua

 













2 i

P Y

i

2 |

i

P Y

i

2 |

i

P Y

i

1|

i



x



x





x





x

2 1 2 1

1

T T i i T T i i

e

       







x β x β

Peluang kategori ketiga

 













3 i

P Y

i

3 |

i

P Y

i

3 |

i

P Y

i

2 |

i



x



x





x





x

3 2 1

1

T T T

i i i

T T T

i i i

T T T

i i i

T T T

i i i

e

                       





























xβ x β x β

x β x β x β

xβ x β x β

x β x β x β

Peluang kategori keempat

 





















4 i

P Y

i

4 |

i

P Y

i

4 |

i

P Y

i

3 |

i

P Y

i

2 |

i

P Y

i

1|

i



x



x





x





x





x





x

3 3

1

T i T i

e

   

 



x β x β

Nilai peluang untuk masing-masing kategori respon digunakan sebagai pedoman untuk pengklasifikasian. Suatu pengamatan akan masuk dalam respon kategori ke-g berdasarkan nilai peluang yang terbesar.

2.2 Model Geographically Weighted Ordinal Logistic Regression (GWOLR)

(4)







|











ln , , , 1, 2,..., 1

1 |

i i T

g i i i i i

i i

P Y g

u v u v g G

P Y g



  

   

 _ _ 

 

 

x

x β

x

dengan

x

_i menyatakan vektor variabel prediktor lokasi ke-i,

1 2 ,

T

i  xi xi xip

x L

P Y



_i



g

|

x

_i



menyatakan peluang kumulatif kategori respon ke-g terhadap

x

_i,

β



u v

_i

,

_i



merupakan vektor koefisien regresi untuk lokasi ke-i,



_g



u v

_i

,

_i



merupakan intersep dan memenuhi kondisi



₁



u v

_i

,

_i







₂



u v

_i

,

_i





L





_G_₁



u v

_i

,

_i



,

dan



u v

_i

,

_i



adalah titik koordinat (longitude, latitude).

2.3 Estimasi Parameter Model GWOLR

Parameter model GWOLR dapat diestimasi menggunakan metode maksimum likelihood terboboti, yaitu dengan memberikan pembobot geografis yang berbeda untuk setiap lokasi pada fungsi ln-likelihood. Estimasi parameter pada lokasi ke-i diperoleh dengan melakukan turunan parsial pertama terhadap parameter yang akan diestimasi dan kemudian disamakan dengan nol (Atkinson, German, Sear, dan Clark [2]).

Hasil turunan parsial pertama yang diperoleh berbentuk nonlinear sehingga diperlukan suatu metode numerik untuk memperoleh estimasi parameternya. Metode numerik yang dapat digunakan adalah metode iterasi Newton-Raphson. Oleh karena itu diperlukan turunan parsial kedua dari fungsi ln-likelihood terboboti terhadap parameter yang akan diestimasi.

3. HASILPENELITIANDANPEMBAHASAN

Pada penelitian ini, parameter dalam model GWOLR yaitu



,



1



,



2



,



1



,

 

,



T

i i i i i i G i i i i

u v

 





u v



u v



_

u v





θ

L

β

diestimasi dengan

menggunakan metode maximum likelihood terboboti. Langkah awal dengan membentuk fungsi likelihood. Misalkan diambil nsampel random

Y Y

₁

,

₂

,...,

Y

_n dengan peluang hasil pada kategori g adalah



g*

 

x

i . Jika dimisalkan variabel respon memiliki 4 buah kategori maka

(5)

 











 



           





    1 2 1 2 , ,

1 1 1 2 3

1

, , , ,

2

, ,

2 3

* , , ln 1

ln

ln 1

T i i i i i

T T

i i i i i i i i i i

T i i i i i

n

u v u v

T

j i i i i i j j j

j

u v u v u v u v

j

u v u v

j j

L y u v u v y y y e

y e e

y y e

   



            _  _    _  _     _  _ 



x β

xβ x β

x β

θ x β

           

             





   



1 2 3

1 3 1 2 3

3

, , , , , ,

3

, , 2 , , , , 3 ,

, ,

2 1

ln

2

1 ln 1

T T T

i i i i i i i i i i i i i i i

T T

i i i i i i i i i i i i i i i i

T i i i i i

u v u v u v u v u v u v

j

u v u v u v u v u v u v u v

u v u v

j j

y e e e

e e

y y e

                   _ _     _      _  _

xβ x β x β

xβ x β

xβ





,

j i i

w u v

Faktor letak geografis merupakan faktor pembobot pada model GWOLR yang disimbolkan dengan

w u v

_j



_i

,

_i



. Faktor ini memiliki nilai yang berbeda untuk setiap lokasi yang menunjukkan sifat lokal pada model GWOLR. Oleh karena itu pembobot diberikan pada bentuk lnlikelihoodnya untuk model GWOLR. Estimasi parameter dilakukan dengan melakukan turunan parsial pertama dari fungsi ln-likelihood terhadap parameter yang akan diestimasi dan kemudian disamakan dengan nol.





 _  _  _  _    

         

     

1 1

1 2 1

1 1 3

1 2

, , , ,

*

1 1 2 3 _, _, 2

1 1

, , , , 2 ,

3 _, _, _,

1

2 +

T T

i i i i i i i i i i

T T T

i i i i i i i

T T

i i i i i i i i i i i i T

i i i i i i i

u v u v u v u v

n

j j j j _{u v} _{u v} j

j

u v u v u v u v u v

j _{u v} _{u v} _{u v}

L e e

y y y y y

e e e e e y e e          



             _  _ _ _ _   _ _ _  



x βx β x β x β x β

xβ x β

x β x            

       

3 1 3

1 2 3

, , , , , 2 ,

3

, , , 3 ,

2

0

T T T

T i

T i i i i i i i i i

u v u v u v u v u v u v

u v u v u v u v

e e e e                       _{ }   _

β x β x β

xβ

x β

Selain parameter di atas, juga dilakukan penurunan terhadap

2 * 1 2

L

 



 

, 2 * 1 3

L

 



 

, 2 * 1

L





 

β

, 2 * 2 2

L





, 2 * 2 3

L

 



 

, 2 * 2

L





 

β

, 2 * 2 3

L





, dan 2 *

T

L



 

β β

.Hasil turunan parsial pertama yang

(6)





_ _ _ _ _ _ _ _ _ _ _ _

         

1 1 2

1 2 1

1 3 1 2

, , , , 2 ,

2 *

1 2 3 2 2 2

2

, , , , , ,

1 1

, , 2 , , , 2

3

1

T T

i i i i i i i i i i i i

T T T

T T

u v u v u v u v u v

n

j j j j

u v u v u v u v u v u v

j

u v u v u v u v u v

j

L e e

y y y y

e e e

e e y                         _  _ _ _   _ _ _ _ _ _ _       



xβ x β

x β x β x β

xβ x β               

           



         

1 3 1 2 3

1 2 3

1 2 3 1 2

, , 2 , 3 , , , , 3 ,

, , , , , ,

, , 2 , 4 , , 2 ,

2 2

T T

i i i i i i i i i i i i i i i i i i

T T T

T

u v u v u v u v u v u v u v u v

u v u v u v u v u v u v

u v u v u v u v u v u

e e

e e e

e e                               

xβ x β

xβ x β x β

x β      

             





3

1 3 1 2 3

, 4 ,

2

, , 2 , , , , 3 ,

2

T

i i i i i i

T T

i i i i i i i i i i i i i i i i

v u v u v

u v u v u v u v u v u v u v

e e                    _ xβ

xβ x β

             





         



           

1 2 1 2

1

2 1

1 2 3 1 2 3

, , 2 , , , 2 ,

2 *

2 2 3 _, _,

, , , ,

1

1 2

, , , 3 , , 2 , ,

2

T T

i i i i i i i i i i i i i i

T

T T _i _i _i _i _i

i i i i i i i i i i

T

i i i i i i i i i i i i i i

u v u v u v u v u v u v

n

j j

u v u v

u v u v u v u v

j

u v u v u v u v u v u v u v

L e e

y y e e e e e             

 

                _ _    _ _   



_x _β x β _{x β} x β x β

x β    

                     



2 3 1 3 1 2 3

4 ,

2

, , , , , , 2 , , , , 3 ,

2

T i i i i

T T T T

i i i i i i i i i i i i i i i i i i i i i i i i i i

u v

u v u v u v u v u v u v u v u v u v u v u v

e e e  e  

                 x β

xβ x β x β x β

Selain kedua parameter di atas, juga dilakukan estimasi terhadap parameter

2 * 1 3

L

 



 

, 2 * 1

L





 

β

, 2 * 2 2

L





, 2 * 2 3

L

 



 

, 2 * 2

L





 

β

, 2 * 2 3

L





, dan 2 *

T

L



 

β β

.

Persamaan yang digunakan dalam proses iterasi Newton-Raphson untuk mendapatkan nilai θˆ



u vi, i



yaitu :









 





1





( 1) ( ) ( ) ( )

, , , ,

t t t t

i i i i i i i i

u v u v u v  u v

 _ _ _

  

θ θ H θ q θ

Proses iterasi Newton-Raphson berhenti jika terpenuhi kondisi konvergen, yaitu selisih









( 1) ( )

, , ,

t t

i i i i

u v u v



 _ _

θ θ dimana



adalah bilangan yang sangat kecil. Hasil estimasi yang diperoleh adalah ( 1)





,

t

i i

u v



θ pada saat iterasi terakhir.Prosedur iterasi ini diulang untuk setiap lokasi ke-i, sehingga akan didapatkan penaksir parameter lokal model GWOLR.

4. SIMPULAN

(7)

Prosiding Seminar Nasional Matematika dan Pendidikan Matematika UMS 2015 558 melakukan turunan parsial pertama terhadap parameter yang akan diestimasi dan kemudian disamakan dengan nol. Hasil turunan parsial pertama yang diperoleh merupakan fungsi nonlinear terhadap parameter yang akan diestimasi sehingga diperlukan suatu metode numerik untuk memperoleh estimasi parameternya. Metode numerik yang dapat digunakan adalah metode iterasi Newton-Raphson. Oleh karena itu diperlukan turunan parsial kedua dari fungsi ln-likelihood terhadap parameter yang akan diestimasi.

DAFTAR PUSTAKA

[1] Agresti, A. (2002). Categorical Data Analysis (Second ed.). New York: John Wiley & Sons.

[2] Atkinson, P. M., German, S. E., Sear, D. A., & Clark, M. J. (2003). Exploring the Baltagi, B. H. 2005. Econometric Analysis of Panel Data. New York: John Wiley dan Sons.

[3] Fotheringham, A. S., Brunsdon, C., & Charlton, M. (2002). Geographically Weighted Regression. UK: John Wiley & Sons.