REGRESSION (GWR) UNTUK MERAMALKAN DEBIT PUNCAK
PADA DAERAH ALIRAN SUNGAI
Nur Atikah*
Abstrak : Debit puncak daerah aliran sungai dipengaruhi beberapa faktor, salah satu faktor yang mempengaruhi adalah faktor posisi geografis. Analisis regresi merupakan salah satu analisis untuk menentukan tingkat pengaruh suatu variabel independen dan variabel dependen. Masalah utama dari metode ini adalah jika metode ini diterapkan pada data spasial. Mengatasi permasalahan pada data spasial, metode statistik yang akan digunakan adalah Geographically Weighted Regression (GWR), yaitu model yang menggunakan faktor geografis sebagai variabel independen yang dapat mempengaruhi variabel dependen.
Kata kunci : Regresi, Data Spasial, Geographically Weighted Regression (GWR)
PENDAHULUAN
Beberapa tahun terakhir terjadi perubahan iklim dan cuaca yang tidak menentu sehingga menyebabkan musim hujan maupun musim kemarau sulit untuk diprediksi. Perubahan iklim menyebabkan perubahan pola curah hujan, sehingga sewaktu-waktu intensitas hujan bisa sangat tinggi dan terkadang juga bisa rendah. Intensitas hujan yang sangat tinggi sering menyebabkan bencana banjir, sedangkan intensitas hujan yang rendah serta berkepanjangan dapat menyebabkan bencana kekeringan. Bencana banjir hampir setiap musim penghujan melanda sebagian besar wilayah Indonesia terutama di wilayah perkotaan yang padat penduduk dan wilayah dekat Daerah Aliran Sungai (DAS). Berdasarkan nilai kerugian dan frekuensi kejadian bencana banjir terlihat adanya peningkatan yang cukup berarti dari tahun ke tahun. Banjir dapat diartikan sebagai suatu keadaan dimana tinggi muka air sungai (atau debit sungai) melebihi suatu batas yang ditetapkan oleh suatu kepentingan tertentu. Banjir merupakan hasil rusaknya kesetimbangan air akibat berkurangnya nilai
infiltrasi (penyerapan) dan evepotranspirasi (penguapan), sehingga nilai debit aliran permukaan menjadi lebih besar daripada kapasitas angkut debit air pada sistem drainase (alami maupun buatan). Nilai kapasitas angkut yang lebih kecil ini menyebabkan air meluap dari tanggul dan menggenangi daerah sekitarnya. Pengelolaan Daerah Aliran Sungai (DAS) yang tidak optimal menjadi salah satu penyebab utama. Daerah Aliran Sungai (DAS) merupakan suatu wilayah tempat mengumpulnya air hujan dan mengalirkan aliran sungai. Asdak (2002) menyatakan bahwa DAS merupakan wilayah daratan yang secara topografik dibatasi oleh punggung-punggung gunung yang menampung dan menyimpan air hujan untuk kemudian menyalurkannya ke laut melalui sungai utama, atau dikenal sebagai daerah tangkapan air (catchment area).
Menurut Sosrodarsono dan Takeda (1985), aliran sungai tergantung dari berbagai faktor. Salah satu faktor aliran sungai berhubungan dengan limpasan, yang dibagi dua elemen, yaitu elemen-elemen meteorologi dan elemen-elemen-elemen-elemen daerah
pengaliran yang menyatakan sifat-sifat fisik DAS seperti: luas, penggunaan lahan, kondisi topografi, jenis tanah, karakteristik jaringan sungai, dan lain-lain. Debit puncak merupakan aliran limpasan maksimum pada saat terjadi hujan dan menjadi salah satu indikator kekuatan hujan yang berguna untuk prediksi besarnya sedimentasi. Semakin luas DAS maka semakin lama limpasan mencapai titik pengukuran dan debit puncak semakin berkurang.
Analisis regresi merupakan salah satu analisis yang paling populer dan luas pemakaiannya. Regresi adalah salah satu metode untuk menentukan tingkat pengaruh suatu variabel independen dan variabel dependen. Data spasial merupakan data pengukuran dengan pengamatan di suatu lokasi yang bergantung pada pengamatan di lokasi lain yang berdekatan (neighboring). Cressie (1993) menyatakan bahwa data spasial merupakan salah satu jenis data dependen, karena data dikumpulkan dari lokasi spasial berbeda yang mengindikasikan terdapatnya ketergantungan antara pengukuran data dengan lokasi. Jika metode regresi diterapkan pada data spasial dengan metode
Ordinary Least Square (OLS) untuk mengestimasi
parameter model regresi dengan asumsi error identik independen dan berdistribusi normal, maka akan diperoleh suatu model taksiran untuk semua data. Hal inilah yang menyebabkan ketidaksesuaian model pada data spasial karena pada analisis regresi diasumsikan bahwa lokasi geografis tidak mempengaruhi respon model. Asumsi ini bisa menyebabkan kesimpulan yang salah dan menghasilkan error autokorelasi spasial. Metode lain yang bisa digunakan adalah
Geographically Weighted Regression (GWR), yaitu
metode yang menggunakan faktor geografis sebagai variabel bebas yang dapat mempengaruhi variabel respon (Fotheringham, et al, 2002). Metode GWR
dapat diterapkan dalam berbagai bidang, salah satunya untuk meramalkan debit puncak air.
MODEL REGRESI
Persamaan regresi yang biasa didefinisikan dengan menggunakan metode pendugaan parameter
Ordinary Least Square (OLS), secara umum dapat
dituliskan: p k k ik i i x y 1 0 (1) ) , 0 ( ~
2e
N IID i i = 1, 2, ... , n,k = 1, 2, ... , p dengan
0,
1,...,
padalah parametermodel.
Pada model ini, hubungan antara variabel independen dan variabel dependen dianggap sama pada setiap lokasi geografis. Dalam bentuk matriks ditulis sebagai berikut:
Y = Xβ + ε n p np n p p n x x x x x x y y y 2 1 1 0 1 2 21 1 11 2 1 1 1 1
Pendugaan dilakukan dengan menggunakan metode OLS dengan meminimumkan jumlah kuadrat
error. Estimator dari parameter model didapat dari
persamaan
X X
X Y β T 1 T ˆ (2) dengan x x x x x x np p p n T 2 1 1 21 11 1 1 1 Xβˆ : vektor dari parameter yang ditaksir berukuran
n x (p+1)
X : matrik data berukuran n x (p+1) dari variabel independen yang elemen pada kolom pertama bernilai 1
Y : vektor observasi dari variabel dependen berukuran (n x 1).
MODEL GEOGRAPHICALLY WEIGHTED
REGRESSION (GWR)
Metode GWR adalah suatu teknik yang membawa kerangka dari model regresi sederhana menjadi model regresi yang terboboti (Fotheringham dkk, 2002). Model ini merupakan model regresi linier lokal (locally linier regression) yang menghasilkan penaksir parameter model yang bersifat lokal untuk setiap titik atau lokasi dimana data tersebut dikumpulkan. Pada model GWR, variabel dependen diprediksi dengan variabel independen yang masing-masing nilai parameter regresinya bergantung pada lokasi dimana data tersebut diamati. Model GWR dapat ditulis sebagai berikut :
p k k i i ik i i i i u v u v x y 1 0 ,
,
(3) denganyi = pengamatan pada lokasi ke-i (i = 1, 2, ... , n)
xik = nilai observasi variabel independen k pada pengamatan ke-i
(ui,vi) =koordinat (longitude, latitude) dari titik ke-i pada suatu lokasi geografis.
bk (ui,vi) = parameter regresi pada titik ke-i
i
= error yang diasumsikan identik, independen, dan berdistribusi Normal dengan mean nol dan variansi konstan
e2.Jika nilai parameter regresi konstan pada tiap-tiap wilayah geografis, maka model GWR adalah model global. Artinya tiap-tiap wilayah geografis mempunyai model yang sama. Hal ini merupakan kasus spesial dari GWR.
Pada model GWR diasumsikan bahwa data observasi yang dekat dengan titik ke-i mempunyai pengaruh yang besar pada estimasi dari bk (ui,vi) daripada data yang berada jauh dari titik ke-i. Persamaan di atas mengukur hubungan model pada semua titik ke-i. Pada GWR sebuah observasi diboboti dengan nilai yang berhubungan dengan titik ke-i. Bobot wij, untuk j = 1, 2, . . . , n, pada tiap lokasi (ui,vi) diperoleh sebagai fungsi yang kontinu dari jarak antara titik ke-i dan titik data lainnya. Misal matriks berikut merupakan matriks dari lokal parameter
n n p n n n n p v u v u v u v u v u v u , β ... , β , β . . . . . . . . . , β ... , β , β 1 0 1 1 1 1 1 1 1 0 B (4)
Estimasi tiap baris menggunakan persamaan berikut
X W()X
X W()Y ) ( ˆ i T i 1 T i (5) dengan:X = matrik data dari variabel independen Y = vektor variabel dependen
W(i) = matriks pembobot
= diag [wi1, wi2, ... , win] . (6) Estimasi dari persamaan (5) merupakan estimasi least square tetapi matriks pembobot tidak konstan, sehingga W(i) dihitung untuk tiap i dan wij mengindikasikan kedekatan atau bobot tiap titik data dengan lokasi i. Hal ini yang membedakan GWR dengan tradisional WLS (Weighted Least Square) yang mempunyai matrik bobot yang konstan.
2 1 *( ) ˆ
n i i i y b y CV (8)dengan i*
i dany
ˆ
i*(
b
)
adalah nilai dugaan untukyi dengan pengamatan pada titik ke-i diabaikan dalam proses penaksiran.
UJI GOODNESS OF FIT MODEL GWR
Uji hipotesis yang pertama dilakukan adalah pengujian model secara serentak untuk menguji signifikansi dari faktor geografis yang merupakan inti dari model GWR. Bentuk hipotesisnya adalah: Hipotesis:
H0 :
k(ui,vi)
k k 1,2,...,p(tidak ada pengaruh faktor geografis pada model)
H1 : paling tidak ada satu k(ui,vi)k
(ada pengaruh faktor geografis pada model) Statistik uji model GWR, berdasar pada uji F, yang dapat digunakan untuk membandingkan model GWR dan model regresi global. Uji ini berdasarkan hasil SSE dibagi dengan banyak derajat bebas yang efektif yang mendekati distribusi
2dengan derajat bebas banyak derajat bebas yang efektif. Secara matematis dituliskan sebagai berikut:
1 2 1 0 1 0 / / ) ( ) ( 2 / ) 1 ( / df SSE df SSE tr tr n SSE p n SSE F S S S T (9)Tolak H0 jika Fhit > Fá;(df1;df2) atau P_value < á.
Setelah melakukan pengujian model secara serentak, selanjutnya dilakukan pengujian parameter secara parsial. Pengujian ini untuk mengetahui parameter mana saja yang signifikan mempengaruhi variabel independennya. Bentuk hipotesisnya adalah sebagai berikut:
Selain menghasilkan estimasi parameter lokal untuk tiap-tiap lokasi geografis, GWR juga menghasilkan versi lokal untuk seluruh standar
regression pada seluruh lokasi geografis misalnya
ukuran goodness of fit. Hal ini dapat memberikan informasi pada pemahaman aplikasi dari model dan untuk penelitian lebih lanjut apakah diperlukan penambahan variabel independen pada model GWR. Hal yang penting lainnya adalah titik dimana parameter lokal diestimasi dengan model GWR tidak memerlukan titik dimana data diambil. Estimasi dari parameter dapat didapat dari semua lokasi geografis. Peran pembobot pada model GWR sangat penting karena nilai pembobot ini mewakili letak data observasi satu dengan lainnya. Oleh karena itu, sangat dibutuhkan ketepatan cara pembobotan (Chasco dkk, 2007). Skema pembobotan pada GWR dapat menggunakan beberapa metode yang berbeda, salah satu metode pembobotan yang biasa digunakan adalah kernel Gaussian dan fungsi pembobotan bisquare (Bocci dkk, 2006). Fungsi Gaussian untuk menghitung titik ke-n yang terdekat adalah
2 / exp 2 b d ij Wij (7) dengan:j = salah satu titik ke-n yang terdekat dari titik ke- i
b = jarak titik ke-n yang terdekat dij = merupakan jarak Euclidean
= (ui uj)2 (vi vj)2 .
Kriteria untuk penentuan nilai n yang tepat dapat diperoleh dengan pendekatan least square yaitu dengan menggunakan kriteria cross-validation
Hipotesis:
H0 : k(ui,vi)0, k = 1, 2, ..., p
H1 : paling tidak ada satu k(ui,vi) yang tidak bernilai 0
Uji ini berdasarkan penaksir parameter yang dibagi dengan SE df2. Secara matematis dituliskan
sebagai berikut: )) , ( ˆ ( ) , ( ˆ v u SE v u t i i k i i k (10) Jika diberikan level keyakinan sebesar á, maka keputusan diambil dengan menolak H0 jika nilai
t thitung ( 2,df ) 2 , dimana t( 2,df ) 2
didapat dari t tabel.
PEMBAHASAN
Faktor-faktor yang mempengaruhi debit puncak air antara lain panjang sungai, rata-rata curah hujan, dan kemiringan sungai. Sebelum menggunakan GWR untuk analisis data, terlebih dahulu menggunakan model regresi untuk menganalisis data. Hasil persamaan regresi diasumsikan sama dan diberlakukan untuk semua wilayah pada Daerah Aliran Sungai. Secara umum, model regresi antara debit puncak dan faktor-faktor yang mempengaruhinya adalah:
y
=
Panjang +
Hujan +
3Miring +
Model regresi yang layak digunakan dapat dilihat dari nilai R2. Nilai R2 dikalikan 100% menunjukkan persentase keragaman di dalam variabel Y yang dapat diberikan oleh model regresi yang didapatkan. Semakin besar nilai R2, semakin baik model regresi yang diperoleh.
Untuk menjaga akurasi hasil yang diperoleh, maka perlu dilakukan beberapa tahapan uji asumsi model. Uji asumsi model dilakukan untuk menjawab sah atau tidaknya suatu model regresi yang akan dipakai sebagai model penjelas bagi pengaruh antar variabel. Beberapa asumsi yang dibutuhkan dalam model regresi diantaranya varian homogen (homoskedastisitas), tidak ada autokorelasi antar error (independensi), dan error mengikuti distribusi normal. Apabila asumsi-asumsi sudah terpenuhi, selanjutnya dilakukan pengujian parameter model yaitu pengujian parameter secara serentak dan pengujian parameter secara parsial.
Pengujian parameter model dengan uji serentak. Bentuk hipotesisnya adalah:
Hipotesis:
H
0:
01230H1 : Minimal ada 1 parameter model (0,1,2atau3) yang tidak bernilai 0
Uji ini menggunakan uji F dengan daerah penolakan H0 H0 adalah Fhitung F( ;df ,df ) 2 1 . Apabila H 0 ditolak, maka model regresi yang diperoleh dapat digunakan. Setelah dilakukan pengujian parameter model dengan uji serentak, selanjutnya dilakukan pengujian parameter model dengan uji parsial.
Bentuk hipotesisnya adalah: H0 :
j= 0H1 :
j
0dimana j = 0, 1, 2, 3Uji parsial menggunakan uji t dengan daerah penolakan H0 adalah jika nilai
t
hitungt
( 2,df )2
,dimana
t
( 2,df )2
didapat dari t tabel. Apabila H 0 ditolak, maka variabel independen memiliki kontribusi yang signifikan terhadap variabel dependen.
Selanjutnya dilakukan analisis dengan model GWR. Langkah-langkah untuk membangun model GWR adalah dengan memilih bandwidth optimum, menentukan pembobot, penaksiran parameter dan pengujian hipotesis. Penaksiran parameter model GWR diperoleh dengan memasukkan pembobot spasial dalam perhitungannya. Jika pembobot yang digunakan adalah fungsi kernel maka pemilihan
bandwidth ini sangatlah penting, karena bandwidth
merupakan pengontrol keseimbangan antara kesesuaian kurva terhadap data dan kemulusan data. Salah satu metode yang digunakan untuk menentukan
bandwidth optimum adalah metode Cross Validation
(CV) (Fotheringham dkk, 2002). Bandwidth yang optimum diperoleh dengan meminimumkan Persamaan (8).
Bandwidth optimum merupakan besarnya
radius sehingga setiap titik pengamatan yang berada dalam radius tersebut dianggap memiliki pengaruh yang signifikan dalam menduga parameter GWR pada titik ke-i. Langkah awal mendapatkan matriks pembobot adalah dengan mencari jarakeuclide lokasi
u
i,
v
i
ke semua lokasi penelitian. Matriks pembobot yang terbentuk dengan fungsi Gauss di lokasi ke-i dan nilai bandwidth tertentu dapat ditulis sebagai berikut:
2 / exp 2 b d ij WijMatriks pembobot ini nantinya digunakan untuk menaksir parameter di lokasi dengan menggunakan rumus:
X W X
X W Y βˆ(u,v) (u,v) 1 (ui,vi) T i i T i i Model yang digunakan dalam menduga parameter GWR adalah :
Debit(i)=0i
ui,vi
+1i
ui,vi
Panjang(i )+2iui,viHujan(i) +3iui,viMiring(i)+
iSetelah diperoleh hasil estimasi baik model GWR dan regresi OLS, selanjutnya melakukan uji parameter model secara serentak dengan menggunakan statistik uji F. Adapun bentuk hipotesisnya adalah:
H
0:
k( , )u vi i k, k = 0, 1, 2, 3
H
1: paling tidak ada satu
k( , )u vi i kSetelah dilakukan uji parameter model secara serentak, maka perlu dilakukan pengujian parameter model secara parsial. Pengujian parameter model secara parsial dimaksudkan untuk mengetahui faktor-faktor yang berpengaruh terhadap tinggi debit puncak di setiap lokasi. Bentuk hipotesisnya adalah:
H
0:
H
1:
Identifikasi bahwa model GWR merupakan model yang lebih baik daripada model OLS dalam menjelaskan hubungan variabel dependen dengan variabel independen, dilakukan pengujian secara global dengan menggunakan ANOVA. Nilai p yang besarnya kurang dari 5% menyatakan bahwa model GWR lebih baik dalam menjelaskan hubungan variabel dependen dengan variabel independen dibandingkan model OLS.
Salah satu indikator model yang lebih baik adalah yang menghasilkan nilai MSE terkecil. Apabila nilai MSE pada model GWR lebih kecil daripada nilai MSE pada model OLS, dapat disimpulkan bahwa model yang dihasilkan dengan metode GWR merupakan model yang lebih baik daripada model OLS.
DAFTAR PUSTAKA
Asdak, C. 2002. Hidrologi dan Pengelolaan Daerah
Aliran Sungai. Gajah Mada University Press.
Yogyakarta.
Bocci, C., Petrucci, A., dan Rocco, E. 2006. An
Application of Geographically Weighted Regression to Agricultural Data for Small Area Estimates. Dipartimento di Statistica “G. Parenti”. Universita degli Studi di Firenze, Italy.
Casella, G. dan Berger, R.L. 1990. Statistical
Inference. Wadsworth, Inc. California.
Chasco, C., Garcia, I., dan Vicens, J. 2007. Modeling
spatial variations in household disposable income with Geographically Weighted Regression. Munich Personal RePEc Archive Paper No. 1682.
Cressie, N.A.C. 1991. Statistics For Spatial Data. John Wiley & Sons, Inc. United States of America.
Draper, N.R., Smith, H. 1998. Applied Regression
Analysis. 3th ed. John Wiley & Sons, Inc. United States of America.
Fotheringham, A.S., Brundson, C., dan Charlton, M. 2002. Geographically Weighted Regression: the
analysis of spatially varying relationships. John
Wiley & Sons Ltd, England.
Kutner, M.H., Nachtsheim, C.J., dan J. Neter, J. 2004.
Applied Linear Regression Models. 4th ed. New York: McGraw-Hill Companies, Inc.
Leung, Y. 2000. Statistical Tests for Spatial
Non-Stationarity Based on the Geographically Weighted Regression Model. Journal, The
Chinese University of Hong Kong, Hong Kong. Sosrodarsono, S. dan K. Takeda. 1985. Hidrologi