• Tidak ada hasil yang ditemukan

PEMANFAATAN METODE GEOGRAPHICALLY WEIGHTED REGRESSION (GWR) UNTUK MERAMALKAN DEBIT PUNCAK PADA DAERAH ALIRAN SUNGAI

N/A
N/A
Protected

Academic year: 2021

Membagikan "PEMANFAATAN METODE GEOGRAPHICALLY WEIGHTED REGRESSION (GWR) UNTUK MERAMALKAN DEBIT PUNCAK PADA DAERAH ALIRAN SUNGAI"

Copied!
7
0
0

Teks penuh

(1)

REGRESSION (GWR) UNTUK MERAMALKAN DEBIT PUNCAK

PADA DAERAH ALIRAN SUNGAI

Nur Atikah*

Abstrak : Debit puncak daerah aliran sungai dipengaruhi beberapa faktor, salah satu faktor yang mempengaruhi adalah faktor posisi geografis. Analisis regresi merupakan salah satu analisis untuk menentukan tingkat pengaruh suatu variabel independen dan variabel dependen. Masalah utama dari metode ini adalah jika metode ini diterapkan pada data spasial. Mengatasi permasalahan pada data spasial, metode statistik yang akan digunakan adalah Geographically Weighted Regression (GWR), yaitu model yang menggunakan faktor geografis sebagai variabel independen yang dapat mempengaruhi variabel dependen.

Kata kunci : Regresi, Data Spasial, Geographically Weighted Regression (GWR)

PENDAHULUAN

Beberapa tahun terakhir terjadi perubahan iklim dan cuaca yang tidak menentu sehingga menyebabkan musim hujan maupun musim kemarau sulit untuk diprediksi. Perubahan iklim menyebabkan perubahan pola curah hujan, sehingga sewaktu-waktu intensitas hujan bisa sangat tinggi dan terkadang juga bisa rendah. Intensitas hujan yang sangat tinggi sering menyebabkan bencana banjir, sedangkan intensitas hujan yang rendah serta berkepanjangan dapat menyebabkan bencana kekeringan. Bencana banjir hampir setiap musim penghujan melanda sebagian besar wilayah Indonesia terutama di wilayah perkotaan yang padat penduduk dan wilayah dekat Daerah Aliran Sungai (DAS). Berdasarkan nilai kerugian dan frekuensi kejadian bencana banjir terlihat adanya peningkatan yang cukup berarti dari tahun ke tahun. Banjir dapat diartikan sebagai suatu keadaan dimana tinggi muka air sungai (atau debit sungai) melebihi suatu batas yang ditetapkan oleh suatu kepentingan tertentu. Banjir merupakan hasil rusaknya kesetimbangan air akibat berkurangnya nilai

infiltrasi (penyerapan) dan evepotranspirasi (penguapan), sehingga nilai debit aliran permukaan menjadi lebih besar daripada kapasitas angkut debit air pada sistem drainase (alami maupun buatan). Nilai kapasitas angkut yang lebih kecil ini menyebabkan air meluap dari tanggul dan menggenangi daerah sekitarnya. Pengelolaan Daerah Aliran Sungai (DAS) yang tidak optimal menjadi salah satu penyebab utama. Daerah Aliran Sungai (DAS) merupakan suatu wilayah tempat mengumpulnya air hujan dan mengalirkan aliran sungai. Asdak (2002) menyatakan bahwa DAS merupakan wilayah daratan yang secara topografik dibatasi oleh punggung-punggung gunung yang menampung dan menyimpan air hujan untuk kemudian menyalurkannya ke laut melalui sungai utama, atau dikenal sebagai daerah tangkapan air (catchment area).

Menurut Sosrodarsono dan Takeda (1985), aliran sungai tergantung dari berbagai faktor. Salah satu faktor aliran sungai berhubungan dengan limpasan, yang dibagi dua elemen, yaitu elemen-elemen meteorologi dan elemen-elemen-elemen-elemen daerah

(2)

pengaliran yang menyatakan sifat-sifat fisik DAS seperti: luas, penggunaan lahan, kondisi topografi, jenis tanah, karakteristik jaringan sungai, dan lain-lain. Debit puncak merupakan aliran limpasan maksimum pada saat terjadi hujan dan menjadi salah satu indikator kekuatan hujan yang berguna untuk prediksi besarnya sedimentasi. Semakin luas DAS maka semakin lama limpasan mencapai titik pengukuran dan debit puncak semakin berkurang.

Analisis regresi merupakan salah satu analisis yang paling populer dan luas pemakaiannya. Regresi adalah salah satu metode untuk menentukan tingkat pengaruh suatu variabel independen dan variabel dependen. Data spasial merupakan data pengukuran dengan pengamatan di suatu lokasi yang bergantung pada pengamatan di lokasi lain yang berdekatan (neighboring). Cressie (1993) menyatakan bahwa data spasial merupakan salah satu jenis data dependen, karena data dikumpulkan dari lokasi spasial berbeda yang mengindikasikan terdapatnya ketergantungan antara pengukuran data dengan lokasi. Jika metode regresi diterapkan pada data spasial dengan metode

Ordinary Least Square (OLS) untuk mengestimasi

parameter model regresi dengan asumsi error identik independen dan berdistribusi normal, maka akan diperoleh suatu model taksiran untuk semua data. Hal inilah yang menyebabkan ketidaksesuaian model pada data spasial karena pada analisis regresi diasumsikan bahwa lokasi geografis tidak mempengaruhi respon model. Asumsi ini bisa menyebabkan kesimpulan yang salah dan menghasilkan error autokorelasi spasial. Metode lain yang bisa digunakan adalah

Geographically Weighted Regression (GWR), yaitu

metode yang menggunakan faktor geografis sebagai variabel bebas yang dapat mempengaruhi variabel respon (Fotheringham, et al, 2002). Metode GWR

dapat diterapkan dalam berbagai bidang, salah satunya untuk meramalkan debit puncak air.

MODEL REGRESI

Persamaan regresi yang biasa didefinisikan dengan menggunakan metode pendugaan parameter

Ordinary Least Square (OLS), secara umum dapat

dituliskan:      p k k ik i i x y 1 0    (1) ) , 0 ( ~

2e

N IID i i = 1, 2, ... , n,

k = 1, 2, ... , p dengan

0,

1,...,

padalah parameter

model.

Pada model ini, hubungan antara variabel independen dan variabel dependen dianggap sama pada setiap lokasi geografis. Dalam bentuk matriks ditulis sebagai berikut:

Y = Xβ + ε                                                         n p np n p p n x x x x x x y y y           2 1 1 0 1 2 21 1 11 2 1 1 1 1

Pendugaan dilakukan dengan menggunakan metode OLS dengan meminimumkan jumlah kuadrat

error. Estimator dari parameter model didapat dari

persamaan

X X

X Y β T1 T  ˆ (2) dengan              x x x x x x np p p n T        2 1 1 21 11 1 1 1 X

(3)

βˆ : vektor dari parameter yang ditaksir berukuran

n x (p+1)

X : matrik data berukuran n x (p+1) dari variabel independen yang elemen pada kolom pertama bernilai 1

Y : vektor observasi dari variabel dependen berukuran (n x 1).

MODEL GEOGRAPHICALLY WEIGHTED

REGRESSION (GWR)

Metode GWR adalah suatu teknik yang membawa kerangka dari model regresi sederhana menjadi model regresi yang terboboti (Fotheringham dkk, 2002). Model ini merupakan model regresi linier lokal (locally linier regression) yang menghasilkan penaksir parameter model yang bersifat lokal untuk setiap titik atau lokasi dimana data tersebut dikumpulkan. Pada model GWR, variabel dependen diprediksi dengan variabel independen yang masing-masing nilai parameter regresinya bergantung pada lokasi dimana data tersebut diamati. Model GWR dapat ditulis sebagai berikut :



   p k k i i ik i i i i u v u v x y 1 0 ,

,

(3) dengan

yi = pengamatan pada lokasi ke-i (i = 1, 2, ... , n)

xik = nilai observasi variabel independen k pada pengamatan ke-i

(ui,vi) =koordinat (longitude, latitude) dari titik ke-i pada suatu lokasi geografis.

bk (ui,vi) = parameter regresi pada titik ke-i

i

= error yang diasumsikan identik, independen, dan berdistribusi Normal dengan mean nol dan variansi konstan

e2.

Jika nilai parameter regresi konstan pada tiap-tiap wilayah geografis, maka model GWR adalah model global. Artinya tiap-tiap wilayah geografis mempunyai model yang sama. Hal ini merupakan kasus spesial dari GWR.

Pada model GWR diasumsikan bahwa data observasi yang dekat dengan titik ke-i mempunyai pengaruh yang besar pada estimasi dari bk (ui,vi) daripada data yang berada jauh dari titik ke-i. Persamaan di atas mengukur hubungan model pada semua titik ke-i. Pada GWR sebuah observasi diboboti dengan nilai yang berhubungan dengan titik ke-i. Bobot wij, untuk j = 1, 2, . . . , n, pada tiap lokasi (ui,vi) diperoleh sebagai fungsi yang kontinu dari jarak antara titik ke-i dan titik data lainnya. Misal matriks berikut merupakan matriks dari lokal parameter

                            n n p n n n n p v u v u v u v u v u v u , β ... , β , β . . . . . . . . . , β ... , β , β 1 0 1 1 1 1 1 1 1 0 B (4)

Estimasi tiap baris menggunakan persamaan berikut

X W()X

X W()Y ) ( ˆ i T i 1 T i   (5) dengan:

X = matrik data dari variabel independen Y = vektor variabel dependen

W(i) = matriks pembobot

= diag [wi1, wi2, ... , win] . (6) Estimasi dari persamaan (5) merupakan estimasi least square tetapi matriks pembobot tidak konstan, sehingga W(i) dihitung untuk tiap i dan wij mengindikasikan kedekatan atau bobot tiap titik data dengan lokasi i. Hal ini yang membedakan GWR dengan tradisional WLS (Weighted Least Square) yang mempunyai matrik bobot yang konstan.

(4)

2 1 *( ) ˆ

   n i i i y b y CV (8)

dengan i*

i dan

y

ˆ

i*

(

b

)

adalah nilai dugaan untuk

yi dengan pengamatan pada titik ke-i diabaikan dalam proses penaksiran.

UJI GOODNESS OF FIT MODEL GWR

Uji hipotesis yang pertama dilakukan adalah pengujian model secara serentak untuk menguji signifikansi dari faktor geografis yang merupakan inti dari model GWR. Bentuk hipotesisnya adalah: Hipotesis:

H0 :

k(ui,vi)

k k 1,2,...,p

(tidak ada pengaruh faktor geografis pada model)

H1 : paling tidak ada satu k(ui,vi)k

(ada pengaruh faktor geografis pada model) Statistik uji model GWR, berdasar pada uji F, yang dapat digunakan untuk membandingkan model GWR dan model regresi global. Uji ini berdasarkan hasil SSE dibagi dengan banyak derajat bebas yang efektif yang mendekati distribusi

2dengan derajat bebas banyak derajat bebas yang efektif. Secara matematis dituliskan sebagai berikut:

1 2 1 0 1 0 / / ) ( ) ( 2 / ) 1 ( / df SSE df SSE tr tr n SSE p n SSE F       S S S T (9)

Tolak H0 jika Fhit > Fá;(df1;df2) atau P_value < á.

Setelah melakukan pengujian model secara serentak, selanjutnya dilakukan pengujian parameter secara parsial. Pengujian ini untuk mengetahui parameter mana saja yang signifikan mempengaruhi variabel independennya. Bentuk hipotesisnya adalah sebagai berikut:

Selain menghasilkan estimasi parameter lokal untuk tiap-tiap lokasi geografis, GWR juga menghasilkan versi lokal untuk seluruh standar

regression pada seluruh lokasi geografis misalnya

ukuran goodness of fit. Hal ini dapat memberikan informasi pada pemahaman aplikasi dari model dan untuk penelitian lebih lanjut apakah diperlukan penambahan variabel independen pada model GWR. Hal yang penting lainnya adalah titik dimana parameter lokal diestimasi dengan model GWR tidak memerlukan titik dimana data diambil. Estimasi dari parameter dapat didapat dari semua lokasi geografis. Peran pembobot pada model GWR sangat penting karena nilai pembobot ini mewakili letak data observasi satu dengan lainnya. Oleh karena itu, sangat dibutuhkan ketepatan cara pembobotan (Chasco dkk, 2007). Skema pembobotan pada GWR dapat menggunakan beberapa metode yang berbeda, salah satu metode pembobotan yang biasa digunakan adalah kernel Gaussian dan fungsi pembobotan bisquare (Bocci dkk, 2006). Fungsi Gaussian untuk menghitung titik ke-n yang terdekat adalah

          2 / exp 2 b d ij Wij (7) dengan:

j = salah satu titik ke-n yang terdekat dari titik ke- i

b = jarak titik ke-n yang terdekat dij = merupakan jarak Euclidean

= (uiuj)2 (vivj)2 .

Kriteria untuk penentuan nilai n yang tepat dapat diperoleh dengan pendekatan least square yaitu dengan menggunakan kriteria cross-validation

(5)

Hipotesis:

H0 : k(ui,vi)0, k = 1, 2, ..., p

H1 : paling tidak ada satu k(ui,vi) yang tidak bernilai 0

Uji ini berdasarkan penaksir parameter yang dibagi dengan SE df2. Secara matematis dituliskan

sebagai berikut: )) , ( ˆ ( ) , ( ˆ v u SE v u t i i k i i k    (10) Jika diberikan level keyakinan sebesar á, maka keputusan diambil dengan menolak H0 jika nilai

t thitung ( 2,df ) 2   , dimana t( 2,df ) 2

didapat dari t tabel.

PEMBAHASAN

Faktor-faktor yang mempengaruhi debit puncak air antara lain panjang sungai, rata-rata curah hujan, dan kemiringan sungai. Sebelum menggunakan GWR untuk analisis data, terlebih dahulu menggunakan model regresi untuk menganalisis data. Hasil persamaan regresi diasumsikan sama dan diberlakukan untuk semua wilayah pada Daerah Aliran Sungai. Secara umum, model regresi antara debit puncak dan faktor-faktor yang mempengaruhinya adalah:

y

=

Panjang +

Hujan +

3

Miring +

Model regresi yang layak digunakan dapat dilihat dari nilai R2. Nilai R2 dikalikan 100% menunjukkan persentase keragaman di dalam variabel Y yang dapat diberikan oleh model regresi yang didapatkan. Semakin besar nilai R2, semakin baik model regresi yang diperoleh.

Untuk menjaga akurasi hasil yang diperoleh, maka perlu dilakukan beberapa tahapan uji asumsi model. Uji asumsi model dilakukan untuk menjawab sah atau tidaknya suatu model regresi yang akan dipakai sebagai model penjelas bagi pengaruh antar variabel. Beberapa asumsi yang dibutuhkan dalam model regresi diantaranya varian homogen (homoskedastisitas), tidak ada autokorelasi antar error (independensi), dan error mengikuti distribusi normal. Apabila asumsi-asumsi sudah terpenuhi, selanjutnya dilakukan pengujian parameter model yaitu pengujian parameter secara serentak dan pengujian parameter secara parsial.

Pengujian parameter model dengan uji serentak. Bentuk hipotesisnya adalah:

Hipotesis:

H

0

:

01230

H1 : Minimal ada 1 parameter model (0,1,2atau3) yang tidak bernilai 0

Uji ini menggunakan uji F dengan daerah penolakan H0 H0 adalah Fhitung F( ;df ,df ) 2 1   . Apabila H 0 ditolak, maka model regresi yang diperoleh dapat digunakan. Setelah dilakukan pengujian parameter model dengan uji serentak, selanjutnya dilakukan pengujian parameter model dengan uji parsial.

Bentuk hipotesisnya adalah: H0 :

j= 0

H1 :

j

0dimana j = 0, 1, 2, 3

Uji parsial menggunakan uji t dengan daerah penolakan H0 adalah jika nilai

t

hitung

t

( 2,df )

2

,

dimana

t

( 2,df )

2

didapat dari t tabel. Apabila H 0 ditolak, maka variabel independen memiliki kontribusi yang signifikan terhadap variabel dependen.

(6)

Selanjutnya dilakukan analisis dengan model GWR. Langkah-langkah untuk membangun model GWR adalah dengan memilih bandwidth optimum, menentukan pembobot, penaksiran parameter dan pengujian hipotesis. Penaksiran parameter model GWR diperoleh dengan memasukkan pembobot spasial dalam perhitungannya. Jika pembobot yang digunakan adalah fungsi kernel maka pemilihan

bandwidth ini sangatlah penting, karena bandwidth

merupakan pengontrol keseimbangan antara kesesuaian kurva terhadap data dan kemulusan data. Salah satu metode yang digunakan untuk menentukan

bandwidth optimum adalah metode Cross Validation

(CV) (Fotheringham dkk, 2002). Bandwidth yang optimum diperoleh dengan meminimumkan Persamaan (8).

Bandwidth optimum merupakan besarnya

radius sehingga setiap titik pengamatan yang berada dalam radius tersebut dianggap memiliki pengaruh yang signifikan dalam menduga parameter GWR pada titik ke-i. Langkah awal mendapatkan matriks pembobot adalah dengan mencari jarakeuclide lokasi

u

i

,

v

i

ke semua lokasi penelitian. Matriks pembobot yang terbentuk dengan fungsi Gauss di lokasi ke-i dan nilai bandwidth tertentu dapat ditulis sebagai berikut:

          2 / exp 2 b d ij Wij

Matriks pembobot ini nantinya digunakan untuk menaksir parameter di lokasi dengan menggunakan rumus:

X W X

X W Y βˆ(u,v) (u,v) 1 (ui,vi) T i i T i i  

Model yang digunakan dalam menduga parameter GWR adalah :

Debit(i)=0i

ui,vi

+1i

ui,vi

Panjang(i )

+2iui,viHujan(i) +3iui,viMiring(i)+

i

Setelah diperoleh hasil estimasi baik model GWR dan regresi OLS, selanjutnya melakukan uji parameter model secara serentak dengan menggunakan statistik uji F. Adapun bentuk hipotesisnya adalah:

H

0

:

k( , )u vi i k

, k = 0, 1, 2, 3

H

1

: paling tidak ada satu

k( , )u vi i k

Setelah dilakukan uji parameter model secara serentak, maka perlu dilakukan pengujian parameter model secara parsial. Pengujian parameter model secara parsial dimaksudkan untuk mengetahui faktor-faktor yang berpengaruh terhadap tinggi debit puncak di setiap lokasi. Bentuk hipotesisnya adalah:

H

0

:

H

1

:

Identifikasi bahwa model GWR merupakan model yang lebih baik daripada model OLS dalam menjelaskan hubungan variabel dependen dengan variabel independen, dilakukan pengujian secara global dengan menggunakan ANOVA. Nilai p yang besarnya kurang dari 5% menyatakan bahwa model GWR lebih baik dalam menjelaskan hubungan variabel dependen dengan variabel independen dibandingkan model OLS.

Salah satu indikator model yang lebih baik adalah yang menghasilkan nilai MSE terkecil. Apabila nilai MSE pada model GWR lebih kecil daripada nilai MSE pada model OLS, dapat disimpulkan bahwa model yang dihasilkan dengan metode GWR merupakan model yang lebih baik daripada model OLS.

(7)

DAFTAR PUSTAKA

Asdak, C. 2002. Hidrologi dan Pengelolaan Daerah

Aliran Sungai. Gajah Mada University Press.

Yogyakarta.

Bocci, C., Petrucci, A., dan Rocco, E. 2006. An

Application of Geographically Weighted Regression to Agricultural Data for Small Area Estimates. Dipartimento di Statistica “G. Parenti”. Universita degli Studi di Firenze, Italy.

Casella, G. dan Berger, R.L. 1990. Statistical

Inference. Wadsworth, Inc. California.

Chasco, C., Garcia, I., dan Vicens, J. 2007. Modeling

spatial variations in household disposable income with Geographically Weighted Regression. Munich Personal RePEc Archive Paper No. 1682.

Cressie, N.A.C. 1991. Statistics For Spatial Data. John Wiley & Sons, Inc. United States of America.

Draper, N.R., Smith, H. 1998. Applied Regression

Analysis. 3th ed. John Wiley & Sons, Inc. United States of America.

Fotheringham, A.S., Brundson, C., dan Charlton, M. 2002. Geographically Weighted Regression: the

analysis of spatially varying relationships. John

Wiley & Sons Ltd, England.

Kutner, M.H., Nachtsheim, C.J., dan J. Neter, J. 2004.

Applied Linear Regression Models. 4th ed. New York: McGraw-Hill Companies, Inc.

Leung, Y. 2000. Statistical Tests for Spatial

Non-Stationarity Based on the Geographically Weighted Regression Model. Journal, The

Chinese University of Hong Kong, Hong Kong. Sosrodarsono, S. dan K. Takeda. 1985. Hidrologi

Referensi

Dokumen terkait

Dimana Use Case diagram memperlihatkan pengguna ( actor ) yang menggunakan sistem dan fungsionalitas ( use case ) dari sistem. Sedangkan Class diagram

Musik Wagner mendapatkan suatu tempat utama dalam sejarah musik Romantik, bahkan opera Wagner menjadi acuan awal perkembangan musik film, dengan tema yang besar

Mendeskripsikan data apa yg disimpan pada database dan relasi apa yang terjadi antar data tersebut.. Level tertinggi, yang mendeskripsikan hanya sebagian dari seluruh database,

Penelitian ini bertujuan untuk mengetahui pengaruh konsumsi energi, protein dan seng serta riwayat penyakit infeksi terhadap kejadian stunting pada anak balita umur 24-59 bulan

Begitu pula Rini (2009) juga menyatakan perasaan berhubungan dengan perasaan yang paling dalam dan emosi pelanggan. Iklan yang bersifat feel good biasanya digunakan untuk membuat

Penelitian yang dilakukan penulis bertempat di Restoran Gurih 7 Bogor dengan mengkaji aspek kepuasan pelanggannya..

Hasil penelitian menunjukkan bahwa pemanfaatan sumber daya perikanan masih kurang di bawah MSY (Maximum Sustainable Yield). Beberapa program yang harus dikembangkan adalah

Untuk mengetahui perlindungan hukum terhadap Hiu setelah ditetapkan menjadi spesies liar yang masuk dalam daftar Appendiks II CITES Tahun 2013.. Untuk mengetahui