2. PERKEMBANGAN TEKNIK STATISTICAL
2.6. Permasalahan Dalam Teknik Statistical Downscaling
Pemodelan SD diawali dengan penyusunan hubungan fungsional antara peubah atmosfir skala global dengan peubah skala lokal. Pemodelan ini memerlukan asumsi-asumsi dan prosedurnya. Prosedur-prosedurnya mencakup pemilihan peubah lokal sebagai peubah respon (y), pemilihan peubah global sebagai peubah prediktor (X) dan domain GCM, dan penentuan model dan metode pendugaannya.
Beberapa asumsi diperlukan dalam penggunaan model statistik untuk teknik SD. Asumsi penting untuk menilai dampak iklim dengan pendekatan statistik adalah adanya hubungan antara sirkulasi atmosfir skala besar dan iklim lokal yang tidak berubah dengan terjadinya perubahan iklim, meskipun tidak ada jaminan demikian (Zorita & Storch 1999). Namun jika data pengamatan historis (record length) untuk pemodelan cukup panjang, maka data tersebut dapat diasumsikan mengandung informasi penting tentang kondisi iklim yang berbeda atau adanya perubahan iklim. Hal ini berguna untuk menilai iklim lokal dengan memanfaatkan model statistik yang dapat mengidentifikasi informasi tersebut dalam data historis, dan dapat menduga kemungkinan dampaknya terhadap iklim lokal. Keadaan ini akan valid jika keragaman di masa lampau sama dengan keragaman pada saat sekarang dan masa datang. Tetapi kenyataannya bahwa model yang dapat memberikan hasil yang baik untuk masa lampau belum tentu berimplikasi bahwa model tersebut dapat digunakan dengan baik pula untuk kondisi yang akan datang, bahkan ada kemungkinan model itu sudah tidak berlaku lagi karena adanya perubahan keragaman, apalagi kalau ada kejadian ekstrim.
Sehubungan dengan teknik SD ini, Zorita et al (1995) mengemukakan tiga asumsi, yaitu (1) GCM dapat memprediksi peubah atmosfir berskala besar yang lebih realistis daripada memprediksi peubah iklim lokal; (2) Hubungan antara peubah skala besar dan lokal tidak berubah dengan adanya perubahan
iklim; dan (3) Prosedur statistik tidak hanya menghasilkan suatu replika data historis tetapi juga makna pengaruh setiap peubah dan hubungannya secara fisik terhadap peubah lokal. Yarnal et al (2001) menyatakan bahwa salah satu asumsi dalam pemodelan SD adalah kestabilan hubungan antara peubah luaran GCM dengan peubah lokal, di mana hubungan ini tidak tergantung waktu (time invariant). Namun hubungan ini umumnya tidak stabil, terutama kalau banyak peubah yang terlibat dalam penyusunan model dan untuk jangka panjang.
Cavazos (1999) menyebutkan asumsi-asumsi dalam pemodelan linear, yaitu (1) Kelinearan; (2) Kenormalan; dan (3) Tidak ada multikolinearitas. Dengan asumsi kelinearan, model SD harus bersifat linear. Model ini memerlukan asumsi kenormalan, di mana suatu model tidak dapat digunakan secara langsung bila peubah lokal tidak menyebar normal, terutama untuk model paramterik. Pada umumnya peubah lokal tidak menyebar normal, misalnya curah hujan. Luaran GCM menyebar normal selama sirkulasi atmosfir skala besar menyebar normal, tetapi secara umum kenyataannya tidak normal (Cavazos 1999). Multikolinearitas adalah suatu keadaan di mana peubah-peubah prediktor dalam model saling berkorelasi tinggi. Keadaan ini akan menjadi masalah dalam penduga model yang berbias dan overestimate.
Pada dasarnya model SD adalah model regresi yang melibatkan pemodelan suatu fungsi antara satu atau lebih peubah prediktor dan satu atau lebih peubah respon, yaitu pendugaan f(X). Bentuk umum model SD pada persamaan (2.1) terdiri dari peubah respon Y(t x p) dan peubah prediktor X(t x q x s x g) . Bila
fungsi f(X) diketahui, maka pendugaannya dapat dilakukan dengan baik. Tetapi pada kenyataannya bentuk fungsi ini sering tidak diketahui dan model yang tidak tepat akan memberikan hasil dugaan yang tidak tepat pula (Friedman & Stuetzle 1981). Bila bentuk fungsi tidak diketahui dan hanya melibatkan satu peubah prediktor, maka f(X) dapat dimodelkan dengan pemulusan linear seperti spline atau kernel. Untuk jumlah peubah prediktor yang lebih banyak, metode pemulusan linear akan bermasalah karena data prediktor bersifat curse of dimensionality di mana ukuran ruang peubah prediktor bertambah besar secara eksponensial sesuai dengan bertambahnya jumlah peubah prediktor. Hal ini akan
menimbulkan masalah dalam pendugaan f(X) apabila tidak didukung dengan jumlah data yang besar.
Tahap awal dalam SD adalah pemilihan peubah lokal dan lokasi target pendugaan, sehubungan dengan peubah respon pada model SD. Peubah ini harus terukur dan berhubungan dengan sirkulasi global. Pada umumnya temperatur banyak digunakan dalam studi SD. Temperatur bersifat kontinu dan berdistribusi normal. Di samping itu curah hujan juga sering digunakan. Curah hujan berdistribusi skewed dengan nilai minimum nol dan berhubungan dengan proses- proses yang terjadi pada skala lokal sehingga sukar untuk proses downscaling
(Yarnal et al. 2001).
Setelah peubah respon terpilih, tahap berikutnya adalah memilih peubah prediktor dan domainnya. Peubah prediktor mempengaruhi lingkungan pada tingkat permukaan dan dapat disimulasi secara akurat oleh GCM (Yarnal et al.
2001). Peubah GCM yang sering digunakan adalah SLP, geopotential height,
moisture, humidity, dew point temperature, vorticity, dan presipitasi. Presipitasi pernah digunakan sebagai prediktor oleh Venugopal et al (1999), diacu dalam (Yarnal et al. 2001), dan Semenov & Barrow (1996), Palutikof & Wigley (1995), dan Wilks (1999), diacu dalam Giorgi & Hewitson (2001). Presipitasi bulanan luaran GCM merupakan salah satu peubah prediktor yang berpotensi digunakan dalam pemodelan SD (BIOCLIM 2004).
Peubah respon juga bersifat temporal sehingga kemungkinan ada masalah otokorelasi. Jika peubah respon lebih dari satu, maka masalah multikolinearitas mungkin terjadi dalam peubah respon. Permasalahan lain yang mungkin terjadi pada peubah respon adalah kondisi kawasan di mana lokasi target pendugaan akan dilakukan, terutama berkaitan dengan kehomogenan topografi dan vegetasi di wilayah target di kawasan tropis seperti Indonesia. Wilayah yang heterogen memerlukan teknik SD yang dapat digunakan dengan skala ‘titik’ (point scale), yaitu khusus untuk suatu lokasi tertentu, tidak berlaku untuk wilayah sekitarnya yang lebih luas. Untuk wilayah target yang lebih homogen, teknik SD dapat digunakan untuk pendugaan target yang lebih luas. Kejadian ekstrim pada peubah respon juga akan merupakan masalah dalam pendugaan model SD. Kejadian ini akan menjadi data pencilan yang mungkin akan mengganggu pendugaan model
SD, sehingga teknik SD harus bersifat kekar (robust) terhadap kejadian ekstrim atau pencilan.
Peubah prediktor bersifat spasial (g) dan temporal (t) sedangkan peubah respon bersifat temporal (t) di mana peubah ini berupa deret waktu. Kedua jenis peubah ini mempunyai permasalahannya masing- masing, di samping masalah
curse of dimensionality terutama pada peubah prediktor. Peubah prediktor adalah data luaran GCM yang tergantung pada luasan dan lokasi domain GCM yang bersifat spasial sehingga kemungkinan adanya korelasi spasial antar grid dalam domain. Keadaan ini menunjukkan kemungkinan adanya masalah multikolinearitas antar grid. Demikian juga jika model melibatkan lebih dari satu prediktor dan lebih dari satu lapisan atmosfir, yang kemungkinan ada korelasi antara peubah prediktor. Di samping bersifat spasial, prediktor ini bersifat temporal sehingga kemungkinan ada masalah otokorelasi.
Secara umum permasalahan dalam pemodelan SD adalah sebagai berikut: (1) Luasan dan lokasi domain GCM, yaitu jumlah grid dalam domain dan lokasi
domain di mana peubah prediktornya berkorelasi tinggi dengan peubah respon.
(2) Peubah prediktor (luaran GCM) yang bersifat curse of dimensionality, nonlinear, non Gaussian, bahkan tidak mengikuti sebaran statistik yang baku, dan multikolinearitas.
(3) Peubah respon juga bersifat nonlinear, non Gaussian, bahkan tidak mengikuti sebaran statistik yang baku.
(4) Panjang data historis, di mana umumnya teknik SD memerlukan data historis yang relatif panjang.
(5) Data peubah respon yang ekstrim atau pencilan.
2.7. Simpulan
1). Penggunaan suatu teknik SD perlu memperhatikan permasalahan yang ada. Teknik-teknik SD yang ada sudah memberikan hasil yang cukup akurat dengan berbagai asumsi dan kendala tertentu. Pada kenyataannya teknik SD masih terus berkembang dan mencoba untuk mengantisipasi permasalahan yang ada sehingga dapat memberikan hasil dugaan dengan
kesalahan yang relatif kecil. Teknik-teknik SD berbasis regresi nonlinear, nonparametrik, proyeksi atau seleksi, dan data-driven akan menjadi pilihan yang lebih tepat untuk data iklim, antara lain metode PPR.
2). Pemilihan domain GCM yang berhubungan kuat dengan peubah responnya masih merupakan masalah dalam SD. Peubah prediktornya bersifat curse of dimensionality dan peubah respon umumnya bersifat nonlinear dan tidak menyebar menurut sebaran yang baku (tidak normal), sehingga diperlukan teknik SD berbasis regresi nonlinear, nonparametrik, proyeksi atau seleksi, dan data-driven. Masalah lainnya berkaitan dengan kestabilan model hubungan peubah prediktor dengan peubah respon dari waktu ke waktu atau bahwa apakah model tersebut time invariant. Meskipun tidak sering menjadi kendala, panjang data historis dan data peubah respon yang ekstrim (mungkin berupa data pencilan) juga dapat mempengaruhi hasil pendugaan model SD.