Pendahuluan
Pemodelan Statistical Downscaling (SDS) merupakan salah satu permasalahan dalam pemodelan statistika dengan sejumlah kovariat yang umumnya sangat besar dan tidak saling bebas. Downscaling membuat hubungan antara keadaan (state) dari beberapa peubah yang merepresentasikanspace besar (sering dirujuk sebagai ”skala besar”) dengan keadaan dari beberapa peubah yang merepresentasikan space yang sangat kecil (sering dirujuk sebagai ”skala kecil”) (Benestad et al. 2008). Pemodelan Statistical Downscaling menggunakan pemodelan statistika untuk menganalisis hubungan antara data yang berskala besar (global) dengan data yang berskala kecil (lokal). Data berskala besar umumnya adalah data luaran General Circulation Model (GCM) dan data berskala kecil berupa iklim lokal seperti data curah hujan di suatu pos pengamatan wilayah tertentu. Ilustrasi pemodelan SDS disajikan dalam Gambar 5.1.
Teknik pemodelan SDS dalam statistika merupakan model regresi yang diperluas (Wigena 2006). Secara umum untuk penelitian ini ditulis dalam bentuk model:
y= f(X) (5.1) dalam hal ini:
y(t)= peubah respons (curah hujan),
X(t×g)= peubah prediktor/kovariat,
t= banyaknya waktu (bulanan),
g= banyaknya grid domain luaran GCM.
Model tersebut sangat kompleks dan solusi yang baku untuk model ini tidak tersedia. Kompleksitas model ini terjadi karena kemungkinan terjadinya kolinieritas atau korelasi antar peubah kovariat akibat pengaruh spasial dan adanya otokorelasi akibat pengaruh temporal.
Teknik penanganan solusi pemodelan linier akibat terjadinya kolinieritas atau berkorelasi tinggi antar peubah kovariat adalah:
1. Mentransformasi peubah kovariat dengan cara pereduksian dimensi: analisis komponen utama (AKU),partial least square(PLS)
2. Seleksi peubah: regresi terbaik (best regression), regresi bertatar (stepwise) 3. Menyusutkan nilai penduga parameter (shrinkage): regresi gulud (ridge
regression) / regularisasi L2
4. Seleksi peubah danshrinkage: regularisasi L1(lasso), kombinasi regularisasi
L1dan L2(elastic net)
Dalam penelitian ini hanya mengkaji pengaruh akibat adanya multikolinieritas atau berkorelasi tinggi antar peubah kovariat menggunakan teknik regularisasi L1yang
Gambar 5.1 PemodelanStatistical Downscaling(SDS)
Model Prediksi Curah Hujan di Pos Hujan Indramayu
Aplikasi pemodelan linier pertama dilakukan untuk prediksi curah hujan bulanan di 11 pos hujan Indramayu yang terbagi dalam 3 Zona Musim (ZOM), yaitu ZOM 77, ZOM 78 dan ZOM 79.
Data
Kajian pertama pada pemodelan Statistical Downscaling menggunakan dua tipe data, yaitu kovariat data skala besar dari observasi presipitasi bulanan dalam bentuk grid, dan respons dari data curah hujan bulanan 11 pos hujan di Kabupaten Indramayu dan sekitarnya. Berdasarkan peta prakiraan musim, wilayah Kabupaten Indramayu terbagi menjadi empat wilayah Zona Musim (ZOM) yaitu ZOM 77, 78,79, dan 80. Pada penelitian ini digunakan curah hujan bulanan dari pos hujan yang mewakili tiga ZOM, yaitu ZOM 77, ZOM 78, dan ZOM 79 (Gambar 5.2) masing-masing sebanyak 3, 4, dan 4 pos hujan. ZOM 77 diwakili oleh pos hujan Kr Anyar, Pusakanegara dan Tulang Kacang; ZOM 78 diwakili oleh Dempet, Indramayu, Juntinyuat dan Losarang; dan ZOM 79 diwakili oleh Gegesik, Karangkendal, Krangken dan Sukadana. Data yang digunakan dipilih dari periode yang sama mulai Januari 1981 sampai Mei 2014 (34 periode). Data hilang (missing
value) tidak digunakan dalam pendugaan model.
Letak geografis Kabupaten Indramayu berada pada posisi 107◦52′ - 108◦36′ BT dan 6◦15′- 6◦40′LS. Luas wilayah kabupaten ini seluas kurang lebih 204.011 Ha, dengan panjang pantai kurang lebih 114 km yang membentang sepanjang
37 pantai utara Laut Jawa antara Kabupaten Cirebon - Kabupaten Subang dan secara administratif berbatasan:
• Sebelah Utara : Laut Jawa
• Sebelah Selatan : Kabupaten Majalengka, Sumedang dan Cirebon
• Sebelah Barat : Kabupaten Subang
• Sebelah Timur : Laut Jawa dan Kabupaten Cirebon
Secara umum wilayah Kabupaten Indramayu merupakan daerah yang datar dan tidak terdapat dataran tinggi atau pegunungan dengan kemiringan tanahnya rata-rata 0% – 2%. Sebagian besar wilayah Indramayu bagian utara mempunyai klasifikasi agroklimatik seasonally dry (kering musiman) 5-8 bulan pertahun dengan rata-rata curah hujan kurang dari 100 mm/bulan, sedangkan bagian selatan
permanently moist (tetap basah) selama 0-4 bulan dengan rata-rata curah hujan
kurang dari 100 mm berdasarkan tinjauan sumber daya lahan oleh Bakosurtanal tahun 1990 (Haryoko 2015).
Gambar 5.2 Peta pos hujan di Kabupaten Indramayu dan sekitarnya yang diteliti (tanda yang sama menunjukkan pos-pos hujan dalam satu wilayah ZOM)
Pola curah hujan bulanan 11 pos hujan di Kabupaten Indramayu dan sekitarnya yang digunakan dalam penelitian ini menunjukkan pola monsunal, yaitu berbentuk U (Gambar 5.3, Gambar 5.4, dan Gambar 5.5). Curah hujan tertinggi terjadi pada bulan Januari dan terendah antara bulan Juli-September. Rata-rata curah hujan terendah untuk wilayah ZOM 77 di mulai sekitar bulan Juli, dan wilayah ZOM 78 dan ZOM 79 dimulai sekitar bulan Agustus, sedangkan awal musim hujan ketiga ZOM dimulai pada bulan Oktober.
Gambar 5.3 Pola sebaran curah hujan bulanan 3 pos hujan pada wilayah ZOM 77
39
Gambar 5.5 Pola sebaran curah hujan bulanan 4 pos hujan pada wilayah ZOM 79
Presipitasi hasil interpolasi kombinasi data observasi permukaan dan satelit dalam bentuk grid dari GPCP (Global Precipitation Climatology Project) versi 2.2 (Adleret al.2003) selanjutnya disingkat sebagai GPCP, digunakan sebagai kovariat skala besar. Data presipitasi GPCP diberikan oleh the NOAA/OAR/ESRL PSD, Boulder, Colorado, USA, dari Web sitenya di http://www.esrl.noaa.gov/psd/). Data kovariat diambil dalam domain 7 × 7 grid (49 kovariat) pada sistem koordinat 101.25◦ – 116.25◦ BT dan 13.75◦ LS – 1.25◦ LU dengan lebar grid sebesar 2.5◦ x 2.5◦. Pada posisi ini, letak Kabupaten Indramayu berada di bawah grid tengah daerah yang dipilih (Gambar 5.6).
Hasil analisis komponen utama terhadap data observasi GPCP telah dibahas pada Bab 2 dengan diperolehnya 8 komponen utama yang akan digunakan dalam pendugaan model linier. Secara spasial ke-delapan komponen utama menunjukkan pemisahan-pemisahan wilayah akibat karakteristik iklim. Sebagai contoh, komponen utama pertama (KU-1) memisahkan wilayah dengan pola curah hujan di wilayah A dan wilayah B seperti didefinisikan oleh Aldrian dan Susanto (2003) dan komponen utama kedua (KU-2) lebih menjelaskan karakteristik iklim di wilayah Barat Daya (Gambar 5.7). Karakteristik yang diberikan oleh komponen-komponen utama (Lampiran 7) diduga terkait dengan letak geografis wilayah yang berada di antara dua benua dan dua samudera, kejadian ENSO
Gambar 5.6 Domain grid kovariat yang digunakan dalam penelitian
KU-1 KU-2
41
Metode
Pemodelan Statistical Downscaling dilakukan dengan memodelkan secara linier kovariat presipitasi bulanan dengan respons curah hujan. Langkah-langkah yang dilakukan untuk melakukan pendugaan model adalah sebagai berikut:
1. Penyiapan Data
(a) Data curah hujan 11 pos hujan di Kabupaten Indramayu dan sekitarnya diperoleh dari BMKG dalam format Microsoft Excel dan dimasukkan ke dalam perangkat lunak komputasi statistik R.
(b) Data observasi GPCP diperoleh dari web sitenya dalam format file netCDF versi 4. Format ini merupakan format standar untuk penyimpanan data klimatologi. Perangkat lunak komputasi statistik R dengan paket ncdf4 yang dijalankan pada sistem operasi Linux digunakan untuk membaca format ini.
(c) Data observasi GPCP selanjutnya dilakukan pereduksian dimensi untuk menghilangkan kolinier/korelasi dengan menggunakan teknik Analisis Komponen Utama (AKU) untuk mendapatkan peubah laten yang ortogonal dalam bentuk skor komponen utama. Banyaknya peubah laten ditentukan oleh grafik screeplot, proporsi keragaman dan nilai ragam yang direpresentasikan oleh nilai akar ciri.
(d) Data curah hujan bulanan 11 pos hujan dan data observasi GPCP digabungkan dan disajikan dalam format data frame (gugus data) melalui perangkat lunak komputasi statistik R. Hal yang sama dilakukan penggabungan data curah hujan bulanan 11 pos hujan dengan peubah laten yang diperoleh menggunakan AKU.
(e) Proses penyiapan data menghasilkan dua data frame, yaitu:
• DATA1 : Gabungan curah hujan 11 pos hujan dengan GPCP
• DATA2 : Gabungan curah hujan 11 pos hujan dengan peubah laten dari GPCP
2. Pendugaan Model
(a) Pendugaan menggunakan Metode Regresi dengan Regularisasi L1
(lasso)
DATA1 digunakan untuk menduga model regresi melalui metode seleksi dan penyusutan koefisien menggunakan teknik lasso. Banyaknya kovariat yang dipilih ditentukan berdasarkan nilai statistikCp Mallows yang dekat dengan banyaknya parameter yang diduga (Draper dan Smith 1998). StatistikCpMallows mempunyai bentuk:
Cp=JKSp/s2−(n−2p) (5.2) Dalam hal ini JKSp adalah jumlah kuadrat sisaan dari model yang mengandungpparameter, padalah banyaknya parameter dalam model termasukβ0, dans2 adalah kuadrat tengah sisaan dari persamaan yang
mengandung semua kovariat. Model yang diduga dengan menggunakan metode lasso adalah:
Dalam hal iniCH adalah curah hujan di salah satu pos hujan,xpadalah presipitasi dari data observasi GPCP pada satu koordinat.
(b) Pendugaan menggunakan Metode Kuadrat Terkecil
Dengan menetapkan λ = 0 pada pendugaan dengan menggunakan metode lasso, diperoleh model dugaan kuadrat terkecil. Penduga dengan metode MKT digunakan sebagai pembanding hasil dugaan model dengan menggunakan teknik lasso.
(c) Pendugaan menggunakan Metode Regresi Komponen Utama
DATA2 digunakan untuk menduga model regresi komponen utama (RKU) untuk setiap pos hujan. Model yang diduga adalah:
CH=β0+β1KU1+β2KU2+. . .βjKUj (5.4) Dalam hal iniCHadalah curah hujan di salah satu pos hujan,KUjadalah skor komponen utama untuk setiap peubah laten yang diperoleh dari analisis komponen utama (komponen utama ke-j).
(d) Pendugaan Menggunakan Pemodelan Linier Terampat Sebaran Gamma Pendugaan menggunakan pemodelan linier terampat sebaran Gamma dilakukan dengan teknik regularisasi L1 dan pereduksian dimensi
menggunakan analisis komponen utama. Model yang diduga sama dengan model linier pada pendugaan dengan metode lasso dan model regresi komponen utama masing-masing untuk teknik yang sama. Fungsi hubung yang digunakan dalam penelitian ini adalah dengan menggunakan fungsi hubungreciprocal/inverse (1/µ). Teknik Analisis Komponen Utama (AKU) dan teknik regularisasi L1 digunakan untuk
memenuhi syarat dalam pemodelan linier yaitu peubah kovariat saling bebas (tidak terkondisi buruk). Pemilihan model untuk teknik regularisasi L1 dilakukan dengan menggunakan nilai validasi silang
terkecil.
Bentuk sebaran curah hujan pada setiap bulan lebih cenderung memiliki sebaran yang menjulur ke kanan seperti tersaji pada Gambar 5.3 - Gambar 5.5 sebelumnya. Dengan bentuk sebaran yang cenderung menjulur ke kanan sesuai, sebaran Gamma dapat juga digunakan untuk pendugaan curah hujan ekstrim. Stephensonet al. (1999) menunjukkan bahwa sebaran Gamma dan Weibull memberikan nilai dugaan (fit) yang baik dalam menduga sebaran curah hujan ekstrim di India pada hari-basah (wet-day).
Pada bagian ini dilakukan kajian pendugaan curah hujan normal bulanan dan curah hujan ekstrim bulanan menggunakan pemodelan linier terampat dengan sebaran Gamma. Curah hujan normal bulanan diduga dengan hasil dugaan nilai tengah (µ), sedangkan curah hujan ekstrim diduga menggunakan quantil 0.75, 0.9, dan 0.95 dari sebaran Gamma yang diduga oleh model. Penetapan curah hujan ekstrim dilakukan secara statistik berupa perhitungan untuk data pencilan
(outlier). Identifikasi curah hujan ekstrim digunakan pendekatan nilai
pencilan setiap bulan, yaitu nilai di atasQ3+1.5×(Q3−Q1). Q1 dan
Q3 adalah nilai quartil pertama dan quartil ketiga pada data curah hujan masing-masing untuk setiap bulan.
43 3. Pemilihan Metode Pendugaan Terbaik
Metode pendugaan terbaik ditentukan melalui nilai penduga galat yang terkecil. Nilai Root Means Square Error (RMSE) dan Root Means Square
Error Prediction (RMSEP) digunakan untuk tujuan tersebut. RMSE dan
RMSEP merupakan metode untuk mengukur perbedaan antara nilai prediksi dengan nilai aktual yang didefinisikan sebagai berikut:
RMSE atau RMSEP=
s
∑ni=1(Yi−Yˆi)2
n (5.5)
dalam hal iniYi adalah nilai observasi/aktual dan ˆYiadalah nilai dugaan ke-i. Nilai RMSEP diduga menggunakan teknik validasi silang 10-fold. Kebaikan dari suatu metode ditentukan oleh nilai RMSE dan RMSEP yang paling kecil.
Pendugaan Curah Hujan Bulanan dengan Asumsi Respons Menyebar Normal
Pendugaan curah hujan bulanan dengan asumsi respons berasal dari sebaran normal dilakukan melalui pemodelan linier menggunakan teknik lasso yang diperbandingkan dengan metode kuadrat terkecil dan regresi komponen utama (RKU). Pendugaan menggunakan RKU merupakan metode yang sering digunakan dalam pemodelan SDS, sehingga selanjutnya dibahas terlebih dahulu. Banyaknya komponen utama yang diperoleh dari hasil AKU telah dibahas pada Bab 2 dalam pemilihan skenario kovariat untuk simulasi. Model regresi yang diduga adalah:
y=β0+β1KU1+β2KU2+. . .+β8KU8 (5.6)
dalam hal iniKUiadalah kovariat dari skor komponen utama data observasi GPCP. Pendugaan model linier menggunakan metode lasso dilakukan menggunakan paket lars pada perangkat lunak komputasi statistik R. Peubah yang diseleksi ditentukan dengan cara mencari nilai statistik Cp Mallows yang dekat dengan banyaknya parameter yang diduga (Draper dan Smith 1998). Grafik plot Cp Mallows dengan banyaknya parameter yang diduga digunakan untuk identifikasi banyaknya parameter yang digunakan. Grafik plotCpMallows untuk pos hujan di wilayah ZOM 77 dengan kovariat menggunakan GPCP disajikan pada Gambar 5.8. Lampiran 8 menyajikan grafik plotCp Mallows untuk pos-pos hujan yang berada pada wilayah ZOM 78 dan ZOM 79 dengan kovariat menggunakan data observasi GPCP.
Banyaknya parameter model pendugaan curah hujan setiap pos hujan untuk setiap kovariat disajikan pada Tabel 5.1. Model regresi linier yang diduga dengan menggunakan metode lasso adalah model:
ˆ
y=βˆ0+βˆ1x1+βˆ2x2+. . .+βˆpxp (5.7) dalam hal inix1,x2, ...,xpadalah presipitasi observasi GPCP. Pada Tabel 5.1 terlihat bahwa banyaknya kovariat yang masuk dalam model untuk menduga curah hujan bervariasi antara model untuk setiap pos hujan. Banyaknya kovariat yang terseleksi dalam pendugaan model bervariasi mulai dari 4 kovariat (5 parameter) sampai dengan 39 kovariat (40 parameter) dari total 49 kovariat presipitasi.
Nilai statistik RMSE dan RMSEP setiap penduga model disajikan pada Tabel 5.2. Nilai penduga RMSE dari metode kuadrat terkecil (MKT) merupakan nilai yang terkecil diantara semua metode pendugaan yang diperbandingkan pada kajian ini sesuai dengan teori pendugaannya. Tetapi, nilai penduga RMSEP yang diperoleh menggunakan teknik validasi silang 10-folddari MKT menunjukkan nilai RMSEP yang selalu lebih besar dibanding metode RKU dan lasso. Hal tersebut merupakan kewajaran sesuai dengan teori karena kovariat-kovariat dari skala besar yang digunakan untuk pendugaan model terkondisi buruk (ill-conditioned) yang ditunjukkan oleh nilai koefisien korelasi yang tinggi.
Gambar 5.8 Grafik plot Cp Mallows dengan banyaknya parameter yang diduga untuk pos hujan di wilayah ZOM77 dengan kovariat data observasi GPCP
45 Tabel 5.1 Banyaknya parameter model yang diduga menggunakan metode lasso
di luar intersep
Model Pos Hujan Banyak Kovariat Terseleksi ZOM 77 Kr Anyar 17 Pusakanegara 20 Tulang Kacang 23 ZOM 78 Dempet 24 Indramayu 25 Juntinyuat 19 Losarang 22 ZOM 79 Gegesik 34 Karangkendal 14 Krangken 21 Sukadana 19
Nilai statistik RMSE dari pendugaan menggunakan teknik lasso diperoleh selalu lebih kecil dibanding nilai statistik RMSE menggunakan metode RKU pada semua model penduga curah hujan di setiap pos hujan seperti pada percobaan simulasi pada Bab 2. Hal ini menunjukkan bahwa pendugaan model menggunakan teknik lasso memberikan hasil lebih baik dibandingkan dengan menggunakan RKU. Demikian juga nilai penduga RMSEP yang diperoleh dari validasi silang 10-fold
memberikan nilai yang lebih kecil dibanding metode RKU. Pada pendugaan model curah hujan ini, nilai statistik RMSEP terkecil diberikan semuanya oleh penduga model menggunakan teknik lasso (Tabel 5.2).
Koefisien korelasi antara nilai respons dengan nilai dugaan dari teknik lasso dan analisis komponen utama disajikan pada Tabel 5.3. Koefisien korelasi semua model pos hujan dengan menggunakan teknik lasso memberikan nilai yang lebih baik dibanding dengan analisis komponen utama. Nilai koefisien korelasi terbesar dengan teknik lasso diberikan oleh model pos hujan Gegesik (wilayah ZOM 79) sebesar 0.75 dan terendah diberikan oleh model pos hujan Tulang Kacang (wilayah ZOM 77) sebesar 0.65. Koefisien korelasi terbesar dari analisis komponen utama diperoleh dari model pos hujan Sukadana (wilayah ZOM 79) sebesar 0.70 dan terendah oleh model pos hujan Indramayu (wilayah ZOM 78) sebesar 0.59.
Tabel 5.2 Nilai statistik RMSE dan RMSEP menggunakan validasi silang 10-fold
untuk setiap penduga model menggunakan data observasi model GPCP versi 2.2
Penduga Model Curah Hujan Pos Pengamatan
RMSE RMSEP 10-fold
MKT RKU lasso MKT RKU lasso
ZOM 77 Kr Anyar 106.96 121.19 113.75 124.95 124.70 120.46 Pusakanegara 83.04 95.35 87.58 97.01 98.30 93.27 Tulang Kacang 126.52 137.56 131.91 150.88 143.33 142.9 ZOM 78 Dempet 95.33 108.31 98.91 110.90 111.39 106.82 Indramayu 115.95 131.07 119.89 128.72 134.29 127.45 Juntinyuat 95.21 103.83 99.37 109.26 106.31 104.77 Losarang 94.49 104.71 98.09 109.95 108.31 105.52 ZOM 79 Gegesik 78.80 89.32 80.92 94.36 91.52 91.32 Karangkendal 83.42 93.28 87.75 100.77 96.46 94.01 Krangken 76.74 85.62 79.96 89.02 87.89 86.40 Sukadana 80.51 89.62 84.41 93.91 92.81 90.32
Tabel 5.3 Koefisien korelasi antara nilai respons dengan dugaan setiap teknik
Model Pos Hujan Teknik Lasso Analisis Komponen Utama ZOM 77 Kr Anyar 0.67 0.61 Pusakanegara 0.72 0.66 Tulang Kacang 0.65 0.61 ZOM 78 Dempet 0.71 0.63 Indramayu 0.68 0.59 Juntinyuat 0.66 0.62 Losarang 0.69 0.63 ZOM 79 Gegesik 0.75 0.68 Karangkendal 0.71 0.66 Krangken 0.69 0.63 Sukadana 0.74 0.70
47
Pendugaan Curah Hujan Normal Bulanan dengan Asumsi Respons Menyebar Gamma
Hasil pendugaan model menggunakan regresi komponen utama (RKU) dan model linier terampat (GLM) sebaran Gamma dengan pra pemrosesan AKU (Gamma-KU) disajikan pada Tabel 5.4. Pendugaan curah hujan normal bulanan menggunakan metode model linier terampat sebaran Gamma tidak memberikan pendugaan yang lebih baik dibanding dengan metode regresi komponen utama. Rataan nilai statistik RMSE hasil pendugaan dengan model linier terampat respons sebaran Gamma menghasilkan nilai yang lebih tinggi pada semua model curah hujan. Dengan memperhatikan karakteristik pola sebaran curah hujan setiap bulan yang menunjukkan pola berbeda dilakukan penambahan peubah dummy bulan sebagai kovariat dalam model.
Penambahan peubahdummybulan berdampak pada penurunan nilai statistik RMSE seperti ditunjukkan pada Tabel 5.4. Penurunan nilai RMSE ini terjadi sangat signifikan pada pendugaan model linier terampat sebaran gamma dengan pra pemrosesan AKU (Gamma-KU-Dummy) dibanding penurunan pada RKU (RKU-Dummy). Selanjutnya pemodelan linier terampat sebaran Gamma dengan regularisasi L1 didasari oleh peubah kovariat dari data observasi GPCP ditambah
dengan peubahdummybulan.
Penggunaan teknik regularisasi L1 pada pemodelan linier terampat sebaran
Gamma (Gamma-L1-Dummy) belum memberikan keunggulan mutlak sebagai
metode yang terbaik dibanding dengan analisis komponen utama seperti pada teknik lasso dan regresi komponen utama di sub bab sebelumnya. Demikian juga nilai koefisien korelasi dari teknik regularisasi L1 dan analisis komponen utama
tidak memiliki pola yang dapat menentukan metode terbaik (Tabel 5.5) dibanding dengan analisis komponen utama. Ketiga metode pendugaan memberikan koefisien korelasi yang bervariasi dan tidak ada satu metode yang memberikan koefisien korelasi selalu lebih tinggi dibanding metode lain. Oleh karena itu, pemodelan linier terampat sebaran Gamma dengan regularisasi L1 dan analisis komponen
utama sama-sama dapat dipertimbangkan dalam pemodelan SDS, karena perbedaan nilai statistik RMSE dan nilai koefisien korelasi yang tidak terlalu signifikan. Hasil teknik regularisasi L1 memberikan kovariat yang mempengaruhi respons.
Banyaknya penduga parameter ˆβ yang masuk ke dalam model dari kovariat data observasi GPCP disajikan pada Tabel 5.6.
Tabel 5.4 Nilai RMSE untuk setiap model pendugaan
Model Pos Hujan RKU Gamma-KU RKU- Gamma-KU- Gamma-L1-
Dummy Dummy Dummy
ZOM 77 Kr Anyar 121.19 131.57 110.81 108.51 100.32 Pusakanegara 95.35 96.81 83.57 83.24 85.76 Tulang Kacang 137.56 160.09 127.31 138.39 132.53 ZOM 78 Dempet 108.31 110.15 99.17 98.45 96.77 Indramayu 131.07 130.95 120.33 121.01 126.17 Juntinyuat 103.83 112.85 97.61 102.00 99.24 Losarang 104.71 114.34 95.30 97.92 99.91 ZOM 79 Gegesik 89.32 102.81 82.21 81.64 86.14 Karangkendal 93.28 107.67 88.12 90.35 91.71 Krangken 85.62 92.35 81.93 84.65 80.69 Sukadana 89.62 104.75 83.39 85.90 84.73
Tabel 5.5 Koefisien korelasi antara nilai respons dengan dugaan model regresi komponen utama, model linier terampat sebaran Gamma dengan analisis komponen utama dan regularisasi L1
Model Pos Hujan RKU-dummy Gamma-KU-dummy Gamma-L1-dummy ZOM 77 Kr Anyar 0.69 0.70 0.75 Pusakanegara 0.75 0.75 0.73 Tulang Kacang 0.68 0.62 0.64 ZOM 78 Dempet 0.70 0.71 0.72 Indramayu 0.67 0.67 0.65 Juntinyuat 0.68 0.64 0.66 Losarang 0.71 0.69 0.67 ZOM 79 Gegesik 0.74 0.74 0.74 Karangkendal 0.70 0.69 0.67 Krangken 0.67 0.64 0.68 Sukadana 0.75 0.73 0.74
49 Tabel 5.6 Banyaknya parameter model yang diduga menggunakan metode model linier terampat sebaran Gamma dengan regularisasi L1termasuk peubah
dummy di luar intersep
Model Curah Hujan Banyak Kovariat Terseleksi ZOM 77 Kr Anyar 22 Pusakanegara 24 Tulang Kacang 19 ZOM 78 Dempet 19 Indramayu 19 Juntinyuat 18 Losarang 21 ZOM 79 Gegesik 25 Karangkendal 18 Krangken 22 Sukadana 28
Pendugaan Curah Hujan Ekstrim Bulanan
Penggunaan metode pemodelan linier terampat sebaran Gamma untuk pendugaan nilai tengah curah hujan bulanan di 11 pos hujan Indramayu dan sekitarnya dengan penambahan peubah dummy bulan, tidak memberikan hasil RMSE yang lebih kecil dibanding dengan metode RKU. Tetapi, pendugaan dengan model linier terampat sebaran Gamma selalu memberikan nilai positif, sesuai dengan sifat dari curah hujan. Oleh karena itu, dalam hal ini metode linier terampat sebaran Gamma secara alami dapat dikatakan lebih baik dalam pendugaan dibanding metode RKU. Selain untuk pendugaan nilai tengah, penggunaan sebaran Gamma dalam curah hujan dapat digunakan untuk pendugaan nilai ekstrim seperti yang dilakukan Stephensonet al. (1999). Pada kajian ini, pendugaan nilai ekstrim dilakukan dengan mengambil nilai dugaan pada peluang quantil ke-0.75, 0.90, dan 0.95. Batas nilai ekstrim yang digunakan menggunakan batas pencilan setiap bulan, yaitu: Q3+1.5×(Q3−Q1). Nilai RMSE setiap model pendugaan curah hujan yang melebihi batas atas nilai pencilan disajikan pada Tabel 5.7 - Tabel 5.9. Tabel 5.7 menyajikan nilai RMSE untuk setiap model pendugaan curah hujan ekstrim menggunakan teknik regresi komponen utama, Tabel 5.8 menggunakan model linier terampat dengan teknik analisis komponen utama, dan Tabel 5.9 menggunakan model linier terampat sebaran Gamma dengan teknik regularisasi L1.
Pendugaan nilai ekstrim dengan menggunakan nilai tengah pada semua metode memberikan nilai RMSE paling besar dibanding dengan pendugaan menggunakan pendekatan quantil. Nilai RMSE terkecil umumnya diberikan oleh pendugaan dengan nilai quantil 0.90 dan quantil 0.95. Secara umum metode linier terampat sebaran Gamma (baik menggunakan pra pemrosesan AKU ataupun regularisasi L1) memberikan nilai RMSE yang lebih kecil dibanding dengan
menggunakan RKU untuk pendugaan curah hujan di atas pencilan.
Pada pendugaan menggunakan metode linier terampat sebaran Gamma dengan pereduksian dimensi menggunakan analisis komponen utama (Tabel 5.8), nilai statistik RMSE terkecil diberikan bervariasi oleh pendugaan quantil 0.90 dan quantil 0.95 dengan jumlah relatif sama, sedangkan pendugaan menggunakan metode linier terampat sebaran Gamma dengan regularisasi L1 (Tabel 5.9), nilai
RMSE terkecil lebih banyak diberikan oleh pendugaan mengunakan quantil 0.90. Diantara teknik pereduksian dimensi menggunakan analisis komponen utama dengan teknik regularisasi L1 tidak ada metode yang konsisten memberikan nilai
statistik RMSE terkecil.
Tabel 5.7 Nilai RMSE untuk setiap model pendugaan curah hujan ekstrim menggunakan metode regresi komponen utama
Model Pos Hujan Nilai RMSE Berdasarkan Pendugaan
Nilai Tengah (µ) Quantil 0.75 Quantil 0.90 Quantil 0.95
ZOM 77 Kr Anyar 313.20 265.75 236.83 228.05 Pusakanegara 143.89 60.76 60.22 103.40 Tulang Kacang 328.67 275.92 246.64 240.31 ZOM 78 Dempet 237.57 190.60 162.17 154.79 Indramayu 347.12 288.62 248.37 232.65 Juntinyuat 279.36 234.59 205.25 194.79 Losarang 234.16 194.81 173.76 170.06 ZOM 79 Gegesik 166.48 116.78 81.26 70.33 Karangkendal 230.49 180.02 141.93 125.30 Krangken 180.94 141.54 118.76 114.24