MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU
MUHAMMAD ASYHAR AGMALARO
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
Saya menyatakan dengan sebenar-benarnya bahwa segala pernyataan dalam tesis
yang berjudul Pemodelan Statistical Downscaling Data GCM Menggunakan
SupportVectorRegression untuk Memprediksi Curah Hujan Bulanan Indramayu, merupakan gagasan atau hasil penelitian tesis saya sendiri dengan arahan dari
komisi pembimbing, kecuali yang dengan jelas ditunjukkan oleh sumbernya.
Tesis ini belum pernah diajukan untuk memperoleh gelar pada program sejenis di
Perguruan Tinggi lain. Semua data dan informasi yang digunakan telah
dinyatakan secara jelas dan dapat diperiksa kebenarannya.
Bogor, Desember 2011
Muhammad Asyhar Agmalaro
MUHAMMAD ASYHAR AGMALARO. Statistical Downscaling of GCM Data
using Support Vector Regression to Predict Monthly Rainfall in Indramayu.
Under direction of AGUS BUONO, and MUSHTHOFA.
The knowledge about weather and climate pattern, especially rainfall is
required by many sectors such as, agricultural, plantation, transportation, and so
on. Recently, the model that is used to observe the impact and to predict the
climate change is the global circulation model (GCM). However, the current
GCM-resolution data is too low and it is difficult to predict the local climate
pattern that requires high resolution. However, it is possible to obtain
regional-scale information if it is combined with statistical downscaling (SD) methods. The
main objective of this research is to develop SD models by using support vector
regression (SVR) in forecasting monthly rainfall in Indramayu, in order to get the
accurate climate information based on GCM data. The results of this research
showed that overall, the model is good enough to predict rainfall with normal
conditions. But for extreme circumstances, although the prediction model was
able to follow the pattern of the observational data, but the value of the resulting
predictions have not managed to predict accuratelly the actual observed values.
Variations of the evaluation of estimated results by the model for 13 rain stations
in Indramayu district showed that the location of rain stations in certain areas can
influence and determine the accuracy of the monthly rainfall forecast. Rain
observations points located farther from the sea tend to have better estimation
results than the observation points located close to the sea.
Data GCM Menggunakan Support Vector Regression untuk Memprediksi Curah Hujan Bulanan Indramayu. Dibimbing oleh AGUS BUONO dan MUSHTHOFA.
Iklim merupakan gejala alamiah yang sangat penting dan berpengaruh bagi
kehidupan manusia. Pengetahuan tentang pola cuaca dan iklim terutama curah
hujan, sangat dibutuhkan di banyak sektor seperti pertanian, perkebunan,
transportasi, dan lain-lain. Untuk mengetahui dan memahami sistem iklim
sehingga dapat digunakan dalam memprediksi jumlah curah hujan bulanan di
suatu daerah, diperlukan suatu model/alat yang dapat menyimulasikan iklim.
Sampai saat ini, model/alat yang digunakan dalam kajian utama untuk
mempelajari dampak dan menduga perubahan iklim adalah global circulation
model (GCM). Akan tetapi resolusi dari data luaran GCM yang dianggap terlalu rendah menyulitkan dalam melakukan prediksi dengan mempelajari pola iklim
regional/lokal yang membutuhkan resolusi yang tinggi. Namun GCM masih
mungkin digunakan untuk memperoleh informasi skala regional hingga lokal bila
dipadukan dengan teknik statistical downscaling (SD).
Usaha pelaksanaan pengelolaan dampak dan resiko iklim menggunakan
SD sudah banyak dilakukan dan coba diterapkan dengan tujuan mengembangkan
model yang dapat memberikan berbagai informasi tentang iklim yang memadai
dan berguna untuk perencanaan kedepan. Oleh karena itu, studi kali ini akan
mencoba menekankan pada pentingnya upaya pembelajaran dan pemahaman
sistem iklim melalui pengembangan model SD menggunakan suport vector
regression (SVR) dalam melakukan peramalan curah hujan bulanan sehingga dapat dijadikan sebagai alat pendukung dalam proses penyebaran informasi iklim
yang efektif, efisien, dan tepat guna.
Tujuan utama dari penelitian ini adalah mengembangkan model SD
menggunakan SVR untuk peramalan curah hujan bulanan (studi kasus Indramayu)
agar dapat menghasilkan informasi iklim yang akurat dan dapat dijadikan sebagai
dasar pembuat keputusan. Manfaat dari hasil penelitian ini dihasilkan suatu model
curah hujan yang digunakan berasal dari stasiun hujan yang berada di daerah
Indramayu (13 stasiun) dari tahun 1979 – 2002 serta data General Circulation
Model (GCM) yang digunakan adalah sebanyak 6 model (1901 – 2000).
Secara keseluruhan model yang dihasilkan menggunakan SVR cukup
bagus untuk memprediksi curah hujan dengan kondisi normal, tetapi untuk
keadaan ekstrim, walaupun model prediksi sudah dapat mengikuti pola dari data
pengamatan namun nilai prediksi yang dihasilkan belum berhasil menjangkau dan
mendekati nilai pengamatan yang sesungguhnya. Salah satu penyebabnya diduga
karena ketidaksempurnaan luaran GCM dalam menyimulasikan peubah penjelas
khususnya untuk wilayah tropis (Cavazos dan Hewitson 2005).
Variasi dari evaluasi hasil estimasi oleh model terhadap 13 stasiun hujan di
Kabupaten Indramayu memperlihatkan bahwa lokasi stasiun hujan di wilayah
tertentu mempengaruhi dan menentukan ketepatan hasil ramalan curah hujan
bulanan. Titik Observasi Hujan dengan lokasi berada agak jauh dari laut
cenderung memiliki hasil estimasi lebih baik daripada titik observasi yang berada
dekat dengan garis pantai/laut. Untuk stasiun hujan yang lokasinya berdekatan
dengan laut, akan mengurangi pengaruh dari topografi (lokal) sehingga
mempengaruhi luaran GCM yang digunakan dalam melakukan proses
downscaling. Dengan kata lain, akan timbul kesulitan bagi luaran GCM dalam menyimulasikan dengan baik peubah penjelas untuk menghasilkan pemodelan
downscaling yang handal dan memiliki ketepatan prediksi yang baik. Sementara untuk stasiun hujan yang lokasinya agak berjauhan dengan laut, topografi (lokal)
tidak terlalu terpengaruh oleh adanya interaksi iklim yang kompleks antara
daratan, lautan dan atmosfir sehingga cenderung lebih baik hasil dugaan
modelnya. Hasil ini mendukung penelitian Watterhall (2002) yang menyimpulkan
bahwa lokasi stasiun hujan mempengaruhi luaran GCM dalam melakukan proses
© Hak Cipta Milik IPB, Tahun 2011 Hak Cipta dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau
tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar IPB
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh
MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU
MUHAMMAD ASYHAR AGMALARO
Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Ilmu Komputer pada
Program Studi Ilmu Komputer
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR
Indramayu
Nama : Muhammad Asyhar Agmalaro
NIM : G651090241
Disetujui
Komisi Pembimbing
Dr. Ir. Agus Buono, M.Si, M,Kom Mushthofa, S.Kom, M.Sc
Ketua Anggota
Diketahui,
Ketua Program Studi Dekan Sekolah Pascasarjana
Ilmu Komputer
Dr. Ir. Agus Buono, M.Si, M.Kom Dr. Ir. Dahrul Syah, M.Sc.Agr
Tanggal Ujian : Tanggal Lulus :
Puji syukur kehadirat Allah SWT, atas berkat rahmat dan hidayah-Nya
penulis dapat menyelesaikan penelitian dan penulisan tesis sebagai syarat dalam
menyelesaikan perkuliahan di Magister Ilmu Komputer, Institut Pertanian Bogor.
Tidak lupa shalawat serta salam semoga senantiasa di berikan kepada Nabi
Muhammad, SAW, keluarganya, dan umatnya sampai akhir zaman.
Penulis melakukan penelitian tentang pengembangan model statistical
downscaling (SD)menggunakan support vectormachine (SVR) untuk peramalan curah hujan bulanan dengan studi kasus meliputi wilayah observasi disekitar
stasiun hujan yang terdapat di Kabupaten Indramayu. Untuk data GCM yang
digunakan dalam penelitin ini terdiri atas 6 model dan untuk data observasi
digunakan 13 titik koordinat stasiun curah hujan di Indramayu. Dengan
menerapkan metode SVR dalam peramalan curah hujan di Kabupaten Indramayu,
diharapkan dapat dijadikan sebagai dasar pembuat keputusan contohnya di bidang
pertanian dalam pemilihan varietas tanaman dan pola tanam yang cocok sesuai
dengan informasi iklim yang tersedia.
Penulis mengucapkan terima kasih atas bantuan dan dukungan dari
semua pihak yang mendukung baik secara langsung maupun tidak langsung dalam
pelaksanaan kuliah maupun penelitian yang telah dilaksanakan. Cinta dan rasa
syukur yang sedalam-dalamnya penulis curahkan untuk:
1. Ayahanda Ahmadi Agusni dan Ibunda Jumarsnimi, atas nasihat, doa,
cinta, kasih sayang, semangat, motivasi dan dukungan materil maupun
non materil selama penulis menjalani pendidikan dan dapat
menyelesaikan kuliah di Pasca Sarjana Intitut Pertanian Bogor,
2. Kakakku Andini Safitri, Kakak ipar Rinaldi Marza Putra dan
keponakanku tercinta zahra yang selalu menjadi sumber semangat bagi
penulis untuk menyelesaikan tesis ini,
3. Bapak Dr. Ir. Agus Buono, M.Si, M.Kom dan Bapak Mushthofa, S.Kom,
4. Cagia R.A. Wulantari, S.Ikom, M.Si, yang selalu memberi dukungan,
semangat, motivasi, dan kasih sayangnya selama penulis menempuh
pendidikan di Institut Pertanian Bogor,
5. Sahabat-sahabatku Sigit Susilo, Warid, Dena, Elvie, Puput, yang selalu
setia memberi dukungan dan semangat dalam menjalani masa-masa
kuliah,
6. Rekan-rekan seperjuangan angkatan XI S2 Ilmu Komputer IPB (alm Pak
Oke Hendradly, Pak Mukhlis, Pak Tahir, Mas Mawan, Pak Rico, Pak
Iyan, Pak Boy, Pak Azhari, Mas Kamal, Mas Deba Supriyanto, M Rafi
Muttaqin, Aries M, Pak Yusuf, Bu Zuriati, Bu Dewi, Bu Sinta, Bu Retno,
Bu Ari Q), atas kebersamaan dan bantuannya selama kulian dan
penelitian di MKOM IPB, khususnya Rafi yang selalu membantu penulis
dalam menyelesaikan tesis ini.
Penulis menyadari bahwa dalam penulisan tesis ini masih banyak
kekurangan. Kritik, saran dan masukan dalam penelitian ini sangat penulis
harapkan, demi sempurnanya tesis ini di kemudian hari.
Bogor, Desember 2011
Penulis (Muhammad Asyhar Agmalaro) dilahirkan di Jambi, 31 Maret 1986
sebagai anak kedua dari dua bersaudara pasangan Ahmadi Agusni dan
Jumarsnimi. Penulis mengenyam pendidikan sekolah dasar di SDN 92 Jambi
(1992-1998). Kemudian, penulis melanjutkan pendidikan menengahnya ke SMP
Negeri 7 Jambi (1998 – 2001), lalu SMA Negeri 1 Jambi (2001-2004). Setelah
lulus SMU pada tahun 2004, penulis berkesempatan melanjutkan studi di IPB
melalui jalur USMI (Undangan Seleksi Masuk IPB) di Departemen Matematika,
Fakultas Matematika dan Ilmu Pengetahuan Alam dan lulus pada tahun 2008.
Penulis berkesempatan melanjutkan ke jenjang pascsarjana (S2) Ilmu Komputer
(ILKOM), Institut Pertanian Bogor pada tahun 2009. Penulis melaksanakan
penelitian dengan judul “Pemodelan Statistical Downscaling Data GCM menggunakan Support Vector Regression untuk Memprediksi Curah Hujan Bulanan Indramayu” untuk penyusunan tesis sebagai tugas akhir guna
DAFTAR ISI
Halaman
DAFTAR ISI ... i
DAFTAR GAMBAR ... iii
DAFTAR TABEL ... v
DAFTAR LAMPIRAN ... vi
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Tujuan ... 3
1.3 Ruang Lingkup ... 4
1.4 Hasil dan Manfaat ... 4
BAB II TINJAUAN PUSTAKA ... 5
2.1 Model Sirkulasi Umum ... 5
2.2 Statistical Downscaling ... 6
2.3 Principal Component Analysis (PCA) ... 8
2.4 Support Vector Regression (SVR) ... 9
2.5 K-fold Cross Validation ... 14
2.6 Grid Search ... 15
BAB III DATA DAN METODOLOGI ... 17
3.1 Data ... 17
3.1.1 Data Luaran GCM (Peubah Penjelas) ... 17
3.1.2 Data Curah Hujan (Peubah Respon) ... 18
3.2 Tahapan Penelitian ... 19
3.3 Lingkup Pengembangan Model ... 24
BAB IV HASIL DAN PEMBAHASAN ... 25
4.1 Pemodelan Downscaling untuk Pendugaan Curah Hujan ... 25
4.2 Kinerja Model Berdasarkan Luaran GCM ... 27
4.3 Kinerja Model Berdasarkan Fungsi Kernel SVR ... 31
4.4 Pengaruh Parameter Fungsi Kernel Terhadap Performance Model ... 35
BAB V KESIMPULAN DAN SARAN... 43
5.1 Kesimpulan ... 43
5.2 Saran ... 44
DAFTAR PUSTAKA ... 45
DAFTAR GAMBAR
Halaman
1 Visualisasi Layering pada GCM (Sumber : IPPC, 2011) ... 5
2 Ilustrasi proses downscaling, (Sumber : Sutikno 2008) ... 7
3 Fungsi regresi pada SVR (Sumber : Smola dan Schölkopf 2003)... 10
4 Penambahan variable slack pada SVR (Sumber : Smola dan ... 12
5 Ilustrasi proses SVR (Sumber : Smola dan Schölkopf 2003) ... 13
6 Ilustrasi pembagian kelompok data latih dan uji pada k-cross ... 14
7 Grid dengan = 4 ... 15
8 Ilustrasi metode grid search. ... 16
9 Contoh Data Luaran GCM. ... 18
10 Tahapan proses penelitian ... 19
11 Ilustrasi proses cropping luasan grid data GCM. ... 20
12 Struktur SVR. ... 23
13 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM (fungsi RBF kernel) ... 25
14 Perbandingan antara pola observasi dan prediksi curah hujan untuk seluruh luaran GCM (rataan, minimum, dan maksimum). ... 26
15a Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan observasi (curah hujan dalam mm) ... 29
16 Nilai rataan NRMSE, MAEP validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM ... 32
17 Nilai rataan korelasi validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM ... 32
Gambar 18 Grafik scater untuk plot hasil observasi dengan estimasi masing masing fungsi kernel ... 34
Gambar 19 Hasil korelasi antara data estimasi dan pengamatan curah hujan bulanan Kabupaten Indramayu (fungsi kernel: RBF) ... 38
Gambar 20 Hasil NRMSE, dan MAEP antara data estimasi dan pengamatan curah hujan bulanan Kabupaten Indramayu (fungsi kernel: RBF) ... 39
Gambar 21 Plot hasil estimasi dan pengamatan stasiun hujan Bondan ... 40
Gambar 23 Lokasi Stasiun Hujan di Kabupaten Indramayu (Sumber: diolah dari
DAFTAR TABEL
Halaman
1 Kategori teknik downscaling (Sumber : Sutikno 2008) ... 8
2 Data Observasi curah hujan di Kota Indramayu ... 18
3 Matriks data GCM mengikuti data observasi ... 21
4 PCA Matriks data GCM ... 21
5 Nilai RMSE, korelasi validasi model menurut menurut Fungsi kernel dan rataan masing-masing model pada GCM ... 27
DAFTAR LAMPIRAN
1 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM
... 48
2 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM
... 49
3 Plot perbandingan hasil estimasi dan pengamatan perstasiun hujan di Indramayu
BAB I PENDAHULUAN
1.1 Latar Belakang
Iklim merupakan gejala alamiah yang sangat penting dan berpengaruh
bagi kehidupan manusia. Pengetahuan tentang pola cuaca dan iklim terutama
curah hujan, sangat dibutuhkan di banyak sektor seperti pertanian, perkebunan,
transportasi, dan lain-lain. Pada sektor pertanian dan perkebunan, informasi yang
dapat meramalkan mengenai besar kecilnya jumlah curah hujan bulanan di setiap
daerah, akan sangat berguna untuk dapat menentukan pola tanam dan varietas
tanaman yang tepat agar menghasilkan produksi yang baik. Hal ini dikarenakan
curah hujan berpengaruh langsung terhadap ketersediaan air. Kurangnya
ketersedian air akan berdampak kekeringan, dan sebaliknya apabila kelebihan air
akan membanjiri lahan pertanian (Bruinsma, 2003). Indonesia sebagai negara
agraris dengan sektor pertanian dan perkebunan yang menjadi penyokong utama
kehidupan dan ekonomi rakyat akan terkena dampak paling serius akibat
terjadinya kekeringan dan banjir yang disebabkan kurangnya informasi mengenai
jumlah curah hujan. Oleh karena itu dibutuhkan suatu ramalan informasi yang
akurat, cepat dan bersifat spesifik lokasi untuk memprediksi curah hujan di masa
yang akan datang agar dapat meminimalisir dampak kerugian yang terjadi.
Untuk mengetahui dan memahami sistem iklim sehingga dapat
digunakan dalam memprediksi jumlah curah hujan bulanan di suatu daerah,
diperlukan suatu model/alat yang dapat menyimulasikan iklim, memprediksi
perubahan-perubahan iklim masa lampau, sekarang, dan membuat skenario
perubahan iklim masa yang akan datang. Sampai saat ini, model/alat yang
digunakan dalam kajian utama untuk mempelajari dampak dan menduga
perubahan iklim adalah global circulation model (GCM). Secara umum, GCM diartikan sebagai penggambaran matematis dari sejumlah besar interaksi fisika,
kimia, dan dinamika atmosfer bumi dan menghasilkan data dalam jumlah sangat
besar yang dapat digunakan untuk membuat prakiraan iklim (Wigena, 2006).
Akan tetapi beberapa pemerhati dan peneliti meteorologi beranggapan GCM
belum cukup baik untuk mendapatkan informasi iklim secara detail sehingga
dengan sangat tepat dan akurat terutama di kawasan tropis. Seperti daerah-daerah
di Indonesia yang termasuk kasawan tropis, proses pembentukan hujan
dipengaruhi oleh topografi dan interaksi antara laut, darat dan atmosfir yang
kompleks menyebabkan keragaman sifat hujan bulanan di setiap daerah sehingga
menimbulkan kesulitan membuat simulasi untuk prediksi curah hujan (Storch dan
Zwiers, 1999). Resolusi dari data luaran GCM yang dianggap terlalu rendah juga
menyulitkan dalam melakukan prediksi dengan mempelajari pola iklim
regional/lokal yang membutuhkan resolusi yang tinggi. Akan tetapi GCM masih
mungkin digunakan untuk memperoleh informasi skala regional hingga lokal bila
dipadukan dengan teknik statistical downscaling (SD).
Penggunaan teknik SD pada luaran GCM, telah banyak dilakukan dengan
maksud mendapatkan suatu model iklim dengan melakukan transformasi data dari
suatu grid luaran GCM menjadi data pada grid-grid dengan unit skala yang lebih
kecil untuk yang menghasilkan informasi secara lebih detail dari berbagai unsur
iklim dengan resolusi yang cukup tinggi, baik dari segi skala spasial maupun
temporal (Wilby et al., 1998). Pendekatan ini menciptakan korelasi antara skala global/lokal, berdasarkan hubungan fungsional kedua skala tersebut. Hubungan
antara skala global dengan variabel yang mewakili proses sirkulasi atmosfir
(seperti data tekanan permukaan laut, dan kelembaban relatif) dengan skala lokal
(seperti data curah hujan), digunakan untuk melakukan simulasi model iklim
bersifat statik dimana dalam periode dan jangka waktu tertentu data pada grid
luaran GCM yang berskala besar dipakai sebagai dasar untuk
menentukan/memprediksi data pada grid berskala lebih kecil.
Kebutuhan Informasi mengenai pola iklim terutama curah hujan yang
berdampak langsung di bidang pertanian harus ditanggapi dan pikirkan dengan
penuh perencanaan. Dalam hal ini, sinergi dalam penyediaan informasi iklim yang
efektif dan tepat guna sangat perlu untuk terus dievaluasi dan dikembangkan.
Apalagi ditambah dengan adanya kondisi perubahan iklim yang mungkin
memberikan dampak yang lebih terhadap kegiatan pertanian. Oleh karena itu,
perencanaan yang menyeluruh baik jangka pendek maupun jangka panjang sangat
konteks pengembangan model yang dapat melakukan prediksi curah hujan sebagai
salah satu upaya dalam pengelolaan dampak resiko iklim (Fowler et al., 2007). Usaha pelaksanaan pengelolaan dampak dan resiko iklim menggunakan
SD sudah banyak dilakukan dan coba diterapkan. Penelitian terdahulu, Wigena
(2004), mengembangkan model SD menggunakan regression projection pursuit (RPP) dalam melakukan peramalan curah hujan di Indramayu dengan salah satu
kajian analisisnya adalah menentukan domain yang baik pada luaran GCM. Hasil
penelitian menunjukkan domain dengan grid 5x5, cukup baik untuk digunakan
pada proses downscaling. Selanjutnya Cavazos dan Hewitson (2004) melakukan penelitian untuk melihat performance luaran GCM NCEP-NCAR dengan mencari kombinasi peubah penjelas potensial dalam menduga curah hujan menggunakan
jaringan saraf buatan (JST). Hasil penelitian menyimpulkan bahwa satu peubah
penjelas GCM yaitu presipitasi sudah cukup baik untuk memperoleh informasi
curah hujan saat melakukan proses downscaling. Kemudian masih banyak penelitian lainnya mengenai SD yang bertujuan mengembangkan model yang
dapat memberikan berbagai informasi tentang iklim yang memadai dan berguna
untuk perencanaan kedepan. Oleh karena itu, studi kali ini akan mencoba
menekankan pada pentingnya upaya pembelajaran dan pemahaman sistem iklim
melalui pengembangan model SD menggunakan suport vector regression (SVR) dalam melakukan peramalan curah hujan bulanan sehingga dapat dijadikan
sebagai alat pendukung dalam proses penyebaran informasi iklim yang efektif,
efisien, dan tepat guna.
1.2 Tujuan
Tujuan dari penelitian ini adalah mengembangkan model statistical
downscaling menggunakan SVR untuk peramalan curah hujan bulanan (studi kasus Indramayu). Oleh karena itu, diharapkan dapat menghasilkan informasi
iklim yang akurat dan dapat dijadikan sebagai dasar pembuat keputusan. Salah
satu contohnya yaitu di bidang pertanian seperti pemilihan varietas tanaman dan
pola tanam yang cocok terkait dengan informasi iklim yang tersedia untuk
1.3 Ruang Lingkup
Ruang lingkup dari penelitian ini adalah sebagai berikut:
 Data curah hujan yang digunakan adalah data yang berasal dari titik observasi berdasarkan 13 lokasi koordinat stasiun hujan di Indramayu.
 Data General Circulation Model (GCM) yang digunakan adalah sebanyak 6 model (1901 – 2000).
1.4 Hasil dan Manfaat
Hasil dan manfaat yang diharapkan melalui penelitian ini adalah
dihasilkan suatu model stastisticaldownscaling yang memberikan informasi iklim akurat berdasarkan dari data luaran GCM sehingga dapat dijadikan sebagai suatu
BAB II TINJAUAN PUSTAKA
2.1 Model Sirkulasi Umum
Model sirkulasi umum atau general circulation model (GCM) merupakan suatu penggambaran matematis dari sejumlah besar interaksi fisika, kimia, dan
dinamika atmosfer bumi (Stroch, 1999). GCM ini menduga perubahan iklim dan
disajikan tiga layer, yaitu layer horisontal dengan ukuran 100 hingga 600 km, 10
hingga 20 layer vertikal di atmosfer dan kadangkala 30 layer di samudra, seperti
disajikan pada Gambar 1.
Gambar 1 Visualisasi Layering pada GCM (Sumber : IPPC, 2011)
Dengan resolusi yang begitu kasar, maka GCM tidak bisa menangkap
fitur penting pada suatu area (region) tertentu yang menjadi fokus kajian dampak perubahan iklim. Namun demikian, GCM ini bisa digunakan untuk mengestimasi
kepekaan iklim terhadap kondisi yang berbeda seperti perubahan gas rumah kaca
(GRK). Oleh karena itu, model GCM memberikan beberapa keuntungan seperti
tertera pada Sutikno, 2008, yaitu : (1) dapat digunakan untuk mengestimasi
perubahan iklim global dalam merespon terhadap peningkatan konsentrasi GRK,
(2) estimasi peubah iklim (curah hujan, suhu, kelembaban) secara fisik sesuai
dengan model-model fisika, (3) estimasi peubah cuaca (angin, radiasi, penutupan
mengenai dampak, (4) mampu mensimulasi keragaman iklim siklus harian.
Disamping kelebihan seperti disebutkan di atas, beberapa kelemahannya adalah :
(1) resolusi terlalu kasar, sehingga terjadi gap antara hasil simulasi global,
regional dan lokal, (2) model tersebut sulit mengkopel dengan
model-model sirkulasi lautan, dan (3) proses-proses umpan balik atmosfer-biosfer tidak
terpenuhi. Untuk menjembatani gap antara hasil global dengan regional dan lokal,
maka diperlukan satu model yang dikenal dengan nama downscaling.
Dalam perkembangannya, model sirkulasi umum dikenal dengan nama
model dinamik untuk memprediksi musim dan kondisi ENSO yang disebut model
dinamik Coupled AO-GCM. Kedua model yang terpisah ini dipasangkan dan
saling mempengaruhi satu sama lain. Saat model atmorfer bergerak dengan waktu,
perubahan-perubahan pada angin rendah (dekat permukaan laut) berfungsi sebagai
daya yang menggerakkan model lautan. Dengan bergeraknya model lautan
dengan waktu, perubahan pada suhu lautan berfungsi sebagai mesin untuk model
atmosfer melalui aliran panas dan uap air dari laut ke atmosfer. Luaran dari
prakiraan musim disajikan dalam bentuk peluang yang diperoleh dari banyak
model yang dikenal dengan ensemble model. Dalam hal ini Coupled AO-GCM dijalankan beberapa kali dengan nilai input awal yang sedikit berbeda.
2.2 Statistical Downscaling
Statistical Downscaling didefinisikan sebagai upaya menghubungkan antara sirkulasi peubah skala global (peubah penjelas) dan peubah skala lokal
(peubah respon, Sutikno 2008). Gambar 2 memberikan ilustrasi proses
downscaling.
Pendekatan statistical downscaling (SD) menggunakan data regional (statistic dynamical downscaling) atau global (statistical downscaling) untuk memperoleh hubungan fungsional antara skala lokal dengan skala global GCM,
seperti model regresi. Pendekatan SD disusun berdasarkan adanya hubungan
antara grid skala besar (prediktor) dengan grid skala lokal (respon) yang
dinyatakan dengan model statistik yang dapat digunaan untuk menterjemahkan
anomali-anomali skala global yang menjadi anomali dari beberapa peubah iklim
hubungan fungsional sirkulasi atmosfer global dengan unsur-unsur iklim lokal,
yang bentuk umumnya adalah (Storch et al, 1993):
)
(
, , , ,p t q s gt
f
X
Y
(1)
Dengan :
Y : Peubah-peubah iklim lokal
X : Peubah-peubah luaran GCM
t : Periode waktu
p : Banyaknya peubah Y
q : Banyaknya peubah X
s : Banyaknya lapisan atmosfer
g : Banyaknya grid domain GCM
Gambar 2 Ilustrasi proses downscaling, (Sumber : Sutikno 2008)
Pada umumnya model SD melibatkan data deret waktu (t) dan data
spasial GCM (g). Banyaknya peubah Y, peubah X, lapisan atmosfer dalam model
dan autokorelasi serta kolinearitas pada peubah Y maupun X menunjukkan kompleksitas model.
Saat ini telah banyak dikembangkan model SD yang secara umum
berbasis model linear atau non linear, berbasis parametrik dan non parametrik, berbasis proyeksi dan seleksi, serta teknik berbasis model-driven atau data-driven. Pembedaan mengenai model yang dipergunakan sesuai kategori, disajikan secara
detail pada Tabel 1. Suatu model perhitungan SD bisa termasuk ke dalam
kombinasi ke lima kategori tersebut, sebagai contoh PCR termasuk kategori
metode berbasis regresi, linear, parametrik, proyeksim dan data-driven.
Pengembangan model-model downscaling sangat diperlukan untuk pelaksanaan kegiatan kajian dampak keragaman dan perubahan iklim dan
penyusunan strategi atau pembuatan keputusan baik pada tingkat pembuatan
keputusan sampai petani.
Tabel 1 Kategori teknik downscaling (Sumber : Sutikno 2008)
2.3 Principal Component Analysis (PCA)
Salah satu tantangan dalam analisis peubah ganda adalah mereduksi
dimesi dari himpunan data peubah ganda yang besar. Hal ini sering dilakukan
dengan cara mereduksi himpunan peubah tersebut menjadi himpunan peubah yang
lebih kecil atau himpunan peubah baru yang banyaknya lebih sedikit.
Peubah-peubah baru tersebut merupakan fungsi dari Peubah-peubah asal atau Peubah-peubah asal itu
sendiri yang memiliki proporsi informasi yang signifikan mengenai himpunan
PCA dapat mereduksi q peubah pengamatan menjadi k peubah baru yang saling ortogonal yang masing-masing k peubah baru tersebut merupakan kombinasi linear dari q peubah asal. Pemilihan k peubah baru sedemikian hingga keragaman yang dimiliki p peubah lama dapat diterangkan secara optimal oleh k peubah baru. PCA efektif jika antar q peubah asal memiliki korelasi yang cukup besar (Dillon & Goldstein 1984).
Ada beberapa fungsi dari penggunaan PCA diantaranya adalah (Dillon &
Goldstein 1984):
1. Identifikasi peubah baru yang mendasari data peubah ganda, yang bercirikan:
merupakan kombinasi linear peubah-peubah asal; jumlah kuadrat koefisien dalam kombinasi linear tersebut adalah satu;tidak berkorelasi;dan mempunyai ragam berurut dari yang terbesar ke yang terkecil.
2. Mengurangi banyaknya dimensi himpunan peubah yang biasanya terdiri atas
peubah yang banyak dan saling berkorelasi menjadi peubah-peubah baru yang
tidak berkorelasi dengan mempertahankan sebanyak mungkin keragaman
dalam himpunan tersebut.
3. Memilih peubah asal yang banyak memberi kontribusi informasi atau
menghilangkan peubah asal yang mempunyai kontribusi informasi relatif
kecil.
Hasil PCA dapat digunakan untuk analisis lebih lanjut misalkan
pengelompokkan (clustering) dan regresi komponen utama.
2.4 Support Vector Regression (SVR)
SVR merupakan penerapan support vector machine (SVM) untuk kasus regresi. Dalam kasus regresi output berupa bilangan riil atau kontinyu. SVR
merupakan metode yang dapat mengatasi overfitting, sehingga akan menghasilkan performansi yang bagus (Smola dan Schölkopf, 2003).
Pada Gambar 3, dimisalkan diberikan data training
1 1 2 2
[( ,x y), (x y, ),..., ( ,x yl l)] dengan vektor input xi dan data output yi yang
SVR ingin menemukan suatu fungsi regresi f(x) yang dapat mengaproksimasi output ke suatu target aktual, dengan eror toleransi-ε, dan kompleksitas yang
minimal. Fungsi regresi f(x) dapat dinyatakan dengan formula sebagai berikut (Smola dan Schölkopf, 2003):
( ) T ( )
f x w  x b (2)
Dimana φ(x) menunjukkan suatu titik didalam ruang fitur berdimensi lebih tinggi, hasil pemetaan dari input vektor x di dalam ruang input yang berdimensi lebih rendah.
Gambar 3 Fungsi regresi pada SVR (Sumber : Smola dan Schölkopf 2003)
Koefisien w dan b diestimasi dengan cara meminimalkan fungsi resiko (risk function) yang didefinisikan dalam persamaan:
 
2
1
1 1
min ,
2 w C i L y f xi i
  
(3a)yang memenuhi:
 
i i
y w x   b 
(3b)
 
i i , 1, 2,...,w x   y b  i 
 
 
 
0 ( , )0,untuk yang lain
i i i i
i i
y f x y f x
L y f x
    
  
 (3c)
Faktor w2 dinamakan reguralisasi. Meminimalkan w 2 akan membuat suatu fungsi setipis mungkin, sehingga dapat mengontrol kapasitas fungsi.
Empirical error diukur dengan ε-insensitive loss function yang diharuskan meminimalkan norm dari w agar mendapatkan generalisasi yang baik untuk fungsi regresi f(x) (Smola dan Schölkopf, 2003). Oleh karena itu diperlukan untuk menyelesaikan problem optimasi berikut:
2
2 1
min w (4a)
yang memenuhi:
 
i i
y w x   b 
(4b)
 
i i , 1, 2,...,w x   y b  i 
Diasumsikan bahwa ada suatu fungsi f yang dapat mengaproksimasi semua titik
xi,yi
dengan presisi ε. Dalam kasus ini kita asumsikan bahwa semua titik ada dalam rentang f  (feasible). Dalam hal ketidaklayakan(infeasible), dimana mungkin ada beberapa titik yang mungkin keluar dari rentang
Gambar 4 Penambahan variable slack pada SVR (Sumber : Smola dan Schölkopf 2003)
Selanjutnya problem optimasi di atas bisa diformulasikan sebagai
berikut:
2 *
1
1 1
m i n ,
2
l
i i
i
w C x x
l 
(5a)yang memenuhi:
 
 
**
- - - £ , 1, 2, ...,
- - £ , 1, 2, ...,
, ³0 T
i i i
i i i
i i
y w j x b x Î i l
wj x y b x Î i l
x x
 
(5b)
Konstanta C>0 menentukan tawar menawar (trade off) antara ketipisan fungsi dan batas atas deviasi lebih dari yang masih dapat ditoleransi. Semua
deviasi lebih besar daripada ε akan dikenakan pinalti sebesar C. Dalam SVR, ε setara dengan akurasi dari aproksimasi terhadap data training. Nilai ε yang kecil
Gambar 5 Ilustrasi proses SVR (Sumber : Smola dan Schölkopf 2003)
Nilai yang tinggi untuk variable slack akan membuat empirical error mempunyai pengaruh yang besar terhadap faktor regulasi. Dalam SVR, support
vector adalah data training yang terletak pada dan diluar batas f dari fungsi keputusan, karena itu jumlah support vector menurun dengan naiknya ε (Smola
dan Schölkopf, 2003).
Dalam formulasi dual, problem optimisasi dari SVR adalah sebagai
berikut:
* *
1 1
* *
1 1
1
max ,
2 i j i i j j i j
i i i i i
i i
K x x
y
 
 
   
   
 
 
   
   
 
(6a)yang memenuhi:
*
1 *
0
0 , 1, 2, ...,
0 , 1, 2, ...,
i i
i
i
i C i
C i
 
 
 
 
     
(6b)
j
i x
x
K , adalah dot-product kernel yang didefinisikan sebagai
 
i 
j Tj
i x x x
x
K ,   . Dengan menggunakan langrange multiplier dan kondisi optimalitas, fungsi regresi secara eksplisit dirumuskan sebagai berikut:
 
*
1
- ,
i i i
i
f x K x x b
 
(7)
2.5 K-fold Cross Validation
K-fold cross validation merupakan salah satu variasi dari teknik cross
validation. k-fold cross validation dilakukan untuk membagi training set dan test
set. Inti validasi tipe ini adalah membagi data secara acak ke dalam k himpunan bagian. k-fold cross validation mengulang k-kali untuk membagi sebuah himpunan contoh secara acak menjadi k subset yang paling bebas, setiap ulangan disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan. Dari k himpunan bagian tersebut dipilih satu himpunan bagian menjadi data uji dan (k-1)
dijadikan data latih. Proses ini dilakukan berulang sebanyak k, dimana setiap k himpunan bagian yang ada menjadi data uji dan sisanya menjadi data latih.
Namun, secara teori tidak ada tolak ukur yang pasti untuk nilai k.
Keuntungan k-fold cross validation dibandingkan dengan variasi cross
validation seperti Repeated random sub-sampling validation adalah semua data digunakan baik untuk data uji maupun data latih. Ilustrasi proses validasi dapat
dilihat pada Gambar 6.
Gambar 6 Ilustrasi pembagian kelompok data latih dan uji pada k-cross
2.6 Grid Search
Metode Gridsearch merupakan salah satu metode yang sederhana untuk mengatasi masalah pengoptimuman (Rao, 2009). Metode ini melibatkan
penyusunan grid yang cocok dalam suatu ruang dimensi, mengevaluasi fungsi
objektif dari seluruh titik grid, dan menemukan titik grid yang sesuai dengan
fungsi objektif yang memiliki nilai optimum. Jika batas atas dan batas bawah dari
variable ke- diketahui masing-masing sebagai dan , dapat dibagi range ( , ) ke dalam -1 bagian yang sama, sehingga ( ), ( ), …, ( )menunjukkan titik-titik grid sumbu ( = 1,2,3, …, ).
Gambar 7 Grid dengan = 4
Hal ini menunjukkan kepada total dari , , …, titik grid dalam
dimensi ruang. Sebuah grid dengan = 4 ditunjukkan dalam 2 dimensi ruang
seperti pada Gambar 7.
Sebagai contoh, akan dicari nilai optimum suatu model/fungsi dengan
mencari kombinasi parameter-parameter yang memberikan atau dapat
mengaprokmasi nilai terbaik (misalnya memiliki eror yang paling kecil). Ilustrasi
Gambar 8 Ilustrasi metode grid search.
Metode grid search memiliki cara kerja yang hampir serupa dengan percobaan secara manual menggunakan teknik trial dan eror. Mencoba kombinasi parameter satu persatu dan membandingkan nilai terbaik yang diberikan oleh
parameter tersebut. Namun perbedaan metode grid search terletak pada proses perbandingan nilai yang tidak dilakukan di awal saat terpilihnya pasangan
kombinasi parameter. Pasangan kombinasi dari parameter terlebih dahulu
disimpan dalam grid-grid. Selanjutnya perbandingan nilai eror terkecil dilihat dari
BAB III DATA DAN METODOLOGI
3.1 Data
Pada penelitian ini, ada dua jenis data yang akan digunakan. Jenis data
pertama adalah data curah hujan bulanan dan yang kedua adalah data luaran
GCM.
3.1.1 Data Luaran GCM (Peubah Penjelas)
Data GCM yang digunakan dalam penelitian ini terdiri dari 6 luaran:  Pacific_20c3m_cgcm3.1_t47 (t-47)
Peubah luaran: presipitasi, subset: koordinat 25 titik bujur x 18 titik lintang,
waktu: 1200 bulan (Jan 1901- Des 2000).
 Pacific_20c3m_cgcm3.1_t63 (t-63)
Peubah luaran presipitasi, subset: koordinat 33 titik bujur x 22 titik lintang,
waktu: 1200 bulan (Jan 1901- Des 2000).  Pacific_20c3m_giss_model_er (giss-er)
Peubah luaran presipitasi, subset: koordinat 18 titik bujur x 16 titik lintang,
waktu: 1200 bulan (Jan 1901- Des 2000).
 Pacific_20c3m_gissaom (giss-aom)
Peubah luaran presipitasi, subset: koordinat 23 titik bujur x 20 titik lintang,
waktu: 1200 bulan (Jan 1901- Des 2000).  Pacific_20c3m_miub_echo_g (miub-g)
Peubah luaran presipitasi, subset: koordinat 25 titik bujur x 18 titik lintang,
waktu: 1200 bulan (Jan 1901- Des 2000).
 Pacific_20c3m_mri_cgcm2_3_2a(mri-32a)
Peubah luaran presipitasi, subset: koordinat 33 titik bujur x 22 titik lintang,
waktu: 1200 bulan (Jan 1901- Des 2000).
Data luaran GCM memiliki peubah luaran salah satu contohnya adalah
presipitasi yang merupakan nilai-nilai hasil pengambaran matematis dari sejumlah
besar interaksi fisika, kimia, dan dinamika atmosfer bumi. Nilai-nilai tersebut
cuaca seperti curah hujan, suhu, kelembapan, penutupan awan, radiasi, dan
lain-lain. Contoh dari luaran GCM dapat dilihat pada Gambar 9
Gambar 9 Contoh Data Luaran GCM.
3.1.2 Data Curah Hujan (Peubah Respon)
Data Curah hujan yang digunakan untuk penelitian ini adalah dari data
titik-titik observasi di kota Indramayu dari Januari 1979 sampai Desember 2000
Contoh data dapat dilihat pada Tabel 2.
Tabel 2 Data Observasi curah hujan di Kota Indramayu
NamaSta Cidempet Cikedung Indramayu Jatibarang Sudikampiran Kedokan bund
Jan-89 125 167 150 202 112 109
Feb-89 491 430 556 480 389 345
Mar-89 337 304 357 191 278 273
Apr-89 92 348 40 99 156 40
May-89 159 215 128 89 153 105
Jun-89 117 173 139 86 122 232
Terdapat 13 titik observasi curah hujan yang diamati tersebar di
Kabupaten Indramayu, dengan lokasinya sebagian berada dekat dengan garis
pantai/ laut dan sebagian lagi jauh dari laut. Secara umum lokasi yang menjadi
titik observasi curah hujan memiliki topografi berupa dataran atau daerah landai
dengan kemiringan tanahnya rata-rata 0 – 2 %. Bila curah hujan cukup tinggi,
maka di daerah-daerah tertentu yang tidak mempunyai drainase yang baik akan
3.2 Tahapan Penelitian
Tahapan penelitian ini terangkum secara lengkap pada gambar Gambar
[image:37.595.105.486.143.740.2]10.
Tahap awal yang dilakukan pada penelitian ini adalah dimulai dari
pemahaman terhadap permasalahan yang akan diselesaikan. Mengacu pada
tujuan, penelitian ini mencoba untuk mengembangkan model SVR yang dapat
memprediksi curah hujan bulanan di wilayah Kabupaten Indramayu. Untuk
mendapatkan gambaran menyeluruh tentang domain penelitian yang akan
dilaksanakan, diperlukan studi literatur sehingga dapat mengukur dan melihat
seberapa berbeda dan pentingnya penelitian yang akan dilakukan.
Setelah memahami masalah, maka tahap yang dilakukan selanjutnya
adalah pengumpulan data. Secara keseluruhan data observasi terdiri dari 22
periode (tahun 1979 – 2000). Dengan demikian data GCM yang digunakan hanya
dari tahun 1979 – 2000.
Berdasarkan titik observasi hujan dilihat koordinatnya, kemudian
berdasarkan titik koordinat tersebut akan digunakan untuk menentukan grid dari
data luaran GCM dengan luasan grid berupa matriks 5x5. Titik koordinat
observasi berada ditengah-tengah luasan grid GCM yang akan diambil. Sebagai
contoh, stasiun hujan memiliki titik koordinat 112 bujur timur dan 6 derajat
lintang selatan. Luasan grid yang di-cropp pada gcm merupakan grid matriks 5x5 dengan pusatnya merupakan lokasi stasiun hujan. Ilustrasi proses pengambilan
data GCM dengan grid 5x5 dapat dilihat pada Gambar 11.
Dikarenakan data observasi memiliki periode 22 tahun, maka proses
cropping yang dilakukan mengikuti observasi sebanyak 12x22 tahun. Luasan grid yang diperoleh dari prosis cropping keseluruhan luaran GCM adalah sebanyak 264 dari bulan Januari 1979 sampai dengan Desember 2000, sehingga jumlah
keseluruhan untuk data masukan menjadi 264 (22x12) data dengan atribut
sebanyak 25 (5x5) buah. Kemudian diperoleh matriks baru berdasarkan titik
observasi dan luasan grid GCM seperti yang diperlihatkan oleh Tabel 3, dengan
nilai adalah jumlah cropping luasan GCM dan menunjukkan grids matriks. Tabel 3 Matriks data GCM mengikuti data observasi
Stasiun
Observasi Data GCM
… ×
… ×
… ×
… … … …
.. ×
Kemudian, untuk mengurangi masalah ukuran pada data luaran GCM
yang berdimensi besar, maka dilakukan reduksi dimensi spasial dari matriks data
GCM dengan menggunakan PCA. Ilustrasi pereduksian dimensi dari data matriks
GCM terlihat pada Tabel 4.
Tabel 4 PCA Matriks data GCM
Stasiun
Observasi PCA Data GCM
… …
…
… … … …
Proses analisis komponen utama/PCA adalah suatu analisis peubah ganda
yang bertujuan untuk mereduksi dimensi data tanpa harus kehilangan informasi
secara berarti. Pada penelitian ini proses reduksi dilakukan dengan mengambil
lebih dari satu komponen utama (principal component), dengan keragaman ≥ 97%. Proses reduksi menghasilkan atribut kolom data matriks baru yang berasal
dari komponen utama PCA sebesar m, dengan kearagaman/principle component
score lebih besar dari 97%. Dapat dikatakan bahwa hasil reduksi dimensi menggunakan PCA menghasilkan variabel baru sebanyak m yang merepresentasikan informasi dengan tingkat kepercayaan sebesar 97% dari data
matriks sebelumnya dengan atribut kolom berupa vektor berukuran nxn, dimana m jauh lebih kecil dari pada nxn (m<<nxn).
Dalam penelitian ini pemodelan membagi bulan didasarkan pada musim,
yaitu bulan pada musim hujan dengan rataan curah hujuan yang tinggi terjadi pada
bulan Desember-Januari-Februari (DJF), bulan pada musim kemarau dengan
rataan curah hujan yang sedikit terjadi pada bulan Juni-Juli-Agustus(JJA) dan
bulan pada masa pancaroba yang merupakan peralihan musim hujan ke kemarau
terjadi pada bulan Maret-April-Mei (MAM) serta peralihan musim kemarau ke
musim hujan terjadi pada bulan September-Oktober-November(SON). Sehingga
PCA data matriks GCM terbagi menjadi 4 bagian menjadi DJF,
GCM-MAM, GCM-JJA, dan GCM-SON yang masing-masing berjumlah 66 baris.
Langkah selanjutnya yaitu menyusun model SVR berdasarkan data GCM
dan observasi. Pada model SVR, data GCM akan berperan sebagai masukan, dan
data observasi berperan sebagai targetnya. Namun, sebelum dilakukan
penyusunan model, terlebih dahulu harus dilakukan pembagian data menjadi data
latih dan data uji menggunakan teknik -fold cross validation. Berdasarkan teknik
k-fold cross validation, seluruh data baik GCM maupun observasi dibagi menjadi
k subset, yaitu S1, S2,…, Sk. Pada penelitian ini ditentukan nilai k sebesar 5. Masing-masing subset memiliki ukuran yang sama. Pembagian data dilakukan secara acakdengan mempertahankan perbandingan jumlahbaris data setiap kelas.
Setelah dilakukan pembagian data maka penyusunan model SVR dapat
[image:41.595.127.462.131.424.2]dilakukan. Ilustrasi arsitektur dari model SVR, diperlihatkan pada Gambar 12.
Gambar 12 Struktur SVR.
Pada tahap pelatihan data yang digunakan adalah data latih sebagai
masukan untuk pelatihan menggunakan metode SVR dengan masing-masing
fungsi kernel-nya adalah linear kernel, polynomial kernel, dan radial basis
function (RBF) kernel menghasilkan keluaran berupa model SVR. Dari fungsi
kernel yang digunakan, sebelumnya diharuskan untuk menentukan nilai parameter
C untuk fungsi linear kernel, nilai parameter C, γ, r, dan d untuk fungsi
polynomial kernel, dan parameter C dan γ untuk fungsi RBF kernel. Penentuan parameter fungsi kernel berpengaruh pada model SVR yang dihasilkan. Semakin optimal parameternya, maka semakin baik model yang dihasilkan. Dalam
penelitian ini untuk mendapatkan parameter fungsi kernel yang optimum dilakukan dengan menggunakan metode grid search didapatkan model SVR dengan parameter yang optimal.
Pada tahap pengujian, data uji digunakan sebagai masukan bagi model
SVR untuk mendapatkan keluaran/ouput berupa nilai estimasi atau nilai prediksi.
JJA, SON) dan berlangsung selama 5-fold cross validation sehingga menghasilkan nilai estimasi untuk keseluruhan data dengan rentang tahun periode
1979-200. Selanjutnya dilakukan proses evaluasi dan divalidasi dengan cara
membandingkan nilai estimasi yang diperoleh dengan nilai dari pengamatan
sesungguhnya untuk menguji kehandalan model dalam melakukan pendugaan
curah hujan bulanan di wilayah Kabupaten Indramayu. Tahap terakhir dari
penelitian yaitu melakukan dokumentasi dan pelaporan akhir hasil evaluasi yang
menandakan penelitian yang dilakukan telah selesai.
3.3 Lingkup Pengembangan Model
Spesifikasi perangkat keras dan perangkat lunak komputer yang
digunakan dalam penelitian ini sebagai berikut :
 Perangkat keras: processor Intel Core 2 duo 3.20 GHz, memori 2 GB, dan
harddisk 250 GB.
BAB IV HASIL DAN PEMBAHASAN
4.1 Pemodelan Downscaling untuk Pendugaan Curah Hujan
Pemodelan downscaling luaran GCM menggunakan SVR yang dihasilkan, diterapkan untuk menduga curah hujan pada masing-masing 13 pos
stasiun hujan di Kabupaten Indramayu selama 22 tahun (1979-2000) dengan
menggunakan teknik 5-foldcros validation. Model pendugaan pada setiap luaran GCM dan 13 stasiun hujan yang diujicobakan, menghasilkan kecendrungan
estimasi yang cukup baik bila dilihat dari hasil plot antara nilai prediksi yang
dirata-ratakan, mengikuti rata-rata hasil pengamatan stasiun hujan (Gambar 13).
Gambar 13 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan
luaran GCM (fungsi RBF kernel)
Gambar 13 merupakan plot hasil estimasi model SVR dengan fungsi
RBF kernel yang diujicobakan terhadap enam luaran GCM (gambar untuk plot hasil estimasi dan observasi menggunakan fungsi linear kernel dan polynomial disajikan di Lampiran 1). Pada gambar tersebut menunjukkan bahwa secara umum
baik menggunakan SVR dengan fungsi linear, polynomial, maupun RBF kernel, pola distribusi dari curah hujan bulanan hasil estimasi sudah mendekati data
pengamatannya. Setiap luaran GCM yang diujicobakan menghasilkan model
dengan hasil estimasi yang cenderung hampir sama yaitu mendekati hasil dari
0 100 200 300 400 500 600 700
78 79 80 81 82 83 84 85 86 87 88 89 89 90 91 92 93 94 95 96 97 98 99 00
C
u
r
ah
H
u
jan
(m
m
)
Tahun
observasi, sehingga didapatkan pola distribusi yang menyerupai satu sama
lainnnya. Pola distribusi yang hampir sama antara GCM yang satu dan yang
lainnya dapat diperlihatkan dengan cara merata-ratakan nilai estimasi
masing-masing luaran GCM, kemudian dibandingkan dengan observasi yang terlihat
[image:44.595.107.502.197.415.2]seperti pada Gambar 14 .
Gambar 14 Perbandingan antara pola observasi dan prediksi curah hujan untuk
seluruh luaran GCM (rataan, minimum, dan maksimum).
Pada Gambar 14 juga memperlihatkan bahwa sebagian besar dari nilai
observasi berada diantara nilai maksimum (biru) dan nilai minimum (hijau) dari
estimasi seluruh luaran GCM . Akan tetapi pada titik-titik dengan jumlah curah
hujan ekstrim yang ditunjukkan oleh data pengamatan pada gambar tersebut,
untuk hasil estimasi terbaik yang didapatkan jauh dibawah nilai pengamatannya.
Nilai pengamatan pada titik ekstrim contohnya pada titik di tahun 1980, tahun
1997, dan beberapa titik ekstrim lainnya, berada di atas nilai maksimum dari
prediksi seluruh luaran GCM. Hal tersebut dapat diartikan bahwa masing-masing
luaran GCM menghasilkan model yang cukup bagus untuk memprediksi curah
hujan dengan kondisi normal, tetapi untuk keadaan ekstrim, walaupun model
prediksi sudah dapat mengikuti pola dari data pengamatan namun nilai prediksi
yang dihasilkan belum berhasil menjangkau dan mendekati nilai pengamatan yang
sesungguhnya.
0 100 200 300 400 500 600 700
78 79 80 81 82 83 84 85 86 87 88 89 89 90 91 92 93 94 95 96 97 98 99 00
C
u
r
ah
H
u
jan
(m
m
)
Tahun
4.2 Kinerja Model Berdasarkan Luaran GCM
Berdasarkan hasil grafik di Gambar 14 yang menggunakan panjang tahun
selama 22 tahun, dapat dilihat bahwa enam luaran model GCM yang diujikan
memiliki kencenderungan dan pola yang hampir sama. Tidak telihat perbedaan
yang mencolok secara kasat mata antara luaran satu dan lainnya. Akan tetapi bila
melihat nilai korelasi dan eror (NRMSE dan MAEP) yang didapatkan dari nilai
estimasi dan observasi maka akan dapat dilihat luaran GCM yang mempunyai
kinerja yang paling baik dalam menduga curah hujan menggunakan SVR. Pada
masing-masing luaran GCM, nilai korelasi dan eror dari estimasi dan observasi
untuk setiap stasiun di Kabupaten di Indramayu dirata-ratakan seperti yang
terlihat pada Tabel 5.
Tabel 5 Nilai RMSE, korelasi validasi model menurut menurut fungsi kernel dan rataan masing-masing model pada GCM
Luaran GCM Fungsi Kernel NRMSE MAEP r
t-47 Linear kernel 9,891 8,174 0,639
PolynomialKernel 9,547 8,072 0,660 RBF Kernel 9,271 7,928 0,685
t-63 Linear kernel 9,923 8,197 0,634
PolynomialKernel 9,691 8,127 0,652 RBF Kernel 9,477 7,974 0,669
giss-er Linear kernel 9,726 8,144 0,642
PolynomialKernel 9,391 8,071 0,668 RBF Kernel 9,124 7,955 0,688
giss-aom Linear kernel 10,093 8,257 0,628
PolynomialKernel 9,822 8,130 0,641 RBF Kernel 9,592 7,974 0,666
miub-g Linear kernel 10,584 8,278 0,613
PolynomialKernel 10,290 8,229 0,626 RBF Kernel 9,925 8,075 0,657
mri-32a Linear kernel 10,221 8,259 0,624
PolynomialKernel 9,946 8,190 0,638
RBF Kernel 9,737 8,023 0,662
Kinerja dari luaran dapat dilihat berdasarkan nilai eror dan korelasinya.
Luaran GCM dikatakan memiliki kinerja yang baik apabila nilai eror yang
kinerja yang kurang baik apabila memiliki nilai eroryang besar dan nilai korelasi
yang kecil.
Hasil validasi model downscaling menggunakan SVR pada luaran GCM yang ditunjukkan pada Tabel 5 memperlihatkan bahwa luaran GCM giss-er
memiliki nilai rata-rata eror yang paling rendah dan nilai rata-rata korelasi yang
paling tinggi. Nilai eror dari luaran GCM giss-er yaitu NRMSE = (9,726 - linear
kernel), (9,391 - polynomial kernel), (9,124 - RBF kernel), MAEP = (8,144 –
linear kernel), (8,071 - polynomial kernel), (7,955 - RBF kernel). Nilai korelasi dari luaran GCM giss-er yaitu r = (0,642- linear kernel), (0,668- polynomial
kernel), (0,688- RBF kernel). Berdasarkan Tabel 5 luaran GCM dengan nilai nilai rata-rata eror yang paling tinggi dan nilai rata-rata korelasi yang paling rendah
adalah luaran GCM miub-g. Nilai eror dari luaran GCM miub-g yaitu NRMSE =
(10,584 - linear kernel), (10,290 - polynomial kernel), (9,925 – RBF kernel), MAEP = (8,278 - linear kernel), (8,229 - polynomial kernel), (8,075- RBF
kernel). Nilai korelasi dari luaran GCM miub-g yaitu r = (0,613- linear kernel), (0,626- polynomialkernel), (0,657- RBF kernel).
Berdasarkan keterangan dari tabel 5, terlihat jelas urutan kinerja dari
luaran GCM yang paling tinggi sampai pada GCM dengan kinerja yang paling rendah.
Luaran GCM yang diujikan menggunakan model SVR dengan tiga fungsi kernel yang berbeda yaitu fungsi linear kernel, polynomial kernel, dan RBF kernel, menunjukkan hasil yang sama dimana kinerja paling baik dengan nilai eroryang
paling kecil dan korelasinya paling besar adalah luaran GCM giss-er. Selanjutnya
luaran GCM dengan kinerja dibawah giss-er sampai pada luaran gcm dengan
kinerja terendah secara berurutan adalah: luaran GCM t-47, luaran GCM t-63,
luaran GCM giss-aom, luaran GCM mri-32a, dan yang terakhir luaran GCM yang
memiliki kinerja paling rendah adalah luaran GCM miub-g.
Hasil kinerja dari luaran GCM juga dapat dilihat dari hasil perbandingan
nilai rataan estimasi dan pengamatan menurut bulannya. Nilai estimasi dan
pengamatan selama 22 tahun (1979-200) dirata-ratakan perbulan dari januari
sampai bulan desember. Plot nilai dari perbandingan antara hasil estimasi dan
Gambar 15a Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan
observasi (curah hujan dalam mm)
[image:47.595.111.500.79.676.2]Gambar 15b Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan
[image:48.595.110.502.76.435.2]observasi (curah hujan dalam mm)
Gambar 15 menunjukkan bahwa secara umum tingkat ketepatan luaran
GCM giss-er lebih baik dari luaran GCM lainnya. Nilai estimasi perbulan dari
januari sampai desember, baik menggunakan fungsi linear kernel, polynomial maupun RBF kernel, mendekati nilai pengamatannya. Pola dari nilai estimasi yamg mengikuti pola dari nilai pengamatan menunjukkan kekonsistenan dan
ketepatan yang cukup baik dari luaran GCM giss-er tersebut. Hal ini menandakan
bahwa luaran GCM giss-er memiliki kinerja yang baik dalam memprediksi curah
hujan bulanan di Kabupaten Indramayu.
Selanjutnya untuk luaran GCM lainnya, tidak berbeda jauh karena pola
nilai estimasi mengikuti nilai pengamatan seperti yang ditunjukkan pada Gambar
15. Hanya satu atau dua nilai estimasi yang kurang mendekati dari nilai
pengamatan disetiap luaran GCM. Seperti pada bulan Januari, untuk beberapa
luaran GCM nilai estimasinya kurang mendekati nilai pengamatannya, namun
tetap bisa dikatakan cukup konsisten karena masing-masing luaran GCM
[image:48.595.103.507.81.807.2]memperlihatkan pola yang dapat mengestimasi nilai-nilai rataan dari pengamatan
yang berfluktuatif selama bulan januari sampai desember.
Bila diperhatikan dari Gambar 15, untuk luaran GCM dengan kinerja
yang paling rendah berdasarkan perbandingan nilai rataan estimasi dan
pengamatanya, diperlihatkan oleh luaran GCM miub-g. Hal ini ditunjukkan dari
nilai estimasinya yang cukup mencolok dan kurang mendekati nilai
pengamatannya pada bulan-bulan tertentu. Nilai estimasi yang kurang mendekati
nilai pengamatanya adalah pada bulan Januari, September dan November.
Sehingga dengan demikian, untuk model SVR yang menggunakan luaran GCM
yaitu miub-g, mendapatkan hasil prediksi terendah dibandingkan dengan model
yang menggunakan luaran GCM yang lain.
Berdasarkan hasil kinerja antara luaran GCM yang diujikan dapat
dinyatakan bahwa setiap luaran GCM mempunyai tingkat akurasi berbeda-beda
pada suatu wilayah. Pemodelan downscaling menggunakan SVR dengan luaran GCM giss-er merupakan model paling baik untuk melakukan prediksi curah hujan
bulanan di wilayah Kabupaten Indramayu, sedangkan GCM miub-g merupakan
model luaran GCM yang memiliki kinerja paling rendah untuk melakukan
prediksi curah hujan bulanan di wilayah Kabupaten Indramayu.
4.3 Kinerja Model Berdasarkan Fungsi Kernel SVR
Hasil analisis kinerja fungsi kernel pada SVR diperoleh dengan melihat tingkat eror dan korelasi dari estimasi terhadap data pengamatan yang ditunjukkan
oleh Gambar 16 dan Gambar 17.
Jika dilihat dari analisis grafik pada Gambar 16 dan Gambar 17, model
SVR dengan fungsi linear kernel memiliki nilai eror paling besar dan ukuran korelasinya paling kecil, kemudian fungsi polynomial kernel dengan ukuran eror lebih kecil dan korelasinya lebih besar dan terakhir fungsi RBF yang memiliki
Gambar 16 Nilai rataan NRMSE, MAEP validasi model berdasarkan kinerja
[image:50.595.157.505.84.302.2]fungsi kernel SVR pada setiap luaran GCM
Gambar 17 Nilai rataan korelasi validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM
Ukuran eror model yang menggunakan salah satu luaran GCM yaitu
GCM giss-er dan fungsi linear kernel memiliki nilai NRMSE=9,726, MAEP=8,144, dan ukuran korelasi r=0,642. Selanjutnya ukuran eror
menggunakan luaran GCM yang sama namun fungsi kernel berbeda yaitu
polynomial memiliki nilai NRMSE=9,391, MAEP=8,071, dan ukuran korelasi
Linear Polinom ial Radial Basis
NRM SE 10,073 9,781 9,521
M AEP 8,218 8,136 8,002
7 8 8 9 9 10 10
11 NRM SE M AEP
Linear Polinom ial Radial Basis
Korelasi 0,630 0,647 0,671
0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67
dengan nilai r=0,668. Terakhir adalah model yang menggunakan fungsi RBF
kernel dan luaran GCM giss-er, menghasilkan ukuran eror paling kecil dengan nilai NRMSE=9,124, MAEP= 7,955, dan ukuran korelasinya sebesr r=0,688.
Kecendrungan hasil eror dan korelasi yang sama terlihat untuk setiap
luaran GCM dimana hasil perbandingan ukuran eror dan korelasi menunjukkan
bahwa model dengan kinerja paling baik secara berurutan adalah fungsi RBF
kernel, fungsi polynomial kernel, dan yang terakhir fungsi linear kernel yang memiliki kinerja paling rendah bila dibandingkan dua fungsi kernel lainnya.
Penjelasan lebih lanjut untuk kinerja fungsi kernel pada model SVR diilustrasikan oleh grafik scater pada Gambar 18. Grafik scater tersebut memperlihatkan hubungan antara observasi dan hasil prediksi untuk setiap fungsi
kernel pada model SVR. Hubungan yang kuat antara observasi dan prediksi menunjukkan semakin kuat pula korelasi dan semakin kecil ukuran eror antara
nilai yang diamati dan nilai yang diestimasi. Kuat atau tidaknya hubungan antara
prediksi dan observasi dapat dilihat melalui persamaan regresi = + yang
mengambarkan antara sebagai prediksi memiliki kedekatan hubungan dengan
( ) yang disebut sebagai observasi yang ditunjukkan pada grafik scater.
Pada model SVR dengan luaran GCM giss-er yang menggunakan fungsi
RBF kernel memiliki hubungan kedekatan antara prediksi dan observasi yang paling baik bila dibandingkan dengan model yang menggunakan fungsi kernel lainnya. Gradien dari persamaan pada model SVR menggunakan fungsi RBF
kernel memiliki nilai paling besar yaitu bernilai 0.83 dan intercept bernilai 10,07. Sementara, gradient yang menunjukkan hubungan antara prediksi dan observasi
untuk masing-masing fungsi kernel lain yaitu polynomial dan linear kernel secara berurutan adalah 0,789, 0,768, dan intercept sebesar 11,09, dan 14, 56. Gradient yang besar (mendekati 1) dan nilai intercept yang kecil (mendekati nol) menandakan adanya hubungan kuat antara prediksi dan observasi, ukuran
Gambar 18 Grafik scater untuk plot hasil observasi dengan estimasi masing
masing fungsi kernel
y = 0,719x + 28,73
0 100 200 300 400 500 600
0 200 400 600
P
re
d
ik
si
(
m
m
)
Observasi (mm)
RBFKernel
y = 0,698x + 31,09
0 100 200 300 400 500 600
0 200 400 600
P
re
d
ik
si
(
m
m
)
Observasi (mm)
Polynomial Kernel
y = 0,677x + 34,56
0 100 200 300 400 500 600
0 200 400 600
P
re
d
ik
si
(
m
m
)
Observasi (mm)
Hasil running time atau waktu komputasi dalam melakukan run model SVR dari tahap pelatihan sampai pengujian memiliki nilai yang berbeda untuk
setiap fungsi kernel-nya. Contohnya model SVR dengan luaran GCM giss-er, hasil waktu komputasi menggunakan fungsi linear kernel dalam memprediksi curah hujan bulanan untuk tiap stasiun hujan di Kabupaten Indramayu memiliki
rata-rata sebesar 20 detik. Waktu komputasi yang didapatkan oleh model yang
menggunakan fungsi polynomial kernel memiliki rata-rata sebesar 523 detik (8 menit 43 detik). Sedangkan waktu komputasi yang didapatkan oleh model yang
menggunakan fungsi RBF memiliki rata-rata sebesar 32 detik.
Secara keseluruhan dapat diketahui bahwa kinerja model dengan fungsi
kernel-nya yang memiliki hasil paling baik adalah RBF. Dengan waktu komputasi yang diperlukan untuk melakukan run model SVR dalam hitungan detik namun ukuran eror yang dihasilkan kecil dan korelasinya lebih besar dari pada fungsi
kernel lainnya seperti linear dan polynomial. Sementara bila dilakukan perbandingan antara dua fungsi kernel yaitu polynomial dengan linear, fungsi
polynomial kernel membutuhkan waktu