Statistical Downscaling of GCM Data using Support Vector Regression to Predict Monthly Rainfall in Indramayu.

(1)

MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU

MUHAMMAD ASYHAR AGMALARO

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

(2)

Saya menyatakan dengan sebenar-benarnya bahwa segala pernyataan dalam tesis

yang berjudul Pemodelan Statistical Downscaling Data GCM Menggunakan

SupportVectorRegression untuk Memprediksi Curah Hujan Bulanan Indramayu, merupakan gagasan atau hasil penelitian tesis saya sendiri dengan arahan dari

komisi pembimbing, kecuali yang dengan jelas ditunjukkan oleh sumbernya.

Tesis ini belum pernah diajukan untuk memperoleh gelar pada program sejenis di

Perguruan Tinggi lain. Semua data dan informasi yang digunakan telah

dinyatakan secara jelas dan dapat diperiksa kebenarannya.

Bogor, Desember 2011

Muhammad Asyhar Agmalaro

(3)

MUHAMMAD ASYHAR AGMALARO. Statistical Downscaling of GCM Data

using Support Vector Regression to Predict Monthly Rainfall in Indramayu.

Under direction of AGUS BUONO, and MUSHTHOFA.

The knowledge about weather and climate pattern, especially rainfall is

required by many sectors such as, agricultural, plantation, transportation, and so

on. Recently, the model that is used to observe the impact and to predict the

climate change is the global circulation model (GCM). However, the current

GCM-resolution data is too low and it is difficult to predict the local climate

pattern that requires high resolution. However, it is possible to obtain

regional-scale information if it is combined with statistical downscaling (SD) methods. The

main objective of this research is to develop SD models by using support vector

regression (SVR) in forecasting monthly rainfall in Indramayu, in order to get the

accurate climate information based on GCM data. The results of this research

showed that overall, the model is good enough to predict rainfall with normal

conditions. But for extreme circumstances, although the prediction model was

able to follow the pattern of the observational data, but the value of the resulting

predictions have not managed to predict accuratelly the actual observed values.

Variations of the evaluation of estimated results by the model for 13 rain stations

in Indramayu district showed that the location of rain stations in certain areas can

influence and determine the accuracy of the monthly rainfall forecast. Rain

observations points located farther from the sea tend to have better estimation

results than the observation points located close to the sea.

(4)

Data GCM Menggunakan Support Vector Regression untuk Memprediksi Curah Hujan Bulanan Indramayu. Dibimbing oleh AGUS BUONO dan MUSHTHOFA.

Iklim merupakan gejala alamiah yang sangat penting dan berpengaruh bagi

kehidupan manusia. Pengetahuan tentang pola cuaca dan iklim terutama curah

hujan, sangat dibutuhkan di banyak sektor seperti pertanian, perkebunan,

transportasi, dan lain-lain. Untuk mengetahui dan memahami sistem iklim

sehingga dapat digunakan dalam memprediksi jumlah curah hujan bulanan di

suatu daerah, diperlukan suatu model/alat yang dapat menyimulasikan iklim.

Sampai saat ini, model/alat yang digunakan dalam kajian utama untuk

mempelajari dampak dan menduga perubahan iklim adalah global circulation

model (GCM). Akan tetapi resolusi dari data luaran GCM yang dianggap terlalu rendah menyulitkan dalam melakukan prediksi dengan mempelajari pola iklim

regional/lokal yang membutuhkan resolusi yang tinggi. Namun GCM masih

mungkin digunakan untuk memperoleh informasi skala regional hingga lokal bila

dipadukan dengan teknik statistical downscaling (SD).

Usaha pelaksanaan pengelolaan dampak dan resiko iklim menggunakan

SD sudah banyak dilakukan dan coba diterapkan dengan tujuan mengembangkan

model yang dapat memberikan berbagai informasi tentang iklim yang memadai

dan berguna untuk perencanaan kedepan. Oleh karena itu, studi kali ini akan

mencoba menekankan pada pentingnya upaya pembelajaran dan pemahaman

sistem iklim melalui pengembangan model SD menggunakan suport vector

regression (SVR) dalam melakukan peramalan curah hujan bulanan sehingga dapat dijadikan sebagai alat pendukung dalam proses penyebaran informasi iklim

yang efektif, efisien, dan tepat guna.

Tujuan utama dari penelitian ini adalah mengembangkan model SD

menggunakan SVR untuk peramalan curah hujan bulanan (studi kasus Indramayu)

agar dapat menghasilkan informasi iklim yang akurat dan dapat dijadikan sebagai

dasar pembuat keputusan. Manfaat dari hasil penelitian ini dihasilkan suatu model

(5)

curah hujan yang digunakan berasal dari stasiun hujan yang berada di daerah

Indramayu (13 stasiun) dari tahun 1979 – 2002 serta data General Circulation

Model (GCM) yang digunakan adalah sebanyak 6 model (1901 – 2000).

Secara keseluruhan model yang dihasilkan menggunakan SVR cukup

bagus untuk memprediksi curah hujan dengan kondisi normal, tetapi untuk

keadaan ekstrim, walaupun model prediksi sudah dapat mengikuti pola dari data

pengamatan namun nilai prediksi yang dihasilkan belum berhasil menjangkau dan

mendekati nilai pengamatan yang sesungguhnya. Salah satu penyebabnya diduga

karena ketidaksempurnaan luaran GCM dalam menyimulasikan peubah penjelas

khususnya untuk wilayah tropis (Cavazos dan Hewitson 2005).

Variasi dari evaluasi hasil estimasi oleh model terhadap 13 stasiun hujan di

Kabupaten Indramayu memperlihatkan bahwa lokasi stasiun hujan di wilayah

tertentu mempengaruhi dan menentukan ketepatan hasil ramalan curah hujan

bulanan. Titik Observasi Hujan dengan lokasi berada agak jauh dari laut

cenderung memiliki hasil estimasi lebih baik daripada titik observasi yang berada

dekat dengan garis pantai/laut. Untuk stasiun hujan yang lokasinya berdekatan

dengan laut, akan mengurangi pengaruh dari topografi (lokal) sehingga

mempengaruhi luaran GCM yang digunakan dalam melakukan proses

downscaling. Dengan kata lain, akan timbul kesulitan bagi luaran GCM dalam menyimulasikan dengan baik peubah penjelas untuk menghasilkan pemodelan

downscaling yang handal dan memiliki ketepatan prediksi yang baik. Sementara untuk stasiun hujan yang lokasinya agak berjauhan dengan laut, topografi (lokal)

tidak terlalu terpengaruh oleh adanya interaksi iklim yang kompleks antara

daratan, lautan dan atmosfir sehingga cenderung lebih baik hasil dugaan

modelnya. Hasil ini mendukung penelitian Watterhall (2002) yang menyimpulkan

bahwa lokasi stasiun hujan mempengaruhi luaran GCM dalam melakukan proses

(6)

© Hak Cipta Milik IPB, Tahun 2011 Hak Cipta dilindungi Undang-undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa

mencantumkan atau menyebutkan sumber

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,

penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau

tinjauan suatu masalah

b. Pengutipan tidak merugikan kepentingan yang wajar IPB

2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh

(7)

MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU

MUHAMMAD ASYHAR AGMALARO

Tesis

sebagai salah satu syarat untuk memperoleh gelar

Magister Ilmu Komputer pada

Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

(8)

(9)

Indramayu

Nama : Muhammad Asyhar Agmalaro

NIM : G651090241

Disetujui

Komisi Pembimbing

Dr. Ir. Agus Buono, M.Si, M,Kom Mushthofa, S.Kom, M.Sc

Ketua Anggota

Diketahui,

Ketua Program Studi Dekan Sekolah Pascasarjana

Ilmu Komputer

Dr. Ir. Agus Buono, M.Si, M.Kom Dr. Ir. Dahrul Syah, M.Sc.Agr

Tanggal Ujian : Tanggal Lulus :

(10)

Puji syukur kehadirat Allah SWT, atas berkat rahmat dan hidayah-Nya

penulis dapat menyelesaikan penelitian dan penulisan tesis sebagai syarat dalam

menyelesaikan perkuliahan di Magister Ilmu Komputer, Institut Pertanian Bogor.

Tidak lupa shalawat serta salam semoga senantiasa di berikan kepada Nabi

Muhammad, SAW, keluarganya, dan umatnya sampai akhir zaman.

Penulis melakukan penelitian tentang pengembangan model statistical

downscaling (SD)menggunakan support vectormachine (SVR) untuk peramalan curah hujan bulanan dengan studi kasus meliputi wilayah observasi disekitar

stasiun hujan yang terdapat di Kabupaten Indramayu. Untuk data GCM yang

digunakan dalam penelitin ini terdiri atas 6 model dan untuk data observasi

digunakan 13 titik koordinat stasiun curah hujan di Indramayu. Dengan

menerapkan metode SVR dalam peramalan curah hujan di Kabupaten Indramayu,

diharapkan dapat dijadikan sebagai dasar pembuat keputusan contohnya di bidang

pertanian dalam pemilihan varietas tanaman dan pola tanam yang cocok sesuai

dengan informasi iklim yang tersedia.

Penulis mengucapkan terima kasih atas bantuan dan dukungan dari

semua pihak yang mendukung baik secara langsung maupun tidak langsung dalam

pelaksanaan kuliah maupun penelitian yang telah dilaksanakan. Cinta dan rasa

syukur yang sedalam-dalamnya penulis curahkan untuk:

1. Ayahanda Ahmadi Agusni dan Ibunda Jumarsnimi, atas nasihat, doa,

cinta, kasih sayang, semangat, motivasi dan dukungan materil maupun

non materil selama penulis menjalani pendidikan dan dapat

menyelesaikan kuliah di Pasca Sarjana Intitut Pertanian Bogor,

2. Kakakku Andini Safitri, Kakak ipar Rinaldi Marza Putra dan

keponakanku tercinta zahra yang selalu menjadi sumber semangat bagi

penulis untuk menyelesaikan tesis ini,

3. Bapak Dr. Ir. Agus Buono, M.Si, M.Kom dan Bapak Mushthofa, S.Kom,

(11)

4. Cagia R.A. Wulantari, S.Ikom, M.Si, yang selalu memberi dukungan,

semangat, motivasi, dan kasih sayangnya selama penulis menempuh

pendidikan di Institut Pertanian Bogor,

5. Sahabat-sahabatku Sigit Susilo, Warid, Dena, Elvie, Puput, yang selalu

setia memberi dukungan dan semangat dalam menjalani masa-masa

kuliah,

6. Rekan-rekan seperjuangan angkatan XI S2 Ilmu Komputer IPB (alm Pak

Oke Hendradly, Pak Mukhlis, Pak Tahir, Mas Mawan, Pak Rico, Pak

Iyan, Pak Boy, Pak Azhari, Mas Kamal, Mas Deba Supriyanto, M Rafi

Muttaqin, Aries M, Pak Yusuf, Bu Zuriati, Bu Dewi, Bu Sinta, Bu Retno,

Bu Ari Q), atas kebersamaan dan bantuannya selama kulian dan

penelitian di MKOM IPB, khususnya Rafi yang selalu membantu penulis

dalam menyelesaikan tesis ini.

Penulis menyadari bahwa dalam penulisan tesis ini masih banyak

kekurangan. Kritik, saran dan masukan dalam penelitian ini sangat penulis

harapkan, demi sempurnanya tesis ini di kemudian hari.

Bogor, Desember 2011

(12)

Penulis (Muhammad Asyhar Agmalaro) dilahirkan di Jambi, 31 Maret 1986

sebagai anak kedua dari dua bersaudara pasangan Ahmadi Agusni dan

Jumarsnimi. Penulis mengenyam pendidikan sekolah dasar di SDN 92 Jambi

(1992-1998). Kemudian, penulis melanjutkan pendidikan menengahnya ke SMP

Negeri 7 Jambi (1998 – 2001), lalu SMA Negeri 1 Jambi (2001-2004). Setelah

lulus SMU pada tahun 2004, penulis berkesempatan melanjutkan studi di IPB

melalui jalur USMI (Undangan Seleksi Masuk IPB) di Departemen Matematika,

Fakultas Matematika dan Ilmu Pengetahuan Alam dan lulus pada tahun 2008.

Penulis berkesempatan melanjutkan ke jenjang pascsarjana (S2) Ilmu Komputer

(ILKOM), Institut Pertanian Bogor pada tahun 2009. Penulis melaksanakan

penelitian dengan judul “Pemodelan Statistical Downscaling Data GCM menggunakan Support Vector Regression untuk Memprediksi Curah Hujan Bulanan Indramayu” untuk penyusunan tesis sebagai tugas akhir guna

(13)

DAFTAR ISI

Halaman

DAFTAR ISI ... i

DAFTAR GAMBAR ... iii

DAFTAR TABEL ... v

DAFTAR LAMPIRAN ... vi

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Tujuan ... 3

1.3 Ruang Lingkup ... 4

1.4 Hasil dan Manfaat ... 4

BAB II TINJAUAN PUSTAKA ... 5

2.1 Model Sirkulasi Umum ... 5

2.2 Statistical Downscaling ... 6

2.3 Principal Component Analysis (PCA) ... 8

2.4 Support Vector Regression (SVR) ... 9

2.5 K-fold Cross Validation ... 14

2.6 Grid Search ... 15

BAB III DATA DAN METODOLOGI ... 17

3.1 Data ... 17

3.1.1 Data Luaran GCM (Peubah Penjelas) ... 17

3.1.2 Data Curah Hujan (Peubah Respon) ... 18

3.2 Tahapan Penelitian ... 19

3.3 Lingkup Pengembangan Model ... 24

BAB IV HASIL DAN PEMBAHASAN ... 25

4.1 Pemodelan Downscaling untuk Pendugaan Curah Hujan ... 25

4.2 Kinerja Model Berdasarkan Luaran GCM ... 27

4.3 Kinerja Model Berdasarkan Fungsi Kernel SVR ... 31

4.4 Pengaruh Parameter Fungsi Kernel Terhadap Performance Model ... 35

(14)

BAB V KESIMPULAN DAN SARAN... 43

5.1 Kesimpulan ... 43

5.2 Saran ... 44

DAFTAR PUSTAKA ... 45

(15)

DAFTAR GAMBAR

Halaman

1 Visualisasi Layering pada GCM (Sumber : IPPC, 2011) ... 5

2 Ilustrasi proses downscaling, (Sumber : Sutikno 2008) ... 7

3 Fungsi regresi pada SVR (Sumber : Smola dan Schölkopf 2003)... 10

4 Penambahan variable slack pada SVR (Sumber : Smola dan ... 12

5 Ilustrasi proses SVR (Sumber : Smola dan Schölkopf 2003) ... 13

6 Ilustrasi pembagian kelompok data latih dan uji pada k-cross ... 14

7 Grid dengan = 4 ... 15

8 Ilustrasi metode grid search. ... 16

9 Contoh Data Luaran GCM. ... 18

10 Tahapan proses penelitian ... 19

11 Ilustrasi proses cropping luasan grid data GCM. ... 20

12 Struktur SVR. ... 23

13 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM (fungsi RBF kernel) ... 25

14 Perbandingan antara pola observasi dan prediksi curah hujan untuk seluruh luaran GCM (rataan, minimum, dan maksimum). ... 26

15a Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan observasi (curah hujan dalam mm) ... 29

16 Nilai rataan NRMSE, MAEP validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM ... 32

17 Nilai rataan korelasi validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM ... 32

Gambar 18 Grafik scater untuk plot hasil observasi dengan estimasi masing masing fungsi kernel ... 34

Gambar 19 Hasil korelasi antara data estimasi dan pengamatan curah hujan bulanan Kabupaten Indramayu (fungsi kernel: RBF) ... 38

Gambar 20 Hasil NRMSE, dan MAEP antara data estimasi dan pengamatan curah hujan bulanan Kabupaten Indramayu (fungsi kernel: RBF) ... 39

Gambar 21 Plot hasil estimasi dan pengamatan stasiun hujan Bondan ... 40

(16)

Gambar 23 Lokasi Stasiun Hujan di Kabupaten Indramayu (Sumber: diolah dari

(17)

DAFTAR TABEL

Halaman

1 Kategori teknik downscaling (Sumber : Sutikno 2008) ... 8

2 Data Observasi curah hujan di Kota Indramayu ... 18

3 Matriks data GCM mengikuti data observasi ... 21

4 PCA Matriks data GCM ... 21

5 Nilai RMSE, korelasi validasi model menurut menurut Fungsi kernel dan rataan masing-masing model pada GCM ... 27

(18)

DAFTAR LAMPIRAN

1 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM

... 48

2 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM

... 49

3 Plot perbandingan hasil estimasi dan pengamatan perstasiun hujan di Indramayu

(19)

BAB I PENDAHULUAN

1.1 Latar Belakang

Iklim merupakan gejala alamiah yang sangat penting dan berpengaruh

bagi kehidupan manusia. Pengetahuan tentang pola cuaca dan iklim terutama

curah hujan, sangat dibutuhkan di banyak sektor seperti pertanian, perkebunan,

transportasi, dan lain-lain. Pada sektor pertanian dan perkebunan, informasi yang

dapat meramalkan mengenai besar kecilnya jumlah curah hujan bulanan di setiap

daerah, akan sangat berguna untuk dapat menentukan pola tanam dan varietas

tanaman yang tepat agar menghasilkan produksi yang baik. Hal ini dikarenakan

curah hujan berpengaruh langsung terhadap ketersediaan air. Kurangnya

ketersedian air akan berdampak kekeringan, dan sebaliknya apabila kelebihan air

akan membanjiri lahan pertanian (Bruinsma, 2003). Indonesia sebagai negara

agraris dengan sektor pertanian dan perkebunan yang menjadi penyokong utama

kehidupan dan ekonomi rakyat akan terkena dampak paling serius akibat

terjadinya kekeringan dan banjir yang disebabkan kurangnya informasi mengenai

jumlah curah hujan. Oleh karena itu dibutuhkan suatu ramalan informasi yang

akurat, cepat dan bersifat spesifik lokasi untuk memprediksi curah hujan di masa

yang akan datang agar dapat meminimalisir dampak kerugian yang terjadi.

Untuk mengetahui dan memahami sistem iklim sehingga dapat

digunakan dalam memprediksi jumlah curah hujan bulanan di suatu daerah,

diperlukan suatu model/alat yang dapat menyimulasikan iklim, memprediksi

perubahan-perubahan iklim masa lampau, sekarang, dan membuat skenario

perubahan iklim masa yang akan datang. Sampai saat ini, model/alat yang

digunakan dalam kajian utama untuk mempelajari dampak dan menduga

perubahan iklim adalah global circulation model (GCM). Secara umum, GCM diartikan sebagai penggambaran matematis dari sejumlah besar interaksi fisika,

kimia, dan dinamika atmosfer bumi dan menghasilkan data dalam jumlah sangat

besar yang dapat digunakan untuk membuat prakiraan iklim (Wigena, 2006).

Akan tetapi beberapa pemerhati dan peneliti meteorologi beranggapan GCM

belum cukup baik untuk mendapatkan informasi iklim secara detail sehingga

(20)

dengan sangat tepat dan akurat terutama di kawasan tropis. Seperti daerah-daerah

di Indonesia yang termasuk kasawan tropis, proses pembentukan hujan

dipengaruhi oleh topografi dan interaksi antara laut, darat dan atmosfir yang

kompleks menyebabkan keragaman sifat hujan bulanan di setiap daerah sehingga

menimbulkan kesulitan membuat simulasi untuk prediksi curah hujan (Storch dan

Zwiers, 1999). Resolusi dari data luaran GCM yang dianggap terlalu rendah juga

menyulitkan dalam melakukan prediksi dengan mempelajari pola iklim

regional/lokal yang membutuhkan resolusi yang tinggi. Akan tetapi GCM masih

mungkin digunakan untuk memperoleh informasi skala regional hingga lokal bila

dipadukan dengan teknik statistical downscaling (SD).

Penggunaan teknik SD pada luaran GCM, telah banyak dilakukan dengan

maksud mendapatkan suatu model iklim dengan melakukan transformasi data dari

suatu grid luaran GCM menjadi data pada grid-grid dengan unit skala yang lebih

kecil untuk yang menghasilkan informasi secara lebih detail dari berbagai unsur

iklim dengan resolusi yang cukup tinggi, baik dari segi skala spasial maupun

temporal (Wilby et al., 1998). Pendekatan ini menciptakan korelasi antara skala global/lokal, berdasarkan hubungan fungsional kedua skala tersebut. Hubungan

antara skala global dengan variabel yang mewakili proses sirkulasi atmosfir

(seperti data tekanan permukaan laut, dan kelembaban relatif) dengan skala lokal

(seperti data curah hujan), digunakan untuk melakukan simulasi model iklim

bersifat statik dimana dalam periode dan jangka waktu tertentu data pada grid

luaran GCM yang berskala besar dipakai sebagai dasar untuk

menentukan/memprediksi data pada grid berskala lebih kecil.

Kebutuhan Informasi mengenai pola iklim terutama curah hujan yang

berdampak langsung di bidang pertanian harus ditanggapi dan pikirkan dengan

penuh perencanaan. Dalam hal ini, sinergi dalam penyediaan informasi iklim yang

efektif dan tepat guna sangat perlu untuk terus dievaluasi dan dikembangkan.

Apalagi ditambah dengan adanya kondisi perubahan iklim yang mungkin

memberikan dampak yang lebih terhadap kegiatan pertanian. Oleh karena itu,

perencanaan yang menyeluruh baik jangka pendek maupun jangka panjang sangat

(21)

konteks pengembangan model yang dapat melakukan prediksi curah hujan sebagai

salah satu upaya dalam pengelolaan dampak resiko iklim (Fowler et al., 2007). Usaha pelaksanaan pengelolaan dampak dan resiko iklim menggunakan

SD sudah banyak dilakukan dan coba diterapkan. Penelitian terdahulu, Wigena

(2004), mengembangkan model SD menggunakan regression projection pursuit (RPP) dalam melakukan peramalan curah hujan di Indramayu dengan salah satu

kajian analisisnya adalah menentukan domain yang baik pada luaran GCM. Hasil

penelitian menunjukkan domain dengan grid 5x5, cukup baik untuk digunakan

pada proses downscaling. Selanjutnya Cavazos dan Hewitson (2004) melakukan penelitian untuk melihat performance luaran GCM NCEP-NCAR dengan mencari kombinasi peubah penjelas potensial dalam menduga curah hujan menggunakan

jaringan saraf buatan (JST). Hasil penelitian menyimpulkan bahwa satu peubah

penjelas GCM yaitu presipitasi sudah cukup baik untuk memperoleh informasi

curah hujan saat melakukan proses downscaling. Kemudian masih banyak penelitian lainnya mengenai SD yang bertujuan mengembangkan model yang

dapat memberikan berbagai informasi tentang iklim yang memadai dan berguna

untuk perencanaan kedepan. Oleh karena itu, studi kali ini akan mencoba

menekankan pada pentingnya upaya pembelajaran dan pemahaman sistem iklim

melalui pengembangan model SD menggunakan suport vector regression (SVR) dalam melakukan peramalan curah hujan bulanan sehingga dapat dijadikan

sebagai alat pendukung dalam proses penyebaran informasi iklim yang efektif,

efisien, dan tepat guna.

1.2 Tujuan

Tujuan dari penelitian ini adalah mengembangkan model statistical

downscaling menggunakan SVR untuk peramalan curah hujan bulanan (studi kasus Indramayu). Oleh karena itu, diharapkan dapat menghasilkan informasi

iklim yang akurat dan dapat dijadikan sebagai dasar pembuat keputusan. Salah

satu contohnya yaitu di bidang pertanian seperti pemilihan varietas tanaman dan

pola tanam yang cocok terkait dengan informasi iklim yang tersedia untuk

(22)

1.3 Ruang Lingkup

Ruang lingkup dari penelitian ini adalah sebagai berikut:

 Data curah hujan yang digunakan adalah data yang berasal dari titik observasi berdasarkan 13 lokasi koordinat stasiun hujan di Indramayu.

 Data General Circulation Model (GCM) yang digunakan adalah sebanyak 6 model (1901 – 2000).

1.4 Hasil dan Manfaat

Hasil dan manfaat yang diharapkan melalui penelitian ini adalah

dihasilkan suatu model stastisticaldownscaling yang memberikan informasi iklim akurat berdasarkan dari data luaran GCM sehingga dapat dijadikan sebagai suatu

(23)

BAB II TINJAUAN PUSTAKA

2.1 Model Sirkulasi Umum

Model sirkulasi umum atau general circulation model (GCM) merupakan suatu penggambaran matematis dari sejumlah besar interaksi fisika, kimia, dan

dinamika atmosfer bumi (Stroch, 1999). GCM ini menduga perubahan iklim dan

disajikan tiga layer, yaitu layer horisontal dengan ukuran 100 hingga 600 km, 10

hingga 20 layer vertikal di atmosfer dan kadangkala 30 layer di samudra, seperti

disajikan pada Gambar 1.

Gambar 1 Visualisasi Layering pada GCM (Sumber : IPPC, 2011)

Dengan resolusi yang begitu kasar, maka GCM tidak bisa menangkap

fitur penting pada suatu area (region) tertentu yang menjadi fokus kajian dampak perubahan iklim. Namun demikian, GCM ini bisa digunakan untuk mengestimasi

kepekaan iklim terhadap kondisi yang berbeda seperti perubahan gas rumah kaca

(GRK). Oleh karena itu, model GCM memberikan beberapa keuntungan seperti

tertera pada Sutikno, 2008, yaitu : (1) dapat digunakan untuk mengestimasi

perubahan iklim global dalam merespon terhadap peningkatan konsentrasi GRK,

(2) estimasi peubah iklim (curah hujan, suhu, kelembaban) secara fisik sesuai

dengan model-model fisika, (3) estimasi peubah cuaca (angin, radiasi, penutupan

(24)

mengenai dampak, (4) mampu mensimulasi keragaman iklim siklus harian.

Disamping kelebihan seperti disebutkan di atas, beberapa kelemahannya adalah :

(1) resolusi terlalu kasar, sehingga terjadi gap antara hasil simulasi global,

regional dan lokal, (2) model tersebut sulit mengkopel dengan

model-model sirkulasi lautan, dan (3) proses-proses umpan balik atmosfer-biosfer tidak

terpenuhi. Untuk menjembatani gap antara hasil global dengan regional dan lokal,

maka diperlukan satu model yang dikenal dengan nama downscaling.

Dalam perkembangannya, model sirkulasi umum dikenal dengan nama

model dinamik untuk memprediksi musim dan kondisi ENSO yang disebut model

dinamik Coupled AO-GCM. Kedua model yang terpisah ini dipasangkan dan

saling mempengaruhi satu sama lain. Saat model atmorfer bergerak dengan waktu,

perubahan-perubahan pada angin rendah (dekat permukaan laut) berfungsi sebagai

daya yang menggerakkan model lautan. Dengan bergeraknya model lautan

dengan waktu, perubahan pada suhu lautan berfungsi sebagai mesin untuk model

atmosfer melalui aliran panas dan uap air dari laut ke atmosfer. Luaran dari

prakiraan musim disajikan dalam bentuk peluang yang diperoleh dari banyak

model yang dikenal dengan ensemble model. Dalam hal ini Coupled AO-GCM dijalankan beberapa kali dengan nilai input awal yang sedikit berbeda.

2.2 Statistical Downscaling

Statistical Downscaling didefinisikan sebagai upaya menghubungkan antara sirkulasi peubah skala global (peubah penjelas) dan peubah skala lokal

(peubah respon, Sutikno 2008). Gambar 2 memberikan ilustrasi proses

downscaling.

Pendekatan statistical downscaling (SD) menggunakan data regional (statistic dynamical downscaling) atau global (statistical downscaling) untuk memperoleh hubungan fungsional antara skala lokal dengan skala global GCM,

seperti model regresi. Pendekatan SD disusun berdasarkan adanya hubungan

antara grid skala besar (prediktor) dengan grid skala lokal (respon) yang

dinyatakan dengan model statistik yang dapat digunaan untuk menterjemahkan

anomali-anomali skala global yang menjadi anomali dari beberapa peubah iklim

(25)

hubungan fungsional sirkulasi atmosfer global dengan unsur-unsur iklim lokal,

yang bentuk umumnya adalah (Storch et al, 1993):

)

(

_, _, _, ,p t q s g

t

f

X

Y



(1)

Dengan :

Y : Peubah-peubah iklim lokal

X : Peubah-peubah luaran GCM

t : Periode waktu

p : Banyaknya peubah Y

q : Banyaknya peubah X

s : Banyaknya lapisan atmosfer

g : Banyaknya grid domain GCM

Gambar 2 Ilustrasi proses downscaling, (Sumber : Sutikno 2008)

Pada umumnya model SD melibatkan data deret waktu (t) dan data

spasial GCM (g). Banyaknya peubah Y, peubah X, lapisan atmosfer dalam model

dan autokorelasi serta kolinearitas pada peubah Y maupun X menunjukkan kompleksitas model.

Saat ini telah banyak dikembangkan model SD yang secara umum

(26)

berbasis model linear atau non linear, berbasis parametrik dan non parametrik, berbasis proyeksi dan seleksi, serta teknik berbasis model-driven atau data-driven. Pembedaan mengenai model yang dipergunakan sesuai kategori, disajikan secara

detail pada Tabel 1. Suatu model perhitungan SD bisa termasuk ke dalam

kombinasi ke lima kategori tersebut, sebagai contoh PCR termasuk kategori

metode berbasis regresi, linear, parametrik, proyeksim dan data-driven.

Pengembangan model-model downscaling sangat diperlukan untuk pelaksanaan kegiatan kajian dampak keragaman dan perubahan iklim dan

penyusunan strategi atau pembuatan keputusan baik pada tingkat pembuatan

keputusan sampai petani.

Tabel 1 Kategori teknik downscaling (Sumber : Sutikno 2008)

2.3 Principal Component Analysis (PCA)

Salah satu tantangan dalam analisis peubah ganda adalah mereduksi

dimesi dari himpunan data peubah ganda yang besar. Hal ini sering dilakukan

dengan cara mereduksi himpunan peubah tersebut menjadi himpunan peubah yang

lebih kecil atau himpunan peubah baru yang banyaknya lebih sedikit.

Peubah-peubah baru tersebut merupakan fungsi dari Peubah-peubah asal atau Peubah-peubah asal itu

sendiri yang memiliki proporsi informasi yang signifikan mengenai himpunan

(27)

PCA dapat mereduksi q peubah pengamatan menjadi k peubah baru yang saling ortogonal yang masing-masing k peubah baru tersebut merupakan kombinasi linear dari q peubah asal. Pemilihan k peubah baru sedemikian hingga keragaman yang dimiliki p peubah lama dapat diterangkan secara optimal oleh k peubah baru. PCA efektif jika antar q peubah asal memiliki korelasi yang cukup besar (Dillon & Goldstein 1984).

Ada beberapa fungsi dari penggunaan PCA diantaranya adalah (Dillon &

Goldstein 1984):

1. Identifikasi peubah baru yang mendasari data peubah ganda, yang bercirikan:

merupakan kombinasi linear peubah-peubah asal; jumlah kuadrat koefisien dalam kombinasi linear tersebut adalah satu;tidak berkorelasi;dan mempunyai ragam berurut dari yang terbesar ke yang terkecil.

2. Mengurangi banyaknya dimensi himpunan peubah yang biasanya terdiri atas

peubah yang banyak dan saling berkorelasi menjadi peubah-peubah baru yang

tidak berkorelasi dengan mempertahankan sebanyak mungkin keragaman

dalam himpunan tersebut.

3. Memilih peubah asal yang banyak memberi kontribusi informasi atau

menghilangkan peubah asal yang mempunyai kontribusi informasi relatif

kecil.

Hasil PCA dapat digunakan untuk analisis lebih lanjut misalkan

pengelompokkan (clustering) dan regresi komponen utama.

2.4 Support Vector Regression (SVR)

SVR merupakan penerapan support vector machine (SVM) untuk kasus regresi. Dalam kasus regresi output berupa bilangan riil atau kontinyu. SVR

merupakan metode yang dapat mengatasi overfitting, sehingga akan menghasilkan performansi yang bagus (Smola dan Schölkopf, 2003).

Pada Gambar 3, dimisalkan diberikan data training

1 1 2 2

[( ,x y), (x y, ),..., ( ,x y_l _l)] dengan vektor input xi dan data output yi yang

(28)

SVR ingin menemukan suatu fungsi regresi f(x) yang dapat mengaproksimasi output ke suatu target aktual, dengan eror toleransi-ε, dan kompleksitas yang

minimal. Fungsi regresi f(x) dapat dinyatakan dengan formula sebagai berikut (Smola dan Schölkopf, 2003):

( ) T ( )

f x w  x b ₍₂₎

Dimana φ(x) menunjukkan suatu titik didalam ruang fitur berdimensi lebih tinggi, hasil pemetaan dari input vektor x di dalam ruang input yang berdimensi lebih rendah.

Gambar 3 Fungsi regresi pada SVR (Sumber : Smola dan Schölkopf 2003)

Koefisien w dan b diestimasi dengan cara meminimalkan fungsi resiko (risk function) yang didefinisikan dalam persamaan:

 





2

1

1 1

min ,

2 w C _i L y f xi i



 _ 





(3a)

yang memenuhi:

 

i i

y w x   b 

(3b)

 

_i _i , 1, 2,...,

w x   y b  i 

(29)

 

0 ( , )

0,untuk yang lain

i i i i

i i

y f x y f x

L y f x



 _ _ _ _

  

 (3c)

Faktor w2 dinamakan reguralisasi. Meminimalkan w 2 akan membuat suatu fungsi setipis mungkin, sehingga dapat mengontrol kapasitas fungsi.

Empirical error diukur dengan ε-insensitive loss function yang diharuskan meminimalkan norm dari w agar mendapatkan generalisasi yang baik untuk fungsi regresi f(x) (Smola dan Schölkopf, 2003). Oleh karena itu diperlukan untuk menyelesaikan problem optimasi berikut:

2

2 1

min w (4a)

yang memenuhi:

 

i i

y w x   b 

(4b)

 

_i _i , 1, 2,...,

w x   y b  i 

Diasumsikan bahwa ada suatu fungsi f yang dapat mengaproksimasi semua titik



x_i,y_i



dengan presisi ε. Dalam kasus ini kita asumsikan bahwa semua titik ada dalam rentang f  (feasible). Dalam hal ketidaklayakan

(infeasible), dimana mungkin ada beberapa titik yang mungkin keluar dari rentang

(30)

[image:30.595.183.461.85.270.2]

Gambar 4 Penambahan variable slack pada SVR (Sumber : Smola dan Schölkopf 2003)

Selanjutnya problem optimasi di atas bisa diformulasikan sebagai

berikut:





2 *

1

1 1

m i n ,

2

l

i i

i

w C x x

l _





(5a)

yang memenuhi:

 

*

- - - £ , 1, 2, ...,

- - £ , 1, 2, ...,

, ³0 T

i i i

i i

y w j x b x Î i l

wj x y b x Î i l

x x



 

(5b)

Konstanta C>0 menentukan tawar menawar (trade off) antara ketipisan fungsi dan batas atas deviasi lebih dari yang masih dapat ditoleransi. Semua

deviasi lebih besar daripada ε akan dikenakan pinalti sebesar C. Dalam SVR, ε setara dengan akurasi dari aproksimasi terhadap data training. Nilai ε yang kecil

(31)

Gambar 5 Ilustrasi proses SVR (Sumber : Smola dan Schölkopf 2003)

Nilai yang tinggi untuk variable slack akan membuat empirical error mempunyai pengaruh yang besar terhadap faktor regulasi. Dalam SVR, support

vector adalah data training yang terletak pada dan diluar batas f dari fungsi keputusan, karena itu jumlah support vector menurun dengan naiknya ε (Smola

dan Schölkopf, 2003).

Dalam formulasi dual, problem optimisasi dari SVR adalah sebagai

berikut:















* *

1 1

* *

1 1

1

max ,

2 _i _j i i j j i j

i i i i i

i i

K x x

y

 

   

   

 

   

   

 



(6a)

yang memenuhi:



*



1 *

0

0 , 1, 2, ...,

i i

i

i C i

C i



 

 



 

     



(6b)

(32)

j

i x

x

K , adalah dot-product kernel yang didefinisikan sebagai

 

i

 

j T

j

i x x x

x

K ,   . Dengan menggunakan langrange multiplier dan kondisi optimalitas, fungsi regresi secara eksplisit dirumuskan sebagai berikut:

 



*







1

- ,

i i i

i

f x K x x b



 







(7)

2.5 K-fold Cross Validation

K-fold cross validation merupakan salah satu variasi dari teknik cross

validation. k-fold cross validation dilakukan untuk membagi training set dan test

set. Inti validasi tipe ini adalah membagi data secara acak ke dalam k himpunan bagian. k-fold cross validation mengulang k-kali untuk membagi sebuah himpunan contoh secara acak menjadi k subset yang paling bebas, setiap ulangan disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan. Dari k himpunan bagian tersebut dipilih satu himpunan bagian menjadi data uji dan (k-1)

dijadikan data latih. Proses ini dilakukan berulang sebanyak k, dimana setiap k himpunan bagian yang ada menjadi data uji dan sisanya menjadi data latih.

Namun, secara teori tidak ada tolak ukur yang pasti untuk nilai k.

Keuntungan k-fold cross validation dibandingkan dengan variasi cross

validation seperti Repeated random sub-sampling validation adalah semua data digunakan baik untuk data uji maupun data latih. Ilustrasi proses validasi dapat

dilihat pada Gambar 6.

Gambar 6 Ilustrasi pembagian kelompok data latih dan uji pada k-cross

(33)

2.6 Grid Search

Metode Gridsearch merupakan salah satu metode yang sederhana untuk mengatasi masalah pengoptimuman (Rao, 2009). Metode ini melibatkan

penyusunan grid yang cocok dalam suatu ruang dimensi, mengevaluasi fungsi

objektif dari seluruh titik grid, dan menemukan titik grid yang sesuai dengan

fungsi objektif yang memiliki nilai optimum. Jika batas atas dan batas bawah dari

variable ke- diketahui masing-masing sebagai dan , dapat dibagi range ( , ) ke dalam -1 bagian yang sama, sehingga ( ), ( ), …, ( )menunjukkan titik-titik grid sumbu ( = 1,2,3, …, ).

Gambar 7 Grid dengan = 4

Hal ini menunjukkan kepada total dari , , …, titik grid dalam

dimensi ruang. Sebuah grid dengan = 4 ditunjukkan dalam 2 dimensi ruang

seperti pada Gambar 7.

Sebagai contoh, akan dicari nilai optimum suatu model/fungsi dengan

mencari kombinasi parameter-parameter yang memberikan atau dapat

mengaprokmasi nilai terbaik (misalnya memiliki eror yang paling kecil). Ilustrasi

(34)

Gambar 8 Ilustrasi metode grid search.

Metode grid search memiliki cara kerja yang hampir serupa dengan percobaan secara manual menggunakan teknik trial dan eror. Mencoba kombinasi parameter satu persatu dan membandingkan nilai terbaik yang diberikan oleh

parameter tersebut. Namun perbedaan metode grid search terletak pada proses perbandingan nilai yang tidak dilakukan di awal saat terpilihnya pasangan

kombinasi parameter. Pasangan kombinasi dari parameter terlebih dahulu

disimpan dalam grid-grid. Selanjutnya perbandingan nilai eror terkecil dilihat dari

(35)

BAB III DATA DAN METODOLOGI

3.1 Data

Pada penelitian ini, ada dua jenis data yang akan digunakan. Jenis data

pertama adalah data curah hujan bulanan dan yang kedua adalah data luaran

GCM.

3.1.1 Data Luaran GCM (Peubah Penjelas)

Data GCM yang digunakan dalam penelitian ini terdiri dari 6 luaran:  Pacific_20c3m_cgcm3.1_t47 (t-47)

Peubah luaran: presipitasi, subset: koordinat 25 titik bujur x 18 titik lintang,

waktu: 1200 bulan (Jan 1901- Des 2000).

 Pacific_20c3m_cgcm3.1_t63 (t-63)

Peubah luaran presipitasi, subset: koordinat 33 titik bujur x 22 titik lintang,

waktu: 1200 bulan (Jan 1901- Des 2000).  Pacific_20c3m_giss_model_er (giss-er)

 Pacific_20c3m_gissaom (giss-aom)

waktu: 1200 bulan (Jan 1901- Des 2000).  Pacific_20c3m_miub_echo_g (miub-g)

 Pacific_20c3m_mri_cgcm2_3_2a(mri-32a)

Data luaran GCM memiliki peubah luaran salah satu contohnya adalah

presipitasi yang merupakan nilai-nilai hasil pengambaran matematis dari sejumlah

besar interaksi fisika, kimia, dan dinamika atmosfer bumi. Nilai-nilai tersebut

(36)

cuaca seperti curah hujan, suhu, kelembapan, penutupan awan, radiasi, dan

lain-lain. Contoh dari luaran GCM dapat dilihat pada Gambar 9

Gambar 9 Contoh Data Luaran GCM.

3.1.2 Data Curah Hujan (Peubah Respon)

Data Curah hujan yang digunakan untuk penelitian ini adalah dari data

titik-titik observasi di kota Indramayu dari Januari 1979 sampai Desember 2000

Contoh data dapat dilihat pada Tabel 2.

Tabel 2 Data Observasi curah hujan di Kota Indramayu

NamaSta Cidempet Cikedung Indramayu Jatibarang Sudikampiran Kedokan bund

Jan-89 125 167 150 202 112 109

Feb-89 491 430 556 480 389 345

Mar-89 337 304 357 191 278 273

Apr-89 92 348 40 99 156 40

May-89 159 215 128 89 153 105

Jun-89 117 173 139 86 122 232

Terdapat 13 titik observasi curah hujan yang diamati tersebar di

Kabupaten Indramayu, dengan lokasinya sebagian berada dekat dengan garis

pantai/ laut dan sebagian lagi jauh dari laut. Secara umum lokasi yang menjadi

titik observasi curah hujan memiliki topografi berupa dataran atau daerah landai

dengan kemiringan tanahnya rata-rata 0 – 2 %. Bila curah hujan cukup tinggi,

maka di daerah-daerah tertentu yang tidak mempunyai drainase yang baik akan

(37)

3.2 Tahapan Penelitian

Tahapan penelitian ini terangkum secara lengkap pada gambar Gambar

[image:37.595.105.486.143.740.2]

10.

(38)

Tahap awal yang dilakukan pada penelitian ini adalah dimulai dari

pemahaman terhadap permasalahan yang akan diselesaikan. Mengacu pada

tujuan, penelitian ini mencoba untuk mengembangkan model SVR yang dapat

memprediksi curah hujan bulanan di wilayah Kabupaten Indramayu. Untuk

mendapatkan gambaran menyeluruh tentang domain penelitian yang akan

dilaksanakan, diperlukan studi literatur sehingga dapat mengukur dan melihat

seberapa berbeda dan pentingnya penelitian yang akan dilakukan.

Setelah memahami masalah, maka tahap yang dilakukan selanjutnya

adalah pengumpulan data. Secara keseluruhan data observasi terdiri dari 22

periode (tahun 1979 – 2000). Dengan demikian data GCM yang digunakan hanya

dari tahun 1979 – 2000.

Berdasarkan titik observasi hujan dilihat koordinatnya, kemudian

berdasarkan titik koordinat tersebut akan digunakan untuk menentukan grid dari

data luaran GCM dengan luasan grid berupa matriks 5x5. Titik koordinat

observasi berada ditengah-tengah luasan grid GCM yang akan diambil. Sebagai

contoh, stasiun hujan memiliki titik koordinat 112 bujur timur dan 6 derajat

lintang selatan. Luasan grid yang di-cropp pada gcm merupakan grid matriks 5x5 dengan pusatnya merupakan lokasi stasiun hujan. Ilustrasi proses pengambilan

data GCM dengan grid 5x5 dapat dilihat pada Gambar 11.

(39)

Dikarenakan data observasi memiliki periode 22 tahun, maka proses

cropping yang dilakukan mengikuti observasi sebanyak 12x22 tahun. Luasan grid yang diperoleh dari prosis cropping keseluruhan luaran GCM adalah sebanyak 264 dari bulan Januari 1979 sampai dengan Desember 2000, sehingga jumlah

keseluruhan untuk data masukan menjadi 264 (22x12) data dengan atribut

sebanyak 25 (5x5) buah. Kemudian diperoleh matriks baru berdasarkan titik

observasi dan luasan grid GCM seperti yang diperlihatkan oleh Tabel 3, dengan

nilai adalah jumlah cropping luasan GCM dan menunjukkan grids matriks. Tabel 3 Matriks data GCM mengikuti data observasi

Stasiun

Observasi Data GCM

… _×

… ×

… … … …

.. ×

Kemudian, untuk mengurangi masalah ukuran pada data luaran GCM

yang berdimensi besar, maka dilakukan reduksi dimensi spasial dari matriks data

GCM dengan menggunakan PCA. Ilustrasi pereduksian dimensi dari data matriks

GCM terlihat pada Tabel 4.

Tabel 4 PCA Matriks data GCM

Stasiun

Observasi PCA Data GCM

… …

…

… … … …

(40)

Proses analisis komponen utama/PCA adalah suatu analisis peubah ganda

yang bertujuan untuk mereduksi dimensi data tanpa harus kehilangan informasi

secara berarti. Pada penelitian ini proses reduksi dilakukan dengan mengambil

lebih dari satu komponen utama (principal component), dengan keragaman ≥ 97%. Proses reduksi menghasilkan atribut kolom data matriks baru yang berasal

dari komponen utama PCA sebesar m, dengan kearagaman/principle component

score lebih besar dari 97%. Dapat dikatakan bahwa hasil reduksi dimensi menggunakan PCA menghasilkan variabel baru sebanyak m yang merepresentasikan informasi dengan tingkat kepercayaan sebesar 97% dari data

matriks sebelumnya dengan atribut kolom berupa vektor berukuran nxn, dimana m jauh lebih kecil dari pada nxn (m<<nxn).

Dalam penelitian ini pemodelan membagi bulan didasarkan pada musim,

yaitu bulan pada musim hujan dengan rataan curah hujuan yang tinggi terjadi pada

bulan Desember-Januari-Februari (DJF), bulan pada musim kemarau dengan

rataan curah hujan yang sedikit terjadi pada bulan Juni-Juli-Agustus(JJA) dan

bulan pada masa pancaroba yang merupakan peralihan musim hujan ke kemarau

terjadi pada bulan Maret-April-Mei (MAM) serta peralihan musim kemarau ke

musim hujan terjadi pada bulan September-Oktober-November(SON). Sehingga

PCA data matriks GCM terbagi menjadi 4 bagian menjadi DJF,

GCM-MAM, GCM-JJA, dan GCM-SON yang masing-masing berjumlah 66 baris.

Langkah selanjutnya yaitu menyusun model SVR berdasarkan data GCM

dan observasi. Pada model SVR, data GCM akan berperan sebagai masukan, dan

data observasi berperan sebagai targetnya. Namun, sebelum dilakukan

penyusunan model, terlebih dahulu harus dilakukan pembagian data menjadi data

latih dan data uji menggunakan teknik -fold cross validation. Berdasarkan teknik

k-fold cross validation, seluruh data baik GCM maupun observasi dibagi menjadi

k subset, yaitu S1, S2,…, Sk. Pada penelitian ini ditentukan nilai k sebesar 5. Masing-masing subset memiliki ukuran yang sama. Pembagian data dilakukan secara acakdengan mempertahankan perbandingan jumlahbaris data setiap kelas.

(41)

Setelah dilakukan pembagian data maka penyusunan model SVR dapat

[image:41.595.127.462.131.424.2]

dilakukan. Ilustrasi arsitektur dari model SVR, diperlihatkan pada Gambar 12.

Gambar 12 Struktur SVR.

Pada tahap pelatihan data yang digunakan adalah data latih sebagai

masukan untuk pelatihan menggunakan metode SVR dengan masing-masing

fungsi kernel-nya adalah linear kernel, polynomial kernel, dan radial basis

function (RBF) kernel menghasilkan keluaran berupa model SVR. Dari fungsi

kernel yang digunakan, sebelumnya diharuskan untuk menentukan nilai parameter

C untuk fungsi linear kernel, nilai parameter C, γ, r, dan d untuk fungsi

polynomial kernel, dan parameter C dan γ untuk fungsi RBF kernel. Penentuan parameter fungsi kernel berpengaruh pada model SVR yang dihasilkan. Semakin optimal parameternya, maka semakin baik model yang dihasilkan. Dalam

penelitian ini untuk mendapatkan parameter fungsi kernel yang optimum dilakukan dengan menggunakan metode grid search didapatkan model SVR dengan parameter yang optimal.

Pada tahap pengujian, data uji digunakan sebagai masukan bagi model

SVR untuk mendapatkan keluaran/ouput berupa nilai estimasi atau nilai prediksi.

(42)

JJA, SON) dan berlangsung selama 5-fold cross validation sehingga menghasilkan nilai estimasi untuk keseluruhan data dengan rentang tahun periode

1979-200. Selanjutnya dilakukan proses evaluasi dan divalidasi dengan cara

membandingkan nilai estimasi yang diperoleh dengan nilai dari pengamatan

sesungguhnya untuk menguji kehandalan model dalam melakukan pendugaan

curah hujan bulanan di wilayah Kabupaten Indramayu. Tahap terakhir dari

penelitian yaitu melakukan dokumentasi dan pelaporan akhir hasil evaluasi yang

menandakan penelitian yang dilakukan telah selesai.

3.3 Lingkup Pengembangan Model

Spesifikasi perangkat keras dan perangkat lunak komputer yang

digunakan dalam penelitian ini sebagai berikut :

 Perangkat keras: processor Intel Core 2 duo 3.20 GHz, memori 2 GB, dan

harddisk 250 GB.

(43)

BAB IV HASIL DAN PEMBAHASAN

4.1 Pemodelan Downscaling untuk Pendugaan Curah Hujan

Pemodelan downscaling luaran GCM menggunakan SVR yang dihasilkan, diterapkan untuk menduga curah hujan pada masing-masing 13 pos

stasiun hujan di Kabupaten Indramayu selama 22 tahun (1979-2000) dengan

menggunakan teknik 5-foldcros validation. Model pendugaan pada setiap luaran GCM dan 13 stasiun hujan yang diujicobakan, menghasilkan kecendrungan

estimasi yang cukup baik bila dilihat dari hasil plot antara nilai prediksi yang

dirata-ratakan, mengikuti rata-rata hasil pengamatan stasiun hujan (Gambar 13).

Gambar 13 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan

luaran GCM (fungsi RBF kernel)

Gambar 13 merupakan plot hasil estimasi model SVR dengan fungsi

RBF kernel yang diujicobakan terhadap enam luaran GCM (gambar untuk plot hasil estimasi dan observasi menggunakan fungsi linear kernel dan polynomial disajikan di Lampiran 1). Pada gambar tersebut menunjukkan bahwa secara umum

baik menggunakan SVR dengan fungsi linear, polynomial, maupun RBF kernel, pola distribusi dari curah hujan bulanan hasil estimasi sudah mendekati data

pengamatannya. Setiap luaran GCM yang diujicobakan menghasilkan model

dengan hasil estimasi yang cenderung hampir sama yaitu mendekati hasil dari

0 100 200 300 400 500 600 700

78 79 80 81 82 83 84 85 86 87 88 89 89 90 91 92 93 94 95 96 97 98 99 00

C

u

r

ah

H

u

jan

(m

m

)

Tahun

(44)

observasi, sehingga didapatkan pola distribusi yang menyerupai satu sama

lainnnya. Pola distribusi yang hampir sama antara GCM yang satu dan yang

lainnya dapat diperlihatkan dengan cara merata-ratakan nilai estimasi

masing-masing luaran GCM, kemudian dibandingkan dengan observasi yang terlihat

[image:44.595.107.502.197.415.2]

seperti pada Gambar 14 .

Gambar 14 Perbandingan antara pola observasi dan prediksi curah hujan untuk

seluruh luaran GCM (rataan, minimum, dan maksimum).

Pada Gambar 14 juga memperlihatkan bahwa sebagian besar dari nilai

observasi berada diantara nilai maksimum (biru) dan nilai minimum (hijau) dari

estimasi seluruh luaran GCM . Akan tetapi pada titik-titik dengan jumlah curah

hujan ekstrim yang ditunjukkan oleh data pengamatan pada gambar tersebut,

untuk hasil estimasi terbaik yang didapatkan jauh dibawah nilai pengamatannya.

Nilai pengamatan pada titik ekstrim contohnya pada titik di tahun 1980, tahun

1997, dan beberapa titik ekstrim lainnya, berada di atas nilai maksimum dari

prediksi seluruh luaran GCM. Hal tersebut dapat diartikan bahwa masing-masing

luaran GCM menghasilkan model yang cukup bagus untuk memprediksi curah

hujan dengan kondisi normal, tetapi untuk keadaan ekstrim, walaupun model

prediksi sudah dapat mengikuti pola dari data pengamatan namun nilai prediksi

yang dihasilkan belum berhasil menjangkau dan mendekati nilai pengamatan yang

sesungguhnya.

0 100 200 300 400 500 600 700

78 79 80 81 82 83 84 85 86 87 88 89 89 90 91 92 93 94 95 96 97 98 99 00

C

u

r

ah

H

u

jan

(m

m

)

Tahun

(45)

4.2 Kinerja Model Berdasarkan Luaran GCM

Berdasarkan hasil grafik di Gambar 14 yang menggunakan panjang tahun

selama 22 tahun, dapat dilihat bahwa enam luaran model GCM yang diujikan

memiliki kencenderungan dan pola yang hampir sama. Tidak telihat perbedaan

yang mencolok secara kasat mata antara luaran satu dan lainnya. Akan tetapi bila

melihat nilai korelasi dan eror (NRMSE dan MAEP) yang didapatkan dari nilai

estimasi dan observasi maka akan dapat dilihat luaran GCM yang mempunyai

kinerja yang paling baik dalam menduga curah hujan menggunakan SVR. Pada

masing-masing luaran GCM, nilai korelasi dan eror dari estimasi dan observasi

untuk setiap stasiun di Kabupaten di Indramayu dirata-ratakan seperti yang

terlihat pada Tabel 5.

Tabel 5 Nilai RMSE, korelasi validasi model menurut menurut fungsi kernel dan rataan masing-masing model pada GCM

Luaran GCM Fungsi Kernel NRMSE MAEP r

t-47 Linear kernel 9,891 8,174 0,639

PolynomialKernel 9,547 8,072 0,660 RBF Kernel 9,271 7,928 0,685

t-63 Linear kernel 9,923 8,197 0,634

giss-er Linear kernel 9,726 8,144 0,642

giss-aom Linear kernel 10,093 8,257 0,628

miub-g Linear kernel 10,584 8,278 0,613

mri-32a Linear kernel 10,221 8,259 0,624

PolynomialKernel 9,946 8,190 0,638

RBF Kernel 9,737 8,023 0,662

Kinerja dari luaran dapat dilihat berdasarkan nilai eror dan korelasinya.

Luaran GCM dikatakan memiliki kinerja yang baik apabila nilai eror yang

(46)

kinerja yang kurang baik apabila memiliki nilai eroryang besar dan nilai korelasi

yang kecil.

Hasil validasi model downscaling menggunakan SVR pada luaran GCM yang ditunjukkan pada Tabel 5 memperlihatkan bahwa luaran GCM giss-er

memiliki nilai rata-rata eror yang paling rendah dan nilai rata-rata korelasi yang

paling tinggi. Nilai eror dari luaran GCM giss-er yaitu NRMSE = (9,726 - linear

kernel), (9,391 - polynomial kernel), (9,124 - RBF kernel), MAEP = (8,144 –

linear kernel), (8,071 - polynomial kernel), (7,955 - RBF kernel). Nilai korelasi dari luaran GCM giss-er yaitu r = (0,642- linear kernel), (0,668- polynomial

kernel), (0,688- RBF kernel). Berdasarkan Tabel 5 luaran GCM dengan nilai nilai rata-rata eror yang paling tinggi dan nilai rata-rata korelasi yang paling rendah

adalah luaran GCM miub-g. Nilai eror dari luaran GCM miub-g yaitu NRMSE =

(10,584 - linear kernel), (10,290 - polynomial kernel), (9,925 – RBF kernel), MAEP = (8,278 - linear kernel), (8,229 - polynomial kernel), (8,075- RBF

kernel). Nilai korelasi dari luaran GCM miub-g yaitu r = (0,613- linear kernel), (0,626- polynomialkernel), (0,657- RBF kernel).

Berdasarkan keterangan dari tabel 5, terlihat jelas urutan kinerja dari

luaran GCM yang paling tinggi sampai pada GCM dengan kinerja yang paling rendah.

Luaran GCM yang diujikan menggunakan model SVR dengan tiga fungsi kernel yang berbeda yaitu fungsi linear kernel, polynomial kernel, dan RBF kernel, menunjukkan hasil yang sama dimana kinerja paling baik dengan nilai eroryang

paling kecil dan korelasinya paling besar adalah luaran GCM giss-er. Selanjutnya

luaran GCM dengan kinerja dibawah giss-er sampai pada luaran gcm dengan

kinerja terendah secara berurutan adalah: luaran GCM t-47, luaran GCM t-63,

luaran GCM giss-aom, luaran GCM mri-32a, dan yang terakhir luaran GCM yang

memiliki kinerja paling rendah adalah luaran GCM miub-g.

Hasil kinerja dari luaran GCM juga dapat dilihat dari hasil perbandingan

nilai rataan estimasi dan pengamatan menurut bulannya. Nilai estimasi dan

pengamatan selama 22 tahun (1979-200) dirata-ratakan perbulan dari januari

sampai bulan desember. Plot nilai dari perbandingan antara hasil estimasi dan

(47)

Gambar 15a Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan

observasi (curah hujan dalam mm)

[image:47.595.111.500.79.676.2]

(48)

Gambar 15b Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan

[image:48.595.110.502.76.435.2]

observasi (curah hujan dalam mm)

Gambar 15 menunjukkan bahwa secara umum tingkat ketepatan luaran

GCM giss-er lebih baik dari luaran GCM lainnya. Nilai estimasi perbulan dari

januari sampai desember, baik menggunakan fungsi linear kernel, polynomial maupun RBF kernel, mendekati nilai pengamatannya. Pola dari nilai estimasi yamg mengikuti pola dari nilai pengamatan menunjukkan kekonsistenan dan

ketepatan yang cukup baik dari luaran GCM giss-er tersebut. Hal ini menandakan

bahwa luaran GCM giss-er memiliki kinerja yang baik dalam memprediksi curah

hujan bulanan di Kabupaten Indramayu.

Selanjutnya untuk luaran GCM lainnya, tidak berbeda jauh karena pola

nilai estimasi mengikuti nilai pengamatan seperti yang ditunjukkan pada Gambar

15. Hanya satu atau dua nilai estimasi yang kurang mendekati dari nilai

pengamatan disetiap luaran GCM. Seperti pada bulan Januari, untuk beberapa

luaran GCM nilai estimasinya kurang mendekati nilai pengamatannya, namun

tetap bisa dikatakan cukup konsisten karena masing-masing luaran GCM

[image:48.595.103.507.81.807.2]

(49)

memperlihatkan pola yang dapat mengestimasi nilai-nilai rataan dari pengamatan

yang berfluktuatif selama bulan januari sampai desember.

Bila diperhatikan dari Gambar 15, untuk luaran GCM dengan kinerja

yang paling rendah berdasarkan perbandingan nilai rataan estimasi dan

pengamatanya, diperlihatkan oleh luaran GCM miub-g. Hal ini ditunjukkan dari

nilai estimasinya yang cukup mencolok dan kurang mendekati nilai

pengamatannya pada bulan-bulan tertentu. Nilai estimasi yang kurang mendekati

nilai pengamatanya adalah pada bulan Januari, September dan November.

Sehingga dengan demikian, untuk model SVR yang menggunakan luaran GCM

yaitu miub-g, mendapatkan hasil prediksi terendah dibandingkan dengan model

yang menggunakan luaran GCM yang lain.

Berdasarkan hasil kinerja antara luaran GCM yang diujikan dapat

dinyatakan bahwa setiap luaran GCM mempunyai tingkat akurasi berbeda-beda

pada suatu wilayah. Pemodelan downscaling menggunakan SVR dengan luaran GCM giss-er merupakan model paling baik untuk melakukan prediksi curah hujan

bulanan di wilayah Kabupaten Indramayu, sedangkan GCM miub-g merupakan

model luaran GCM yang memiliki kinerja paling rendah untuk melakukan

prediksi curah hujan bulanan di wilayah Kabupaten Indramayu.

4.3 Kinerja Model Berdasarkan Fungsi Kernel SVR

Hasil analisis kinerja fungsi kernel pada SVR diperoleh dengan melihat tingkat eror dan korelasi dari estimasi terhadap data pengamatan yang ditunjukkan

oleh Gambar 16 dan Gambar 17.

Jika dilihat dari analisis grafik pada Gambar 16 dan Gambar 17, model

SVR dengan fungsi linear kernel memiliki nilai eror paling besar dan ukuran korelasinya paling kecil, kemudian fungsi polynomial kernel dengan ukuran eror lebih kecil dan korelasinya lebih besar dan terakhir fungsi RBF yang memiliki

(50)

Gambar 16 Nilai rataan NRMSE, MAEP validasi model berdasarkan kinerja

[image:50.595.157.505.84.302.2]

fungsi kernel SVR pada setiap luaran GCM

Gambar 17 Nilai rataan korelasi validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM

Ukuran eror model yang menggunakan salah satu luaran GCM yaitu

GCM giss-er dan fungsi linear kernel memiliki nilai NRMSE=9,726, MAEP=8,144, dan ukuran korelasi r=0,642. Selanjutnya ukuran eror

menggunakan luaran GCM yang sama namun fungsi kernel berbeda yaitu

polynomial memiliki nilai NRMSE=9,391, MAEP=8,071, dan ukuran korelasi

Linear Polinom ial Radial Basis

NRM SE 10,073 9,781 9,521

M AEP 8,218 8,136 8,002

7 8 8 9 9 10 10

11 NRM SE M AEP

Linear Polinom ial Radial Basis

Korelasi 0,630 0,647 0,671

0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67

(51)

dengan nilai r=0,668. Terakhir adalah model yang menggunakan fungsi RBF

kernel dan luaran GCM giss-er, menghasilkan ukuran eror paling kecil dengan nilai NRMSE=9,124, MAEP= 7,955, dan ukuran korelasinya sebesr r=0,688.

Kecendrungan hasil eror dan korelasi yang sama terlihat untuk setiap

luaran GCM dimana hasil perbandingan ukuran eror dan korelasi menunjukkan

bahwa model dengan kinerja paling baik secara berurutan adalah fungsi RBF

kernel, fungsi polynomial kernel, dan yang terakhir fungsi linear kernel yang memiliki kinerja paling rendah bila dibandingkan dua fungsi kernel lainnya.

Penjelasan lebih lanjut untuk kinerja fungsi kernel pada model SVR diilustrasikan oleh grafik scater pada Gambar 18. Grafik scater tersebut memperlihatkan hubungan antara observasi dan hasil prediksi untuk setiap fungsi

kernel pada model SVR. Hubungan yang kuat antara observasi dan prediksi menunjukkan semakin kuat pula korelasi dan semakin kecil ukuran eror antara

nilai yang diamati dan nilai yang diestimasi. Kuat atau tidaknya hubungan antara

prediksi dan observasi dapat dilihat melalui persamaan regresi = + yang

mengambarkan antara sebagai prediksi memiliki kedekatan hubungan dengan

( ) yang disebut sebagai observasi yang ditunjukkan pada grafik scater.

Pada model SVR dengan luaran GCM giss-er yang menggunakan fungsi

RBF kernel memiliki hubungan kedekatan antara prediksi dan observasi yang paling baik bila dibandingkan dengan model yang menggunakan fungsi kernel lainnya. Gradien dari persamaan pada model SVR menggunakan fungsi RBF

kernel memiliki nilai paling besar yaitu bernilai 0.83 dan intercept bernilai 10,07. Sementara, gradient yang menunjukkan hubungan antara prediksi dan observasi

untuk masing-masing fungsi kernel lain yaitu polynomial dan linear kernel secara berurutan adalah 0,789, 0,768, dan intercept sebesar 11,09, dan 14, 56. Gradient yang besar (mendekati 1) dan nilai intercept yang kecil (mendekati nol) menandakan adanya hubungan kuat antara prediksi dan observasi, ukuran

(52)

[image:52.595.121.465.81.727.2]

Gambar 18 Grafik scater untuk plot hasil observasi dengan estimasi masing

masing fungsi kernel

y = 0,719x + 28,73

0 100 200 300 400 500 600

0 200 400 600

P

re

d

ik

si

(

m

)

Observasi (mm)

RBFKernel

y = 0,698x + 31,09

0 100 200 300 400 500 600

0 200 400 600

P

re

d

ik

si

(

m

)

Observasi (mm)

Polynomial Kernel

y = 0,677x + 34,56

0 100 200 300 400 500 600

0 200 400 600

P

re

d

ik

si

(

m

)

Observasi (mm)

(53)

Hasil running time atau waktu komputasi dalam melakukan run model SVR dari tahap pelatihan sampai pengujian memiliki nilai yang berbeda untuk

setiap fungsi kernel-nya. Contohnya model SVR dengan luaran GCM giss-er, hasil waktu komputasi menggunakan fungsi linear kernel dalam memprediksi curah hujan bulanan untuk tiap stasiun hujan di Kabupaten Indramayu memiliki

rata-rata sebesar 20 detik. Waktu komputasi yang didapatkan oleh model yang

menggunakan fungsi polynomial kernel memiliki rata-rata sebesar 523 detik (8 menit 43 detik). Sedangkan waktu komputasi yang didapatkan oleh model yang

menggunakan fungsi RBF memiliki rata-rata sebesar 32 detik.

Secara keseluruhan dapat diketahui bahwa kinerja model dengan fungsi

kernel-nya yang memiliki hasil paling baik adalah RBF. Dengan waktu komputasi yang diperlukan untuk melakukan run model SVR dalam hitungan detik namun ukuran eror yang dihasilkan kecil dan korelasinya lebih besar dari pada fungsi

kernel lainnya seperti linear dan polynomial. Sementara bila dilakukan perbandingan antara dua fungsi kernel yaitu polynomial dengan linear, fungsi

polynomial kernel membutuhkan waktu