• Tidak ada hasil yang ditemukan

PEMODELAN STATISTICAL DOWNSCALING DATA GCM MENGGUNAKAN SUPPORT VECTOR REGRESSION UNTUK MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU

N/A
N/A
Protected

Academic year: 2021

Membagikan "PEMODELAN STATISTICAL DOWNSCALING DATA GCM MENGGUNAKAN SUPPORT VECTOR REGRESSION UNTUK MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU"

Copied!
71
0
0

Teks penuh

(1)

MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU

MUHAMMAD ASYHAR AGMALARO

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2011

(2)

DAN SUMBER INFORMASI

Saya menyatakan dengan sebenar-benarnya bahwa segala pernyataan dalam tesis yang berjudul Pemodelan Statistical Downscaling Data GCM Menggunakan

SupportVectorRegression untuk Memprediksi Curah Hujan Bulanan Indramayu, merupakan gagasan atau hasil penelitian tesis saya sendiri dengan arahan dari komisi pembimbing, kecuali yang dengan jelas ditunjukkan oleh sumbernya. Tesis ini belum pernah diajukan untuk memperoleh gelar pada program sejenis di Perguruan Tinggi lain. Semua data dan informasi yang digunakan telah dinyatakan secara jelas dan dapat diperiksa kebenarannya.

Bogor, Desember 2011

Muhammad Asyhar Agmalaro

(3)

using Support Vector Regression to Predict Monthly Rainfall in Indramayu. Under direction of AGUS BUONO, and MUSHTHOFA.

The knowledge about weather and climate pattern, especially rainfall is required by many sectors such as, agricultural, plantation, transportation, and so on. Recently, the model that is used to observe the impact and to predict the climate change is the global circulation model (GCM). However, the current GCM-resolution data is too low and it is difficult to predict the local climate pattern that requires high resolution. However, it is possible to obtain regional-scale information if it is combined with statistical downscaling (SD) methods. The main objective of this research is to develop SD models by using support vector regression (SVR) in forecasting monthly rainfall in Indramayu, in order to get the accurate climate information based on GCM data. The results of this research showed that overall, the model is good enough to predict rainfall with normal conditions. But for extreme circumstances, although the prediction model was able to follow the pattern of the observational data, but the value of the resulting predictions have not managed to predict accuratelly the actual observed values. Variations of the evaluation of estimated results by the model for 13 rain stations in Indramayu district showed that the location of rain stations in certain areas can influence and determine the accuracy of the monthly rainfall forecast. Rain observations points located farther from the sea tend to have better estimation results than the observation points located close to the sea.

Keywords: statistical downscaling (SD), general circulation model (GCM), support vector regression (SVR)

(4)

MUHAMMAD ASYHAR AGMALARO. Pemodelan Statistical Downscaling

Data GCM Menggunakan Support Vector Regression untuk Memprediksi Curah Hujan Bulanan Indramayu. Dibimbing oleh AGUS BUONO dan MUSHTHOFA.

Iklim merupakan gejala alamiah yang sangat penting dan berpengaruh bagi kehidupan manusia. Pengetahuan tentang pola cuaca dan iklim terutama curah hujan, sangat dibutuhkan di banyak sektor seperti pertanian, perkebunan, transportasi, dan lain-lain. Untuk mengetahui dan memahami sistem iklim sehingga dapat digunakan dalam memprediksi jumlah curah hujan bulanan di suatu daerah, diperlukan suatu model/alat yang dapat menyimulasikan iklim. Sampai saat ini, model/alat yang digunakan dalam kajian utama untuk mempelajari dampak dan menduga perubahan iklim adalah global circulation model (GCM). Akan tetapi resolusi dari data luaran GCM yang dianggap terlalu rendah menyulitkan dalam melakukan prediksi dengan mempelajari pola iklim regional/lokal yang membutuhkan resolusi yang tinggi. Namun GCM masih mungkin digunakan untuk memperoleh informasi skala regional hingga lokal bila dipadukan dengan teknik statistical downscaling (SD).

Usaha pelaksanaan pengelolaan dampak dan resiko iklim menggunakan SD sudah banyak dilakukan dan coba diterapkan dengan tujuan mengembangkan model yang dapat memberikan berbagai informasi tentang iklim yang memadai dan berguna untuk perencanaan kedepan. Oleh karena itu, studi kali ini akan mencoba menekankan pada pentingnya upaya pembelajaran dan pemahaman sistem iklim melalui pengembangan model SD menggunakan suport vector regression (SVR) dalam melakukan peramalan curah hujan bulanan sehingga dapat dijadikan sebagai alat pendukung dalam proses penyebaran informasi iklim yang efektif, efisien, dan tepat guna.

Tujuan utama dari penelitian ini adalah mengembangkan model SD menggunakan SVR untuk peramalan curah hujan bulanan (studi kasus Indramayu) agar dapat menghasilkan informasi iklim yang akurat dan dapat dijadikan sebagai dasar pembuat keputusan. Manfaat dari hasil penelitian ini dihasilkan suatu model SD yang memberikan informasi iklim akurat berdasarkan dari data luaran GCM

(5)

curah hujan yang digunakan berasal dari stasiun hujan yang berada di daerah Indramayu (13 stasiun) dari tahun 1979 – 2002 serta data General Circulation Model (GCM) yang digunakan adalah sebanyak 6 model (1901 – 2000).

Secara keseluruhan model yang dihasilkan menggunakan SVR cukup bagus untuk memprediksi curah hujan dengan kondisi normal, tetapi untuk keadaan ekstrim, walaupun model prediksi sudah dapat mengikuti pola dari data pengamatan namun nilai prediksi yang dihasilkan belum berhasil menjangkau dan mendekati nilai pengamatan yang sesungguhnya. Salah satu penyebabnya diduga karena ketidaksempurnaan luaran GCM dalam menyimulasikan peubah penjelas khususnya untuk wilayah tropis (Cavazos dan Hewitson 2005).

Variasi dari evaluasi hasil estimasi oleh model terhadap 13 stasiun hujan di Kabupaten Indramayu memperlihatkan bahwa lokasi stasiun hujan di wilayah tertentu mempengaruhi dan menentukan ketepatan hasil ramalan curah hujan bulanan. Titik Observasi Hujan dengan lokasi berada agak jauh dari laut cenderung memiliki hasil estimasi lebih baik daripada titik observasi yang berada dekat dengan garis pantai/laut. Untuk stasiun hujan yang lokasinya berdekatan dengan laut, akan mengurangi pengaruh dari topografi (lokal) sehingga mempengaruhi luaran GCM yang digunakan dalam melakukan proses

downscaling. Dengan kata lain, akan timbul kesulitan bagi luaran GCM dalam menyimulasikan dengan baik peubah penjelas untuk menghasilkan pemodelan

downscaling yang handal dan memiliki ketepatan prediksi yang baik. Sementara untuk stasiun hujan yang lokasinya agak berjauhan dengan laut, topografi (lokal) tidak terlalu terpengaruh oleh adanya interaksi iklim yang kompleks antara daratan, lautan dan atmosfir sehingga cenderung lebih baik hasil dugaan modelnya. Hasil ini mendukung penelitian Watterhall (2002) yang menyimpulkan bahwa lokasi stasiun hujan mempengaruhi luaran GCM dalam melakukan proses

(6)

© Hak Cipta Milik IPB, Tahun 2011 Hak Cipta dilindungi Undang-undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah

b. Pengutipan tidak merugikan kepentingan yang wajar IPB

2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin IPB

(7)

MEMPREDIKSI CURAH HUJAN BULANAN INDRAMAYU

MUHAMMAD ASYHAR AGMALARO

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Ilmu Komputer pada

Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2011

(8)
(9)

Indramayu

Nama : Muhammad Asyhar Agmalaro NIM : G651090241

Disetujui Komisi Pembimbing

Dr. Ir. Agus Buono, M.Si, M,Kom Mushthofa, S.Kom, M.Sc

Ketua Anggota

Diketahui,

Ketua Program Studi Dekan Sekolah Pascasarjana Ilmu Komputer

Dr. Ir. Agus Buono, M.Si, M.Kom Dr. Ir. Dahrul Syah, M.Sc.Agr

Tanggal Ujian : Tanggal Lulus : 19 Desember 2011

(10)

Puji syukur kehadirat Allah SWT, atas berkat rahmat dan hidayah-Nya penulis dapat menyelesaikan penelitian dan penulisan tesis sebagai syarat dalam menyelesaikan perkuliahan di Magister Ilmu Komputer, Institut Pertanian Bogor. Tidak lupa shalawat serta salam semoga senantiasa di berikan kepada Nabi Muhammad, SAW, keluarganya, dan umatnya sampai akhir zaman.

Penulis melakukan penelitian tentang pengembangan model statistical downscaling (SD)menggunakan support vectormachine (SVR) untuk peramalan curah hujan bulanan dengan studi kasus meliputi wilayah observasi disekitar stasiun hujan yang terdapat di Kabupaten Indramayu. Untuk data GCM yang digunakan dalam penelitin ini terdiri atas 6 model dan untuk data observasi digunakan 13 titik koordinat stasiun curah hujan di Indramayu. Dengan menerapkan metode SVR dalam peramalan curah hujan di Kabupaten Indramayu, diharapkan dapat dijadikan sebagai dasar pembuat keputusan contohnya di bidang pertanian dalam pemilihan varietas tanaman dan pola tanam yang cocok sesuai dengan informasi iklim yang tersedia.

Penulis mengucapkan terima kasih atas bantuan dan dukungan dari semua pihak yang mendukung baik secara langsung maupun tidak langsung dalam pelaksanaan kuliah maupun penelitian yang telah dilaksanakan. Cinta dan rasa syukur yang sedalam-dalamnya penulis curahkan untuk:

1. Ayahanda Ahmadi Agusni dan Ibunda Jumarsnimi, atas nasihat, doa, cinta, kasih sayang, semangat, motivasi dan dukungan materil maupun non materil selama penulis menjalani pendidikan dan dapat menyelesaikan kuliah di Pasca Sarjana Intitut Pertanian Bogor,

2. Kakakku Andini Safitri, Kakak ipar Rinaldi Marza Putra dan keponakanku tercinta zahra yang selalu menjadi sumber semangat bagi penulis untuk menyelesaikan tesis ini,

3. Bapak Dr. Ir. Agus Buono, M.Si, M.Kom dan Bapak Mushthofa, S.Kom, M.Sc atas kesabarannya dalam membimbing penulis dan saran serta

(11)

4. Cagia R.A. Wulantari, S.Ikom, M.Si, yang selalu memberi dukungan, semangat, motivasi, dan kasih sayangnya selama penulis menempuh pendidikan di Institut Pertanian Bogor,

5. Sahabat-sahabatku Sigit Susilo, Warid, Dena, Elvie, Puput, yang selalu setia memberi dukungan dan semangat dalam menjalani masa-masa kuliah,

6. Rekan-rekan seperjuangan angkatan XI S2 Ilmu Komputer IPB (alm Pak Oke Hendradly, Pak Mukhlis, Pak Tahir, Mas Mawan, Pak Rico, Pak Iyan, Pak Boy, Pak Azhari, Mas Kamal, Mas Deba Supriyanto, M Rafi Muttaqin, Aries M, Pak Yusuf, Bu Zuriati, Bu Dewi, Bu Sinta, Bu Retno, Bu Ari Q), atas kebersamaan dan bantuannya selama kulian dan penelitian di MKOM IPB, khususnya Rafi yang selalu membantu penulis dalam menyelesaikan tesis ini.

Penulis menyadari bahwa dalam penulisan tesis ini masih banyak kekurangan. Kritik, saran dan masukan dalam penelitian ini sangat penulis harapkan, demi sempurnanya tesis ini di kemudian hari.

Bogor, Desember 2011

(12)

Penulis (Muhammad Asyhar Agmalaro) dilahirkan di Jambi, 31 Maret 1986 sebagai anak kedua dari dua bersaudara pasangan Ahmadi Agusni dan Jumarsnimi. Penulis mengenyam pendidikan sekolah dasar di SDN 92 Jambi (1992-1998). Kemudian, penulis melanjutkan pendidikan menengahnya ke SMP Negeri 7 Jambi (1998 – 2001), lalu SMA Negeri 1 Jambi (2001-2004). Setelah lulus SMU pada tahun 2004, penulis berkesempatan melanjutkan studi di IPB melalui jalur USMI (Undangan Seleksi Masuk IPB) di Departemen Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam dan lulus pada tahun 2008. Penulis berkesempatan melanjutkan ke jenjang pascsarjana (S2) Ilmu Komputer (ILKOM), Institut Pertanian Bogor pada tahun 2009. Penulis melaksanakan penelitian dengan judul “Pemodelan Statistical Downscaling Data GCM menggunakan Support Vector Regression untuk Memprediksi Curah Hujan Bulanan Indramayu” untuk penyusunan tesis sebagai tugas akhir guna memperoleh gelar Magister Ilmu Komputer.

(13)

DAFTAR ISI

Halaman

DAFTAR ISI ... i

DAFTAR GAMBAR ... iii

DAFTAR TABEL ... v DAFTAR LAMPIRAN ... vi BAB I PENDAHULUAN ... 1 1.1 Latar Belakang ... 1 1.2 Tujuan ... 3 1.3 Ruang Lingkup ... 4

1.4 Hasil dan Manfaat ... 4

BAB II TINJAUAN PUSTAKA ... 5

2.1 Model Sirkulasi Umum ... 5

2.2 Statistical Downscaling ... 6

2.3 Principal Component Analysis (PCA) ... 8

2.4 Support Vector Regression (SVR) ... 9

2.5 K-fold Cross Validation ... 14

2.6 Grid Search ... 15

BAB III DATA DAN METODOLOGI ... 17

3.1 Data ... 17

3.1.1 Data Luaran GCM (Peubah Penjelas) ... 17

3.1.2 Data Curah Hujan (Peubah Respon) ... 18

3.2 Tahapan Penelitian ... 19

3.3 Lingkup Pengembangan Model ... 24

BAB IV HASIL DAN PEMBAHASAN ... 25

4.1 Pemodelan Downscaling untuk Pendugaan Curah Hujan ... 25

4.2 Kinerja Model Berdasarkan Luaran GCM ... 27

4.3 Kinerja Model Berdasarkan Fungsi Kernel SVR ... 31

4.4 Pengaruh Parameter Fungsi Kernel Terhadap Performance Model ... 35

(14)

BAB V KESIMPULAN DAN SARAN... 43

5.1 Kesimpulan ... 43

5.2 Saran ... 44

DAFTAR PUSTAKA ... 45

(15)

DAFTAR GAMBAR

Halaman

1 Visualisasi Layering pada GCM (Sumber : IPPC, 2011) ... 5

2 Ilustrasi proses downscaling, (Sumber : Sutikno 2008) ... 7

3 Fungsi regresi pada SVR (Sumber : Smola dan Schölkopf 2003)... 10

4 Penambahan variable slack pada SVR (Sumber : Smola dan ... 12

5 Ilustrasi proses SVR (Sumber : Smola dan Schölkopf 2003) ... 13

6 Ilustrasi pembagian kelompok data latih dan uji pada k-cross ... 14

7 Grid dengan = 4 ... 15

8 Ilustrasi metode grid search. ... 16

9 Contoh Data Luaran GCM. ... 18

10 Tahapan proses penelitian ... 19

11 Ilustrasi proses cropping luasan grid data GCM. ... 20

12 Struktur SVR. ... 23

13 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM (fungsi RBF kernel) ... 25

14 Perbandingan antara pola observasi dan prediksi curah hujan untuk seluruh luaran GCM (rataan, minimum, dan maksimum). ... 26

15a Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan observasi (curah hujan dalam mm) ... 29

16 Nilai rataan NRMSE, MAEP validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM ... 32

17 Nilai rataan korelasi validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM ... 32

Gambar 18 Grafik scater untuk plot hasil observasi dengan estimasi masing masing fungsi kernel ... 34

Gambar 19 Hasil korelasi antara data estimasi dan pengamatan curah hujan bulanan Kabupaten Indramayu (fungsi kernel: RBF) ... 38

Gambar 20 Hasil NRMSE, dan MAEP antara data estimasi dan pengamatan curah hujan bulanan Kabupaten Indramayu (fungsi kernel: RBF) ... 39

Gambar 21 Plot hasil estimasi dan pengamatan stasiun hujan Bondan ... 40

(16)

Gambar 23 Lokasi Stasiun Hujan di Kabupaten Indramayu (Sumber: diolah dari Buono 2010, dan sutikno 2008) ... 41

(17)

DAFTAR TABEL

Halaman

1 Kategori teknik downscaling (Sumber : Sutikno 2008) ... 8

2 Data Observasi curah hujan di Kota Indramayu ... 18

3 Matriks data GCM mengikuti data observasi ... 21

4 PCA Matriks data GCM ... 21

5 Nilai RMSE, korelasi validasi model menurut menurut Fungsi kernel dan rataan masing-masing model pada GCM ... 27

6 Ukuran statistik fungsi kernel dengan perlakuan tanpa optimasi dan menggunakan optimasi parameter (menggunakan luaran GCM giss-er di 13 stasiun pos hujan) ... 36

(18)

DAFTAR LAMPIRAN

1 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM ... 48 2 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM

... 49 3 Plot perbandingan hasil estimasi dan pengamatan perstasiun hujan di Indramayu ... 50

(19)

BAB I PENDAHULUAN

1.1 Latar Belakang

Iklim merupakan gejala alamiah yang sangat penting dan berpengaruh bagi kehidupan manusia. Pengetahuan tentang pola cuaca dan iklim terutama curah hujan, sangat dibutuhkan di banyak sektor seperti pertanian, perkebunan, transportasi, dan lain-lain. Pada sektor pertanian dan perkebunan, informasi yang dapat meramalkan mengenai besar kecilnya jumlah curah hujan bulanan di setiap daerah, akan sangat berguna untuk dapat menentukan pola tanam dan varietas tanaman yang tepat agar menghasilkan produksi yang baik. Hal ini dikarenakan curah hujan berpengaruh langsung terhadap ketersediaan air. Kurangnya ketersedian air akan berdampak kekeringan, dan sebaliknya apabila kelebihan air akan membanjiri lahan pertanian (Bruinsma, 2003). Indonesia sebagai negara agraris dengan sektor pertanian dan perkebunan yang menjadi penyokong utama kehidupan dan ekonomi rakyat akan terkena dampak paling serius akibat terjadinya kekeringan dan banjir yang disebabkan kurangnya informasi mengenai jumlah curah hujan. Oleh karena itu dibutuhkan suatu ramalan informasi yang akurat, cepat dan bersifat spesifik lokasi untuk memprediksi curah hujan di masa yang akan datang agar dapat meminimalisir dampak kerugian yang terjadi.

Untuk mengetahui dan memahami sistem iklim sehingga dapat digunakan dalam memprediksi jumlah curah hujan bulanan di suatu daerah, diperlukan suatu model/alat yang dapat menyimulasikan iklim, memprediksi perubahan-perubahan iklim masa lampau, sekarang, dan membuat skenario perubahan iklim masa yang akan datang. Sampai saat ini, model/alat yang digunakan dalam kajian utama untuk mempelajari dampak dan menduga perubahan iklim adalah global circulation model (GCM). Secara umum, GCM diartikan sebagai penggambaran matematis dari sejumlah besar interaksi fisika, kimia, dan dinamika atmosfer bumi dan menghasilkan data dalam jumlah sangat besar yang dapat digunakan untuk membuat prakiraan iklim (Wigena, 2006). Akan tetapi beberapa pemerhati dan peneliti meteorologi beranggapan GCM belum cukup baik untuk mendapatkan informasi iklim secara detail sehingga dapat digunakan dalam melakukan prakiraan iklim dan memprediksi curah hujan

(20)

dengan sangat tepat dan akurat terutama di kawasan tropis. Seperti daerah-daerah di Indonesia yang termasuk kasawan tropis, proses pembentukan hujan dipengaruhi oleh topografi dan interaksi antara laut, darat dan atmosfir yang kompleks menyebabkan keragaman sifat hujan bulanan di setiap daerah sehingga menimbulkan kesulitan membuat simulasi untuk prediksi curah hujan (Storch dan Zwiers, 1999). Resolusi dari data luaran GCM yang dianggap terlalu rendah juga menyulitkan dalam melakukan prediksi dengan mempelajari pola iklim regional/lokal yang membutuhkan resolusi yang tinggi. Akan tetapi GCM masih mungkin digunakan untuk memperoleh informasi skala regional hingga lokal bila dipadukan dengan teknik statistical downscaling (SD).

Penggunaan teknik SD pada luaran GCM, telah banyak dilakukan dengan maksud mendapatkan suatu model iklim dengan melakukan transformasi data dari suatu grid luaran GCM menjadi data pada grid-grid dengan unit skala yang lebih kecil untuk yang menghasilkan informasi secara lebih detail dari berbagai unsur iklim dengan resolusi yang cukup tinggi, baik dari segi skala spasial maupun temporal (Wilby et al., 1998). Pendekatan ini menciptakan korelasi antara skala global/lokal, berdasarkan hubungan fungsional kedua skala tersebut. Hubungan antara skala global dengan variabel yang mewakili proses sirkulasi atmosfir (seperti data tekanan permukaan laut, dan kelembaban relatif) dengan skala lokal (seperti data curah hujan), digunakan untuk melakukan simulasi model iklim bersifat statik dimana dalam periode dan jangka waktu tertentu data pada grid luaran GCM yang berskala besar dipakai sebagai dasar untuk menentukan/memprediksi data pada grid berskala lebih kecil.

Kebutuhan Informasi mengenai pola iklim terutama curah hujan yang berdampak langsung di bidang pertanian harus ditanggapi dan pikirkan dengan penuh perencanaan. Dalam hal ini, sinergi dalam penyediaan informasi iklim yang efektif dan tepat guna sangat perlu untuk terus dievaluasi dan dikembangkan. Apalagi ditambah dengan adanya kondisi perubahan iklim yang mungkin memberikan dampak yang lebih terhadap kegiatan pertanian. Oleh karena itu, perencanaan yang menyeluruh baik jangka pendek maupun jangka panjang sangat diperlukan. Hal ini merupakan tantangan yang cukup besar terutama dalam

(21)

konteks pengembangan model yang dapat melakukan prediksi curah hujan sebagai salah satu upaya dalam pengelolaan dampak resiko iklim (Fowler et al., 2007).

Usaha pelaksanaan pengelolaan dampak dan resiko iklim menggunakan SD sudah banyak dilakukan dan coba diterapkan. Penelitian terdahulu, Wigena (2004), mengembangkan model SD menggunakan regression projection pursuit

(RPP) dalam melakukan peramalan curah hujan di Indramayu dengan salah satu kajian analisisnya adalah menentukan domain yang baik pada luaran GCM. Hasil penelitian menunjukkan domain dengan grid 5x5, cukup baik untuk digunakan pada proses downscaling. Selanjutnya Cavazos dan Hewitson (2004) melakukan penelitian untuk melihat performance luaran GCM NCEP-NCAR dengan mencari kombinasi peubah penjelas potensial dalam menduga curah hujan menggunakan jaringan saraf buatan (JST). Hasil penelitian menyimpulkan bahwa satu peubah penjelas GCM yaitu presipitasi sudah cukup baik untuk memperoleh informasi curah hujan saat melakukan proses downscaling. Kemudian masih banyak penelitian lainnya mengenai SD yang bertujuan mengembangkan model yang dapat memberikan berbagai informasi tentang iklim yang memadai dan berguna untuk perencanaan kedepan. Oleh karena itu, studi kali ini akan mencoba menekankan pada pentingnya upaya pembelajaran dan pemahaman sistem iklim melalui pengembangan model SD menggunakan suport vector regression (SVR) dalam melakukan peramalan curah hujan bulanan sehingga dapat dijadikan sebagai alat pendukung dalam proses penyebaran informasi iklim yang efektif, efisien, dan tepat guna.

1.2 Tujuan

Tujuan dari penelitian ini adalah mengembangkan model statistical downscaling menggunakan SVR untuk peramalan curah hujan bulanan (studi kasus Indramayu). Oleh karena itu, diharapkan dapat menghasilkan informasi iklim yang akurat dan dapat dijadikan sebagai dasar pembuat keputusan. Salah satu contohnya yaitu di bidang pertanian seperti pemilihan varietas tanaman dan pola tanam yang cocok terkait dengan informasi iklim yang tersedia untuk menghindari kegagalan panen dan menghasilkan porduksi yang baik.

(22)

1.3 Ruang Lingkup

Ruang lingkup dari penelitian ini adalah sebagai berikut:

 Data curah hujan yang digunakan adalah data yang berasal dari titik observasi berdasarkan 13 lokasi koordinat stasiun hujan di Indramayu.

 Data General Circulation Model (GCM) yang digunakan adalah sebanyak 6 model (1901 – 2000).

1.4 Hasil dan Manfaat

Hasil dan manfaat yang diharapkan melalui penelitian ini adalah dihasilkan suatu model stastisticaldownscaling yang memberikan informasi iklim akurat berdasarkan dari data luaran GCM sehingga dapat dijadikan sebagai suatu referensi untuk melakukan pendugaan curah hujan dengan lebih baik.

(23)

BAB II TINJAUAN PUSTAKA 2.1 Model Sirkulasi Umum

Model sirkulasi umum atau general circulation model (GCM) merupakan suatu penggambaran matematis dari sejumlah besar interaksi fisika, kimia, dan dinamika atmosfer bumi (Stroch, 1999). GCM ini menduga perubahan iklim dan disajikan tiga layer, yaitu layer horisontal dengan ukuran 100 hingga 600 km, 10 hingga 20 layer vertikal di atmosfer dan kadangkala 30 layer di samudra, seperti disajikan pada Gambar 1.

Gambar 1 Visualisasi Layering pada GCM (Sumber : IPPC, 2011)

Dengan resolusi yang begitu kasar, maka GCM tidak bisa menangkap fitur penting pada suatu area (region) tertentu yang menjadi fokus kajian dampak perubahan iklim. Namun demikian, GCM ini bisa digunakan untuk mengestimasi kepekaan iklim terhadap kondisi yang berbeda seperti perubahan gas rumah kaca (GRK). Oleh karena itu, model GCM memberikan beberapa keuntungan seperti tertera pada Sutikno, 2008, yaitu : (1) dapat digunakan untuk mengestimasi perubahan iklim global dalam merespon terhadap peningkatan konsentrasi GRK, (2) estimasi peubah iklim (curah hujan, suhu, kelembaban) secara fisik sesuai dengan model-model fisika, (3) estimasi peubah cuaca (angin, radiasi, penutupan awan, kelembaban tanah) yang berikutnya menjadi masukan bagi analisis

(24)

mengenai dampak, (4) mampu mensimulasi keragaman iklim siklus harian. Disamping kelebihan seperti disebutkan di atas, beberapa kelemahannya adalah : (1) resolusi terlalu kasar, sehingga terjadi gap antara hasil simulasi global, regional dan lokal, (2) model tersebut sulit mengkopel dengan model-model sirkulasi lautan, dan (3) proses-proses umpan balik atmosfer-biosfer tidak terpenuhi. Untuk menjembatani gap antara hasil global dengan regional dan lokal, maka diperlukan satu model yang dikenal dengan nama downscaling.

Dalam perkembangannya, model sirkulasi umum dikenal dengan nama model dinamik untuk memprediksi musim dan kondisi ENSO yang disebut model dinamik Coupled AO-GCM. Kedua model yang terpisah ini dipasangkan dan saling mempengaruhi satu sama lain. Saat model atmorfer bergerak dengan waktu, perubahan-perubahan pada angin rendah (dekat permukaan laut) berfungsi sebagai daya yang menggerakkan model lautan. Dengan bergeraknya model lautan dengan waktu, perubahan pada suhu lautan berfungsi sebagai mesin untuk model atmosfer melalui aliran panas dan uap air dari laut ke atmosfer. Luaran dari prakiraan musim disajikan dalam bentuk peluang yang diperoleh dari banyak model yang dikenal dengan ensemble model. Dalam hal ini Coupled AO-GCM dijalankan beberapa kali dengan nilai input awal yang sedikit berbeda.

2.2 Statistical Downscaling

Statistical Downscaling didefinisikan sebagai upaya menghubungkan antara sirkulasi peubah skala global (peubah penjelas) dan peubah skala lokal (peubah respon, Sutikno 2008). Gambar 2 memberikan ilustrasi proses

downscaling.

Pendekatan statistical downscaling (SD) menggunakan data regional (statistic dynamical downscaling) atau global (statistical downscaling) untuk memperoleh hubungan fungsional antara skala lokal dengan skala global GCM, seperti model regresi. Pendekatan SD disusun berdasarkan adanya hubungan antara grid skala besar (prediktor) dengan grid skala lokal (respon) yang dinyatakan dengan model statistik yang dapat digunaan untuk menterjemahkan anomali-anomali skala global yang menjadi anomali dari beberapa peubah iklim lokal. Dalam hal ini SD merupakan suatu fungsi transfer yang menggambarkan

(25)

hubungan fungsional sirkulasi atmosfer global dengan unsur-unsur iklim lokal, yang bentuk umumnya adalah (Storch et al, 1993):

)

(

, , , ,p t q s g t

f

X

Y

(1) Dengan :

Y : Peubah-peubah iklim lokal X : Peubah-peubah luaran GCM t : Periode waktu

p : Banyaknya peubah Y q : Banyaknya peubah X s : Banyaknya lapisan atmosfer g : Banyaknya grid domain GCM

Gambar 2 Ilustrasi proses downscaling, (Sumber : Sutikno 2008)

Pada umumnya model SD melibatkan data deret waktu (t) dan data spasial GCM (g). Banyaknya peubah Y, peubah X, lapisan atmosfer dalam model dan autokorelasi serta kolinearitas pada peubah Y maupun X menunjukkan kompleksitas model.

Saat ini telah banyak dikembangkan model SD yang secara umum dikategorikan menjadi lima, yaitu teknik yang berbasis regresi atau klasifikasi,

(26)

berbasis model linear atau non linear, berbasis parametrik dan non parametrik, berbasis proyeksi dan seleksi, serta teknik berbasis model-driven atau data-driven. Pembedaan mengenai model yang dipergunakan sesuai kategori, disajikan secara detail pada Tabel 1. Suatu model perhitungan SD bisa termasuk ke dalam kombinasi ke lima kategori tersebut, sebagai contoh PCR termasuk kategori metode berbasis regresi, linear, parametrik, proyeksim dan data-driven.

Pengembangan model-model downscaling sangat diperlukan untuk pelaksanaan kegiatan kajian dampak keragaman dan perubahan iklim dan penyusunan strategi atau pembuatan keputusan baik pada tingkat pembuatan keputusan sampai petani.

Tabel 1 Kategori teknik downscaling (Sumber : Sutikno 2008)

2.3 Principal Component Analysis (PCA)

Salah satu tantangan dalam analisis peubah ganda adalah mereduksi dimesi dari himpunan data peubah ganda yang besar. Hal ini sering dilakukan dengan cara mereduksi himpunan peubah tersebut menjadi himpunan peubah yang lebih kecil atau himpunan peubah baru yang banyaknya lebih sedikit. Peubah-peubah baru tersebut merupakan fungsi dari Peubah-peubah asal atau Peubah-peubah asal itu sendiri yang memiliki proporsi informasi yang signifikan mengenai himpunan data tersebut (Dillon & Goldstein 1984).

(27)

PCA dapat mereduksi q peubah pengamatan menjadi k peubah baru yang saling ortogonal yang masing-masing k peubah baru tersebut merupakan kombinasi linear dari q peubah asal. Pemilihan k peubah baru sedemikian hingga keragaman yang dimiliki p peubah lama dapat diterangkan secara optimal oleh k

peubah baru. PCA efektif jika antar q peubah asal memiliki korelasi yang cukup besar (Dillon & Goldstein 1984).

Ada beberapa fungsi dari penggunaan PCA diantaranya adalah (Dillon & Goldstein 1984):

1. Identifikasi peubah baru yang mendasari data peubah ganda, yang bercirikan: merupakan kombinasi linear peubah-peubah asal; jumlah kuadrat koefisien dalam kombinasi linear tersebut adalah satu;tidak berkorelasi;dan mempunyai ragam berurut dari yang terbesar ke yang terkecil.

2. Mengurangi banyaknya dimensi himpunan peubah yang biasanya terdiri atas peubah yang banyak dan saling berkorelasi menjadi peubah-peubah baru yang tidak berkorelasi dengan mempertahankan sebanyak mungkin keragaman dalam himpunan tersebut.

3. Memilih peubah asal yang banyak memberi kontribusi informasi atau menghilangkan peubah asal yang mempunyai kontribusi informasi relatif kecil.

Hasil PCA dapat digunakan untuk analisis lebih lanjut misalkan pengelompokkan (clustering) dan regresi komponen utama.

2.4 Support Vector Regression (SVR)

SVR merupakan penerapan support vector machine (SVM) untuk kasus regresi. Dalam kasus regresi output berupa bilangan riil atau kontinyu. SVR merupakan metode yang dapat mengatasi overfitting, sehingga akan menghasilkan performansi yang bagus (Smola dan Schölkopf, 2003).

Pada Gambar 3, dimisalkan diberikan data training 1 1 2 2

[( ,x y), (x y, ),..., ( ,x yl l)] dengan vektor input xi dan data output yi yang

(28)

SVR ingin menemukan suatu fungsi regresi f(x) yang dapat mengaproksimasi output ke suatu target aktual, dengan eror toleransi-ε, dan kompleksitas yang minimal. Fungsi regresi f(x) dapat dinyatakan dengan formula sebagai berikut (Smola dan Schölkopf, 2003):

( ) T ( )

f xw xb

(2) Dimana φ(x) menunjukkan suatu titik didalam ruang fitur berdimensi lebih tinggi, hasil pemetaan dari input vektor x di dalam ruang input yang berdimensi lebih rendah.

Gambar 3 Fungsi regresi pada SVR (Sumber : Smola dan Schölkopf 2003)

Koefisien w dan b diestimasi dengan cara meminimalkan fungsi resiko (risk function) yang didefinisikan dalam persamaan:

 

2 1 1 1 min , 2 w C i L y f xi i   

(3a) yang memenuhi:

 

i i yw x  b (3b)

 

i i , 1, 2,..., w xy  b i Dimana,

(29)

 

 

 

0

( , )

0,untuk yang lain

i i i i i i y f x y f x L y f x         (3c)

Faktor w2 dinamakan reguralisasi. Meminimalkan w 2 akan membuat suatu fungsi setipis mungkin, sehingga dapat mengontrol kapasitas fungsi.

Empirical error diukur dengan ε-insensitive loss function yang diharuskan meminimalkan norm dari w agar mendapatkan generalisasi yang baik untuk fungsi regresi f(x) (Smola dan Schölkopf, 2003). Oleh karena itu diperlukan untuk menyelesaikan problem optimasi berikut:

2 2 1 min w (4a) yang memenuhi:

 

i i yw x  b (4b)

 

i i , 1, 2,..., w xy  b i

Diasumsikan bahwa ada suatu fungsi f yang dapat mengaproksimasi semua titik

xi,yi

dengan presisi ε. Dalam kasus ini kita asumsikan bahwa semua titik ada dalam rentang f (feasible). Dalam hal ketidaklayakan (infeasible), dimana mungkin ada beberapa titik yang mungkin keluar dari rentang

f , perlu ditambahkan variableslackξ, ξ* untuk mengatasi masalah pembatas

yang tidak layak (infeasible constraint) dalam problem optimasi seperti yang ditunjukkan pada Gambar 4.

(30)

Gambar 4 Penambahan variable slack pada SVR (Sumber : Smola dan Schölkopf 2003)

Selanjutnya problem optimasi di atas bisa diformulasikan sebagai berikut:

2 * 1 1 1 m i n , 2 l i i i w C x x l

(5a) yang memenuhi:

 

 

* * - - - £ , 1, 2, ..., - - £ , 1, 2, ..., , ³0 T i i i i i i i i y w j x b x Î i l wj x y b x Î i l x x    (5b) Konstanta C>0 menentukan tawar menawar (trade off) antara ketipisan fungsi dan batas atas deviasi lebih dari yang masih dapat ditoleransi. Semua deviasi lebih besar daripada ε akan dikenakan pinalti sebesar C. Dalam SVR, ε

setara dengan akurasi dari aproksimasi terhadap data training. Nilai ε yang kecil

terkait dengan nilai yang tinggi pada variable slack i(*) dan akurasi aproksimasi yang tinggi. Sebaliknya, nilai yang besar untuk ε berkaitan dengan nilai i(*) yang kecil dan aproksimasi yang rendah seperti yang diilustrasikan oleh Gambar 5.

(31)

Gambar 5 Ilustrasi proses SVR (Sumber : Smola dan Schölkopf 2003)

Nilai yang tinggi untuk variable slack akan membuat empirical error

mempunyai pengaruh yang besar terhadap faktor regulasi. Dalam SVR, support vector adalah data training yang terletak pada dan diluar batas f dari fungsi keputusan, karena itu jumlah support vector menurun dengan naiknya ε (Smola dan Schölkopf, 2003).

Dalam formulasi dual, problem optimisasi dari SVR adalah sebagai berikut:



* * 1 1 * * 1 1 1 max , 2 i j i i j j i j i i i i i i i K x x y            

 

(6a) yang memenuhi:

*

1 * 0 0 , 1, 2, ..., 0 , 1, 2, ..., i i i i i C i C i         

(6b)

(32)

j i x x

K , adalah dot-product kernel yang didefinisikan sebagai

 

i

 

j T

j

i x x x

x

K ,  . Dengan menggunakan langrange multiplier dan kondisi optimalitas, fungsi regresi secara eksplisit dirumuskan sebagai berikut:

 

*

1 - , i i i i f x K x x b  

 (7) 2.5 K-fold Cross Validation

K-fold cross validation merupakan salah satu variasi dari teknik cross validation. k-fold cross validation dilakukan untuk membagi training set dan test set. Inti validasi tipe ini adalah membagi data secara acak ke dalam k himpunan bagian. k-fold cross validation mengulang k-kali untuk membagi sebuah himpunan contoh secara acak menjadi k subset yang paling bebas, setiap ulangan disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan. Dari k

himpunan bagian tersebut dipilih satu himpunan bagian menjadi data uji dan (k-1) dijadikan data latih. Proses ini dilakukan berulang sebanyak k, dimana setiap k

himpunan bagian yang ada menjadi data uji dan sisanya menjadi data latih. Namun, secara teori tidak ada tolak ukur yang pasti untuk nilai k.

Keuntungan k-fold cross validation dibandingkan dengan variasi cross validation seperti Repeated random sub-sampling validation adalah semua data digunakan baik untuk data uji maupun data latih. Ilustrasi proses validasi dapat dilihat pada Gambar 6.

Gambar 6 Ilustrasi pembagian kelompok data latih dan uji pada k-cross validation (k=6).

(33)

2.6 Grid Search

Metode Gridsearch merupakan salah satu metode yang sederhana untuk mengatasi masalah pengoptimuman (Rao, 2009). Metode ini melibatkan penyusunan grid yang cocok dalam suatu ruang dimensi, mengevaluasi fungsi objektif dari seluruh titik grid, dan menemukan titik grid yang sesuai dengan fungsi objektif yang memiliki nilai optimum. Jika batas atas dan batas bawah dari variable ke- diketahui masing-masing sebagai dan , dapat dibagi range ( , ) ke dalam -1 bagian yang sama, sehingga ( ), ( ), … , ( )menunjukkan titik-titik grid sumbu ( = 1,2,3, … , ).

Gambar 7 Grid dengan = 4

Hal ini menunjukkan kepada total dari , , … , titik grid dalam dimensi ruang. Sebuah grid dengan = 4 ditunjukkan dalam 2 dimensi ruang seperti pada Gambar 7.

Sebagai contoh, akan dicari nilai optimum suatu model/fungsi dengan mencari kombinasi parameter-parameter yang memberikan atau dapat mengaprokmasi nilai terbaik (misalnya memiliki eror yang paling kecil). Ilustrasi metode grid search terlihat pada Gambar 8.

(34)

Gambar 8 Ilustrasi metode grid search.

Metode grid search memiliki cara kerja yang hampir serupa dengan percobaan secara manual menggunakan teknik trial dan eror. Mencoba kombinasi parameter satu persatu dan membandingkan nilai terbaik yang diberikan oleh parameter tersebut. Namun perbedaan metode grid search terletak pada proses perbandingan nilai yang tidak dilakukan di awal saat terpilihnya pasangan kombinasi parameter. Pasangan kombinasi dari parameter terlebih dahulu disimpan dalam grid-grid. Selanjutnya perbandingan nilai eror terkecil dilihat dari baris dan kolom pada grid tersebut. Baris ke-i dan kolom ke-j yang memiliki nilai terbaik merupakan kombinasi parameter ke-i dan parameter ke-j terpilih.

(35)

BAB III DATA DAN METODOLOGI 3.1 Data

Pada penelitian ini, ada dua jenis data yang akan digunakan. Jenis data pertama adalah data curah hujan bulanan dan yang kedua adalah data luaran GCM.

3.1.1 Data Luaran GCM (Peubah Penjelas)

Data GCM yang digunakan dalam penelitian ini terdiri dari 6 luaran:  Pacific_20c3m_cgcm3.1_t47 (t-47)

Peubah luaran: presipitasi, subset: koordinat 25 titik bujur x 18 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).

 Pacific_20c3m_cgcm3.1_t63 (t-63)

Peubah luaran presipitasi, subset: koordinat 33 titik bujur x 22 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).

 Pacific_20c3m_giss_model_er (giss-er)

Peubah luaran presipitasi, subset: koordinat 18 titik bujur x 16 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).

 Pacific_20c3m_gissaom (giss-aom)

Peubah luaran presipitasi, subset: koordinat 23 titik bujur x 20 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).

 Pacific_20c3m_miub_echo_g (miub-g)

Peubah luaran presipitasi, subset: koordinat 25 titik bujur x 18 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).

 Pacific_20c3m_mri_cgcm2_3_2a(mri-32a)

Peubah luaran presipitasi, subset: koordinat 33 titik bujur x 22 titik lintang, waktu: 1200 bulan (Jan 1901- Des 2000).

Data luaran GCM memiliki peubah luaran salah satu contohnya adalah presipitasi yang merupakan nilai-nilai hasil pengambaran matematis dari sejumlah besar interaksi fisika, kimia, dan dinamika atmosfer bumi. Nilai-nilai tersebut perlu dikalibrasi untuk menduga dan mengestimasi peubah-peubah iklim dan

(36)

cuaca seperti curah hujan, suhu, kelembapan, penutupan awan, radiasi, dan lain-lain. Contoh dari luaran GCM dapat dilihat pada Gambar 9

Gambar 9 Contoh Data Luaran GCM.

3.1.2 Data Curah Hujan (Peubah Respon)

Data Curah hujan yang digunakan untuk penelitian ini adalah dari data titik-titik observasi di kota Indramayu dari Januari 1979 sampai Desember 2000 Contoh data dapat dilihat pada Tabel 2.

Tabel 2 Data Observasi curah hujan di Kota Indramayu

NamaSta Cidempet Cikedung Indramayu Jatibarang Sudikampiran Kedokan bunder

Jan-89 125 167 150 202 112 109 Feb-89 491 430 556 480 389 345 Mar-89 337 304 357 191 278 273 Apr-89 92 348 40 99 156 40 May-89 159 215 128 89 153 105 Jun-89 117 173 139 86 122 232

Terdapat 13 titik observasi curah hujan yang diamati tersebar di Kabupaten Indramayu, dengan lokasinya sebagian berada dekat dengan garis pantai/ laut dan sebagian lagi jauh dari laut. Secara umum lokasi yang menjadi titik observasi curah hujan memiliki topografi berupa dataran atau daerah landai dengan kemiringan tanahnya rata-rata 0 – 2 %. Bila curah hujan cukup tinggi, maka di daerah-daerah tertentu yang tidak mempunyai drainase yang baik akan menyebabkan terjadinya genangan air.

(37)

3.2 Tahapan Penelitian

Tahapan penelitian ini terangkum secara lengkap pada gambar Gambar 10.

(38)

Tahap awal yang dilakukan pada penelitian ini adalah dimulai dari pemahaman terhadap permasalahan yang akan diselesaikan. Mengacu pada tujuan, penelitian ini mencoba untuk mengembangkan model SVR yang dapat memprediksi curah hujan bulanan di wilayah Kabupaten Indramayu. Untuk mendapatkan gambaran menyeluruh tentang domain penelitian yang akan dilaksanakan, diperlukan studi literatur sehingga dapat mengukur dan melihat seberapa berbeda dan pentingnya penelitian yang akan dilakukan.

Setelah memahami masalah, maka tahap yang dilakukan selanjutnya adalah pengumpulan data. Secara keseluruhan data observasi terdiri dari 22 periode (tahun 1979 – 2000). Dengan demikian data GCM yang digunakan hanya dari tahun 1979 – 2000.

Berdasarkan titik observasi hujan dilihat koordinatnya, kemudian berdasarkan titik koordinat tersebut akan digunakan untuk menentukan grid dari data luaran GCM dengan luasan grid berupa matriks 5x5. Titik koordinat observasi berada ditengah-tengah luasan grid GCM yang akan diambil. Sebagai contoh, stasiun hujan memiliki titik koordinat 112 bujur timur dan 6 derajat lintang selatan. Luasan grid yang di-cropp pada gcm merupakan grid matriks 5x5 dengan pusatnya merupakan lokasi stasiun hujan. Ilustrasi proses pengambilan data GCM dengan grid 5x5 dapat dilihat pada Gambar 11.

(39)

Dikarenakan data observasi memiliki periode 22 tahun, maka proses

cropping yang dilakukan mengikuti observasi sebanyak 12x22 tahun. Luasan grid yang diperoleh dari prosis cropping keseluruhan luaran GCM adalah sebanyak 264 dari bulan Januari 1979 sampai dengan Desember 2000, sehingga jumlah keseluruhan untuk data masukan menjadi 264 (22x12) data dengan atribut sebanyak 25 (5x5) buah. Kemudian diperoleh matriks baru berdasarkan titik observasi dan luasan grid GCM seperti yang diperlihatkan oleh Tabel 3, dengan nilai adalah jumlah cropping luasan GCM dan menunjukkan grids matriks. Tabel 3 Matriks data GCM mengikuti data observasi

Stasiun Observasi Data GCM ××× … … … … .. ×

Kemudian, untuk mengurangi masalah ukuran pada data luaran GCM yang berdimensi besar, maka dilakukan reduksi dimensi spasial dari matriks data GCM dengan menggunakan PCA. Ilustrasi pereduksian dimensi dari data matriks GCM terlihat pada Tabel 4.

Tabel 4 PCA Matriks data GCM Stasiun

Observasi PCA Data GCM

… … …

… … … …

(40)

Proses analisis komponen utama/PCA adalah suatu analisis peubah ganda yang bertujuan untuk mereduksi dimensi data tanpa harus kehilangan informasi secara berarti. Pada penelitian ini proses reduksi dilakukan dengan mengambil lebih dari satu komponen utama (principal component), dengan keragaman ≥

97%. Proses reduksi menghasilkan atribut kolom data matriks baru yang berasal dari komponen utama PCA sebesar m, dengan kearagaman/principle component score lebih besar dari 97%. Dapat dikatakan bahwa hasil reduksi dimensi menggunakan PCA menghasilkan variabel baru sebanyak m yang merepresentasikan informasi dengan tingkat kepercayaan sebesar 97% dari data matriks sebelumnya dengan atribut kolom berupa vektor berukuran nxn, dimana m

jauh lebih kecil dari pada nxn (m<<nxn).

Dalam penelitian ini pemodelan membagi bulan didasarkan pada musim, yaitu bulan pada musim hujan dengan rataan curah hujuan yang tinggi terjadi pada bulan Desember-Januari-Februari (DJF), bulan pada musim kemarau dengan rataan curah hujan yang sedikit terjadi pada bulan Juni-Juli-Agustus(JJA) dan bulan pada masa pancaroba yang merupakan peralihan musim hujan ke kemarau terjadi pada bulan Maret-April-Mei (MAM) serta peralihan musim kemarau ke musim hujan terjadi pada bulan September-Oktober-November(SON). Sehingga PCA data matriks GCM terbagi menjadi 4 bagian menjadi DJF, GCM-MAM, GCM-JJA, dan GCM-SON yang masing-masing berjumlah 66 baris.

Langkah selanjutnya yaitu menyusun model SVR berdasarkan data GCM dan observasi. Pada model SVR, data GCM akan berperan sebagai masukan, dan data observasi berperan sebagai targetnya. Namun, sebelum dilakukan penyusunan model, terlebih dahulu harus dilakukan pembagian data menjadi data latih dan data uji menggunakan teknik -fold cross validation. Berdasarkan teknik

k-fold cross validation, seluruh data baik GCM maupun observasi dibagi menjadi

k subset, yaitu S1, S2,…, Sk. Pada penelitian ini ditentukan nilai k sebesar 5. Masing-masing subset memiliki ukuran yang sama. Pembagian data dilakukan secara acakdengan mempertahankan perbandingan jumlahbaris data setiap kelas. Pada proses pertama S2,…, S5 dijadikan data pelatihan dan S1 sebagai data uji, pada proses kedua S1,S3,…, S5 sebagai datapelatihan dan S2 sebagai data uji, dan seterusnyasebanyak 5 kali pengulangan.

(41)

Setelah dilakukan pembagian data maka penyusunan model SVR dapat dilakukan. Ilustrasi arsitektur dari model SVR, diperlihatkan pada Gambar 12.

Gambar 12 Struktur SVR.

Pada tahap pelatihan data yang digunakan adalah data latih sebagai masukan untuk pelatihan menggunakan metode SVR dengan masing-masing fungsi kernel-nya adalah linear kernel, polynomial kernel, dan radial basis function (RBF) kernel menghasilkan keluaran berupa model SVR. Dari fungsi

kernel yang digunakan, sebelumnya diharuskan untuk menentukan nilai parameter

C untuk fungsi linear kernel, nilai parameter C, γ, r, dan d untuk fungsi

polynomial kernel, dan parameter C dan γ untuk fungsi RBF kernel. Penentuan parameter fungsi kernel berpengaruh pada model SVR yang dihasilkan. Semakin optimal parameternya, maka semakin baik model yang dihasilkan. Dalam penelitian ini untuk mendapatkan parameter fungsi kernel yang optimum dilakukan dengan menggunakan metode grid search didapatkan model SVR dengan parameter yang optimal.

Pada tahap pengujian, data uji digunakan sebagai masukan bagi model SVR untuk mendapatkan keluaran/ouput berupa nilai estimasi atau nilai prediksi. Proses pelatihan dan pengujian dilakukan untuk setiap data GCM (DJF, MAM,

(42)

JJA, SON) dan berlangsung selama 5-fold cross validation sehingga menghasilkan nilai estimasi untuk keseluruhan data dengan rentang tahun periode 1979-200. Selanjutnya dilakukan proses evaluasi dan divalidasi dengan cara membandingkan nilai estimasi yang diperoleh dengan nilai dari pengamatan sesungguhnya untuk menguji kehandalan model dalam melakukan pendugaan curah hujan bulanan di wilayah Kabupaten Indramayu. Tahap terakhir dari penelitian yaitu melakukan dokumentasi dan pelaporan akhir hasil evaluasi yang menandakan penelitian yang dilakukan telah selesai.

3.3 Lingkup Pengembangan Model

Spesifikasi perangkat keras dan perangkat lunak komputer yang digunakan dalam penelitian ini sebagai berikut :

 Perangkat keras: processor Intel Core 2 duo 3.20 GHz, memori 2 GB, dan

harddisk 250 GB.

 Perangkat lunak: Windows 7 Ultimate, Matlab 7.7.1, Visual Studio 2008, Notepad++, Microsoft Excel 2007, library svm (LIBSVM 3.0).

(43)

BAB IV HASIL DAN PEMBAHASAN 4.1 Pemodelan Downscaling untuk Pendugaan Curah Hujan

Pemodelan downscaling luaran GCM menggunakan SVR yang dihasilkan, diterapkan untuk menduga curah hujan pada masing-masing 13 pos stasiun hujan di Kabupaten Indramayu selama 22 tahun (1979-2000) dengan menggunakan teknik 5-foldcros validation. Model pendugaan pada setiap luaran GCM dan 13 stasiun hujan yang diujicobakan, menghasilkan kecendrungan estimasi yang cukup baik bila dilihat dari hasil plot antara nilai prediksi yang dirata-ratakan, mengikuti rata-rata hasil pengamatan stasiun hujan (Gambar 13).

Gambar 13 Plot hasil estimasi dan observasi curah hujan bulanan berdasarkan luaran GCM (fungsi RBF kernel)

Gambar 13 merupakan plot hasil estimasi model SVR dengan fungsi RBF kernel yang diujicobakan terhadap enam luaran GCM (gambar untuk plot hasil estimasi dan observasi menggunakan fungsi linear kernel dan polynomial

disajikan di Lampiran 1). Pada gambar tersebut menunjukkan bahwa secara umum baik menggunakan SVR dengan fungsi linear, polynomial, maupun RBF kernel, pola distribusi dari curah hujan bulanan hasil estimasi sudah mendekati data pengamatannya. Setiap luaran GCM yang diujicobakan menghasilkan model dengan hasil estimasi yang cenderung hampir sama yaitu mendekati hasil dari

0 100 200 300 400 500 600 700 78 79 80 81 82 83 84 85 86 87 88 89 89 90 91 92 93 94 95 96 97 98 99 00 C u r ah H u jan (m m ) Tahun

data observasi t-47 t-63 giss-er

(44)

observasi, sehingga didapatkan pola distribusi yang menyerupai satu sama lainnnya. Pola distribusi yang hampir sama antara GCM yang satu dan yang lainnya dapat diperlihatkan dengan cara merata-ratakan nilai estimasi masing-masing luaran GCM, kemudian dibandingkan dengan observasi yang terlihat seperti pada Gambar 14 .

Gambar 14 Perbandingan antara pola observasi dan prediksi curah hujan untuk seluruh luaran GCM (rataan, minimum, dan maksimum).

Pada Gambar 14 juga memperlihatkan bahwa sebagian besar dari nilai observasi berada diantara nilai maksimum (biru) dan nilai minimum (hijau) dari estimasi seluruh luaran GCM . Akan tetapi pada titik-titik dengan jumlah curah hujan ekstrim yang ditunjukkan oleh data pengamatan pada gambar tersebut, untuk hasil estimasi terbaik yang didapatkan jauh dibawah nilai pengamatannya. Nilai pengamatan pada titik ekstrim contohnya pada titik di tahun 1980, tahun 1997, dan beberapa titik ekstrim lainnya, berada di atas nilai maksimum dari prediksi seluruh luaran GCM. Hal tersebut dapat diartikan bahwa masing-masing luaran GCM menghasilkan model yang cukup bagus untuk memprediksi curah hujan dengan kondisi normal, tetapi untuk keadaan ekstrim, walaupun model prediksi sudah dapat mengikuti pola dari data pengamatan namun nilai prediksi yang dihasilkan belum berhasil menjangkau dan mendekati nilai pengamatan yang sesungguhnya. 0 100 200 300 400 500 600 700 78 79 80 81 82 83 84 85 86 87 88 89 89 90 91 92 93 94 95 96 97 98 99 00 C u r ah H u jan (m m ) Tahun

Observasi Rataan Prediksi

(45)

4.2 Kinerja Model Berdasarkan Luaran GCM

Berdasarkan hasil grafik di Gambar 14 yang menggunakan panjang tahun selama 22 tahun, dapat dilihat bahwa enam luaran model GCM yang diujikan memiliki kencenderungan dan pola yang hampir sama. Tidak telihat perbedaan yang mencolok secara kasat mata antara luaran satu dan lainnya. Akan tetapi bila melihat nilai korelasi dan eror (NRMSE dan MAEP) yang didapatkan dari nilai estimasi dan observasi maka akan dapat dilihat luaran GCM yang mempunyai kinerja yang paling baik dalam menduga curah hujan menggunakan SVR. Pada masing-masing luaran GCM, nilai korelasi dan eror dari estimasi dan observasi untuk setiap stasiun di Kabupaten di Indramayu dirata-ratakan seperti yang terlihat pada Tabel 5.

Tabel 5 Nilai RMSE, korelasi validasi model menurut menurut fungsi kernel dan rataan masing-masing model pada GCM

Luaran GCM Fungsi Kernel NRMSE MAEP r

t-47 Linear kernel 9,891 8,174 0,639 PolynomialKernel 9,547 8,072 0,660 RBF Kernel 9,271 7,928 0,685 t-63 Linear kernel 9,923 8,197 0,634 PolynomialKernel 9,691 8,127 0,652 RBF Kernel 9,477 7,974 0,669

giss-er Linear kernel 9,726 8,144 0,642

PolynomialKernel 9,391 8,071 0,668

RBF Kernel 9,124 7,955 0,688

giss-aom Linear kernel 10,093 8,257 0,628

PolynomialKernel 9,822 8,130 0,641

RBF Kernel 9,592 7,974 0,666

miub-g Linear kernel 10,584 8,278 0,613

PolynomialKernel 10,290 8,229 0,626

RBF Kernel 9,925 8,075 0,657

mri-32a Linear kernel 10,221 8,259 0,624

PolynomialKernel 9,946 8,190 0,638

RBF Kernel 9,737 8,023 0,662

Kinerja dari luaran dapat dilihat berdasarkan nilai eror dan korelasinya. Luaran GCM dikatakan memiliki kinerja yang baik apabila nilai eror yang dihasilkan kecil dan nilai korelasinya besar. Sebaliknya luaran GCM dengan

(46)

kinerja yang kurang baik apabila memiliki nilai eroryang besar dan nilai korelasi yang kecil.

Hasil validasi model downscaling menggunakan SVR pada luaran GCM yang ditunjukkan pada Tabel 5 memperlihatkan bahwa luaran GCM giss-er memiliki nilai rata-rata eror yang paling rendah dan nilai rata-rata korelasi yang paling tinggi. Nilai eror dari luaran GCM giss-er yaitu NRMSE = (9,726 - linear kernel), (9,391 - polynomial kernel), (9,124 - RBF kernel), MAEP = (8,144 –

linear kernel), (8,071 - polynomial kernel), (7,955 - RBF kernel). Nilai korelasi dari luaran GCM giss-er yaitu r = (0,642- linear kernel), (0,668- polynomial kernel), (0,688- RBF kernel). Berdasarkan Tabel 5 luaran GCM dengan nilai nilai rata-rata eror yang paling tinggi dan nilai rata-rata korelasi yang paling rendah adalah luaran GCM miub-g. Nilai eror dari luaran GCM miub-g yaitu NRMSE = (10,584 - linear kernel), (10,290 - polynomial kernel), (9,925 – RBF kernel), MAEP = (8,278 - linear kernel), (8,229 - polynomial kernel), (8,075- RBF

kernel). Nilai korelasi dari luaran GCM miub-g yaitu r = (0,613- linear kernel), (0,626- polynomialkernel), (0,657- RBF kernel).

Berdasarkan keterangan dari tabel 5, terlihat jelas urutan kinerja dari luaran GCM yang paling tinggi sampai pada GCM dengan kinerja yang paling rendah. Luaran GCM yang diujikan menggunakan model SVR dengan tiga fungsi kernel

yang berbeda yaitu fungsi linear kernel, polynomial kernel, dan RBF kernel, menunjukkan hasil yang sama dimana kinerja paling baik dengan nilai eroryang paling kecil dan korelasinya paling besar adalah luaran GCM giss-er. Selanjutnya luaran GCM dengan kinerja dibawah giss-er sampai pada luaran gcm dengan kinerja terendah secara berurutan adalah: luaran GCM t-47, luaran GCM t-63, luaran GCM giss-aom, luaran GCM mri-32a, dan yang terakhir luaran GCM yang memiliki kinerja paling rendah adalah luaran GCM miub-g.

Hasil kinerja dari luaran GCM juga dapat dilihat dari hasil perbandingan nilai rataan estimasi dan pengamatan menurut bulannya. Nilai estimasi dan pengamatan selama 22 tahun (1979-200) dirata-ratakan perbulan dari januari sampai bulan desember. Plot nilai dari perbandingan antara hasil estimasi dan pengamatan membentuk suatu pola seperti yang ditunjukkan pada Gambar 15.

(47)

Gambar 15a Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan observasi (curah hujan dalam mm)

0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 Ja n Fe b M ar A p r M e i Ju n Ju l A gu Sep Okt N o p D es 1. giss-er 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 Ja n Fe b M ar A p r M ei Ju n Jul A gu Sep Okt N o p D es 2. t-47 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 Ja n Fe b M ar A p r M ei Ju n Jul A gu Sep Okt N o p D es 3. t-63 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 Ja n Fe b M ar A p r M e i Ju n Jul A gu Sep Okt N o p D es 4. giss-aom

(48)

Gambar 15b Luaran GCM berdasarkan perbandingan rataan hasil prediksi dan observasi (curah hujan dalam mm)

Gambar 15 menunjukkan bahwa secara umum tingkat ketepatan luaran GCM giss-er lebih baik dari luaran GCM lainnya. Nilai estimasi perbulan dari januari sampai desember, baik menggunakan fungsi linear kernel, polynomial

maupun RBF kernel, mendekati nilai pengamatannya. Pola dari nilai estimasi yamg mengikuti pola dari nilai pengamatan menunjukkan kekonsistenan dan ketepatan yang cukup baik dari luaran GCM giss-er tersebut. Hal ini menandakan bahwa luaran GCM giss-er memiliki kinerja yang baik dalam memprediksi curah hujan bulanan di Kabupaten Indramayu.

Selanjutnya untuk luaran GCM lainnya, tidak berbeda jauh karena pola nilai estimasi mengikuti nilai pengamatan seperti yang ditunjukkan pada Gambar 15. Hanya satu atau dua nilai estimasi yang kurang mendekati dari nilai pengamatan disetiap luaran GCM. Seperti pada bulan Januari, untuk beberapa luaran GCM nilai estimasinya kurang mendekati nilai pengamatannya, namun tetap bisa dikatakan cukup konsisten karena masing-masing luaran GCM

0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 Ja n Fe b M ar A p r M e i Ju n Jul A gu Sep Okt N o p D e s 5. mri-32a 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 Ja n Fe b M ar A p r M ei Ju n Jul A gu Sep Okt N o p D e s 6. miub-g

(49)

memperlihatkan pola yang dapat mengestimasi nilai-nilai rataan dari pengamatan yang berfluktuatif selama bulan januari sampai desember.

Bila diperhatikan dari Gambar 15, untuk luaran GCM dengan kinerja yang paling rendah berdasarkan perbandingan nilai rataan estimasi dan pengamatanya, diperlihatkan oleh luaran GCM miub-g. Hal ini ditunjukkan dari nilai estimasinya yang cukup mencolok dan kurang mendekati nilai pengamatannya pada bulan-bulan tertentu. Nilai estimasi yang kurang mendekati nilai pengamatanya adalah pada bulan Januari, September dan November. Sehingga dengan demikian, untuk model SVR yang menggunakan luaran GCM yaitu miub-g, mendapatkan hasil prediksi terendah dibandingkan dengan model yang menggunakan luaran GCM yang lain.

Berdasarkan hasil kinerja antara luaran GCM yang diujikan dapat dinyatakan bahwa setiap luaran GCM mempunyai tingkat akurasi berbeda-beda pada suatu wilayah. Pemodelan downscaling menggunakan SVR dengan luaran GCM giss-er merupakan model paling baik untuk melakukan prediksi curah hujan bulanan di wilayah Kabupaten Indramayu, sedangkan GCM miub-g merupakan model luaran GCM yang memiliki kinerja paling rendah untuk melakukan prediksi curah hujan bulanan di wilayah Kabupaten Indramayu.

4.3 Kinerja Model Berdasarkan Fungsi Kernel SVR

Hasil analisis kinerja fungsi kernel pada SVR diperoleh dengan melihat tingkat eror dan korelasi dari estimasi terhadap data pengamatan yang ditunjukkan oleh Gambar 16 dan Gambar 17.

Jika dilihat dari analisis grafik pada Gambar 16 dan Gambar 17, model SVR dengan fungsi linear kernel memiliki nilai eror paling besar dan ukuran korelasinya paling kecil, kemudian fungsi polynomial kernel dengan ukuran eror lebih kecil dan korelasinya lebih besar dan terakhir fungsi RBF yang memiliki ukuran eror paling kecil dan ukuran korelasinya paling besar.

(50)

Gambar 16 Nilai rataan NRMSE, MAEP validasi model berdasarkan kinerja fungsi kernel SVR pada setiap luaran GCM

Gambar 17 Nilai rataan korelasi validasi model berdasarkan kinerja fungsi kernel

SVR pada setiap luaran GCM

Ukuran eror model yang menggunakan salah satu luaran GCM yaitu GCM giss-er dan fungsi linear kernel memiliki nilai NRMSE=9,726, MAEP=8,144, dan ukuran korelasi r=0,642. Selanjutnya ukuran eror menggunakan luaran GCM yang sama namun fungsi kernel berbeda yaitu

polynomial memiliki nilai NRMSE=9,391, MAEP=8,071, dan ukuran korelasi

Linear Polinomial Radial Basis

NRMSE 10,073 9,781 9,521 MAEP 8,218 8,136 8,002 7 8 8 9 9 10 10 11 NRMSE MAEP

Linear Polinomial Radial Basis

Korelasi 0,630 0,647 0,671 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 Korelasi

(51)

dengan nilai r=0,668. Terakhir adalah model yang menggunakan fungsi RBF

kernel dan luaran GCM giss-er, menghasilkan ukuran eror paling kecil dengan nilai NRMSE=9,124, MAEP= 7,955, dan ukuran korelasinya sebesr r=0,688.

Kecendrungan hasil eror dan korelasi yang sama terlihat untuk setiap luaran GCM dimana hasil perbandingan ukuran eror dan korelasi menunjukkan bahwa model dengan kinerja paling baik secara berurutan adalah fungsi RBF

kernel, fungsi polynomial kernel, dan yang terakhir fungsi linear kernel yang memiliki kinerja paling rendah bila dibandingkan dua fungsi kernel lainnya.

Penjelasan lebih lanjut untuk kinerja fungsi kernel pada model SVR diilustrasikan oleh grafik scater pada Gambar 18. Grafik scater tersebut memperlihatkan hubungan antara observasi dan hasil prediksi untuk setiap fungsi

kernel pada model SVR. Hubungan yang kuat antara observasi dan prediksi menunjukkan semakin kuat pula korelasi dan semakin kecil ukuran eror antara nilai yang diamati dan nilai yang diestimasi. Kuat atau tidaknya hubungan antara prediksi dan observasi dapat dilihat melalui persamaan regresi = + yang mengambarkan antara sebagai prediksi memiliki kedekatan hubungan dengan

( ) yang disebut sebagai observasi yang ditunjukkan pada grafik scater.

Pada model SVR dengan luaran GCM giss-er yang menggunakan fungsi RBF kernel memiliki hubungan kedekatan antara prediksi dan observasi yang paling baik bila dibandingkan dengan model yang menggunakan fungsi kernel

lainnya. Gradien dari persamaan pada model SVR menggunakan fungsi RBF

kernel memiliki nilai paling besar yaitu bernilai 0.83 dan intercept bernilai 10,07. Sementara, gradient yang menunjukkan hubungan antara prediksi dan observasi untuk masing-masing fungsi kernel lain yaitu polynomial dan linear kernel secara berurutan adalah 0,789, 0,768, dan intercept sebesar 11,09, dan 14, 56. Gradient yang besar (mendekati 1) dan nilai intercept yang kecil (mendekati nol) menandakan adanya hubungan kuat antara prediksi dan observasi, ukuran kesalahan prediksi yang kecil, korelasi dan ketepatan prediksi yang baik.

(52)

Gambar 18 Grafik scater untuk plot hasil observasi dengan estimasi masing masing fungsi kernel

y = 0,719x + 28,73 0 100 200 300 400 500 600 0 200 400 600 P re d ik si ( m m ) Observasi (mm) RBFKernel y = 0,698x + 31,09 0 100 200 300 400 500 600 0 200 400 600 P re d ik si ( m m ) Observasi (mm) Polynomial Kernel y = 0,677x + 34,56 0 100 200 300 400 500 600 0 200 400 600 P re d ik si ( m m ) Observasi (mm) Linear Kernel

Gambar

Gambar 1 Visualisasi Layering pada GCM (Sumber : IPPC, 2011)
Gambar 2 Ilustrasi proses downscaling, (Sumber : Sutikno 2008)
Gambar 4 Penambahan variable slack  pada SVR (Sumber : Smola dan  Schölkopf 2003)
Gambar 5 Ilustrasi proses SVR (Sumber : Smola dan Schölkopf 2003)
+7

Referensi

Dokumen terkait

apakah variabel bebas yang terdiri dari Exterior, General Interior, Store Layout, Interior Display mempunyai pengaruh yang positif dan signifikan terhadap

Penelitian lainnya yang dilakukan oleh Rizal yang berjudul Hubungan Tingkat Stres dengan Diabetes Mellitus (DM) Tipe 2 pada Usia Pertengahan (45-59 Tahun) Di Persatuan

Berdasarkan latar belakang dan permasalahan- permasalahan yang muncul dari pembangunan Hotel, Apartemen dan Kantor Praxis Surabaya Surabaya tersebut, maka selanjutnya akan

a) Tenaga Kerja Terdidik, Adalah tenaga kerja yang memiliki keahlian khusus pada bidang tertentu. Contoh dari jenis tenaga kerja ini adalah guru, arsitek, pengacara,

Kemampuan teknik dasar bermain bola basket siswa peserta ektrakurikuler SMA Negeri se- Kabupaten Grobogan tahun 2010/2011 dalam kategori cukup. Hasil cukup yang di peroleh

Penelitian ini bertujuan untuk mengetahui hubungan antara power tungkai dan kelentukan pergelangan tangan terhadap hasil lay-up dalam permainan bola basket siswa ekstrakulikuler SMPN

dan pemahaman bagaimana siswa belajar. Hal ini sejalan dengan pendapat Winarno yang menyatakan, metode adalah cara yang ada di dalam fungsinya merupakan alat