• Tidak ada hasil yang ditemukan

Pemodelan Statistical Downscaling Dengan Regresi Kuantil Regularisasi Gulud Dan Elastic-Net Untuk Pendugaan Curah Hujan Di Indramayu

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pemodelan Statistical Downscaling Dengan Regresi Kuantil Regularisasi Gulud Dan Elastic-Net Untuk Pendugaan Curah Hujan Di Indramayu"

Copied!
47
0
0

Teks penuh

(1)

PEMODELAN STATISTICAL DOWNSCALING DENGAN

REGRESI KUANTIL REGULARISASI GULUD DAN ELASTIC-NET

UNTUK PENDUGAAN CURAH HUJAN DI INDRAMAYU

TRI BUDI NOVIA CAHYANI

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*

Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Statistical Downscaling dengan Regresi Kuantil Regularisasi Gulud dan Elastic-net untuk Pendugaan Curah Hujan di Indramayu adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, September 2016

Tri Budi Novia Cahyani

(4)

RINGKASAN

TRI BUDI NOVIA CAHYANI. Pemodelan Statistical Downscaling dengan Regresi Kuantil Regularisasi Gulud dan Elastic-net untuk Pendugaan Curah Hujan di Indramayu. Dibimbing oleh AJI HAMIM WIGENA dan ANIK DJURAIDAH.

Indonesia yang terletak antara 6o LU sampai 11o LS dan antara 95o BT sampai 141o BT, dan dilintasi garis khatulistiwa memiliki iklim tropis dengan keragaman curah hujan yang besar. Hal tersebut dapat menyebabkan peningkatan atau penurunan curah hujan secara ekstrim. Curah hujan ekstrim dapat menimbulkan dampak buruk pada berbagai sektor, salah satunya adalah sektor pertanian karena dapat merusak tanaman.

Indonesia merupakan negara agraris yang cukup maju sektor pertaniannya. Salah satu hasil pertanian terpenting di Indonesia adalah padi, yang banyak dihasilkan di wilayah Pulau Jawa. Kabupaten Indramayu merupakan salah satu penghasil padi terbesar di Jawa Barat yang berpotensi besar terkena dampak buruk adanya curah hujan ekstrim. Pemodelan curah hujan tersebut perlu dilakukan untuk menghindari dampak buruk yang mungkin terjadi.

Regresi kuantil adalah suatu teknik yang dapat digunakan untuk memodelkan curah hujan ekstrim. Regresi kuantil dapat mengukur efek peubah penjelas pada berbagai nilai kuantil sebaran data. Pembentukan model regresi tersebut dapat dilakukan dengan memanfaatkan data luaran dari General Circulation Models (GCM). Akan tetapi, GCM menghasilkan data berskala global, sehingga sulit memperoleh informasi berskala lokal secara langsung. Suatu teknik yang dapat digunakan untuk menghubungkan data berskala global dengan data berskala lokal disebut dengan downscaling.

Statistical downscaling (SD) adalah salah satu teknik downscaling yang menetapkan hubungan fungsional antara data curah hujan dengan data luaran GCM. Karakteristik data GCM selain berskala global adalah terdapat multikolinieritas antar gridnya. Hal tersebut menyebabkan data GCM tidak dapat digunakan secara langsung dalam memodelkan curah hujan sebelum multikolinieritas diatasi.

Metode yang sering digunakan untuk mengatasi multikolinieritas adalah analisis komponen utama atau analisis komponen utama fungsional. Selain metode tersebut, multikolinieritas juga dapat diatasi menggunakan regularisasi gulud, lasso, atau elastic-net (gabungan dari regularisasi gulud dan lasso). Regularisasi gulud mengatasi multikolinieritas dengan membuat nilai koefisien peubah penjelas menjadi sangat kecil mendekati nol. Regularisasi lasso dapat membuat koefisien tersebut bernilai nol sehingga peubah penjelas yang bersesuaian dapat dikeluarkan dari model. Keunggulan tersebut membuat lasso dapat menghasilkan model dengan peubah penjelas yang lebih sedikit dan mempermudah interpretasi. Akan tetapi, ketika banyaknya pengamatan lebih besar daripada banyaknya peubah penjelas, regularisasi gulud tetap memberikan hasil prediksi yang lebih baik. Pada penelitian ini digunakan regularisasi gulud dan elastic-net pada regresi kuantil untuk prediksi curah hujan ekstrim.

(5)

respon dan data presipitasi GCM sebagai peubah penjelas. Sebelum pembentukan model, pada data GCM dilakukan pergeseran waktu untuk mendapatkan peubah penjelas yang berkorelasi tinggi dengan peubah respon. Selanjutnya data dibagi menjadi dua bagian, yaitu data pemodelan (tahun 1981-2012) untuk membangun model dan data validasi (tahun 2013) untuk validasi. Langkah awal yang dilakukan dalam membangun model adalah menentukan nilai parameter regularisasi yang optimum. Penentuan parameter regularisasi gulud dan elastic-net

yang optimum dilakukan dengan menggunakan metode validasi silang (CV). Selanjutnya, pemodelan dilakukan untuk pendugaan nilai-nilai curah hujan pada nilai-nilai kuantil ke-0.75, ke-0.90, dan ke-0.95.

Hasil pemodelan regresi kuantil gulud dan kuantil elastic-net dapat digunakan untuk prediksi curah hujan tinggi yang terjadi pada Bulan Januari (kuantil ke-0.75) dan Bulan Desember (kuantil ke-0.90) dengan baik. Nilai prediksi dan nilai aktual curah hujan memiliki pola yang sama serta konsisten pada berbagai waktu yang berbeda. Akan tetapi, model regresi kuantil elastic-net

memberikan hasil prediksi yang lebih baik dengan nilai RMSEP validasi yang lebih rendah dan nilai korelasi yang lebih tinggi daripada model regresi kuantil gulud.

Kata kunci: general circulation model, regresi kuantil, regularisasi elastic-net,

(6)

SUMMARY

TRI BUDI NOVIA CAHYANI. Statistical Downscaling Modelling with Ridge and Elastic-net Regularized Quantile Regression for Rainfall Prediction in Indramayu. Supervised by AJI HAMIM WIGENA and ANIK DJURAIDAH.

Indonesia is located between 6o N to 11o S latitude and between 95o to 141o E longitude, also crossed the equator has a tropical climate with a high diversity of rainfall. It can cause an extreme decrease or increase of rainfall. Extreme rainfall has a negative impact in many sectors, especially agriculture because it can rainfall is needed to avoid negative effects that may occur.

Quantile regression is a technique that can be used to model extreme rainfall. It measures the effect of the explanatory variables at the various quantiles of the distribution data. Quantile regression model can be built using the output of General Circulation Models (GCM) data. However, GCM generate a global scale data, making it difficult to directly obtain local scale information. A technique that can be used to link a global scale data with a local scale data is downscaling.

Statistical downscaling (SD) is one of the downscaling technique that developes a functional relation between rainfall data and GCM data. GCM data is not only has a global scale but also high correlation between its grids, usually calle multicollinearity. This causes the GCM data can’t be used directly in modeling rainfall before overcoming multicollinearity.

The method often used to overcome multicollinearity is principal component analysis or functional principal component analysis. Another method can be used to overcome multicollinearity is regularization, such as ridge, lasso, or elastic-net (a combination of ridge and lasso regularization) regularization. Ridge regularization overcomes multicollinearity by setting the coefficient of the explanatory variables becomes very small near zero. Lasso regularization can set the coefficient exactly zero so the corresponding explanatory variables can be excluded from the model. It makes lasso can produce models with fewer explanatory variables and simplify interpretation. However, when the number of observations is greater than the number of explanatory variables, the ridge regularization still gives a better prediction. This study applied ridge and elastic-net regularization to quantile regression for the prediction of extreme rainfall.

(7)

conducted then to predict extreme values of rainfall on the upper quantiles of the data, 0.75th, 0.90th, and 0.95th quantiles.

Both quantile ridge and quantile elastic-net regression models can predict extreme values of rainfall that occurred in January (0.75th quantile) and December (0.90th quantile) well. The predicted value and actual value of rainfall has the similar pattern and consistent at various different times. However, quantile elastic-net regression model provides a better prediction than quantile ridge regression model with the lower validation RMSEP value and the higher correlation value. Keywords: elastic-net regularization, general circulation models, quantile

(8)

© Hak Cipta Milik IPB, Tahun 2016

Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

(9)

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Sains

pada

Program Studi Statistika

PEMODELAN STATISTICAL DOWNSCALING DENGAN

REGRESI KUANTIL REGULARISASI GULUD DAN ELASTIC-NET

UNTUK PENDUGAAN CURAH HUJAN DI INDRAMAYU

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2016

(10)
(11)

Judul Tesis : Pemodelan Statistical Downscaling dengan Regresi Kuantil Regularisasi Gulud dan Elastic-net untuk Pendugaan Curah Hujan di Indramayu

Nama : Tri Budi Novia Cahyani NIM : G151140181

Disetujui oleh Komisi Pembimbing

Dr Ir Aji Hamim Wigena, MSc Ketua

Dr Ir Anik Djuraidah, MS Anggota

Diketahui oleh

Ketua Program Studi Statistika

Dr Ir Kusman Sadik, MSi

Dekan Sekolah Pascasarjana

Dr Ir Dahrul Syah, MScAgr

(12)

PRAKATA

Segala puji dan syukur bagi Allah subhanahu wa ta’ala atas segala rahmat dan karunia-Nya sehingga proposal penelitian yag berjudul “Pemodelan Statistical Downscaling dengan Regresi Kuantil Regularisasi Gulud dan Elastic-net untuk Pendugaan Curah Hujan di Indramayu” berhasil diselesaikan.

Penulis menyadari keberhasilan penulisan proposal ini tidak terlepas dari dukungan dan bimbingan berbagai pihak. Oleh karena itu, penulis ingin menyampaikan ucapan terima kasih kepada:

1. Dr Ir Aji Hamim Wigena, MSc dan Dr Ir Anik Djuraidah, MS selaku dosen pembimbing atas segala bimbingan dan waktu yang telah diberikan.

2. Dr Ir Erfiani, MSi selaku dosen penguji dan Dr Ir I Made Sumertajaya, MS selaku moderator pada ujian tesis.

3. Ibu Puji Mulyati, Bapak M. Kusnadi, Eko Budi Sanyoto, Dwi Budi Setiari, Liesca Levy Sandhy, Slamet Rianto, dan suami Dorit Bayu Islam Nuswantoro atas segala dukungannya.

4. Seluruh staf Departemen Statistika IPB.

5. Teman-teman mahasiswa pascasarjana statistika dan statistika terapan IPB. 6. Semua pihak lain yang telah membantu penyusunan tesis yang tidak dapat

disebutkan satu persatu.

Penulis menyadari masih banyak kekurangan pada tesis ini, sehingga penulis mengharapkan kritik dan saran yang membangun. Semoga tesis ini dapat bermanfaat bagi yang membacanya.

Bogor, September 2016

(13)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

1 TINJAUAN PUSTAKA 2

2 PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 2

General Circulation Models dan Statistical Downscaling 2

Regresi Kuantil 3

Regularisasi Gulud (L2) 4

Regularisasi Lasso (L1) 5

Regularisasi Elastic-net 6

Algoritma Semismooth Newton Coordinate Descent (SNCD) 7

Validasi Silang 10

3 METODE 10

Data 10

Prosedur Analisis Data 11

4 HASIL DAN PEMBAHASAN 12

Eksplorasi Data Curah Hujan 12

Pergeseran Waktu Data Presipitasi GCM 13

Regresi Kuantil 13

Regresi Kuantil Gulud 15

Regresi Kuantil Elastic-net 15

Pemilihan Model Terbaik 17

Konsistensi Model 20

5 SIMPULAN 21

DAFTAR PUSTAKA 21

LAMPIRAN 24

(14)

DAFTAR TABEL

1 Statistika deskriptif curah hujan (mm/bulan) Kabupaten Indramayu

tahun 1981-2013 13

2 Nilai parameter gulud optimum hasil CV dan RMSEP pemodelan 15 3 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi

kuantil gulud 15

4 Nilai parameter elastic-net optimum hasil CV dan RMSEP pemodelan 16 5 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi

kuantil elastic-net 16

6 Nilai RMSEP validasi model regresi kuantil gulud dan kuantil

elastic-net pada pendugaan curah hujan dalam 1 tahun 20

7 Nilai korelasi model regresi kuantil gulud dan kuantil elastic-net pada

pendugaan curah hujan dalam 1 tahun 21

DAFTAR GAMBAR

1 Skema statistical downscaling 3

2 Pendugaan koefisien untuk lasso dan gulud 6

3 Wilayah penalti regularisasi gulud, lasso, dan elastic-net dengan = 0.5

untuk � = 2 7

4 Pola curah hujan bulanan Kabupaten Indramayu tahun 1981-2013 12 5 Pola peubah GCM X21 sebelum dan setelah digeser 1 periode 14 6 Data curah hujan dengan beberapa nilai kuantil 14 7 Nilai RMSEP validasi model pada kuantil ke-0.75, ke-0.90, dan ke-0.95 17 8 Nilai korelasi model pada kuantil ke-0.75, ke-0.90, dan ke-0.95 17 9 Plot kuantil data dan nilai dugaan model regresi kuantil elastic-net 18 10 Plot kuantil data dan nilai dugaan model regresi kuantil gulud 18 11 Nilai prediksi model regresi kuantil gulud untuk curah hujan pada tahun

2013 19

12 Nilai prediksi model regresi kuantil elastic-net untuk curah hujan pada

tahun 2013 19

DAFTAR LAMPIRAN

1 Pergeseran waktu peubah presipitasi GCM dan korelasi sebelum dan

sesudah pergeseran terhadap curah hujan 24

2 Nilai kuantil data curah hujan per bulan 25

3 Hasil CV untuk regresi kuantil gulud pada kuantil ke-0.75 tahun

prediksi 2013 26

4 Nilai � optimum pada berbagai nilai dari CV untuk regresi kuantil

elastic-net tahun prediksi 2013 28

5 Peta analisis sifat hujan Bulan Februari 2013 dan Bulan April 2013

Provinsi Jawa Barat 29

(15)
(16)
(17)

1

PENDAHULUAN

Latar Belakang

Curah hujan adalah salah satu komponen iklim, yang merupakan bagian penting dari ekosistem alam. Curah hujan dapat menentukan ketersediaan air yang terdapat pada bumi, sehingga memiliki peranan penting bagi manusia, terutama pada sektor pertanian yang sangat bergantung pada ketersediaan air. Secara astronomis, Indonesia yang terletak antara 6o LU sampai 11o LS dan antara 95o BT sampai 141o BT, dan dilintasi garis khatulistiwa memiliki iklim tropis dengan keragaman curah hujan yang besar. Peningkatan atau penurunan curah hujan secara ekstrim akan berdampak buruk bagi pertanian karena dapat merusak tanaman. Hal tersebut tentu sangat berpengaruh bagi Indonesia yang merupakan negara agraris. Pulau Jawa adalah salah satu pulau di Indonesia yang memiliki sektor pertanian yang baik, sehingga dapat terancam dampak curah hujan ekstrim. Salah satu contoh dampak buruk tersebut telah terjadi di Kabupaten Indramayu.

Kabupaten Indramayu merupakan salah satu penghasil padi terbesar di Jawa Barat dan mendapat julukan sebagai lumbung padi nasional. Curah hujan ekstrim yang terjadi pada awal tahun 2006 menyebabkan banjir yang merendam area sawah hingga seluas 38.981 hektar. Kerugian juga terjadi pada sektor perikanan dan infrastruktur, karena 7.377 hektar area tambak dan 24.287 rumah juga terendam banjir. Total kerugian yang ditimbulkan mencapai 252 miliar rupiah. Oleh karena itu, pemodelan untuk prediksi curah hujan ekstrim diperlukan untuk menghindari dampak buruk yang mungkin terjadi. Regresi kuantil adalah salah satu metode yang dapat digunakan dalam pediksi curah hujan ekstrim karena dapat mengukur efek peubah penjelas di bagian atas, pusat, maupun bawah sebaran data. Djuraidah & Wigena (2011) telah menggunakan regresi kuantil untuk mengeksplorasi curah hujan pada Kabupaten Indramayu. Penelitian tersebut menghasilkan kesimpulan bahwa regresi kuantil dapat digunakan untuk mendeteksi kondisi ekstrim kering (kuantil ke-0.05) maupun ekstrim basah (kuantil ke-0.95).

Pemodelan curah hujan dapat dilakukan dengan memanfaatkan data yang berasal dari luaran General Circulation Models (GCM). Data luaran GCM merepresentasikan berbagai sistem yang terdapat di bumi, termasuk atmosfer, lautan, permukaan tanah, dan laut es yang sangat berguna bagi penelitian tentang perubahan dan variabilitas iklim (Yang et al. 2012). Namun GCM menghasilkan data berskala global, sehingga sulit memperoleh informasi berskala lokal secara langsung. Resolusi data GCM terlalu rendah untuk memprediksi data iklim lokal yang dipengaruhi oleh sirkulasi atmosfer dan parameter lokal seperti topografi dan tataguna lahan sehingga diperlukan suatu teknik yang disebut downscaling

(Wigena 2006). Statistical downscaling (SD) adalah salah satu teknik

(18)

2

Multikolinieritas pada umumnya dapat diatasi dengan analisis komponen utama (AKU) dan analisis komponen utama fungsional (AKUF). Mondiana (2012) melakukan pemodelan curah hujan ekstrim menggunakan regresi kuantil dan mereduksi dimensi peubah penjelas dengan AKU. Sari (2015) juga menggunakan regresi kuantil untuk memprediksi curah hujan ekstrim, sedangkan multikolinieritas diatasi dengan metode AKUF. Selain kedua metode tersebut, multikolinieritas juga dapat diatasi menggunakan regularisasi lasso. Soleh (2015) melakukan pemodelan menggunakan pemodelan linier sebaran gamma dan pareto terampat dengan regularisasi lasso untuk pendugaan curah hujan ekstrim. Santri (2016) membangun model regresi kuantil dengan regularisasi lasso. Metode lain yang dapat digunakan untuk mengatasi multikolinieritas adalah regularisasi gulud dan elastic-net. Pada penelitian ini akan dilakukan pemodelan curah hujan ekstrim dengan menggunakan regresi kuantil regularisasi gulud dan elastic-net.

Tujuan Penelitian

Tujuan dari penelitian ini adalah :

1. Melakukan pemodelan dengan regresi kuantil menggunakan regularisasi gulud dan elastic-net untuk pendugaan curah hujan di Kabupaten Indramayu. 2. Menentukan model terbaik yang dapat digunakan untuk pendugaan curah

hujan di Kabupaten Indramayu.

2

TINJAUAN PUSTAKA

General Circulation Models dan Statistical Downscaling

General Circulation Models (GCM) sering digunakan dalam studi mengenai perubahan dan variabilitas iklim. Pada GCM, peubah iklim global disimulasikan pada setiap grid untuk setiap lapisan atmosfer, sehingga data dari luaran GCM berupa grid-grid dengan ukuran 2.5o×2.5o atau sekitar 300 km ×300 km. Data tersebut dapat digunakan untuk memprediksi pola iklim jangka panjang, misalnya tahunan. Data GCM memiliki karakteristik berdimensi besar dengan resolusi kasar, dan multikolinieritas (Wigena 2006).

Downscaling merupakan suatu teknik untuk melakukan proyeksi masa depan dari data iklim lokal menggunakan data luaran GCM yang beresolusi kasar.

Statistical downscaling (SD) adalah salah satu jenis pendekatan downscaling yang sering digunakan. Metode SD menetapkan hubungan matematis antara data luaran GCM yang berskala relatif kasar dengan peubah iklim lokal berskala baik berdasarkan data pengamatan. Pendekatan SD kebanyakan menggunakan metode regresi (Abraham et al. 2011). Skema dari teknik SD disajikan pada Gambar 1.

(19)

3 respon dan penjelas tidak berubah dengan adanya perubahan waktu dan tetap sama meskipun terdapat perubahan iklim (Busuioc et al. 2001).

Bentuk model SD secara umum adalah: = � �

dengan = vektor peubah iklim lokal (curah hujan) atau respon � = matriks peubah luaran GCM (presipitasi) atau penjelas

Regresi Kuantil

Regresi kuantil pertama kali diperkenalkan oleh Roger Koenker dan Gilbert Bassett pada tahun 1978. Regresi kuantil memodelkan nilai kuantil dari sebaran peubah respon pada nilai tertentu dari peubah penjelas (Koenker & Hallock 2001). Hal tersebut memungkinkan regresi kuantil untuk menduga respon di berbagai nilai kuantil dari sebaran data.

Regresi kuantil sangat berguna ketika melakukan pemodelan yang fokus pada bagian tertentu dari sebaran bersyarat suatu data, misalnya pada kuantil bagian atas atau bawah sebaran data respon. Keuntungan lain dalam menggunakan regresi kuantil adalah dapat melakukan pemodelan tanpa harus memenuhi asumsi-asumsi parametrik tertentu, misalnya syarat sebaran yang harus dipenuhi suatu data (Buhai 2005).

Suatu peubah acak bilangan real � yang memiliki fungsi sebaran:

� = � <

maka kuantil ke-� dari peubah acak � tersebut didefinisikan sebagai:

� � = �− � = inf{ : � �}

untuk setiap � [ , ].

Dalam menduga kuantil ke- �, regresi kuantil meminimumkan jumlah dari sisaan mutlak terboboti. Pada model:

= + �� + �

dengan �× = vektor peubah respon

�× = vektor satu

= intersep

(20)

4

Persamaan tersebut dapat dituliskan kembali menjadi:

min [∑ �� − − �′�

=

]

yang merupakan bentuk minimisasi fungsi kerugian regresi kuantil, dengan: �� = {� , >− � , .

Solusi dari pendugaan pada regresi kuantil diperoleh menggunakan metode optimasi seperti pemrograman linier. Permasalahan optimasi fungsi kerugian pada regresi kuantil dapat juga ditulis sebagai berikut:

min{� ′ + − � ′ | − � = − , ℝ�, ,

+�} ,

dengan = [ − − ��]+ dan = [ − − ��]. Permasalahan tersebut dapat dilihat sebagai bentuk kanonik:

min { ′�|�� − , }

Bentuk dual dari persamaan tersebut adalah:

max ′

Salah satu metode yang dapat digunakan dalam menyelesaikan permasalahan pemrograman linier pada regresi kuantil adalah algoritma simpleks dengan memanfaatkan matriks (Chen & Wei 2005). Algoritma simpleks terdiri atas dua tahap, yaitu tahap pertama memilih kolom dari � sebagai kolom pivot dan tahap kedua mengganti kolom dari � atau −� sebagai kolom basis atau nonbasis. Solusi yang optimal diperoleh dengan menjalankan kedua tahap tersebut secara iteratif.

Regularisasi Gulud (L2)

(21)

5 multikolinieritas. Pendugaan koefisien regresi gulud dilakukan dengan menambahkan penalti gulud:

=

pada minimisasi jumlah kuadrat galat regresi linier. Dugaan koefisien dapat dituliskan dalam persamaan Lagrange menjadi:

dengan � = banyaknya pengamatan dan � =banyaknya peubah penjelas.

Dengan adanya penalti tersebut, terjadi penyusutan koefisien pada regresi gulud. Besarnya penyusutan dikontrol oleh parameter gulud � . Semakin besar nilai � maka semakin besar penyusutan koefisien yang terjadi hingga mendekati nol. Hasil penduga koefisien gulud tidak equivariant dengan adanya perbedaan skala pada data input, sehingga data perlu dibakukan terlebih dahulu sebelum digunakan (Hastie et al. 2008).

Seperti halnya pada regresi linier, penalti juga dapat ditambahkan pada regresi kuantil untuk mengatasi masalah miltikolinieritas. Dugaan koefisien pada regresi kuantil dengan penalti gulud dituliskan sebagai berikut:

= argmin

Penyelesaian dari permasalahan optimasi tersebut dapat diselesaikan secara numerik menggunakan pemrograman linier.

Regularisasi Lasso (L1)

Least Absolute Shrinkage and Selection Operator (lasso) adalah salah satu metode penyusutan seperti gulud yang dapat mengatasi permasalahan multikolinieritas yang diperkenalkan oleh Tibshirani (1996). Pendugaan koefisien pada regresi dengan lasso didefinisikan sebagai:

= argmin

Dugaan koefisien regresi dengan menggunakan lasso dapat dituliskan dalam bentuk persamaan Lagrange menjadi: dalam , sehingga tidak dapat diperoleh solusi secara tertutup seperti pada gulud. Dalam hal ini diperlukan pemrograman kuadratik. Berbeda dengan gulud,

(22)

6

regularisasi lasso melakukan seleksi peubah penjelas yang saling berkorelasi, karena nilai yang cukup kecil dapat menyebabkan koefisien bernilai nol (Hastie

et al. 2008). Hal tersebut menyebabkan lasso dapat menghasilkan model dengan peubah penjelas yang lebih sedikit (parsimoni).

Gambar 2 memberikan ilustrasi tentang penalti lasso dalam membuat nilai koefisien menjadi 0 pada � = . ̂ adalah nilai dugaan dari metode kuadrat terkecil dan garis elips merah adalah fungsi galat kuadrat terkecil. Daerah penalti untuk lasso | | + | | memiliki bentuk belah ketupat, sedangkan daerah penalti untuk gulud + memiliki bentuk lingkaran. Belah ketupat memiliki sudut, maka ketika elips menyentuh sudut tersebut berarti salah satu koefisien bernilai 0. Lingkaran tidak memiliki sudut, sehingga elips menjadi lebih sulit bersinggungan dengan daerah kendala pada titik 0. Ketika � > , maka kendala lasso memiliki sudut lebih banyak sehingga peluang suatu koefisien bernilai 0 lebih besar.

Pada regresi kuantil dengan regularisasi lasso, penduga koefisien dituliskan sebagai berikut:

Regularisasi lasso seperti yang telah dipaparkan memiliki beberapa kekurangan, antara lain (Zou & Hastie 2005):

1. Ketika � > �, maka lasso hanya memilih � peubah yang diikutkan dalam model.

2. Jika ada sekumpulan peubah dengan korelasi tinggi, maka lasso hanya sembarang memilih salah satu peubah saja.

3. Ketika � < �, kinerja lasso lebih didominasi oleh gulud (Tibshirani, 1996).

Zou dan Hastie (2005) memperkenalkan penalti elastic-net sebagai berikut: Gambar 2 Pendugaan koefisien untuk lasso (kiri) dan gulud (kanan)

(23)

7

elastic-net menjadi penalti lasso. Pada regularisasi elastic-net terdapat penyusutan koefisien bersama dari peubah-peubah penjelas yang berkorelasi seperti gulud dan seleksi peubah seperti lasso (Hastie et al. 2008). Ilustrasi penalti gulud, lasso, dan elastic-net disajikan pada Gambar 3.

Penduga koefisien pada regresi kuantil regularisasi elastic-net adalah: = argmin

Algoritma Semismooth Newton Coordinate Descent (SNCD)

Beberapa algoritma optimasi dapat digunakan untuk menyelesaikan permasalahan dalam pendugaan parameter pada regresi kuantil dengan regularisasi elastic-net (termasuk regularisasi lasso dan gulud pada kasus khusus ketika bernilai 0 atau 1). Congrui Yi dan Jian Huang pada tahun 2015 mengombinasikan algoritma semismooth Newton dan coordinate descent untuk menyelesaikan permasalahan tersebut, yang dikenal dengan nama algoritma

Semismooth Newton Coordinate Descent (SNCD).

Algoritma semismooth Newton telah dibuktikan dapat mecapai kondisi yang konvergen, namun penerapannya pada data berdimensi tinggi dapat membutuhkan waktu yang cukup lama. Algoritma coordinate descent telah terbukti efektif untuk permasalahan optimasi pada model regresi berdimensi tinggi, namun tidak ada jaminan akan tercapai kondisi yang konvergen dalam iterasinya. Algoritma SNCD menerapkan algoritma semismooth Newton pada setiap iterasi pada coordinate descent. Dengan demikian, algoritma SNCD dapat mencapai kondisi yang Gambar 3 Wilayah penalti regularisasi untuk � = . penalti gulud,

penalti lasso, dan penalti elastic-net pada = .5.

Sumber: Zou & Hastie (2005)

(24)

8

konvergen dan lebih cepat dibandingkan algoritma semismooth Newton (Yi & Huang 2015).

Permasalahan optimasi regresi kuantil dengan regularisasi elastic-net

dengan intersep adalah: pengamatan, dan � = banyaknya peubah penjelas.

Kondisi Karush-Kuhn-Tucker (KKT) dapat digunakan untuk memperoleh solusi optimal dari suatu permasalahan optimasi konveks. Perumusan ulang kondisi KKT untuk permasalahan optimasi regresi kuantil dengan regularisasi

elastic-net adalah sebagai berikut:

dengan � adalah turunan pertama dari fungsi � dan �| | menunjukkan subgradien dari nilai mutlak , yaitu

�| | = {[− , ], jika | | = .{sign }, jika | | ≠

Kondisi KKT yang terakhir dari permasalahan tersebut dapat dituliskan kembali dengan soft-thresholding operator sebagai berikut:

�� ⟺ = Prox� +

dengan menggunakan nilai threshold 1, maka soft-thresholding operator menjadi:

Prox|.| = = sign | | − +

sehingga �| | ⇔ − ( + ) = .

Misalkan � �′ , ∀ ℝ (turunan Newton dari � ) dan dugaan koefisien terakhir adalah �̃ = ( ̃ , �̃, �̃) dengan sisaan ̃ = − ̃ − �′�̃. Nilai dugaan koefisien diperoleh dengan menetapkan dan� pada nilai tertentu.

(i) Nilai dugaan baru untuk diperoleh dengan menganggap semua koefisien bernilai tetap kecuali , sehingga kondisi KKT menjadi:

− �∑�( − − �′�̃) menggunakan SNA untuk diberikan sebagai berikut:

← ̃ +∑�= � ̃

∑� � ̃

(25)

9 (ii) Nilai dugaan baru untuk dapat dilakukan dengan menganggap semua

peubah sebagai konstanta kecuali dan , sehingga kondisi KKT menjadi:

{ Selanjutnya, penduga koefisien dapat diperoleh dengan memisalkan

= [ ] , = [− � ∑ �( ̃ + ̃ − )

Algoritma pendugaan nilai koefisien pada regresi kuantil regularisasi

elastic-net dapat dituliskan sebagai berikut:

(a) Tentukan nilai awal ̃ , �̃, dan�̃ �‖�̃‖, untuk = . koefisien dan selesai diperbarui.

(26)

10

Validasi Silang

Validasi silang (cross validation - CV) adalah salah satu metode yang dapat digunakan untuk memperoleh nilai parameter dari metode regularisasi. Geisser (1975) mendeskripsikan secara umum bahwa CV dilakukan dengan mengambil rata-rata dari sejumlah penduga yang dihasilkan dari bagian data yang ditahan (Arlot & Celisse, 2010). Pada CV, data dibagi menjadi dua kelompok, yaitu data pemodelan dan data validasi. Pengelompokkan data pemodelan dan data validasi dilakukan secara acak, dan setiap pengamatan memiliki peluang yang sama menjadi data validasi.

-fold cross-validation adalah bentuk umum dari CV. Pada -fold cross-validation data dibagi menjadi bagian dengan ukuran sama, umumnya nilai yang digunakan adalah 5 atau 10 (James et al. 2013). Pemodelan pertama dilakukan dengan bagian pertama digunakan untuk validasi dan − bagian selanjutnya digunakan untuk pemodelan. Dari pemodelan tersebut diperoleh dugaan koefisien model dan galat (MSE) yang dihitung dari data validasi. Selanjutnya pemodelan kedua dilakukan dengan bagian data kedua untuk validasi dan − bagian lainnya digunakan untuk pemodelan. Hal yang sama terus dilakukan hingga − bagian awal dari data digunakan untuk pemodelan dan bagian terakhir digunakan untuk validasi. Cross validation error (CVE) adalah rata-rata dari semua nilai MSE yang diperoleh.

Dalam pemilihan parameter regularisasi, CVE adalah : � � = � ∑ � Kabupaten Indramayu pada tahun 1981 sampai dengan 2013 sebagai peubah respon dan data presipitasi GCM dari Climate Model Intercomparison Project

(27)

11 Prosedur Analisis Data

Langkah-langkah yang dilakukan dalam menganalisis data untuk prediksi curah hujan ekstrim adalah sebagai berikut:

1. Eksplorasi data dengan statistik deskriptif dan membuat diagram pencar data curah hujan maupun data GCM pada masing-masing grid untuk melihat karakteristik dan pola data, serta menghitung besarnya korelasi antara kedua data tersebut.

2. Menentukan pergeseran waktu data GCM terhadap data curah hujan dengan menggunakan Cross Correlation Function (CCF). Hal tersebut dilakukan untuk memperoleh data lag GCM yang memiliki korelasi lebih kuat dengan data curah hujan (Wigena, 2015). CCF dapat dihitung dengan rumus:

= �

dengan � adalah koragam dari dan pada lag ke- , adalah simpangan baku dari , dan adalah simpangan baku dari .

3. Membagi data menjadi dua bagian, yaitu data pemodelan (tahun 1981-2012) dan data validasi (tahun 2013).

4. Melakukan pemodelan SD dengan regresi kuantil pada data pemodelan menggunakan regularisasi gulud dan elastic-net. Pemodelan dilakukan menggunakan data baku curah hujan sebagai peubah respon dan data baku lag GCM sebagai peubah penjelas dengan langkah-langkah sebagai berikut: a. Memilih nilai parameter regularisasi (gulud/elastic-net) yang

optimum. Pemilihan parameter tersebut dilakukan dengan menggunakan CV untuk setiap nilai �, nilai lambda yang dipilih adalah yang menghasilkan CVE minimum.

b. Membuat model regresi kuantil menggunakan lambda optimum yang terpilih. Terdapat tiga model yang dibuat berdasarkan nilai kuantil atas yang mewakili nilai ekstrim, yaitu pada kuantil ke-0.75, ke-0.90, dan ke-0.95.

5. Membandingkan hasil prediksi pada data validasi dari model yang diperoleh pada langkah keempat dengan nilai-nilai kuantil aktual data dan mengukur kebaikan model dengan menghitung korelasi antara nilai aktual dengan nilai prediksi dan RMSEP validasi menggunakan formula:

= √�∑ − ̂

=

Model terbaik adalah model yang memiliki nilai korelasi terbesar dan nilai RMSEP validasi terkecil.

(28)

12

4

HASIL DAN PEMBAHASAN

Eksplorasi Data Curah Hujan

Data curah hujan di Kabupaten Indramayu pada tahun 1981-2013 menunjukan bahwa rata-rata curah hujan bulanan adalah 127,19 mm/bulan dengan simpangan baku 107,47 mm/bulan. Nilai curah hujan tertinggi terjadi pada Bulan Januari tahun 2006 yaitu sebesar 498 mm/bulan dan nilai curah hujan terendah sebesar 0 mm/bulan. Hal tersebut menunjukkan besarnya keragaman curah hujan yang terdapat di Kabupaten Indramayu, dengan nilai yang sangat ekstrim dari nilai rata-ratanya.

Pola curah hujan bulanan ditunjukkan oleh Gambar 4. Pada gambar tersebut terlihat bahwa curah hujan dalam setahun memiliki pola menyerupai huruf U, sehingga curah hujan yang tinggi terdapat pada awal dan akhir tahun, yang menunjukkan musim hujan. Musim kemarau ditunjukkan oleh curah hujan yang rendah dan terjadi pada pertengahan tahun. Curah hujan ekstrim banyak terjadi pada Bulan Januari dan Desember.

Tabel 1 menyajikan statistika deskriptif curah hujan bulanan. Bulan Januari memiliki nilai rataan dan simpangan baku curah hujan tertinggi, yaitu sebesar 263,36 mm/bulan dan 112,92 mm/bulan. Hal tersebut menunjukkan bahwa pada Bulan Januari sering terjadi curah hujan yang cukup tinggi (ekstrim) dengan keragaman curah hujan yang tinggi pula, sesuai dengan pola pada Gambar 4. Curah hujan ekstrim dan keragaman tertinggi kedua terjadi pada Bulan Desember, yaitu sebesar 225,61 mm/bulan dan 92,16 mm/bulan.

Kriteria bulan basah menurut klasifikasi tipe iklim yang digunakan oleh BMKG adalah apabila curah hujan pada satu bulan di atas 200 mm dan bulan kering adalah apabila curah hujan pada satu bulan di bawah 100 mm. Curah hujan di antara 100 mm sampai 200 mm dikategorikan sebagai bulan lembab. Nilai rataan curah hujan per bulan pada Tabel 1 menunjukkan bahwa rata-rata Kabupaten Indramayu mengalami bulan basah pada Bulan Januari, Februari, dan Desember, bulan lembab pada Bulan Maret, April, Mei, dan November, bulan kering pada Bulan Juni sampai Oktober.

(29)

13

Pergeseran Waktu Data Presipitasi GCM

Pergeseran waktu (time lag) untuk data presipitasi GCM dilakukan untuk meningkatkan korelasi data tersebut dengan data curah hujan. Jeda (lag) yang tepat dapat ditentukan dengan menghitung korelasi silang antara data presipitasi GCM dengan data curah hujan menggunakan Cross Correlation Function (CCF), yaitu memilih nilai CCF yang tertinggi.

Dari hasil perhitungan CCF diperoleh hasil bahwa beberapa peubah data presipitasi GCM perlu digeser untuk memperoleh korelasi yang lebih kuat dengan data curah hujan, namun ada juga yang tidak perlu dilakukan pergeseran. Pergeseran waktu untuk data presipitasi GCM dan korelasi sebelum dan setelah pergeseran tersebut diberikan pada Lampiran 1. Secara keseluruhan, terjadi peningkatan korelasi rata-rata 62,69% pada peubah presipitasi GCM terhadap curah hujan.

Peubah presipitasi GCM X21, X51, dan X60 memiliki korelasi tertinggi dengan peubah curah hujan pada time lag ke-1. Sebagai contoh, Gambar 5 menunjukkan pola dari perilaku peubah GCM X21 sebelum digeser dan sesudah digeser 1 periode. Dari kedua gambar tesebut terlihat bahwa peubah GCM X21 yang telah digeser 1 periode memiliki pola yang sama dengan data aktual curah hujan pada Gambar 4. Interpretasi dari time lag tersebut berarti perilaku curah hujan pada bulan sekarang dipengaruhi oleh perilaku presipitasi GCM X21 pada satu bulan sesudahnya.

Regresi Kuantil

Regresi kuantil dapat digunakan untuk melihat perilaku data pada berbagai nilai kuantil sebaran data. Oleh karena itu, regresi kuantil dapat digunakan untuk pemodelan curah hujan ekstrim, yaitu pada kuantil ke-0.75, ke-0.90, dan ke-0.95. Namun, data GCM memiliki korelasi yang tinggi antar-grid, menyebabkan adanya

Tabel 1 Statistika deskriptif curah hujan (mm/bulan) Kabupaten Indramayu tahun 1981-2013

Bulan Rataan Simpangan Baku Nilai Maksimum Nilai Minimum

(30)

14

multikolinieritas pada model. Regularisasi gulud dan elastic-net dapat diterapkan pada model regresi kuantil untuk mengatasi permasalahan tersebut. Pemodelan dilakukan menggunakan software R dengan package‘hqreg’.

Gambar 6 menunjukkan plot curah hujan dengan nilai kuantil 0.75, ke-0.90, dan ke-0.95. Nilai kuantil ke- � menunjukkkan suatu nilai dalam sebaran data yang membatasi � data bagian bawah dan − � data bagian atas. Oleh karena itu, biasanya nilai kuantil 0.90 lebih tinggi daripada nilai kuantil ke-0.75. Begitu pula nilai kuantil ke-0.95 lebih tinggi daripada nilai kuantil ke-0.90 dan ke-0.75. Nilai-nilai kuantil tersebut disajikan pada Lampiran 2.

Gambar 6 Data curah hujan dengan beberapa nilai kuantil. kuantil ke-0.95, kuantil ke-0.90, kuantil ke-0.75

(31)

15 untuk membentuk model regresi kuantil gulud. Tabel 2 menyajikan nilai-nilai � hasil CV dan RMSEP pemodelan dari model menggunakan nilai � tersebut pada data pemodelan, yaitu data tahun 1981-2012. Pada kuantil yang semakin tinggi nilai � semakin kecil, berarti pada kuantil yang semakin tinggi penyusutan yang terjadi pada nilai koefisien model semakin kecil. Hasil CV pada kuantil-75 secara lengkap diberikan pada Lampiran 3.

Model yang telah terbentuk menggunakan data pemodelan tersebut selanjutnya digunakan untuk memprediksi data validasi, yaitu data tahun 2013. Nilai prediksi curah hujan tahun 2013 yang diperoleh dari model regresi kuantil gulud dengan nilai kuantil ke-0.75, ke-0.90, dan ke-0.95 disajikan pada Tabel 3.

Regresi Kuantil Elastic-net

Pada regresi kuantil elastic-net terdapat dua penalti yang digunakan, yaitu penalti lasso (∑| |) dan penalti gulud (∑ ). Pada persamaan (2), terlihat bahwa parameter untuk penalti lasso adalah � × sedangkan parameter untuk penalti gulud adalah � × − , dengan , .

Tabel 3 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi kuantil gulud

Bulan Nilai Prediksi pada Kuantil ke-

0.75 0.90 0.95

Tabel 2 Nilai parameter gulud optimum hasil CV dan RMSEP pemodelan Kuantil ke- Lambda � CVE RMSEP pemodelan

0.75 1.12×10-2 22.88 18.42

0.90 0.44×10-2 13.23 22.86

(32)

16

Nilai-nilai dan � yang akan digunakan ditentukan melalui CV. Tahapan awal CV untuk menentukan parameter elastic-net adalah memilih nilai � optimum yang menghasilkan CVE terkecil untuk setiap nilai , . Nilai yang digunakan pada penelitian ini adalah = . , . , … , .9. Selanjutnya, nilai parameter yang digunakan pada model regresi kuantil elastic-net adalah pasangan nilai dan � yang menghasilkan CVE terkecil. Nilai-nilai pasangan parameter tersebut terdapat pada Lampiran 4.

Hasil CV yang dilakukan untuk model regresi kuantil elastic-net

menunjukkan bahwa nilai parameter untuk penalti lasso lebih besar daripada nilai parameter untuk penalti gulud. Nilai dan � optimum yang diperoleh dari CV pada data pemodelan, nilai parameter lasso � maupun gulud �[ − ] , serta nilai RMSEP pemodelan pada model yang dibentuk dengan data pemodelan disajikan pada Tabel 4. Tabel tersebut menunjukkan bahwa parameter untuk lasso bernilai lebih besar, berarti kontribusi lasso pada model yang terbentuk lebih besar daripada kontribusi gulud. Nilai RMSEP pemodelan yang diperoleh dari model regresi kuantil elastic-net juga lebih kecil daripada nilai RMSEP pemodelan dari model regresi kuantil gulud.

Model yang telah terbentuk tersebut selanjutnya digunakan untuk prediksi pada data validasi tahun 2013. Nilai prediksi curah hujan bulanan pada tahun 2013 dari model yang dibangun dengan nilai-nilai parameter hasil CV tersebut dengan kuantil ke-0.75, ke-0.90, dan ke-0.95 disajikan pada Tabel 5.

Tabel 4 Nilai parameter elastic-net optimum hasil CV dan RMSEP pemodelan Kuantil

Tabel 5 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi kuantil elastic-net

Bulan Nilai Prediksi pada Kuantil ke-

(33)

17 Pemilihan Model Terbaik

Dari model regresi kuantil gulud dan kuantil elastic-net yang diperoleh sebelumnya dapat ditentukan model mana yang lebih baik dalam melakukan prediksi untuk curah hujan ekstrim. Kebaikan model dapat diukur dengan menghitung RMSEP validasi dan korelasi antara nilai dugaan curah hujan dan nilai kuantil aktual data curah hujan per bulan dari data validasi. Perbandingan RMSEP validasi dari kedua model disajikan pada Gambar 7. Gambar tersebut menunjukkan bahwa nilai RMSEP validasi yang dihasilkan oleh model regresi kuantil elastic-net lebih rendah dari pada nilai RMSEP validasi yang dihasilkan oleh model regresi kuantil gulud pada kuantil ke-0.75 dan kuantil ke-0.90, namun pada kuantil ke-0.95 nilai RMSEP validasi pada model regresi kuantil elastic-net

sedikit lebih tinggi daripada nilai RMSEP validasi pada model regresi kuantil gulud meskipun tidak nyata. Hal tersebut berbanding lurus dengan nilai RMSEP pemodelan yang diperoleh dari model pada subbab sebelumnya, yaitu model regresi kuantil elastic-net memberikan nilai sisaan yang lebih kecil daripada model regresi kuantil gulud.

Perbandingan korelasi dari kedua model terdapat pada Gambar 8. Gambar tersebut menunjukkan bahwa korelasi antara nilai aktual dengan nilai prediksi yang dihasilkan oleh kedua model sangat tinggi, yaitu berada pada kisaran 0.99. Namun, model regresi kuantil elastic-net memberikan korelasi antara nilai aktual dengan nilai prediksi yang lebih tinggi daripada korelasi antara nilai aktual dengan nilai prediksi yang dihasilkan oleh model regresi kuantil gulud pada kuantil

Gambar 7 Nilai RMSEP validasi model pada kuantil 0.75, 0.90, dan ke-0.95. ∎ model regresi kuantil gulud, ∎ model regresi kuantil elastic-net

(34)

18

0.75 dan ke-0.90, namun pada kuantil ke-0.95 model regresi kuantil elastic-net

menghasilkan nilai korelasi yang sedikit lebih rendah meskipun tidak nyata. Hasil yang diperoleh pada Gambar 7 dan Gambar 8 tersebut menunjukkan bahwa model regresi kuantil elastic-net menghasilkan nilai prediksi yang lebih baik daripada model regresi kuantil gulud.

Gambar 9 dan Gambar 10 memperlihatkan bahwa regresi kuantil elastic-net

maupun regresi kuantil guluddapat menduga nilai kuantil dari data aktual dengan sangat baik. Kedua model memberikan nilai prediksi curah hujan dengan pola yang sesuai dengan pola aktualnya, yaitu menyerupai huruf U. Dari kedua gambar tersebut juga terlihat bahwa titik-titik kuantil aktual data berada sangat dekat dengan garis prediksi kuantil hasil pemodelan regresi kuantil gulud maupun regresi kuantil elastic-net. Bahkan, sebagian besar titik kuantil data aktual menempel pada garis prediksi kuantil, baik pada kuantil ke-0.75, kuantil ke-0.9, maupun kuantil ke-0.95.

Pada tahun 2013, curah hujan ekstrim terjadi pada Bulan Januari (323,4 mm/bulan) dan Bulan Desember (345,5 mm/bulan). Sementara pada Bulan Februari curah hujan yang terjadi sangat rendah (63,9 mm/bulan), bahkan lebih

Gambar 9 Plot kuantil data dan nilai dugaan model regresi kuantil elastic-net. kuantil ke-0.95 dugaan, kuantil ke-0.90 dugaan, kuantil ke-0.75 dugaan, ▲ kuantil ke-0.95 dugaan, ♦ kuantil ke-0.90 dugaan, ● kuantil ke-0.75 dugaan.

(35)

19 rendah daripada curah hujan Bulan April (169,5 mm/bulan). Hal tersebut sedikit berbeda dari perilaku curah hujan biasanya (Gambar 4). Meskipun tidak terdapat kejadian besar yang mempengaruhi curah hujan pada Tahun 2013, namun hal tersebut sesuai dengan laporan pada buletin BMKG mengenai analisis curah hujan pada Bulan Februari 2013 dan Bulan April 2013 yang terdapat pada Lampiran 5.

Analisis curah hujan pada Bulan Febuari 2013 dan Bulan April 2013 yang diberikan pada buletin tersebut menunjukkan bahwa pada ZOM 79, yaitu daerah Indramayu timur bagian selatan, sifat curah hujan yang terjadi pada Bulan Februari berada pada kisaran bawah-normal sampai normal. Sedangkan pada Bulan April, sifat curah hujan yang terjadi berada pada kisaran normal sampai atas-normal. Hal tersebut telah sesuai dengan data yang diperoleh.

Plot data curah hujan aktual pada tahun 2013 disajikan pada Gambar 11 dan Gambar 12. Model regresi kuantil gulud dan kuantil elastic-net dapat menduga curah hujan ekstrim pada Bulan Januari dan Bulan Desember dengan cukup baik. Akan tetapi, model regresi kuantil gulud tidak dapat memberikan dugaan yang cukup baik pada Bulan April ketika kejadian curah hujan yang lebih tinggi daripada kondisi normalnya, sedangkan model regresi kuantil elastic-net dapat memberikan nilai dugaan yang cukup baik mendekati nilai aktual. Kejadian curah hujan yang lebih tinggi daripada kondisi normalnya juga terjadi pada Bulan Juni dan Bulan Juli.

Curah hujan pada Bulan Januari dan April diduga dengan cukup baik oleh model pada kuantil ke-0.75, curah hujan pada Bulan Juni dan Desember dapat diduga dengan cukup baik oleh model pada kuantil ke-0.90, sedangkan curah hujan pada Bulan Juli dapat diduga dengan model pada kuantil ke-0.95. Pada

Gambar 12 Nilai prediksi model regresi kuantil elastic-net untuk curah hujan pada tahun 2013 (●).

(36)

20

Bulan Februari, kedua model memberikan dugaan nilai yang sangat jauh dari data aslinya. Hal tersebut dikarenakan curah hujan pada Bulan Februari relatif lebih rendah daripada rata-rata curah hujan Bulan Februari (kondisi normalnya).

Konsistensi Model

Hasil yang telah dijabarkan sebelumnya menunjukkan bahwa hubungan antara peubah curah hujan dan peubah GCM cukup erat (korelasi tinggi). Namun untuk membangun model SD yang baik perlu diperhatikan hal lain, yaitu hubungan antara peubah curah hujan dan GCM tidak berubah dengan adanya perubahan waktu. Untuk mengetahui hal tersebut, perlu dilakukan pendugaan curah hujan pada waktu-waktu yang berbeda.

Nilai RMSEP validasi dan korelasi dari hasil pendugaan pada berbagai waktu yang berbeda (tahun 2013, 2012, 2011, dan 2010) disajikan pada Tabel 6 dan Tabel 7. Pada Tabel 6 terlihat bahwa nilai RMSEP validasi pada kuantil ke-0.75 secara rataan lebih rendah daripada nilai RMSEP validasi pada kuantil ke-90, dan nilai RMSEP validasi pada kuantil ke-90 secara rataan lebih rendah daripada nilai kuantil ke-95. Nilai korelasi yang diberikan pada Tabel 7 juga menunjukkan angka pada kisaran 0.99. Kedua hasil yang diberikan pada kedua tabel tersebut menunjukkan bahwa nilai RMSEP validasi dan korelasi untuk setiap pendugaan curah hujan dari model regresi kuantil gulud dan model regresi kuantil elastic-net

pada berbagai waktu yang berbeda nilainya konsisten. Model regresi kuantil

elastic-net juga memberikan nilai RMSEP validasi yang secara rataan lebih rendah dan nilai korelasi yang secara rataan lebih tinggi daripada model regresi kuantil gulud, sehingga model regresi kuantil elastic-net secara konsisten lebih baik daripada model regresi kuantil gulud.

Tabel 6 Nilai RMSEP validasi model regresi kuantil gulud dan kuantil elastic-net

pada pendugaan curah hujan dalam 1 tahun

Data historis Data dugaan Kuantil ke- RMSEP validasi

(37)

21

5

SIMPULAN

Penelitian ini menghasilkan kesimpulan bahwa regresi kuantil dengan regularisasi gulud dan elastic-net dapat memodelkan curah hujan ekstrim yang baik, karena model tersebut menangkap nilai-nilai curah hujan aktual yang tinggi (ekstrim) seperti pada Bulan Januari dan Bulan Desember. Selain itu, model regresi kuantil yang terbentuk juga dapat menangkap nilai-nilai curah hujan pada bulan tertentu yang jatuh pada kuantil atas dari sebaran data curah hujan bulan tersebut. Nilai RMSEP validasi dan korelasi yang dihasilkan dari pemodelan pada waktu yang berbeda tidak jauh berbeda, sehingga model tersebut juga konsisten.

Model regresi kuantil elastic-net lebih baik dibandingkan model regresi kuantil gulud dalam melakukan prediksi ke depannya. Model regresi kuantil

elastic-net menghasilkan dugaan dengan nilai RMSEP validasi lebih rendah dan korelasi lebih tinggi. Hal tersebut menunjukkan bahwa dengan menambahkan penalti lasso pada model dapat memberikan hasil yang lebih baik daripada hanya menggunakan satu penalti gulud saja pada model.

DAFTAR PUSTAKA

Abraham Z, Xin F, Tan PN. 2011. Smoothed Quantile Regression for Statistical Downscaling of Extreme Events in Climate Modeling. Di dalam: Srivastava AN, Chawla NV, Perera AS. Conference on Intelligent Data Understanding; 2011 Okt 19-21; Mountain View, California. Dashlink. hlm 92-106.

Arlot S, Celisse A. 2010. A Survey of Cross-Validation Procedures for Model Selection. Statistics Surveys 4: 40–79.

Tabel 7 Nilai korelasi model regresi kuantil gulud dan kuantil elastic-net pada pendugaan curah hujan dalam 1 tahun

Data historis Data dugaan Kuantil ke- Korelasi

(38)

22

[BMKG] Badan Meteorologi dan Geofisika Stasiun Klimatologi Klas 1 Dramaga Bogor. 2013. Buletin Analisis Hujan Bulan Februari 2013 dan Prakiraan Hujan Bulan April, Mei, dan Juni 2013. [diunduh 2016 Mei 22]. Tersedia pada: http://www.depok.go.id/berkas-unggah/2013/05/Prak-Jabar-Juni-2013-B.pdf [BMKG] Badan Meteorologi dan Geofisika Stasiun Klimatologi Klas 1 Dramaga

Bogor. 2013. Buletin Analisis Hujan Bulan April 2013 dan Prakiraan Hujan Bulan Juni, Juli, dan Agustus 2013. [diunduh 2016 Mei 22]. Tersedia pada: http://www.depok.go.id/berkas-unggah/2013/04/Prak-Jabar-April-2013-B.pdf [BMKG] Badan Meteorologi dan Geofisika Stasiun Klimatologi Klas 1 Dramaga

Bogor. 2014. Buletin Analisis Hujan Bulan Januari 2014 dan Prakiraan Hujan Bulan Maret, April, dan Mei 2014. [diunduh 2016 Mei 29]. Tersedia pada: http://bogor.jabar.bmkg.go.id/diseminasi/publikasi/

Buhai S. 2005. Quantile Regression Overview and Selected Application. Ad Astra 4. Tersedia pada: www.ad-astra.ro/journal.

Busuioc A, Chen D, Hellstrom C. 2001. Performance of Statistical Downscaling Models in GCM Validation and Regional Climate Change Estimates: Application for Swedish Precipitaion. International Journal of Climatology 21: 557–578

Djuraidah A, Wigena AH. 2011. Regresi Kuantil untuk Eksplorasi Pola Curah Hujan di Kapupaten Indramayu. Jurnal Ilmu Dasar 12(1): 50-56.

Friederichs P. 2010. Statistical Downscaling of Extreme Precipitation Events Using Extreme Value Theory. Meteorological Institute.

Hastie T, Tibshirani R, Friedman J. 2008. The Elements of Statistical Learning. Data Mining, Interfere, and Prediction. Second Edition. Stanford (CA): Springer.

Hoerl AE, Kennard RW. 1970. Ridge Regression, Biased Estimation for Nonorthogonal Problems. Technometrics, 12(1): 55-67.

James G, Witten D, Hastie T, Tibshirani R. 2013. An Introduction to Statistical Learning. With Application in R. Springer New York Heidelberg Dordrecht London.

Koenker R, Bassett G Jr. 1978. Regression Quantiles. Econometrica, 46(1): 33-50.

Koenker R, Hallock KF. 2001. Quantile Regression. Journal of Economic Perspectives 15(4): 143–156.

Koenker R. 2005. Quantile Regression. New York (USA): Cambridge University. Mondiana YQ. 2012. Pemodelan Statistical Downscaling dengan Regresi Kuantil

Untuk Pendugaan Curah Hujan Ekstrim [tesis]. Bogor (ID): Institut Pertanian Bogor.

Refaeilzadeh P, Tang L, Liu H. 2008. Cross Validation. Arizona State University. [diunduh 2016 April 2]. Tersedia pada: leitang.net/papers/ency-cross-validation.pdf

Santri D. 2016. Statistical Downscaling Modeling with Quantile Regression Using Lasso to Estimate Extreme Rainfall. Di dalam: Kusumo FA, Wijayanti IE, Alucius IE, Susanti Y, editor. Proceedings of the 7th SEAMS UGM International Conference on Mathematics and Its Applications 2015: Enhancing the Role of Mathematics in Interdisciplinary Research [Internet].

(39)

23 Sari WJ. 2015. Pemodelan Statistical Downscaling dengan Regresi Kuantil Komponen Utama Fungsional untuk Prediksi Curah Hujan Ekstrim [tesis]. Bogor (ID): Institut Pertanian Bogor.

Soleh AM, Wigena AH, Djuraidah A, Saefudin A. 2015. Pemodelan Statistical Downscaling untuk Menduga Curah Hujan Bulanan Menggunakan Model Linier Terampat sebaran Gamma. Jurnal Informatika Pertanian 24(2): 215-222. Suryanto. 2006. Mensos Serahkan Bantuan bagi Korban Banjir Indramayu.

Antara News [Internet]. [diakses 2016 Jun 15]. Tersedia pada: http://www.antaranews.com/berita/27061/mensos-serahkan-bantuan-bagi-korban-banjir-indramayu.

Tibshirani R. 1996. Regression Shrinkage and Selection via the Lasso. Journal of the Royal Statistical Society Series B, 58(1): 267-288.

Wigena AH. 2006. Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit Untuk Peramalan Curah Hujan Bulanan Kasus Curah Hujan di Indramayu [disertasi]. Bogor (ID): Institut Pertanian Bogor.

Wigena AH, Djuraidah A, Sahriman S. 2015. Statistical Downscaling dengan Pergeseran Waktu Berdasarkan Korelasi Silang. Jurnal Meteorologi dan Geofisika, 16(1): 19-24.

Yang T, Li H, Wang W, Xu CY, Yu Z. 2012. Statistical downscaling of extreme daily precipitation, evaporation, and temperature and construction of future scenarios. Hydrological Processes 26: 3510–3523.

Yi C, Huang J. 2015. Semismooth Newton Coordinate Descent Algorithm for Elastic-Net Penalized Hubel Loss and Quantile Regression. [diunduh 2016 Mei 21]. Tersedia pada: http://arxiv.org/abs/1509.02957

Zorita E, Storch HV. 1999. The Analog Method as a Simple Statistical Downscaling Technique: Comparison with More Complicated Methods.

Journal of Climate 12: 2474-2489.

Zou H, Hastie T. 2005. Regularization and Variable Selection via the Elastic Net.

(40)

24

Lampiran 1 Pergeseran waktu peubah presipitasi gcm dan korelasi sebelum dan sesudah pergeseran terhadap curah hujan

(41)

25 Lampiran 2 Nilai kuantil data curah hujan per bulan

Bulan Nilai Kuantil Data

Kuantil ke-0.75 Kuantil ke-0.90 Kuantil ke-0.95

Januari 349.25 399.87 430.10

Februari 281.33 346.95 356.00

Maret 205.25 285.10 305.87

April 197.50 253.40 262.40

Mei 143.75 164.60 199.30

Juni 93.25 152.10 183.93

Juli 62.25 106.33 117.00

Agustus 29.75 43.00 55.57

September 27.00 45.13 78.25

Oktober 106.50 147.10 165.40

November 194.50 260.30 284.68

Desember 273.25 343.27 371.90

(42)

26

Lampiran 3 Hasil CV untuk regresi kuantil gulud pada kuantil ke-0.75 tahun prediksi 2013

(a) Nilai � dan CVE

� CVE � CVE � CVE � CVE

(43)

27

(44)

28

Lampiran 4 Nilai � optimum pada berbagai nilai dari CV untuk regresi kuantil

(45)

29 Lampiran 5 Peta analisis sifat hujan Bulan Februari 2013 dan Bulan April 2013

Provinsi Jawa Barat

(a) Bulan Februari 2013

(46)

30

(47)

31

RIWAYAT HIDUP

Penulis dilahirkan di Pamekasan pada tanggal 27 November 1990, sebagai anak bungsu dari pasangan M. Kusnadi dan Puji Mulyati. Penulis menikah dengan Dorit Bayu Islam Nuswantoro pada tahun 2016. Pendidikan sekolah menengah ditempuh di SMA Negeri 1 Blitar Program Ilmu Alam, lulus pada tahun 2008. Pada tahun yang sama penulis diterima di Program Studi Matematika Universitas Indonesia Depok dan menyelesaikannya pada tahun 2012.

Setelah lulus, penulis bekerja di PT Asuransi Jiwa InHealth Indonesia sebagai staf aktuaria. Pada tahun 2014, penulis melanjutkan studi di Sekolah Pascasarjana IPB dengan Program Studi Statistika. Penulis mempublikasikan hasil

Referensi

Dokumen terkait

Model linier sebaran pareto terampat memberikan nilai RMSE yang lebih besar pada pendugaan rataan curah hujan bulanan di atas nilai ambang, dibanding dengan model linier

Prediksi data curah hujan untuk waktu satu tahun sampai dengan lima tahun ke depan akan dilakukan menggunakan model SD parametrik-3 setelah ditambahkan peubah

Model M4 memberikan hasil prediksi curah hujan ekstrim yang lebih baik bila dibandingkan dengan penelitian sebelumnya yang dilakukan Sari (2015) yaitu model SD berbasis

Model regresi kuantil yang terpilih digunakan untuk memprediksi curah hujan ekstrim, dan disimpulkan bahwa prediksi curah hujan ekstrim yang dihasilkan menunjukkan

Prediksi rata-rata curah hujan bulanan tahun 2008 diperoleh menggunakan model SD dengan Regresi Linier Peubah Ganda. Ukuran kebaikan prediktor dalam memprediksi curah

Dengan ini saya menyatakan bahwa tesis berjudul Pengembangan Prediksi Regresi Gerombol Sebaran Gamma pada Statistical Downscaling Untuk Pendugaan Curah Hujan Harian

Nilai RMSEP dari kelima model pendugaan data curah hujan dengan penambahan peubah dummy rata-rata cenderung lebih kecil dan korelasi yang lebih besar dibandingkan

Model M4 memberikan hasil prediksi curah hujan ekstrim yang lebih baik bila dibandingkan dengan penelitian sebelumnya yang dilakukan Sari (2015) yaitu model SD berbasis