• Tidak ada hasil yang ditemukan

PENDAHULUAN. 1.1 Latar Belakang

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENDAHULUAN. 1.1 Latar Belakang"

Copied!
21
0
0

Teks penuh

(1)

1.1 Latar Belakang

Indonesia berada di wilayah tropis dengan intensitas curah hujan yang tinggi terutama di daerah dataran tinggi. Frekuensi curah hujan dapat menimbulkan berbagai peristiwa ekstrim, misalnya hujan, banjir, bahkan kekeringan. Peristiwa ekstrim tersebut akan berdampak pada kualitas dan kuantitas produksi hasil tani. Oleh karena itu, sangat penting untuk menduga potensi curah hujan khususnya pada sektor pertanian. Curah hujan merupakan salah satu sumber penyediaan air bagi tanaman sehingga untuk mendapatkan informasi mengenai curah hujan, digunakan data Global Climate Models (GCM).

Data GCM saat ini dikenal sebagai data yang berhubungan dengan sistem iklim tetapi hasilnya yang tidak memadai karena sifatnya berskala global sehingga sulit untuk mendapatkan informasi berskala lokal untuk menduga curah hujan. Salah satu upaya untuk mengatasi masalah ini adalah dengan teknik statistical downscaling (SDS). Metode SDS adalah salah satu metode untuk menduga curah hujan dengan menghubungkan unsur iklim berskala global yang diperoleh dari data luaran GCM dengan unsur iklim berskala lokal melalui stasiun klimatologi. Data luaran GCM umumnya tersedia dalam bentuk grid-grid yang terletak di dalam domain. Model SDS tersusun atas peubah kovariat dengan skala yang besar dan tidak saling bebas (Soleh et al. 2015).

Permasalahan yang muncul dalam SDS adalah menentukan domain (Sutikno et al. 2010). Domain dijadikan sebagai prediktor yang berdimensi banyak yang kemungkinan terjadi curse of dimensionality, korelasi spasial antar grid dalam domain dan multikolinieritas antar peubah (Wigena 2006). Kasus multikolinieritas ini menyebabkan ragam dugaan koefisien meningkat sehingga diperlukan metode untuk mengatasinya. Model-model SDS saat ini yang berkembang untuk mengatasi multikolinieritas adalah regresi komponen utama (RKU) (Wigena dan Djuraidah 2014), regresi kuadrat terkecil parsial (RKTP) (Wigena 2011), dan regresi kontinum (RK/continuum regression) (Sutikno et al. 2010). Menurut Setiawan (2007), RK merupakan generalisasi dari regresi kuadrat terkecil (RKT), RKU, dan RKTP. Hasilnya menunjukkan bahwa RK menghasilkan dugaan yang lebih baik dari pada RKU dan RKTP.

Permasalahan dalam SDS selain menentukan domain adalah reduksi dimensi untuk mendapatkan peubah prediktor yang mampu menjelaskan keragaman peubah respon (Sutikno et al. 2010). Oleh karena itu, diperlukan suatu metode pemrosesan untuk mengatasi masalah tersebut. Metode pra-pemrosesan yang seringkali digunakan adalah analisis komponen utama (AKU), transformasi wavelet diskret (TWD), dan Least Absolute Shrinkage and Selection Operator (LASSO). Sutikno et al. (2010) menggunakan RK dengan pra-pemrosesan AKU untuk mengatasi multikolinieritas. Model ini menunjukkan hasil yang lebih baik daripada RKU dan RKTP. Pemodelan SDS menggunakan RK juga dilakukan oleh Setiawan (2007) dengan pra-pemrosesan TWD dan menunjukkan potensi sangat baik untuk mengatasi masalah tersebut.

Salah satu masalah dalam RK adalah jumlah pengamatan yang jauh lebih kecil daripada banyaknya peubah prediktor (݊ ا ݌) sehingga diperlukan metode

(2)

2

pemrosesan dalam bentuk pereduksian dimensi peubah prediktor. Selain pra-pemrosesan AKU dan TWD, pra-pra-pemrosesan LASSO menyusutkan koefisien penduga tepat nol sehingga dapat melakukan seleksi peubah (Hastie et al. 2008). Soleh dan Aunuddin (2013) memberikan solusi alternatif seleksi peubah dan penyusutan koefisien model regresi linier menggunakan LASSO. Hasilnya menunjukkan bahwa LASSO memberikan suatu alternatif bagi penyeleksian peubah dan menempatkan LASSO dalam memberikan kekonsistenan hasil pendugaan pada semua kondisi yang lebih baik dibandingkan dengan metode forward selection. Metode LASSO dapat memberikan akurasi prediksi yang sangat baik dan meningkatkan interpretabilitas model (Fonti 2017).

1.2 Tujuan Penelitian

Tujuan penelitian ini adalah sebagai berikut.

1. Memodelkan statistical downscaling menggunakan regresi kontinum dengan seleksi LASSO untuk pendugaan curah hujan.

2. Membandingkan model yang dihasilkan dengan model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan forward selection. 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 praaaa pemmmm pe pe pe pe pe pe pe pe pe pe pe pe pe pe pe p p p pe pe p p p pe pe pe p pe pe p pe pe p p p p nnnnnnnnnnnnn Sollllllllllllllllllllllll pe p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p nnnn m me m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m nnnn p p p p p p p p pe pe pe p p p p p pe p p p p pe p p p p p p pe p p p p p p p p p p p p p p p p p p p p uuuu pe pe pe p pe p p p p pe p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p pe p p p p p p p p p p nnnn fo fo fo f fo fo f fo fo fo fo fo fo fo f f fo fo fo fo fo f f f f fo f f fo f f f f f f f f f fo f f f f f f f f rwwww sa sa sa s sa sa s sa sa sa s sa sa sa sa sa sa s sa sa sa s s s sa sa sa s sa sa s s sa s s sa sa sa s sa sa sa s sa s sa s sa s sannnn 1 1 1 1 1 1 1 1 1. 1. 1. 1. 1 1. 1 1 1 1 1. 1 1. 1 1 1 1 1 1 1 1 1 1. 1 1 1 1 1 1 1 1 1 1 1 12 T T T T T T Tu T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T jjjj

(3)

II TINJAUAN PUSTAKA

2.1 Statistical Downscaling

Domain GCM terdiri atas grid yang menunjukkan bahwa data GCM merupakan salah satu bentuk data spasial yang berkaitan dengan keruangan. GCM mempresentasikan perubahan iklim global tidak secara lokal, untuk itu diperlukan teknik untuk menduga peubah perubahan iklim dengan skala lokal. Data GCM memiliki karakteristik yang berdimensi tinggi, non-linier, dan terdapat multikolinieritas (Wigena 2006, Auffhammer et al. 2011). Salah satu teknik yang dikembangkan untuk meningkatkan kinerja model adalah teknik downscaling, yaitu proses yang dapat digunakan untuk transformasi hasil simulasi GCM pada skala global ke skala lokal. Teknik downscaling bermanfaat untuk mengetahui hubungan fungsional antara peubah skala global dengan peubah skala lokal dan menduga nilai peubah dalam interval waktu tertentu berdasarkan sirkulasi atmosfer skala global.

Skema downscaling ditampilkan seperti pada Gambar 1. Teknik SDS merupakan salah satu teknik yang dapat digunakan untuk menduga perubahan iklim dari skala global ke skala lokal. Pemilihan peubah prediktor dan penentuan domain (lokasi dan jumlah grid) merupakan faktor kritis yang akan mempengaruhi kestabilan peramalan. Model SDS memberikan hasil yang baik dengan syarat, a) hubungan erat antara respon dengan prediktor yang menjelaskan keragaman iklim lokal dengan baik, b) peubah prediktor disimulasi baik oleh GCM dan c) hubungan antara respon dengan perubahan waktu dan tetap sama meskipun ada perubahan iklim (Busuioc et al. 2010).

Gambar 1 Skema downscaling (Fadhli 2019) Bentuk umum model SDS adalah sebagai berikut

࢟ ൌ ݂ሺࢄሻ dengan :

y : peubah skala lokal atau respon berupa vektor ukuran ൈͳ X : peubah skala global atau prediktor berupa matriks ukuranൈ’ n : periode waktu

(4)

4

2.2 Regresi Kontinum

Regresi kontinum merupakan salah satu metode yang digunakan untuk mengatasi multikolinieritas (Sutikno et al. 2010). Multikolinieritas adalah kondisi terdapatnya hubungan linier atau korelasi yang tinggi antara masing-masing peubah prediktor dalam model regresi. Misalkan X adalah matriks dari data peubah prediktor yang berukuran ሺ݊ ൈ ݌ሻ dan y adalah vektor peubah respon berukuran (n×1) . Regresi kontinum dikembangkan berdasarkan model regresi linier klasik dengan parameter regresi ࢼ berukuran ሺ݌ ൈ ͳሻ. Secara matematis dapat dinyatakan dalam Persamaan (1) berikut:

࢟ ൌ ࢄࢼ ൅ ࢿ૚ (1)

dengan ࢿ adalah vektor galat berukuran (n×1).

Peubah baru (latent) pada regresi kontinum diformulasikan dalam model seperti pada Persamaan (2) berikut:

࢟ ൌ ࢀࣈ ൅ ࢿ (2)

dengan ࢀ ൌ ࢄࢃ dan ࢃ ൌ ሺ࢝ǡ ࢝ǡ ǥ ǡ ࢝ሻ matriks berisi h kolom peubah dengan h<p dan disebut matriks pembobot.

Stone dan Brooks (1990) memformulasikan vektor ࢝௜ሺ݅ ൌ ͳǡʹǡ ǥ ǡ ݄ሻ tersebut seperti pada Persamaan (3) berikut:

࢝௜ ൌ ܽݎ݃݉ܽݔ௪ቄܥ݋ݒሺ࢞࢝ǡ ࢟ሻଶ൫ܸܽݎሺ࢞࢝ሻ൯

ሾఋȀሺଵିఋሻሿିଵ

ቅ (3) dengan kendala ԡwiԡ=1 dan ܥ݋ݒ ቀ࢞࢝࢏ǡ ࢞࢝࢐ቁ ൌ Ͳ untuk ݅ ൏ ݆ ൌ ͳǡʹǡ ǥ ǡ ݄

sedangkan parameter penyesuaian ߜ merupakan bilangan real Ͳ ൑ ߜ ൏ ͳ . Persamaan (2) dapat diperoleh dengan nilai ߜ ൌ ሼ0; 0,5; 1ሽ yang masing-masing merupakan generalisasi dari metode kuadrat terkecil, kuadrat terkecil parsial dan RKU.

Pendugaan parameter ߦ pada Persamaan (2) dilakukan dengan metode kuadrat terkecil yang diformulasikan sebagai berikut:

ࣈ෠ ൌ ሺࢀ்ࢀ௛ሻିଵࢀ௛்ࢅ (4) ࢼ෡ ൌ ࢃሺࢀ்ࢀ௛ሻିଵࢀ௛்ࢅ

ෝ ൌ ࢄࢃࣈ෠ (5)

Penentuan h berdasarkan banyaknya peubah hasil seleksi menggunakan metode LASSO dan forward selection serta proses reduksi dimensi menggunakan metode AKU.

2.3 Least Absolute Shrinkage and Selection Operator

Least Absolute Shrinkage and Selection Operator (LASSO) pertama kali diperkenalkan oleh Tibshirani (1996) yang sangat populer dalam membangun model secara simultan sehingga menghasilkan model yang akurat. LASSO adalah metode penalti alternatif dari metode kuadrat terkecil yang berfungsi dalam penyeleksian peubah dan mengurangi masalah overfitting (Fonti 2017). Ilustrasi metode LASSO ditunjukkan oleh Gambar 2.

4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 2 2 2 2 2 2. 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 22 mennnn terdddd pe pe pe pe p p p p p pe p pe p p p p p p p p p p p p p p p p p pe p p p p p p p p p p p pe p p uuuu p p p p p p p pe pe pe p p p p p pe p p p p pe p p p p p p pe p p p p p p p p p p p p p p p p p p p p uuuu be be be b b b b b b be b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b b rrruu l li li li li l l li l l l l l li li l l l l l l l l l l l l l li l l l l l l l lniiii d d d da d d d d da da d d d d da d d d d d d da d d d d d d d d da da da d d d d d d d d d d d d da d da d d d d da dapppp de de de de d d d d d de de de d d d d d d d d d d de d d d d d d d d d de d d d d d d d de d de d d nnnn s s s se s se se s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s pppp d d d d d d d d de d d nnnn dennnn terssss dennnn sedddd Perrrr merrrr RKKKK kuaaaa Pennnn LAAAA AKKKK 2.3 dipp mo metttt pennnn me me mee me mee me mee me me me meee me me me mee meeeeeeeeeetttt

(5)

Gambar 2 Ilustrasi metode LASSO (Fonti 2017)

Gambar 2 mengilustrasikan tentang penalti LASSO. Hal ini menunjukkan bahwa daerah penalti LASSO dengan ȁߚଵȁ ൅ ȁߚଶȁ  ൑ ߣ memiliki bentuk belah ketupat sehingga penalti LASSO dalam membuat nilai koefisien menjadi 0 ketika ݌ ൌ ʹ. Persamaan normal ࢼ෡ merupakan nilai dugaan dari metode kuadrat terkecil dan garis elips adalah fungsi galat kuadrat terkecil. Jika elips menyentuh sudut pada belah ketupat berarti salah satu koefisien bernilai 0. Jika ݌ ൐ ʹ maka kendala LASSO memiliki sudut lebih banyak sehingga peluang suatu koefisien bernilai 0 semakin besar (Fadhli 2019).

Penduga koefisien yakni βLASSO juga dapat ditulis dalam persamaan Lagrangian seperti pada Persamaan 6 berikut:

ࢼ෡௅஺ௌௌை ൌ ݉݅݊ σ ൫ܻ ௜ െ σ௣௝ୀଵߚ௝ܺ௜௝൯ ଶ ൅ ߣ σ௣௝ୀଵหߚห ௡ ௜ୀଵ Ǣ ߣ ൒ Ͳ (6)

dengan ࢼ ൌ ൫ߚǡ ߚǡ ǥ ǡ ߚ൯்dan ߣ adalah parameter penalti (regularizer) yang mengontrol besarnya penyusutan. Jika ߣ ൌ Ͳ maka maka penduga LASSO memberikan hasil yang sama dengan penduga kuadrat terkecil. Jika λ→∞ maka memaksa semua koefisiennya menjadi nol. Jika ߣ cukup besar maka dugaan koefisiennya akan sama persis dengan nol, sehingga dapat berfungsi sebagai seleksi peubah. Salah satu cara untuk mencari nilai λ yang optimal adalah dengan menggunakan metode validasi silang atau Cross Validation (CV) dengan nilai CV minimum.

(6)

6

III METODE

3.1 Data

Data yang digunakan dalam penelitian ini adalah data GCM yang dikeluarkan oleh Climate Forecast System Reanalysis (CFSR). Peubah yang digunakan adalah jumlah curah hujan bulanan (precipitation rate) sebagai peubah prediktor mulai dari Januari 2011 sampai dengan Desember 2019. Domain GCM yang digunakan adalah sejumah grid berbentuk persegi berukuran 9 ൈ 9 grid (0.5°ൈ0.5° untuk setiap grid) yang terletak pada -5oLS sampai dengan -9oLS dan 105oBT sampai dengan 110oBT dapat diunduh pada situs https://rda.ucar.edu/. Data CFSR merupakan produk analisis ulang yang mendeskripsikan sebuah interaksi global antara daratan, lautan, dan udara bumi yang diperoleh dari National Centers for Environmental Prediction (NCEP). CFSR dirancang untuk memberikan prediksi yang akurat tentang keadaan domain pada periode tertentu. Domain GCM yang digunakan seperti pada Gambar 3 dengan titik yang berwarna merah merupakan lokasi atau stasiun amatan curah hujan.

(a) (b)

(c)

Gambar 3 Domain GCM stasiun (a) Bandung, (b) Jatiwangi dan (c) Bogor Citeko Data curah hujan lokal sebagai peubah respon yang dikeluarkan oleh Badan Meterologi, Klimatologi dan Geofisika (BMKG) pada periode Januari 2011 sampai dengan Desember 2019. Data BMKG dapat diunduh pada situs http://dataonline.bmkg.go.id dengan stasiun hujan amatan di Jawa barat yaitu di kota Bandung (stasiun Bandung) terletak -6.8oLS dan 107.6oBT, kabupaten Majalengka (stasiun Jatiwangi) terletak -6.7oLS dan 108.2oBT, kabupaten Bogor 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 3.11111111111111111111111111 d d d d d d d d di di di di di d d di d d d d d d d d d d d d d d d d di d d d d d d d d d d dkkkk di di di d d di d d d d d d d d d d di di d d d d d d d d d d d d d d d d d d d d d d d d d d dgguu p p p p p p p pr p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p ee ya y y y y y y ya ya ya ya y y y y y y y y y ya y y y ya y y y y y ya y y y y y y y y y y y y y y y y y y y y y y y y y y y y y y nnnn (0 (0 (0 (0 (0 ( (0 (0 (0 (0 ( (0 (0 (0 (0 (0 (0 (0 ( (0 (00 (00 (0 (0 ( (0 (0 (0 (0 (0 (0 (00 (0 ( ( ( (0 ( ( (0 ( ( .5555 1 1 1 1 1 10 10 10 10 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 10 1 10 1 1 10 1 1 5555 Da D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D D tttt in in in in in in in in in in in in in in in in in i i in in in in in in in i i i in in in i i in in in in i in in in i i i i i i teeee N N N N N N N N Na N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N tttt m m m m me m m m m m m m m m m m m m m m m m m m m m m m m m m mmmm Dommmm merrrr Gaaaaa Meeee sa saaa saaa sa saaaaaa sa saa saaaaamammmmmmmmmmmmmmmmmmmmmmmmmmm ht ht ht ht ht ht ht ht ht ht ht ht ht h httttttptptpttttttttt ko ko ko ko ko ko ko ko ko ko ko ko ko ko ko ko k ko ko ko ko k ko ko ko ko ko ko koo k k ko koo k k ttt M M M M M Ma Maa Ma M M M M M M M M M M M M M M M M M M M M M M M M jjj

(7)

(stasiun Bogor) terletak -6.5oLS dan 106.7oBT serta kota Bogor (stasiun Citeko) terletak -6.7oLS dan 106.8oBT. Stasiun Bandung terdiri dari 108 data curah hujan, stasiun Jatiwangi terdiri dari 106 data curah hujan, stasiun Bogor terdiri dari 107 data curah hujan dan stasiun Citeko terdiri dari 106 data curah hujan.

3.2 Prosedur Analisis Data

Analisis data dilakukan dengan menggunakan software R 3.5.1. Adapun tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut.

1. Mempersiapkan dan mengeksplorasi data

a. Mengidentifikasi peubah prediktor (data CFSR) yang diperoleh dari data luaran GCM dan peubah respon yang diperoleh dari situs BMKG. Data CFSR yang diunduh adalah data curah hujan bulanan sedangkan data curah hujan lokal data curah hujan harian.

b. Mentransformasi data CFSR dari format netCDF menjadi format RData menggunakan paket ncdf4. NetCDF merupakan format data dari satu set library dalam perangkat lunak untuk mengakses data.

c. Mengkonversi satuan pengukuran data GCM dari kg/m2s menjadi mm/day dengan mengalikan data GCM dengan 86400.

d. Mengkonversi data curah hujan harian menjadi data curah hujan bulanan dengan menghitung jumlah curah hujan setiap bulan pada bulan yang bersesuaian.

e. Menggabungkan peubah respon dan peubah prediktor menjadi data baru. f. Mengeksplorasi data untuk melihat pola sebaran curan hujan stasiun amatan

melalui diagram kotak garis.

g. Membagi data menjadi dua bagian yaitu data pemodelan dan data validasi. Data pemodelan adalah keseluruhan data bulanan kecuali data validasi. Data validasi adalah data curah hujan bulanan dalam periode 12 bulan terakhir. 2. Melakukan seleksi peubah dan pereduksian dimensi

a. Menyeleksi peubah prediktor menggunakan metode LASSO. Algoritma ini tersedia dalam paket glmnet. Glmnet adalah sebuah paket yang menyesuaikan generalized linear model melalui penalized maximum likelihood. Jalur regularisasi dihitung berdasarkan penalti LASSO (nilai lambda). Penyeleksian peubah prediktor didasarkan dengan pemilihan nilai lambda yang optimum dengan nilai validasi silang terkecil. Prosedur dari validasi silang k-fold adalah sebagai berikut (Jung dan Hu 2015):

1. Membagi data secara acak menjadi k bagian atau folds dengan k=1,2,…,K sehingga terbentuk F1,F2,…,Fk.

2. Menggunakan folds K-1 untuk membangun model (training).

3. Model yang diperoleh dari (2) kemudian diduga nilai peubah responnya. 4. Menghitung nilai mean squared error prediction ሺܯܵܧܲሻ dari peubah

respon fold ke-k,

ܯܵܧܲ ൌ ෍ ሺݕ௜ െ ݕෝሻప ଶ ݊௞ ௜אேೖ

dengan ݕෝ adalah nilai dugaan ݕ dan ࣨadalah set data fold ke-k.

5. Mengulangi langkah (2) sampai (4) sebanyak K sehingga diperoleh MSEP1,MSEP2,…,MSEPK.

(8)

8

Setiap model kandidat menghasilkan ukuran kinerja penduga, ܥܸ ൌ ෍ ܯܵܧܲ௞

ܭ ௄

௞ୀଵ

dengan model yang optimal adalah model yang nilai CV terkecil.

b. Mereduksi dimensi data menggunakan AKU. Komponen utama yang dibentuk berdasarkan matriks kovarian ȭ dari vektor acak ்ܺ ሾܺǡ ܺǡ ǥ ǡ ܺሿ dan ȭ memiliki pasangan nilai eigen-vektor eigen ሺɉ1ǡ e1ሻ, ሺɉଶǡ e2ሻǡ ǥ ǡ ൫ɉpǡ e’൯ dengan ɉ1 ൒ ɉ2 ൒ ڮ ൒ ɉp ൒ Ͳ . Kombinasi linier komponen utama dapat ditulis sebagai berikut:

ܼ ൌ ்݁ࢄ ൌ ݁ଵଵܺ൅ ݁ଶଵܺ൅ ڮ ൅ ݁௣ଵܺ ܼ ൌ ݁ࢄ ൌ ݁

ଵଶܺଵ൅ ݁ଶଶܺଶ൅ ڮ ൅ ݁௣ଶܺ௣ ڭ

ܼ ൌ ்݁ࢄ ൌ ݁ଵ௣ܺ൅ ݁ଶ௣ܺ൅ ڮ ൅ ݁௣௣ܺ

dengan Ziadalah komponen utama ke-i, yang memunyai keragaman terbesar ke-i (i=1,2,..,p). Nilai varian Zidan kovarian (ܼ௜ǡ ܼ௞ሻ yaitu:

ܸܽݎሺܼ௜ሻ ൌ ݁௜்ߑ݁௜ ൌ ߣ ܥ݋ݒሺܼǡ ܼሻ ൌ ்݁ߑ݁ ൌ Ͳ

Sehingga, total keragaman yang dapat dijelaskan oleh komponen utama ke-i = ఒ೔

ఒభାఒమାڮାఒ೛. Kika komponen utama utama yang dipilih sebanyak h dengan (h<p) maka keragaman kumulatif yang dapat dijelaskan oleh komponen utama ke-h adalah ఒభାఒమାڮାఒ೓

ఒభାఒమାڮାఒ೛. Proporsi kumulatif keragaman yang dijelaskan oleh h komponen utama minimal 85% yang digunakan dalam penelitian ini.

c. Menyeleksi peubah prediktor menggunakan metode forward selection. Metode ini adalah langkah maju yakni dimulai dengan menghitung model regresi tanpa peubah prediktor. Menghitung nilai korelasi setiap peubah prediktor dengan peubah respon kemudian memilih peubah prediktor berdasarkan urutan nilai mutlak koefisien korelasi terbesar untuk dimasukkan satu demi satu ke dalam model regresi. Penentuan banyaknya peubah hasil seleksi berdasarkan kriteria R2, R2adjdan Mallow’s Cp.

3. Melakukan pemodelan regresi kontinum menggunakan hasil seleksi peubah dan reduksi dimensi. Peubah prediktor yang digunakan merupakan hasil penyeleksian dari metode LASSO dan metode forward selection serta reduksi dimensi menggunakan AKU sehingga terdapat sebanyak ݄ peubah prediktor dengan h<p. Peubah hasil seleksi ini digunakan untuk menduga parameter seperti pada Persamaan (4).

4. Melakukan prediksi berdasarkan model yang diperoleh pada tahap pemodelan seperti pada Persamaan (5) dan melakukan evaluasi model dengan menghitung keakuratan model melalui root mean squared error prediction (RMSEP) dengan formula ܴܯܵܧܲ ൌ ඩͳ ݊෍ሺݕ௜െ ݕො௜ሻ ଶ ௡ ௜ୀଵ

dan korelasi (ݎ) antara curah hujan aktual (ݕ) dengan curah hujan hasil prediksi (ݕො) dengan formula 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 3. MMMMM d d d d d p p p p d d d d d d d d d d s s s s 4. MMMMM s s s s k k k k k d d d d d d d d d d ( ( ( ( (

(9)

ݎ௬೔ǡ௬ො೔ ൌ σ ሺݕ௜ െ ݕതሻሺݕො௜ െ ݕത෠ሻ ௡

௜ୀଵ ටσ௡ ሺݕെ ݕതሻଶ

௜ୀଵ σ௡௜ୀଵሺݕො௜ െ ݕത෠ሻଶ

5. Membandingkan hasil evaluasi pemodelan menggunakan model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan forward selection melalui nilai RMSEP dan korelasi.

6. Menguji konsistensi model berdasarkan nilai RMSEP dan korelasi dengan melakukan prediksi sebanyak empat kali menggunakan empat data validasi berbeda berdasarkan data empat tahun terakhir yaitu tahun 2019, 2018, 2017 dan 2016.

(10)

10

IV HASIL DAN PEMBAHASAN

4.1 Eksplorasi Data

Indonesia secara umum beriklim tropis dengan dua musim yaitu musim penghujan dan musim kemarau. Sebaran curah hujan di setiap daerah di Indonesia bervariasi karena berbagai faktor. Aldrian dan Susanto (2003) membagi pola curah hujan di Indonesia menjadi tiga wilayah yaitu Wilayah A (tipe monsun), Wilayah B (tipe ekuatorial) dan Wilayah C (tipe lokal) (Gambar 4). Gambar 4 menunjukkan bahwa wilayah A meliputi daerah Sumatera, Jawa, sebagian Kalimantan, sebagian Sulawesi dan sebagian Irian dengan pola curah hujan berbentuk huruf U (bersifat unimodal atau satu puncak musim hujan). Wilayah B meliputi daerah Indonesia bagian barat laut dengan pola curah hujan berbentuk huruf M (bersifat bimodal atau dua puncak musim hujan). Wilayah C meliputi daerah Maluku dan sebagian Sulawesi dengan pola curah hujan unimodal (satu puncak hujan) tetapi bentuknya berlawanan dengan tipe hujan monsun.

Gambar 4 Pembagian wilayah curah hujan Indonesia (Aldrian dan Susanto 2003) Daerah Jawa Barat memiliki satu kali rata-rata curah hujan bulanan tertinggi dan satu kali rata-rata curah hujan bulanan terendah. Hal tersebut terjadi karena pengaruh monsun barat terjadi pada November hingga Maret dan monsun timur terjadi pada Mei hingga September. Daerah bertipe hujan monsun secara normal mendapatkan curah hujan yang maksimum di periode Desember-Januari-Februari (DJF) namun saat transisi monsun menunjukkan data curah hujan bulanan menunjukkan nilai maksimum kedua selama periode Maret-April-Mei (MAM). Fauzi (2014) menyatakan bahwa curah hujan maksimum di Pulau Jawa tidak dapat didefinisikan seragam terjadi selama periode DJF karena beberapa daerah juga memiliki curah hujan maksimum selama transisi monsun di periode MAM.

Pola data curah hujan stasiun di Jawa Barat dapat diketahui dengan melakukan eksplorasi data. Eksplorasi data curah hujan menggunakan data bulanan pada periode 2011 sampai 2019 untuk setiap lokasi stasiun amatan. 1 1 1 1 10 1 1 1 1 1 1 1 1 1 1 1 1 1 1 4.11111111111111111111111111 p p p p p pe pe pe p p p p pe p p p p pe pe p p p p p p pe p p p p p p p p p p p p p p p p p p p p p p p p p p p p p nnnn be be be b b be b b b b b b b b b b b be be b b b b b b b b b b b b b b b b b b b b b b b b b b b b rrrvv c c c c c c cu c c c c c c c cu cu cu c c c c cu c c c c c c c c c c c c c c c c c c c rrr W W W W W W W W W Wi W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W Wlll m m m m m m m m m m m me m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m nnnn K Ka K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K K llll be be be be be b b b b b b b b b b b b b b b b be b b b b b be b b b be be be b b b b b b b b rrbrbb m m m m m m m m m me m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m lll h h hu h hu hu hu h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h rrrr da d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d eeee punnnn Gaaaaa dannnn pennnn terj mennnn (DJJJJ mennnn Fauuuu dapppp ju ju ju juu ju ju juu ju ju ju ju ju juuuuu ju juu juuu j gggggggggggggggggggggggggggggg m m m m m me me m m m m m m m m m me me m m m m m m m m m m m m m lll bu bu bu b b bu b bu b bu buuuu bu buuuuuuull

(11)

Eksplorasi data curah hujan untuk stasiun Bandung, Jatiwangi, Bogor dan Citeko dapat dilihat pada Gambar 5-8.

Gambar 5 Diagram kotak garis curah hujan bulanan stasiun Bandung Gambar 5 menunjukkan pola curah hujan bulanan untuk stasiun Bandung dan statistik deskriptifnya pada Lampiran 1. Curah hujan tertinggi terjadi pada bulan November hingga April dengan rata-rata jumlah curah hujan 200 mm/bulan hingga 435 mm/bulan. Curah hujan terendah terjadi pada bulan Juni hingga Oktober dengan rata-rata jumlah curah hujan 85 mm/bulan hingga 140 mm/bulan.

Gambar 6 Diagram kotak garis curah hujan bulanan stasiun Jatiwangi Gambar 6 menunjukkan pola curah hujan bulanan untuk stasiun Jatiwangi dan statistik deskriptifnya pada Lampiran 2. Curah hujan tertinggi terjadi pada bulan November hingga April dengan rata-rata jumlah curah hujan 290 mm/bulan hingga 485 mm/bulan. Curah hujan terendah terjadi pada bulan Juni hingga Oktober dengan rata-rata jumlah curah hujan berkisar 10 mm/bulan hingga 125 mm/bulan.

(12)

12

Gambar 7 Diagram kotak garis curah hujan bulanan stasiun Bogor

Gambar 7 menunjukkan pola curah hujan bulanan untuk stasiun Bogor dan statistik deskriptifnya pada Lampiran 3. Curah hujan tertinggi dominan terjadi pada setiap bulan dengan rata-rata jumlah curah hujan bulalan >300 mm/bulan. Hal ini terjadi karena kondisi morfologi kabupaten Bogor sebagian besar berupa dataran tinggi, perbukitan dan pegunungan serta kondisi klimatologinya termasuk iklim tropis sangat basah.

Gambar 8 Diagram kotak garis curah hujan bulanan stasiun Citeko

Gambar 8 menunjukkan pola curah hujan bulanan untuk stasiun Citeko dan statistik deskriptifnya pada Lampiran 4. Curah hujan tertinggi terjadi pada bulan November hingga April dengan rata-rata jumlah curah hujan 360 mm/bulan hingga 530 mm/bulan. Curah hujan terendah terjadi pada bulan Mei hingga September dengan rata-rata jumlah curah hujan <300 mm/bulan.

statttt Novvvv hinnn Sepppp 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 1 1 1 1 statttt padddd Hallll dataaa ikliiii

(13)

Gambar 9 Diagram kotak garis curah hujan berdasarkan lokasi stasiun amatan Curah hujan secara umum untuk setiap stasiun diperlihatkan pada Gambar 9 dan statistik deskriptifnya pada Lampiran 5. Rata-rata jumlah curah hujan bulanan stasiun Bandung, Jatiwangi, Bogor dan Citeko berturut-turut adalah 268 mm/bulan, 290 mm/bulan, 450 mm/bulan dan 334 mm/bulan. Nilai rata-rata jumlah curah hujan tersebut lebih besar daripada nilai masing-masing mediannya sehingga sebaran data curah hujan tersebut tidak simetris dan menjulur ke kanan positif. Data curah hujan stasiun Bogor memiliki satu data pencilan dan Citeko terdapat dua data pencilan.

4.2 Regresi Kontinum dengan Seleksi LASSO

Metode LASSO merupakan tahap pra-pemrosesan sebelum dilakukan pemodelan regresi kontinum. Metode ini mampu menyusutkan koefisien penduga tepat nol sehingga dapat melakukan seleksi peubah. Hal ini dapat meningkatkan akurasi dan interpretabilitas model dengan menghilangkan peubah prediktor yang tidak relevan dengan peubah respon. Banyaknya peubah hasil seleksi dapat dilihat pada Gambar 10 berikut ini.

(a) (b)

(c) (d)

Gambar 10 Validasi silang (nfolds=10) stasiun (a) Bandung, (b) Jatiwangi, (c) Bogor dan (d) Citeko

(14)

14

Gambar 10(a) merupakan plot validasi silang untuk stasiun Bandung. Hal ini menunjukkan bahwa terdapat 23 peubah dari 81 peubah prediktor yang berhasil terseleksi pada metode LASSO dengan nilai ߣ௠௜௡pada angka exp(-2,55) atau 0,08 dari validasi silang 10-folds. Gambar 10(b) merupakan plot validasi silang untuk stasiun Jatiwangi. Hal ini menunjukkan bahwa terdapat 9 peubah dari 81 peubah prediktor yang berhasil terseleksi pada metode LASSO dengan nilai ߣ௠௜௡pada angka exp(-0,94) atau 0,39 dari validasi silang 10-folds. Gambar 10(c) merupakan plot validasi silang untuk stasiun Bogor. Hal ini menunjukkan bahwa terdapat 17 peubah dari 81 peubah prediktor yang berhasil terseleksi pada metode LASSO dengan nilai ߣ௠௜௡pada angka exp(-1,75) atau 0,17 dari validasi silang 10-folds. Gambar 10(d) merupakan plot validasi silang untuk stasiun Bogor. Hal ini menunjukkan bahwa terdapat 9 peubah dari 81 peubah prediktor yang berhasil terseleksi pada metode LASSO dengan nilai ߣ௠௜௡ yaitu exp(-3,33) atau 0,04 dari validasi silang 10-folds.

Peubah hasil seleksi LASSO digunakan dalam pemodelan regresi kontinum untuk setiap stasiun amatan. Model yang diperoleh selanjutnya digunakan dalam memprediksi curah hujan bulanan. Plot hasil prediksi untuk validasi ke-1 atau tahun 2019 dapat dilihat pada Gambar 11 berikut.

(a) (b)

(c) (d)

Gambar 11 Plot aktual dan prediksi model regresi stasiun (a) Bandung, (b) Jatiwangi, (c) Bogor dan (d) Citeko

Plot perbandingan nilai curah hujan aktual antar hasil prediksi model regresi LASSO, regresi kontinum dengan AKU, regresi kontinum dengan forward selection dan regresi kontinum dengan seleksi LASSO untuk untuk setiap stasiun

0 100 200 300 400 1 2 3 4 5 6 7 8 9 10 11 12 Cur ah Huj an Bulan 0 100 200 300 400 500 600 1 2 3 4 5 6 7 8 9 10 11 12 Bulan 0 500 1000 1500 1 2 3 4 5 6 7 8 9 10 11 12 Cur ah Huj an Bulan 0 200 400 600 1 2 3 4 5 6 7 8 9 10 11 12 Bulan 1 1 1 1 14 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ini be be be be be be be be be be be be be b b b b b b b b b b b b b b be b b b b b rrrrhrrrrhrrhrhrr atauuuu si s s slaaaa 8 8 8 8 8 8 8 8 8 8 81 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ ߣ௠௜௠௜ m m me m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m rrrr t t t t te te te te te te te t t t t t t t t t t t t t t t t t te t t t t t t t t rdddd L L L L L L L LA LA LA LA L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L fo fo fo fo fo fo f fo fo fo fo fo fo fo fo fo fo fo fo fo fo fo f fo f fo fo fo fo fo f fo fo f f f f f fo fo f f f f f f f f f fo fo f fo f ldddd m me m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m nnnn te te te te te te te te te te te te te te t te te te te te te te te te te te te te te t t te t t t te tee t tee teeee t t t rssss v v v v v v v v v va v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v liiii untttuu memmmm tahuuuu Gammmm LA L LA LA LA LA LA LA LA LAAA LAAA LA L LA L LAA L LA LAAA LA L LA LA LAA LAA se see see s se see se s se se se se s see seeeleellllllllllllllllllelee 100000 200000 300000 400000 C ur ah H uj an 5 100 150 C ur ah H uj an

(15)

ditunjukkan pada Gambar 11. Hasilnya menunjukkan bahwa nilai prediksi model regresi kontinum dengan seleksi LASSO dan regresi kontinum dengan forward selection cenderung memiliki nilai yang relatif sama dengan nilai aktual curah hujan sehingga galat antara nilai aktual dan prediksi curah hujan relatif kecil. Dengan demikian, model ini memberikan hasil yang sangat baik dalam memprediksi curah hujan. Perbandingan nilai galat antara nilai curah hujan aktual dengan nilai prediksi akan di evaluasi melalui nilai RMSEP dan korelasinya. 4.3 Evaluasi Model Regresi

Evaluasi model regresi dilakukan dengan menghitung nilai RMSEP dan korelasi antara curah hujan aktual dengan curah hujan hasil prediksi. Model regresi yang dibandingkan adalah model regresi LASSO, regresi kontinum dengan AKU, regresi kontinum dengan forward selection. Hasil evaluasi model regresi untuk validasi ke-1 atau tahun 2019 dapat dilihat pada Gambar 12 berikut.

(a)

(b)

Gambar 12 Hasil evaluasi model regresi tahun 2019 (a) Nilai RMSEP dan (b) Nilai Korelasi

Gambar 12 merupakan grafik hasil evaluasi beberapa model regresi untuk setiap stasiun. Pemilihan model terbaik didasarkan pada nilai RMSEP minimum dan nilai korelasi yang maksimum. Gambar 12(a) menunjukkan nilai RMSEP dan Gambar 12(b) menunjukkan nilai korelasinya. Model terbaik untuk stasiun Bandung ditunjukkan oleh model regresi kontinum dengan forward selection

0 50 100 150 200 250 300 350 400

Bandung Jatiwangi Bogor Citeko

LASSO RK-Forward RK-LASSO RK-AKU 0.0 0.2 0.4 0.6 0.8 1.0 1.2

Bandung Jatiwangi Bogor Citeko

LASSO RK-Forward RK-LASSO RK-AKU uk val 1 1 2 2 3 3 4 RMS E P 0 0 0 0 1 1 Korelas i

(16)

16

dengan nilai RMSEP minimum 33,86 dan korelasi maksimum 0,96. Model terbaik untuk stasiun Jatiwangi ditunjukkan oleh model regresi kontinum dengan seleksi LASSO dengan nilai RMSEP minimum 7,76 dan korelasi maksimum 0,99. Model terbaik untuk stasiun Bogor ditunjukkan oleh model regresi kontinum dengan seleksi LASSO dengan nilai RMSEP minimum 34,85 dan korelasi maksimum 0,99. Model terbaik untuk stasiun Citeko ditunjukkan oleh model regresi kontinum dengan seleksi LASSO dengan nilai RMSEP minimum 0,04 dan korelasi maksimum 1,00.

4.4 Validasi dan Konsistensi Model

Konsistensi model berdasarkan nilai RMSEP dan korelasi dengan melakukan validasi sebanyak empat kali menggunakan empat data validasi berbeda dapat dilihat pada Tabel 1-4 berikut.

Tabel 1 Validasi model stasiun Bandung

Validasi Evaluasi LASSO RK-Forward RK-LASSO RK-AKU

2019 RMSEP 59,50 33,86 53,06 116,98 Korelasi 0,89 0,96 0,91 0,71 2018 RMSEP 81,81 38,99 41,75 173,06 Korelasi 0,94 0,97 0,96 0,69 2017 RMSEP 137,44 106,14 110,61 280,00 Korelasi 0,54 0,74 0,71 0,17 2016 RMSEP 110,85 48,93 88,85 296,53 Korelasi 0,74 0,95 0,83 0,79 Rata-rata RMSEP 97,40 56,98 73,57 216,64 Korelasi 0,78 0,90 0,85 0,59

Tabel 1 menunjukkan nilai RMSEP dan korelasi untuk setiap model pada empat data validasi stasiun Bandung dan plot prediksinya pada Lampiran 6. Konsistensi model terlihat untuk setiap data validasi yang memberikan nilai RMSEP minimum dan nilai korelasi maksimum adalah model regresi kontinum dengan forward selection. Hasilnya menunjukkan bahwa ini secara konsisten memiliki nilai RMSEP yang lebih kecil dan korelasi yang lebih besar dibanding model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan seleksi LASSO. Hal ini menunjukkan bahwa rata-rata nilai RMSEP terkecil dan nilai korelasi tertinggi adalah model regresi kontinum dengan forward selection yaitu 56,98 dan 0,90 jika dibandingkan dengan model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan seleksi LASSO. 1 1 1 1 16 1 1 1 1 1 1 1 1 1 1 1 1 1 1 d d d d d d de d d d d d d d d d d d d d d d d d d d d d d d d nnnn unttttu LA LA LA LA LA LA LA LA LA LA LA LA LA L L L L L L L L L L L L L L L L L terbrbbbbbbbbbbbbbbbbbbbbbbbb seleeee 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0,,,,,,,99 k k k k ko ko ko ko k k k k k ko ko k k k k ko k k k k k k k k k k k k k k k k k k k k k k k k k k k k k k k nnnn k k k k k k k k k ko ko ko k ko k k k k k k k ko k k k k k k k k k k ko k k k k k k k k k k k k k k k k rrrr 4 4 4 4 4 4 4. 4. 4 4 4 4 4 4 4 4. 4. 4 4 4 4 4 4. 4 4 4 4 4. 4. 4 4 4 4 4. 4. 4 4 4 4 4 4. 4 4 4 44 va va v v va v v v v v va va v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v liiii d d d d d d di di d d d d di di d d d d d d d d d d d d di d d d d d d d d d d d d d d d d d dliiii R R R R empppp Konnnn RMMMM dennnn memmmm mo dennnn terkkkk seleeee reggrr

(17)

Tabel 2 Validasi model stasiun Jatiwangi

Validasi Evaluasi LASSO RK-Forward RK-LASSO RK-AKU

2019 RMSEP 61,11 25,40 7,76 137,81 Korelasi 0,95 0,99 1,00 0,77 2018 RMSEP 149,71 94,72 47,39 277,06 Korelasi 0,77 0,91 0,98 0,35 2017 RMSEP 141,37 57,11 16,11 350,14 Korelasi 0,84 0,97 1,00 0,52 2016 RMSEP 94,23 50,03 21,41 200,43 Korelasi 0,82 0,95 0,99 0,63 Rata-rata RMSEP 111,60 56,81 23,17 241,36 Korelasi 0,85 0,96 0,99 0,57

Tabel 2 menunjukkan nilai RMSEP dan korelasi untuk setiap model pada empat data validasi stasiun Jatiwangi dan plot prediksinya pada Lampiran 7. Konsistensi model terlihat untuk setiap data validasi yang memberikan nilai RMSEP minimum dan nilai korelasi maksimum adalah model regresi kontinum dengan seleksi LASSO. Hasilnya menunjukkan bahwa ini secara konsisten memiliki nilai RMSEP yang lebih kecil dan korelasi yang lebih besar dibanding model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan forward selection. Hal ini menunjukkan bahwa rata-rata nilai RMSEP terkecil dan nilai korelasi tertinggi adalah model regresi kontinum dengan seleksi LASSO yaitu 23.17 dan 0.99 jika dibandingkan dengan model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan forward selection.

Tabel 3 Validasi model stasiun Bogor

Validasi Evaluasi LASSO RK-Forward RK-LASSO RK-AKU

2019 RMSEP 329,45 131,02 34,85 335,37 Korelasi 0,20 0,84 0,99 0,23 2018 RMSEP 134,07 62,98 33,65 386,21 Korelasi 0,81 0,92 0,98 -0,47 2017 RMSEP 194,38 171,99 153,46 390,97 Korelasi -0,16 0,42 0,36 0,12 2016 RMSEP 197,44 120,75 0,02 460,83 Korelasi 0,35 0,20 1,00 -0,34 Rata-rata RMSEP 213,84 121,69 55,49 393,35 Korelasi 0,30 0,60 0,83 -0,11

Tabel 3 menunjukkan nilai RMSEP dan korelasi untuk setiap model pada empat data validasi stasiun Bogor dan plot prediksinya pada Lampiran 8. Konsistensi model terlihat untuk setiap data validasi yang memberikan nilai RMSEP minimum dan nilai korelasi maksimum adalah model regresi kontinum dengan seleksi LASSO. Hasilnya menunjukkan bahwa ini secara konsisten memiliki nilai RMSEP yang lebih kecil dan korelasi yang lebih besar dibanding model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan forward selection. Hal ini menunjukkan bahwa rata-rata nilai RMSEP

(18)

18

terkecil dan nilai korelasi tertinggi adalah model regresi kontinum dengan seleksi LASSO yaitu 55,49 dan 0,83 jika dibandingkan dengan model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan forward selection.

Tabel 4 Validasi model stasiun Citeko

Validasi Evaluasi LASSO RK-Forward RK-LASSO RK-AKU

2019 RMSEP 99,48 7,97 0,04 143,59 Korelasi 0,85 0,99 1,00 0,62 2018 RMSEP 141,83 27,25 8,59 221,07 Korelasi 0,76 0,99 1,00 0,65 2017 RMSEP 93,42 16,46 119,94 290,33 Korelasi 0,88 0,99 0,83 0,48 2016 RMSEP 103,90 17,45 78,36 232,23 Korelasi 0,74 0,99 0,85 0,58 Rata-rata RMSEP 109,66 17,28 51,73 221,81 Korelasi 0,81 0,99 0,92 0,58

Tabel 4 menunjukkan nilai RMSEP dan korelasi untuk setiap model pada empat data validasi stasiun Citeko dan plot prediksinya pada Lampiran 9. Konsistensi model terlihat untuk data validasi tahun 2019 dan 2018 yang memberikan nilai RMSEP minimum dan nilai korelasi maksimum adalah model regresi kontinum dengan seleksi LASSO sedangkan pada tahun 2017 dan 2016 ditunjukkan oleh model regresi kontinum dengan forward selection. Hasilnya menunjukkan bahwa secara rata-rata nilai RMSEP terkecil dan nilai korelasi tertinggi adalah model regresi kontinum dengan forward selection yaitu 17.28 dan 0.99 jika dibandingkan dengan model regresi LASSO, regresi kontinum dengan AKU dan regresi kontinum dengan seleksi LASSO.

1 1 1 1 18 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t t te t t t t t t t t t t t t t t rkkkk LAAAA re re re re re re re re re re re re re r r r r r r r r r r r r r r re reeggggrgggrgrggrggrg empppp Konnnn memmmm reggrr dituuuu mennnn tertttt 0.999 AKKKK

(19)

V SIMPULAN

Regresi kontinum dengan pra pemrosesan seleksi peubah dapat meningkatkan presisi. Pemodelan statistical downscaling menggunakan model regresi kontinum dengan seleksi LASSO dan model regresi kontinum dengan forward selection dapat digunakan untuk menduga curah hujan di provinsi Jawa Barat. Hasilnya menunjukkan bahwa model tersebut memberikan hasil prediksi curah hujan yang cukup akurat dibandingkan dengan model regresi LASSO, dan regresi kontinum dengan AKU.

(20)

20

DAFTAR PUSTAKA

Aldrian E, Susanto RD. 2003. Identification of Three Dominant Rainfall Region within Indonesia and Their Relationship to Sea Surface Temperature. International Journal of Climatology. 23:1435-1452.

Auffhammer M, Hsiang SM, Schlenker W, Sobel A. 2011. Global Climate Data: A User Guide for Economists. Columbia University.

Busuioc A, Chen D, Hellstrom C. 2001. Performance Of Statistical Downscaling Models In GCM Validation And Regional Climate Change Estimates: Application For Swedish Precipitation. Int J Climatol. 21:557-578.

Fadhli N. 2019. Penentuan Domain Global Climate Model dengan LASSO untuk Peningkatan Akurasi Prediksi Curah Hujan di Jawa Barat [tesis]. Bogor (ID): Institut Pertanian Bogor.

Fauzi MA. 2014. Pengaruh Transisi Monsun Terhadap Siklus Tahunan Curah Hujan di Pulau Jawa [skripsi]. Bandung(ID): Institut Teknologi Bandung. Fonti V. 2017. Feature Selection using LASSO. Vrije Universiteit Amsterdam. Hastie T, Tibshirani R, Friedman J. 2008. The Elements of Statistical Learning.

Data mining, Inference, and Prediction. Ed ke-2. London (GB): Springer. Jung Y, Hu J. 2015. A K-fold Averaging Cross-validation Procedure. Journal of

Nonparametric Statistics. 27(2):1-13.

Setiawan. 2007. Pendekatan Regresi Kontinum dalam Model Kalibrasi [disertasi]. Bogor (ID): Institut Pertanian Bogor.

Soleh AM, Aunuddin. 2013. LASSO: Solusi Alternatif Seleksi Peubah dan Penyusutan Koefisien Model Regresi Linier. Forum Statistika dan Komputasi: Indonesian Journal of Statistics. 18(1):21-27.

Soleh AM, Wigena AH, Djuraidah A, Saefuddin A. 2015. Statistical Downscaling to Predict Monthly Rainfall Using Linear Regression with L1 Regularization (LASSO). Applied Mathematical Sciences. 9(108):5361-5369.

Stone M, Brooks RJ. 1990. Continuum Regression: cross-validated sequentially constructed prediction embracing ordinary least squares, partial least squares, and principal component regression (with discussion). Journal of the Royal Statistical Society Series B. 52:237-269.

Sutikno, Setiawan, Purnomoadi H. 2010. Statistical downscaling output GCM modeling with continuum regression and pre-processing PCA approach. IPTEK, The Journal for Technology and Science. 21(3):109-112.

Tibshirani R. 1996. Regression Shrinkage and Selection via the Lasso. Journal of The Royal Statistical Society, Series B. 58:267 – 288.

Wigena AH. 2006. Pemodelan Statistical Downscaling Dengan Regresi Projection Pursuit Untuk Peramalan Curah Hujan Bulanan: Kasus Curah Hujan Bulanan Di Indramayu [disertasi]. Bogor (Id): Institut Pertanian Bogor. Wigena AH. 2011. Regresi kuadrat terkecil parsial multi respon untuk statistical

downscaling. Forum Statistika dan Komputasi. 16(2):12-15.

Wigena AH, Djuraidah A. 2014. Quantile regression in statistical downscaling to estimate extreme monthly rainfall. Science Publishing Group. 2(3):66-70.

2 2 2 2 2 2 2 20 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Alllldllllllllllllddddddddddddddddddddddddddddd w w w w I I I I I A Au A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A fff A A A A B B B B B B B Bu B B B B B B B B B B B B B B B B B B B B B B B B B B B B B B B B B B B ssss M M M M M A A A A F F F F F F F F F F Fa F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F dddd P P P P P I I I I I F F F F F F F F F F F Fa F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F uuuu H H H H H Fonnnn Hassss D D D D D Junnnn N N N N N Settt B B B B B Sollll P P P P P I I I I I Sollll t t t t t ( ( ( ( ( Stoooo c c c c c a a a a a S S S S Sutttt m m m m m I I I I I Tibbbb T T T Wiggg P P P P P H H H H H Wiggg d d d d d Wiggg e e e e e

(21)

RIWAYAT HIDUP

Penulis lahir di Sengkang, 11 Oktober 1996 dan merupakan putri kedua dari pasangan Abdul Radjab dan Arianti. Pendidikan menengah atas ditempuh di SMAN 3 Sengkang pada program IPA tahun 2012 sampai dengan 2014. Penulis melanjutkan studi S1 pada tahun yang sama di Universitas Hasanuddin program studi Statistika dan menyelesaikan pendidikan sarjana pada 27 Februari 2018. Setelah itu, pada tahun yang sama pula penulis berkesempatan melanjutkan studi S2 di Institut Pertanian Bogor pada program studi Statistika Terapan.

Gambar

Gambar 1 Skema downscaling (Fadhli 2019)  Bentuk umum model SDS adalah sebagai berikut
Gambar 2 Ilustrasi metode LASSO (Fonti 2017)
Gambar 3 Domain GCM stasiun (a) Bandung, (b) Jatiwangi dan (c) Bogor Citeko  Data curah hujan lokal sebagai peubah respon yang dikeluarkan oleh Badan  Meterologi, Klimatologi dan Geofisika (BMKG) pada periode Januari 2011  sampai dengan Desember 2019
Gambar 4 Pembagian wilayah curah hujan Indonesia (Aldrian dan Susanto 2003)  Daerah Jawa Barat memiliki satu kali rata-rata curah hujan bulanan tertinggi  dan satu kali rata-rata curah hujan bulanan terendah
+7

Referensi

Dokumen terkait

Ebben a DNP tagok mellett más (keresztény) pártok szimpatizánsainak adatait is rögzítették. Az MSZMP Politikai Bizottságának 1957. júniusi határozata 35

Kereta api di Indonesia di sisi lain mengemban tugas mulia sebagai sarana transportasi yang murah, bahkan tarif untuk beberapa kereta api kelas ekonomi besarnya di bawah

Simpulan dari penelitian pengembangan ini yakni: (1) Tahap-tahap dalam pengembangan media pembelajaran berbasise-learning menggunakan program Moodle pada tema Hujan

Berdasarkan hasil need assesment dengan menggunakan Daftar Cek Masalah yang disebut juga DCM di Madrasah Aliyah Negeri Sidoarjo yang selanjutnya disebut MAN Sidoarjo

Ini merupakan langkah penting, yang mendorong penggunaan prior knowledge dan memori serta memungkinkan mahasiswa untuk menguji atau menggambarkan pemahaman lain;

Terlaksananya Pelatihan Kuliner Pembuatan Kue sebanyak 130 orang terbagi menjadi 17 Kelompok. Semarang, 19-21 mei

Sebuah Sebuah  journal  journal bearing bearing dapat diukur dengan benar dapat diukur dengan benar kalau bekerja cukup luas pada putaran transisinya, sehingga keausan

Paper ini mengajukan pendekatan model regresi dalam mengembangkan persamaan-persamaan untuk memperkirakan permeabilitas relatif air dan gas dalam batubara.. Data yang digunakan dalam