• Tidak ada hasil yang ditemukan

HYBRID MARS TIME SERIES PADA PEMODELAN STATISTICAL DOWNSCALLING Studi Kasus: Stasiun Losarang ABSTRAK

N/A
N/A
Protected

Academic year: 2021

Membagikan "HYBRID MARS TIME SERIES PADA PEMODELAN STATISTICAL DOWNSCALLING Studi Kasus: Stasiun Losarang ABSTRAK"

Copied!
9
0
0

Teks penuh

(1)

1

HYBRID MARS – TIME SERIES PADA PEMODELAN

STATISTICAL DOWNSCALLING

Studi Kasus: Stasiun Losarang

1

Bisyri Effendi, 2Sutikno, dan 3Bambang Widjarnako Otok

1

Mahasiswa S2 Jurusan Statistika FMIPA ITS

2,3

Dosen Jurusan Statistika FMIPA ITS

e-mail :

1

[email protected], [email protected] , [email protected]

ABSTRAK

Salah satu permasalahan utama pemodelan Statistical Downscaling (SD) luaran GCM adalah mendapat metode regresi yang bisa mengatasi adanya hubungan non-linear, dimesi variabel prediktor (GCM) cukup tinggi dan adanya kasus outokorelasi. Dalam makalah ini digunakan metode principal component analysis (PCA) untuk mereduksi dimensi sebagai pra-pemrosesan data. Metode Hybid Multivariate Adaptive Regression Splines dan Time Series (HTS-MARS) digunakan untuk menghubungkan variabel respon dan variabel prediktor dan mengatasi adannya outokorelasi. Hasil penelitian menunjukkan bahwa metode HTS-MARS mempunyai nilai R2 yang lebih besar daripada regresi komponen utama (RKU). Yaitu masing-masing 78.6% untuk metode HTS MARS dan 45.9% untuk metode RKU. Hasil ini memberikan gambaran bahwa metode HTS MARS berpotensi meningkatkan akurasi ramalan dalam pemodelan SD.

Kata Kunci : GCM, SD, MARS, Time series, PCA

1. PENDAHULUAN

Global Circulation Models (GCM) adalah suatu model berbasis komputer yang terdiri atas berbagai persamaan numerik dan deterministik yang terpadu dan mengikuti kaidah-kaidah fisika. GCM banyak digunakan untuk kajian iklim, seperti kajian perubahan iklim, rekonstruksi iklim histories dan kajian iklim lainnya. Namun beberapa komunitas ilmiah mendapatkan kesulitan dalam model tersebut, terkait skala ruang yang dihasilkan oleh model GCM cukup luas, sedangkan kajian-kajian iklim seringkali membutuhkan skala ruang yang lebih sempit. Salah satu pendekatan untuk mengatasi masalah tersebut digunakan teknik downscaling.

(2)

2

Teknik downscaling adalah suatu proses transformasi data dari suatu grid dengan unit skala besar menjadi data pada grid – grid dengan unit skala yang lebih kecil. Wilby & Wigley (1997) menyatakan bahwa downscaling adalah suatu cara menginterpolasi variabel – variabel predictor atmosfir berskala regional terhadap variabel – variabel berskala lebih kecil. Salah jenis teknik downscaling adalah statistical downscaling (SD), yaitu teknik downscaling dengan pendekatan kaidah-kaidah ilmu statistika.

Data iklim (data GCM dan curah hujan) umunya bersifat non-stasioner dalam ruang dan waktu, dinamik dan non linier, menyebar non-gausian atau mungkin tidak mempunyai sebaran baku. Data GCM merupakan data spasial dan temporal dimana kemungkinan besar terjadi korelasi spasial antara data pada grid yang berbeda dalam satu domain dan otokorelasi dala deret waktu. Pemodelan SD untuk pendugaan curah hujan harus memperhatikan kedala – kendala tersebut.

Beberapa metode SD yang telah digunakan antara lain regresi linier berganda, regresi komponen utama, dan korelasi kanonik (untuk multi respon) (Wilby & Wigley 1997 dalam Wigena, 2006). Analisis komponen utama dapat digunakan untuk mengatasi masalah curse of dimensionality. Regresi komponen utama dapat mengatasi korelasi spasial atau multikolinearitas antar variabel prediktor (grid – grid) tetapi metode ini bersifat linier sehingga belum dapat mengatasi sifat data GCM yang non – linier dan belum mengatasi otokorelasi pada data deret waktu (temporal). Kombinasi regresi komponen utama dan ARIMA telah digunakan untuk mengatasi otokorelasi. MARS berbasis regresi , nonlinier, nonparametric yang tidak memerlukan asumsi yang ketat (sof modeling), dan data-driven tetapi belum mengatasi otokorelasi pada deret waktu (temporal). Algoritma metode MARS digunakan dalam pemodelan time series nonlinear yang dikenal dengan Adaptive Spline Threshold Autoregressive (ASTAR), dimana variabel prediktornya berupa nilai lag deret waktu (Lewis dan Stevens, 1991). Metode tersebut merupakan pemodelan data dengan atau tidak melibatkan variabel prediktor. Metode ini termasuk pendekatan non parametrik, sehingga tidak terlalu ketat dengan beberapa asumsi (soft modelling). Beberapa penelitian dengan menggunakan metode ASTAR menunjukkan kinerja yang cukup baik (Lewis dan Steven, 1991; Lewis dan Ray, 1997; Buana, 2001; Sutikno, 2005), tetapi model yang didapatkan ASTAR tidak parsimoni dan ASTAR tidak mampu menyelesaikan dengan prediktor yang banyak. Metode Hybrid MARS – Time Series (HTS-MARS) berpotensi untuk mengatasi masalah – masalah tersebut dan dapat digunakan untuk pemodelan SD.

(3)

3

2. TINJAUAN PUSTAKA 2.1 MARS

Model MARS merupakan kombinasi dari spline dan rekursif partisi. Pemodelan regresi spline diimplemetasikan dengan membentuk kumpulan fungsi basis yang dapat mencapai pendekatan spline orde ke-q dan mengestimasi koefisien fungsi – fungsi basis tersebut menggunakan least-squares (kuadrat terkecil). Secara umum persamaan model MARS dapat ditulis sebagai berikut :

(1) Dengan

Sehingga dalam bentuk matrik dapat di tulis menjadi :

(2)

Dengan

Pada pemodelan MARS, selain penentuan knots yang dilakukan secara otomatis dari data dan menghasilkan model yang kontinu pada knots, pemilihan model pada MARS juga menggunakan metode stepwise (forward dan backward). Forward stepwise dilakukan untuk mendapatkan fungsi dengan jumlah basis maksimum. Kriteria pemilihan fungsi basis pada forward stepwise adalah dengan meminimumkan Average Sum Of Square Residual (ASR). Untuk memenuhi konsep parsemoni (model yang sederhana) dilakukan backward stepwise dengan meminimumkan nilai Generalized Cross – Validation (GCV) (Friedman dan Silverman, 1989). Pada MARS, beberapa hal yang perlu diperhatikan dalam pemilihan model yang paling optimum (terbaik) adalah jika nilai GCV dari model tersebut mempunyai nilai yang paling rendah (paling minimum) diantara model – model yang lain.

(4)

4 Fungsi GCV minimum didefinisikan sebagai

(3)

Dimana :

: variabel independen / prediktor : variabel dependen / respon

N : banyaknya pengamatan

2.2 Autoregresive Integrated Moving Average (ARIMA)

ARIMA merupakan gabungan dari model Auto Regressive (AR) dan Moving Average (MA). AR merupakan model yang menyatakan bahwa kejadian sekarang berakaitan dengan kejadian waktu lalu. Sedangkan MA adalah model yang menyatakan bahwa kejadian sekarang berkaitan error waktu lalu. Model ARIMA merupakan model linear. Model ARIMA musiman ditulisakan sebagai berikut :

(4)

Dengan :

B = operator back shift

= white noise dengan rata-rata 0 dan varians konstan = koefisien komponen AR dengan derajat P

= koefisien komponen MA dengan derajat q

2.3 Uji Non Linearitas pada Data Deret Waktu

Sebelum menerapkan model non linear terlebih dahulu dilakukan uji non-linearitas pada data deret waktu, hal ini dilakukan untuk memastikan bahwa metode yang digunakan sudah sesuai dengan datanya. Ada beberapa uji nonlinearitas yang sudah dikembangkan antara lain UJI RESET, Uji White dan uji Langrange Multiplier (LM).

(5)

5

2.4 Analisis Komponen Utama

Analisis komponen utama adalah teknik mereduksi dimensi data dengan cara mentransformasi variabel asal ke variabel baru (komponen utama) yang merupakan kombinasi linear dari variabel asal sedemikian hingga varians komponen utama menjadi maksimum dan antar komponen utama tidak saling berkorelasi.

Model analisis komponen utama dapat ditulis :

(5)

dimana i = 1, 2, …, n dan j = 1, 2, …, p dengan = komponen utama (komponen score) ke-i.

= variabel awal ke-j.

= vektor eigen ke-j pengamatan ke i

2.5 Statistikal Downscaling

Statistikal Downscaling (SD) adalah suatu proses downscaling yang bersifat statik dimana data pada grid-grid berskala besar dalam periode dan jangka waktu tertentu digunakan sebagai dasar untuk menentukan data pada grid berskala lebih kecil (Wigena, 2006). Secara umum bentuk hubungan tersebut dinyatakan dengan:

Y = f(X) + ε (6)

dengan:

Y(txp) :variabel respon (curah hujan) X(txqxgxl): variabel penjelas (luaran GCM) p : banyaknya variabel Y

q : banyaknya variabel X

g : banyaknya grid domain GCM l : banyaknya level ketinggian

t : banyaknya waktu (misal: harian, dasarian atau bulanan) ε : sisaan

(6)

6

3. METODOLOGI

Data yang digunakan adalah data luaran GCM model CSIRO-Mk3. Domain GCM yang digunakan adalah 3x3 (9 grid), yaitu 4.660 LS- 8.390 LS, 106.870 BT– 110.640 BT, dengan lokasi stasiun berada ditengah-tengah domain. Variabel respon yang digunakan adalah curah hujan bulanan Stasiun Laosarang, diperoleh dari BMKG dengan periode tahun 1967-2000. Sedangkan variabel prediktor yang digunakan pada penelitian ini adalah variabel luaran CSIRO Mk3, meliputi: precipitable water (prw), tekanan permukaan laut (slp), komponen angin meridional (va), komponen zonal (ua), ketinggian geopotensial (zg), dan kelembaban spesifik (hus). Ketinggian (level) yang digunakan dalam penelitian adalah 850 hPa, 500 hPa, dan 200 hPa.

Untuk membangun model, terlebih dahulu dilakukan reduksi dimensi dengan metode Principal Component Analysis (PCA). Selanjutnya memodelkan regresi komponen utama (RKU) dan HTS-MARS. Dalam memodelkan HTS-MARS terlebih dahulu memodelkan MARS dengan menentukan maksimum jumlah basis fungsi (BF), maksimal interaksi (MI) dan minimum jumlah observasi antar knot (MO). Hasil error dari model MARS dilakukan pengujian otokorelasi dan pengujian linier. Tahapan selanjutnya adalah memodelkan error dengan metode ASTAR, jika pola error non-linier dan menggunakan ARIMA jika polanya linier. Untuk melihat kinerja metode HTS-MARS digunakan kriteria R2.

(7)

7

4. HASIL DAN PEMBAHASAN

Berdasarkan hasil pra-pemrosesan dengan PCA didapatkan reduksi data dengan variabel disajikan pada Tabel 1 berikut.

Tabel 1. Vvariabel hasil PCA

Model hubungan antara variabel respon dan variabel prediktor dengan regresi komponen utama (RKU) diperoleh model sebagai berikut:

Y = 126 + 0.34x1 - 1.40x2 + 9.22x3 + 1.78x4 + 21.1x5 - 18.5x6 - 1.5x7 - 3.6x8 + 4.63x9 –

4.00x10 + 8.80x11 - 9.57x12 - 9.85x13 - 1.96x14 + 5.09x15 - 25.5x16 + 11.9x17 +

0.92x18 - 1.1x19 - 4.8x20 + 17.3x21

Model tersebut di atas mempunyai R2 sebesar 45.9%

Tahapan pembentukan model MARS dilakukan dengan trial and error terhadap maksimum basis fungsi, maksimum interaksi dan minimal jumlah pengamatan diantara knots atau minimum observasi sampai diperoleh model optimal dengan nilai GVC yang minimum. Model terbaik didapatkan dengan BF= 63; MI=3; MO=10; MARS GCV = 6433.774 adalah sebagai berikut :

Y = 93.633 + 178.663 * BF2 + 62.658 * BF3 - 22.643 * BF5 - 165.247 * BF6 - 54.503 * BF8 + 24.215 * BF13 + 16.893 * BF14 - 42.376 * BF15 - 11.282 * BF16 + 12.114 * BF19 + 3.108 * BF20 + 11.448 * BF21 + 17.373 * BF22 - 8.281 * BF23 + 11.014 * BF25 + 5.733 * BF26 + 63.435 * BF28 + 36.895 * BF30 - 24.830 * BF32 - 26.740 * BF33 – 19.439 * BF35 - 16.167 * BF39 - 64.202 * BF40 – 3.350 * BF44 - 8.195 * BF45 + 35.909 * BF47 - 24.325 * BF49 - 3.112 * BF50 - 3.183 * BF52 + 70.215 * BF54 –2.009 * BF55 + 13.971 * BF56 + 22.930 * BF58 + 18.681 * BF60 + 7.998 * BF61 Kode Variabel Keterangan Kode Variabel Keterangan x1 hus_200(PC1) x12 uas(PC1) x2 hus_500(PC1) x13 va_200(PC1) x3 hus_850(PC1) x14 va_500(PC1) x4 huss(PC1) x15 va_850(PC1) x5 huss(PC2) x16 va_850(PC2) x6 huss(PC3) x17 vas(PC1) x7 prw(PC1) x18 vas(PC2) x8 psl(PC1) x19 zg_200(PC1) x9 ua_200(PC1) x20 zg_500(PC1) x10 ua_500(PC1) x21 zg_850(PC1) x11 ua_850(PC1)

(8)

8 Dengan: BF2 = max(0, - 1.565 - X12 ); BF3 = max(0, X20 - 3.638) * BF2; BF4 = max(0, 3.638 - X20 ) * BF2; BF5 = max(0, X16 + 1.796); BF6 = max(0, - 1.796 - X16 ); BF8 = max(0, - 3.640 - X12 ) * BF5; BF9 = max(0, X4 + 1.111); BF10 = max(0, - 1.111 - X4 ); BF12 = max(0, - 1.912 - X2 ) * BF9; BF13 = max(0, X17 - 1.604) * BF10; BF14 = max(0, 1.604 - X17 ) * BF10; BF15 = max(0, X21 - 2.374) * BF2; BF16 = max(0, 2.374 - X21 ) * BF2; BF19 = max(0, X19 + 0.468) * BF4; BF20 = max(0, - 0.468 - X19 ) * BF4; BF21 = max(0, X11 + 5.092) * BF15; BF22 = max(0, - 5.092 - X11 ) * BF15; BF23 = max(0, X14 + 0.202) * BF14; BF25 = max(0, X20 - 2.680) * BF12; BF26 = max(0, 2.680 - X20 ) * BF12; BF27 = max(0, X15 + 2.963) * BF10; BF28 = max(0, - 2.963 - X15 ) * BF10; BF29 = max(0, X18 + 2.682) * BF2; BF30 = max(0, X7 - 0.449) * BF27; BF32 = max(0, X11 + 4.053) * BF2; BF33 = max(0, - 4.053 - X11 ) * BF2; BF35 = max(0, 0.064 - X10 ) * BF32; BF39 = max(0, - 1.716 - X3 ) * BF4; BF40 = max(0, X7 - 1.058); BF41 = max(0, 1.058 - X7 ); BF43 = max(0, - 0.888 - X16 ) * BF41; BF44 = max(0, X6 + 9.805) * BF29; BF45 = max(0, X20 - 2.728) * BF41; BF47 = max(0, X3 + 3.850) * BF41; BF49 = max(0, X17 - 5.146) * BF47; BF50 = max(0, 5.146 - X17 ) * BF47; BF52 = max(0, 0.605 - X14 ) * BF47; BF54 = max(0, - 2.435 - X3 ) * BF2; BF55 = max(0, X1 + 3.843) * BF47; BF56 = max(0, - 3.843 - X1 ) * BF47; BF58 = max(0, 0.110 - X9 ) * BF2; BF60 = max(0, - 1.947 - X2 ) * BF43; BF61 = max(0, X5 + 7.933) * BF40;

Model tersebut di atas mempunyai R2 sebesar 78.6 %.

Tahapan selanjutnya adalah memodelkan error (sisaan) dari model MARS yang diperoleh. Untuk memodelkan sisaan ini, diawali dengan menguji outokorelasi dengan uji Ljung-Box dan uji nonlinier dengan uji Reseet Test. Hasil uji Ljung-Box menunjukkan bahwa terdapat outokorelasi antar sisaaan ( p-value > α=0.05). Pada pengujian non-linier dengan uji reset didapatkan p-value = 0.1853 > α=0.05, sehingga dapat disimpulkan bahwa sisaan bersifat linear.

Berdasarkan hasil di atas dapat disimpulkan bahwa sisaan model MARS terdapat kasus outokorelasi dan berpola linier. Hasil model sisaan didapatkan model ARIMA (2.,0,0) sebagai berikut :

E(t) = 0.1148 E(t-2) + a(t)

Sehingga didapatkan model estimasi Hybrid MARS – Time Series sebagai berikut : Y = M(x) + E(t)

(9)

9

PENUTUP

Berdasarkan kinerja model SD menunjukkan bahwa metode MARS mempunyai nilai R2 yang lebih besar dari RKU. Hal ini menunjikkan bahwa model MARS mempunyai potensi meningkatkan akurasi presiksi dalam pemodelan SD. Di samping itu terdapat kasus otokorelasi antar sisaan model MARS, sehingga perlu dilakukan pemodelan sisaan dari model MARS, sehingga model yang dihasilkan model Hybrid MARS – Time Series. Model gabungan ini diperkirakan akan meningkatkan akurasi prediksi.

DAFTAR PUSTAKA

Breiman, L., Friedman, J.H., Olshen, R.A., dan Stone, C.J (1993), Classification and Regression Trees, Wasdswoth, Belmont, C.A.

Friedman, J.H., (1990), “Multivariate Adaptive Regression Splines”, Tech Report 102 Rev,Department of Statistics Stanford University Stanford, California.

Lewis PAW, Stevens JG. (1991). Nonlinear Modelling of Time Series Using Multivariate Adaptive Regression Splines. J. Amer. Statist. Assoc 86: 864 – 877.

Makridakis, S., Wheelwright,S.C. dan McGee, V.E. (1999), jilid 1 edisi kedua. Terjemahan Ir Hari Suminto, Metode dan Aplikasi peramalan,Jakarta, Bina Rupa Aksara. Sutikno, Boer R. (2005). Model Prediksi Curah Hujan Dengan Regresi Splines Adaptif

Berganda. Jurnal Agromet Indonesia 18:36-52.

Taylan P., Weber G.W. (2008), Multivariate Adaptive Regession Spline and Continuous Optimization for Modern Application in science, Economy and Technology. Middle EastTechnical University, Institute of Applied Mathematics, 06531 Ankara, Turkey.

Wigena AH. 2006. Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit untuk Peramalan Curah Hujan Bulanan. Kasus Curah Hujan Bulanan di Indramayu. [Disertasi]. Bogor: Sekolah Pascasarjana, Institut Pertanian Bogor. Zorita, E. and von Storch, H., (1999): “The analog method as a simple statistical

downscaling technique: comparison with more complicated method”, Journal of Climate, 12, 2474-2489.

Gambar

Tabel 1. Vvariabel hasil PCA

Referensi

Dokumen terkait

komponen utama sehingga akan diperoleh persamaan regresi linier berganda dari data.. tersebut yang terbaik dan tidak memiiki

Uji multikolinearitas dilakukan melalui uji regresi dengan patokan bika VIF (Variance Inflation Factor) dan koefisien korelasi antar variabel bebas. Kriteria yang

Tahapan analisis data adalah Menguji Korelasi Antar Variabel Respon, Uji Normal Multivariat, Membuat Model Lengkap Regresi Linier Multivariat, Melakukan Pemilihan

Sedangkan Chen et al (2005) membandingkan performan Regresi Proses Gaussian (RPG) dengan metode regresi komponen utama, jaringan syaraf tiruan dan regresi kuadrat terkecil

dan seperti yang terlihat pada Analisis regresi linier ganda untuk mengukur apakah ada hubungan dan korelasi antara variabel Komunikasi internal dan Sikap pekerja

Nova dan Dwi (2012) meneliti tentang tingkat stress wanita di RS Mardi Rahayu Kudus dengan menggunakan regresi logistik ordinal dan diperoleh hasil bahwa variabel prediktor..

Dalam Penelitian ini masalah dibatasi pada mengkaji pengujian model p g j p g j regresi spasial dengan keberadaan korelasi error spasial menggunakan statistik uji LM dan Robust LM

Model regresi kuantil yang terpilih digunakan untuk memprediksi curah hujan ekstrim, dan disimpulkan bahwa prediksi curah hujan ekstrim yang dihasilkan menunjukkan