• Tidak ada hasil yang ditemukan

PENDEKATAN REGRESI KONTINUM DENGAN PRA-PEMROSESAN ANALISIS KOMPONEN UTAMA UNTUK PEMODELAN STATISTICAL DOWNSCALING

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENDEKATAN REGRESI KONTINUM DENGAN PRA-PEMROSESAN ANALISIS KOMPONEN UTAMA UNTUK PEMODELAN STATISTICAL DOWNSCALING"

Copied!
5
0
0

Teks penuh

(1)

1

PENDEKATAN REGRESI KONTINUM DENGAN PRA-PEMROSESAN ANALISIS KOMPONEN UTAMA UNTUK PEMODELAN

STATISTICAL DOWNSCALING

(STUDI KASUS : STASIUN INDRAMAYU, LOSARANG, DAN JUNTINYUAT)

Setiawan dan Sutikno

Staf Pengajar Jurusan Statistika Institut Teknologi Sepuluh Nopember Surabaya Email: setiawan@statistika.its.ac.id ; sutikno@statistika.its.ac.id

Abstrak

Pendekatan SD menggunakan data regional atau global untuk memperoleh hubungan fungsional antara skala lokal dengan skala global GCM dapat dimodelkan dengan regresi. Pendekatan SD disusun berdasarkan adanya hubungan antara grid skala besar (prediktor) dan grid skala lokal (respon) yang dinyatakan dengan model statistik yang dapat digunakan untuk menterjemahkan anomali-anomali skala global menjadi anomali dari beberapa variabel iklim lokal. Pada umumnya model SD melibatkan data deret waktu dan data spasial GCM. Data GCM merupakan data spasial dan temporal dimana kemungkinan besar terjadi korelasi spasial antara data pada grid yang berbeda dalam satu domain. Adanya masalah mulikolinearitas mengharuskan perlunya pra-pemrosesan data variabel X. Regresi Kontinum dengan prapemrossan Analisis Komponen Utama merupakan salah satu alternatif untuk pemodelan SD. Dari hasil pengolahan data untuk stasiun Indramayu, Losarang dan Juntinyuat masing-masing diperoleh koefisien determinasi sebesar 42,63%, 44,08% dan 38,78%.

Kata kunci : Analisis komponen utama, regresi kontinum

PENDAHULUAN

Ketersediaan informasi ramalan tentang curah hujan sangat berguna bagi petani dalam mengantisipasi kemungkinan kejadian-kejadian ekstrim (kekeringan akibat El-Nino dan kebanjiran akibat La-Nina), yang sering menimbulkan kegagalan produksi pertanian. Curah hujan merupakan salah satu faktor penting bagi pertanian akan berpengaruh secara langsung terhadap ketersediaan air. Dampak kerugian akibat kekeringan maupun banjir pada sektor pertanian ini sering terjadi karena (1) kekurangan informasi tentang curah hujan yang akurat, cepat, dan bersifat spesifik lokasi; (2) tingkat kemampuan peramalan yang masih belum baik; dan (3) tingkat adopsi pengguna akhir, dalam hal ini petani, terhadap hasil ramalan masih sangat rendah.

Pemodelan Statistical Downscaling (SD) pada dasarnya merupakan model yang menunjukkan hubungan fungsional antara luaran GCM (Generalized Circulation Model) dengan curah hujan lokal. Model SD memerlukan suatu domain (luasan dan lokasi) GCM sebagai variabel penjelas dan curah hujan lokal sebagai variabel respon. Penentuan domain GCM merupakan langkah pertama dalam penyusunan model SD.

Data tentang curah hujan pada umumnya bersifat nonlinear dan tidak berdistribusi normal. Sedangkan data GCM merupakan data spasial dan temporal

Seminar Nasional Statistika IX

(2)

2

dimana kemungkinan besar terjadi korelasi spasial antara data pada grid yang berbeda dalam satu domain. Adanya masalah mulikolinearitas mengharuskan perlunya pra-pemrosesan data variabel X. Regresi Kontinum dengan prapemrossan Analisis Komponen Utama merupakan salah satu alternatif untuk pemodelan SD. Pada kajian ini digunakan regresi kontinum dengan pra-pemrosesan analsisi komponen utama untuk pemodelan SD di stasiun Indramayu, Losarang dan Juntinyuat.

REGRESI KONTINUM

Regresi kontinum merupakan salah satu metode yang digunakan untuk mengatasi kolinearitas ganda dan singularitas yang terjadi pada model regresi ganda. Misalkan X adalah matriks data hasil pengamatan yang sudah dipusatkan (centred) berukuran

(

n

x

p

)

dan disebut variabel bebas, sedangkan

y

adalah vektor variabel respon berukuran

(

n

x

1

)

pengamatan yang sudah dipusatkan. Regresi kontinum dikembangkan berdasarkan model regresi linear klasik dengan koefisien regresi

sebagai berikut :

Χ

y

(1)

dengan

adalah vektor galat berukuran

(

n

x

1

)

.

Regresi kuadrat terkecil pada prinsipnya memodelkan hubungan antara variabel bebas X dengan peubah respon Y dengan memaksimumkan korelasi antara variabel bebas dengan variabel respon. Pada model regresi linear terboboti formula matematis dapat ditulis sebagai berikut, maksimumkan

 

w

w

y

s

w

x

w

y

x

w

y

r

T T n i i T n i i n i i T i w

S

2 2 1 2 1 2 2 1 2

)

(

   (2)

dengan xi adalah vektor pengamatan variabel bebas ke-i (i =1,2, ..., n) berukuran

(px1),

s

X

T

y

dan

S

X

T

X

.

Regresi komponen utama pada prinsipnya adalah memaksimumkan :

w

w

x

w

S

n T i i T w

S

(

)

2 1 . (3)

Dari formula (3) tersebut dapat dijelaskan bahwa prinsip dasar dalam RKU adalah memaksimumkan keragaman dari variabel bebas X sehingga dibentuk variabel baru berupa beberapa komponen utama yang merupakan kombinasi linear dari variabel-variabel asal (X). Selanjutnya data variabel-variabel respon

y

diregresikan dengan beberapa komponen utama tersebut dengan menggunakan teknik regresi ganda.

Prinsip RKTP adalah memaksimumkan :

 

2 2 1

s

w

x

w

y

S

n T i i T i w

 . (4)

Dari formula (4) tersebut dapat dilihat bahwa prinsip RKTP adalah memaksimumkan koragam antara variabel bebas dengan variabel respon. Teknik RKTP mempunyai kemiripan dengan RKU. Perbedaan penting kedua metode adalah pada RKU

(3)

3

mengkonstruksi faktor yang dapat menerangkan sebanyak-banyaknya keragaman dari data variabel bebas X tanpa mempertimbangkan apakah faktor tersebut berhubungan dengan data variabel respon

y

atau tidak. Di sisi lain, pada RKTP mengkonstruksi faktor yang mampu menerangkan keragaman data variabel bebas X dan pada saat yang sama faktor tersebut mempunyai hubungan dengan data variabel respon Y.

Pada RK, variabel baru (latent) diformulasikan dalam model sebagai berikut

h

y

T

(5)

dengan :

T

h

XW

h (6)

dan

W

h

w

1

,

w

2

,...,

w

h

matriks berisi h kolom variabel dengan

h

p

dan disebut matriks pembobot.

Stone dan Brooks (1990) memformulasikan matriks pembobot tersebut sebagai berikut :

 

 

2 [ /(1 )]1

,

max

arg

 

 

w

Var

y

w

Cov

w

w i

X

X

(7)

dengan kendala

w

i

1

dan

Cov

X

w

i

,

X

w

j

0

untuk

i

j

1

,

2

,...,

h

sedangkan parameter penyesuaian

merupakan bilangan real

0

1

.

Alternatif lain adalah formula yang dikembangkan oleh Malpass (1996) sebagai berikut :

 

 

(2 2 4 2) ( 12 )

,

max

arg

 

Cov

w

y

Var

w

w

w i

X

X

. (8) Dari formula 7 dibuat suatu formula yang umum sebagai berikut :

 

2

( /(1 ))1

w

y

w

w

 

G

T T T T

X

X

X

(9)

dan disebut metode Stone. Sedangkan dari formula 8 dapat dibuat menjadi :

(2242)

(12)

w

y

w

w

G

T T T T

X

X

X

(10)

dan disebut metode Portsmouth (Malpass 1996). Selanjutnya dalam penelitian ini digunakan metode Stone.

Formula tersebut merupakan generalisasi dari RKT, RKU serta RKTP dengan bentuk keterkaitan sebagai berikut :

1. Untuk

0

, maka

G

   

w

T

s

2

w

T

S

w

1

.

Formula ini ekivalen dengan persamaan (2), artinya pada

0

RK merupakan RKT.

2. Untuk

0

.

5

, maka

G

 

w

T

s

2. Formula ini ekivalen dengan persamaan (4), sehingga pada

0

.

5

RK merupakan RKTP.

3. Untuk

1

, maka

G

 

w

T

S

w

. Formula ini ekivalen dengan persamaan (3), sehingga pada

1

RK merupakan RKU.

Dengan kata lain RKT, RKU serta RKTP merupakan bentuk khusus dari RK.

Karena RK, RKU dan RKTP dikembangkan berdasarkan RKT, maka asumsi yang melekat pada RKT juga masih diperlukan. Asumsi-asumsi tersebut adalah Y merupakan variabel acak yang menyebar normal dengan ragam konstan, serta di antara yi dengan yj saling bebas

(

i

j

1

,

2

,...,

n

)

. Pendugaan parameter regresi

pada persamaan (5) dilakukan dengan menggunakan metode kuadrat terkecil yang diformulasikan sebagai berikut :

 

T

y

h h T h h

T

T

T

1 ,

ˆ

 

(11) h h h

y

ˆ

,

T

ˆ

XW

ˆ

, (12)

(4)

4

 

T

y

h h T h h h

W

W

T

T

T

1 ,

ˆ

ˆ

(13)

dengan

merupakan parameter penyesuaian dan h banyaknya komponen. Analisis Komponen Utama

Salah satu metode statistik yang sering digunakan untuk menyusutkan dimensi (pra-pemrosesan data) adalah analisis komponen utama (AKU). AKU adalah suatu prosedur untuk mereduksi dimensi data dengan cara mentransformasi variabel-variabel asal yang berkorelasi menjadi sekumpulan variabel-variabel baru yang tidak berkorelasi.

Komponen utama dapat diperoleh dari pasangan eigenvalue-eigenvektor matriks kovarian maupun matriks korelasi. Jika satuan data antarvariabel tidak sama, maka disarankan untuk menstandarisasikan data terlebih dahulu. Hal ini diperlukan agar dominansi satu atau dua variabel dalam komponen utama dapat dihindari. Selanjutnya bila Σ adalah matriks varian-kovarian dari vektor random X’=[ X1,X2,…,

Xp]. Dalam hal ini Σ, didapatkan dari metode Maximum Likelihood Estimation (MLE)

dengan rumus,



t i h i i

x

x

n

μ

μ

Σ

1

1

1

h i i

x

n

1

1

μ

dengan :

x

i = vektor observasi ke-i

n = jumlah seluruh observasi

dan Σ memiliki pasangan eigen value-eigen vektor (

1

e

1), (

2

e

2), … , (

p

e

p) dimana

0

.

.

.

2 1

p

. Maka kombinasi linier PC dapat ditulis sebagai berikut : Z1= e1’X = e11X1 + e21X2 + . . . + ep1Xp Z2= e2’X = e12X1 + e22X2 + . . . + ep2Xp . . . Zp= ep’X = e1pX1 + e2pX2 + . . . + eppXp dengan:

Z1 = komponen utama pertama, yang mempunyai varians terbesar

Z2 = komponen utama kedua, yang mempunyai varians terbesar kedua dan seterusnya

Zp = komponen utama ke-p, yang mempunyai varians terbesar ke-p

X1 = variabel asal pertama

X2 = variabel asal kedua

Xp = variabel asal ke-p

HASIL

Pendekatan Regresi Kontinum dengan metode prapemrosesan AKU digunkan untuk meramalkan curah hujan di stasiun Indramayu, Losarang dan Juntinyuat. Dari hasil pendugaan diperoleh koefisien determinasi masing-masing sebesar 42,63%, 44,08% dan 38,78%. Hasil ini belum memuaskan sehingga perlu adanya kajian lebih lanjut.

(5)

5 PENUTUP

Rendahnya koefisien determinasi hasil pendugaan dengan pendekatan Regresi Kontinum dengan metode prapemrosesan AKU menunjukkan bahwa metode ini masih belum memberikan hasil yang memuaskan untuk memodelkan curah hujan. Selanjutnya disarankan untuk mengkaji lebih lanjut terutama untuk menangkap model ketidaklinearan data curah hujan seta adanya pengaruh spasial.

DAFTAR PUSTAKA

Malpass JA. 1994. Continuum Regression : Optimized Prediction of Biological Activity. Di dalam Mallpass J. 1996. Continuum Regression SAS Macro. University of Portsmouth.

Mallpass JA, Salt DW, Ford MG, Wynn EW and Livingstone DJ, 1994. Continuum Regression : A New Algorithm for the Prediction of Biological Activity.

Advanced Computer-Assisted Techniques in Drug Discovery, 163-189.

Serneel et. al, 2005. Robust Continuum Regression. Chemometrics and Intelligant Laboratory System, 76 (2), 197-204.

Setiawan dan Notodiputro KA. 2005a. Regresi Kontinum sebagai Bentuk Umum dari RKT, RKU, serta RKTP. Prosiding Seminar Nasional Statistika VII. Jurusan Statistika FMIPA ITS, Surabaya tanggal 26 Nopember 2005.

Setiawan dan Notodiputro KA. 2005b. Regresi Kontinum dengan Prapemrosesan Transformasi Wavelet dalam Model Kalibrasi. Prosiding Seminar Nasional MIPA. FMIPA UNESA, Surabaya tanggal 17 Desember 2005.

Stone, M. and Brooks R. J. (1990). Continuum Regression : cross-validated sequentially constructed prediction embracing ordinary least squares, partial least squares, and principal component regression (with discussion). Journal of the Royal Statistical Society, Series B, 52, hlm 237-269.

Wigena, A.H.,(2006). “Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit untuk Peramalan Curah Hujan Bulanan” Disertasi. Bogor: Program Pascasarjana, Institut Pertanian Bogor.

Zorita, E. and von Storch, H., (1999): “The Analog Method As A Simple Statistical Downscaling Technique: Comparison With More Complicated Method”,

Referensi

Dokumen terkait

Menurut Neff dan Knox (2017) self- compassion berdampak pada kesejahteraan individu karena memberikan perasaan positif dalam menerima masalah yang ada pada diri,

Data hasil perhitungan rata-rata Indeks Keanekaragaman (H’), Indeks Keseragaman (E) dan Indeks Dominansi (D) plankton di Perairan Kawasan Mangrove Desa Labuhan

Tingginya permintaan akan ikan kerapu tersebut mendorong perlunya pengembangan budidaya laut (Marine Culture) yang diharapkan nantinya akan menggantikan

Berdasarkan hasil need assesment dengan menggunakan Daftar Cek Masalah yang disebut juga DCM di Madrasah Aliyah Negeri Sidoarjo yang selanjutnya disebut MAN Sidoarjo

Berangkat dari ketiga dunia hermeneutika di atas, dalam memahami makna teks muncul kecenderungan tertentu di kalangan pembaca, yaitu kecenderungan hermeneutis. Ada

Hasil penelitian ini menunjukkan bahwa perawat yang mempunyai kesadaran emosi tinggi 65,5%, empati tinggi 56 % dan hubungan sosial tinggi 57,1 %, ketiga variabel ini

Hasil pengamatan tentang motivasi belajar siswa tersebut memiliki 9 langkah kegiatan yang dijadikan sebagai sasaran observasi peneliti, pada data awal kesemua aspek

Jika ada anak-anak di bawah usia 5 (lima) tahun yang belum sekolah, perlu dipersiapkan pem- bentukan Taman Pendidikan AI Qur'an, atau kegiatan Bina Keluarga Balita, atau