3. ANALISIS HUBUNGAN DATA ARL-NOAA DENGAN
3.2. Data dan Metode
Data yang digunakan dalam penelitian ini adalah data profil atmosfer yang diperoleh dari http://www.arl.noaa.gov/ready-bin/profile2a.pl. Sementara data pembanding yang digunakan adalah data profil atmosfer dari hasil pengukuran rawinsonde di wilayah Bandara Soekarno-Hatta, Cengkareng, Tangerang dan wilayah Bandara Juanda, Surabaya yang diperoleh dari Badan Meteorologi Geofisika dan Klimatologi (BMKG), Jakarta. Data yang digunakan adalah data bulan Desember 2004 – Desember 2007. Selain itu, data yang digunakan adalah data suhu udara maksimum dari 9 (sembilan) stasiun observasi di Pulau Jawa dari tahun 2004 – 2006 yang diperoleh dari BMKG. Alat yang digunakan adalah seperangkat PC yang dilengkapi dengan perangkat lunak microsoft excell dan minitab 14.
Metode Analisis
Tahap awal yang dilakukan dalam penelitian ini adalah ekstraksi data profil atmosfer harian yang meliputi data tekanan potensial (H), suhu (T), suhu titik embun (Td), arah angin (WD), kecepatan angin (WS), dan kelembaban relatif (RH) dari tekanan di atas permukaan hingga 20 hPa (mb) melalui situs http://www.arl.noaa.gov/ready-bin/profile2a.pluntuk titik lokasi Bandara Soekarno-Hatta, Cengkareng (6o7’ LS dan 106o39’ BT) dan Bandara Juanda (7o22’ LS dan 112o46’ BT), Surabaya dan 9 (sembilan) titik lokasi stasiun observasi suhu permukaan di Pulau Jawa (Serang, Citeko, Jatiwangi, Tanjung Priok, Cilacap, Achmad Yani – Semarang, Banyuwangi, Bawean, dan Kalianget).
Selanjutnya dilakukan analisis pola hubungan antara masing-masing parameter atmosfer dari ARL-NOAA dengan rawinsonde BMKG (observasi) dan antara suhu level permukaan pada pukul 06.00 UTC dari ARL-NOAA dengan suhu maksimum (Tmax) observasi stasiun permukaan. Analisis ini dilakukan untuk
menilai potensi pemanfaatan data ARL-NOAA dalam menduga parameter atmosfer dan Tmax di wilayah penelitian. Analisis ini dilakukan dengan
memplotkan nilai masing-masing parameter atmosfir ARL-NOAA dengan dari radiosonde dan antara T06.00_UTC ARL-NOAA dengan Tmax observasi BMKG
dalam satu grafik. Jika nilai parameter atmosfer dari ARL-NOAA memiliki pola yang dapat mengikuti fluktuasi nilai parameter atmosfer dari radiosonde dan Tmax
observasi BMKG, maka data ARL-NOAA dikatakan memiliki kemampuan yang baik dalam mengikuti pola perubahan (fluktuasi) nilai observasi.
Selain itu, analisis hubungan kedua data tersebut juga dinilai berdasarkan nilai korelasi (r) antara keduanya. Korelasi dinyatakan dengan suatu koefisien yang menunjukkan hubungan (linier) relatif antara dua peubah. Persamaan koefisien korelasi adalah :
...(3-1)
Nilai r digunakan untuk mengukur tingkat keeratan hubungan antara data ARL- NOAA dengan data observasi BMKG. Jika nilai r > 0,5 maka ada hubungan yang erat antara kedua data tersebut. Dengan demikian nilai parameter atmosfer dari ARL-NOAA dikatakan mempunyai potensi yang baik untuk digunakan sebagai penduga data iklim di permukaan. Analisis ini dilakukan dengan menggunakan perangkat lunak Minitab 14.
Untuk analisis selanjutnya, data parameter atmosfer dari ARL-NOAA dinotasikan sebagai berikut: untuk suhu (T) dengan T_arl, kelembaban (RH) dengan RH_arl, arah angin (WD) dengan WD_arl, dan kecepatan angin (WS) dengan WS_arl, sedangkan parameter atmosfer dari radiosonde dinotasikan dengan T_rason, RH_rason, dan seterusnya. Pada beberapa hubungan kedua data selanjutnya dinyatakan dengan rason untuk radiosonde dan arl untuk data dari ARL-NOAA.
Oleh karena, nilai masing-masing parameter pada setiap lapisan (layer) data rason dan data arl mempunyai batas yang tidak jelas sehingga memungkinkan adanya korelasi antar lapisan atmosfer tersebut, maka analisis statistik yang digunakan dalam penelitian ini adalah analisis PLSR (Partial Least Square Regression). Untuk menilai efektifitas dan kelebihan analisis PLSR, maka dilakukan perbandingannya dengan analisis regresi sederhana.
Analisis PLS (Partial Least Square)
PLS dikembangkan pertama kali oleh Herman Wold pada tahun 1966 sebagai teknik ekonometrik. PLS merupakan metode analisis yang powerfull karena tidak didasarkan pada banyak asumsi. Selain itu, data tidak harus terdistribusi normal, multivariat (indikator dengan skala kategori maupun rasio dapat digunakan pada model yang sama), dan sampel tidak harus besar. Menurut Abdi (2007), regresi PLS merupakan suatu teknik yang mutakhir yang mengkombinasikan ciri-ciri dari analisis komponen utama dan regresi berganda. PLS ditujukan untuk memprediksi atau menganalisis satu set peubah tak bebas (Y) dari satu set peubah bebas atau prediktor (X). Prediksi dapat dicapai melalui ekstraksi dari prediktor sejumlah faktor yang orthogonal yang disebut peubah laten yang mempunyai kemampuan memprediksi yang terbaik.
Untuk meregresikan peubah Y dengan sejumlah peubah prediktor X1,
...,Xp, maka metode PLS digunakan untuk mendapatkan faktor baru yang berperan
sebagai X. Faktor baru ini disebut peubah laten atau komponen. Setiap komponen merupakan kombinasi linier dari X1, ...,Xp. Prinsip ini sama seperti pada PCR
(Principle Component Regression), yakni kedua metode ini digunakan untuk mendapatkan beberapa faktor yang akan diregresikan dengan peubah Y. Perbedaan utamanya adalah PCR hanya menggunakan keragaman X untuk membangun faktor baru, sedangkan PLS menggunakan keragaman X dan Y untuk membangun faktor baru yang akan menggantikan peran peubah prediktor (penjelas). PLS akan membentuk komponen-komponen yang mampu menangkap sebagian besar informasi yang terdapat dalam peubah X yang akan digunakan untuk memprediksi y1, ..., yq sekaligus dengan mereduksi dimensi dari
Untuk menurunkan koefisien penduga dan B, maka matriks X merupakan sebuah dekomposisi bilinier dengan persamaan sebagai berikut:
= + + ⋯ + = = ...(3-2)
ti merupakan kombinasi linier dari X yang ditulis sebagai Xri. Vektor p x 1 dari pi
sering disebut “loading”. Tidak seperti pembobot dalam PCR (eigenvector i),
maka ri tidak orthonormal. Akan tetapi, ti haruslah orthogonal (seperti halnya
dengan Zi pada komponen utama). Ada dua cara untuk mendapatkan koefisien
penduga PLS, yakni dengan algoritma NIPALS atau SIMPLS.
Tahap pertama adalah orthogonalitas ti diperoleh dengan menganggapnya
sebagai kombinasi linier dari matriks sisaan Ei , dimana:
= , = − , = ...(3-3)
dengan wi adalah orthonormal. Dengan demikian, kedua faktor pembobot wi dan
ri ,dimana i = 1, 2, ..., m, akan berupa matriks yang sama. Dalam sebagian besar
algoritma multivariat maupun univariat, tahap pertama adalah menurunkan nilai wi dan ri ,dimana i = 1, 2, ..., m agar dapat digunakan untuk menghitung
kombinasi linier ti. Selanjutnya, p’i dihitung dengan cara meregresikan X
terhadap ti. Ketika sejumlah m faktor dihitung, maka hubungannya dapat ditulis
sebagai berikut:
= ...(3-4)
= ( ) ...(3-5)
= ( ) ...(3-6)
dimana faktor dominan m pertama (yang menangkap sebagian besar keragaman dalam X) mempunyai kemampuan maksimum untuk memprediksi model. Persamaan (3-6) menghubungkan dua set vektor pembobot berdasarkan transformasi linier. Dari persamaan (3-4) dan (3-5), pada saat proses transformasi dilakukan maka P’m Rm dan R’m Pm sama dengan Im.
= ! = ( ) = " ...(3-7)
Kemudian setelah dimensi m diperoleh, maka vektor nilai dugaan dari PLS dapat diwakili oleh m pertama PLS kombinasi linier Tm. Dengan demikian, PLS akan
diperoleh persamaan berikut:
#$ %& = ( ) # ...(3-8)
Untuk PLS multivariat, perolehan persamaannya hampir sama dengan yang univariat, kecuali bahwa vektor #$ %& diganti dengan matriks '( %& . Penggantian
untuk dan )*OLS untuk perolehan y sebagai berikut:
#$ %& = ( ) )*+%&...(3-9) Dengan demikian, jelas bahwa
)* %& = ( ) )*+%&...(3-10)
Persamaan yang lebih sederhana untuk )*+%& dapat diperoleh dengan subtitusi persamaan (3-4) ke dalam persamaan (3-5) yang akan menghasilkan: =
( ) . Selanjutnya dengan menggunakan persamaan (3-10) akan dihasilkan persamaan berikut:
)* %& = )*+%& = ( ) )*+%& ...(3-11)
Dalam PLS multivariat, maka -( %& mempunyai bentuk yang sama. Perbedaannya hanya pada )*+%& diganti dengan -(+%&, sehingga:
-( %& = ( ) -(+%& ...(3-12)
Selanjutnya, analisis PLSR dan regresi sederhana dilakukan dengan menggunakan perangkat lunak minitab 14.
Uji keterandalan dan konsistensi model dilakukan dengan cara validasi silang. Tingkat keterandalan model ditinjau dari nilai RMSEP (Root Mean Square Error Prediction) dan korelasi ( r ) antara nilai dugaan model dengan nilai observasi. RMSE menunjukkan tingkat bias pendugaan yang dilakukan oleh model pendugaan. Nilai RMSE dihitung berdasarkan rumus:
...(3-13) dengan n adalah banyaknya data, Xobi dan Xdgi berturut-turut adalah nilai
observasi dan nilai dugaan ke-i. Korelasi antara nilai prediksi (dugaan) (Xdg)
dengan nilai observasi (Xob) dihitung berdasarkan:
(3-14) Semakin kecil nilai RMSEP dan semakin besar nilai korelasi ( r ) antara nilai dugaan dengan nilai observasi, maka model semakin baik dan andal.
Secara rinci keseluruhan tahapan proses pengolahan data dan analisis disajikan pada bagan alir Gambar 3-1.
Gambar 3-1. Bagan alir tahap pemrosesan dan analisis data
Validasi silang (uji signifikansi & konsistensi model estimasi)
Model estimasi parameter profil atmosfer dan Tmax
dari ARL-NOAA
Uji Korelasi & RMSEP
Model Estimasi Parameter Atmosfer dan Tmax dari ARL-NOAA tervalidasi
Analisis statistik (korelasi & Regresi) Data Tmax T06.00 UTC Analisis PLSR T, RH, WS, WD T, RH, WS, WD Koordinat stasiun
Radiosonde READY ARLNOAA
Koordinat Pengukuran Radiosonde
Stasiun Observasi