Reduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan
Analisis Komponen Utama
Ferry Kondo Lembang
Jurusan Matematika FMIPA UNPATTI
ferrykondolembang@yahoo.co.id
Abstrak
Reduksi dimensi adalah bagian penting bagi prosedur menganalisis data berdimensi tinggi (ukuran besar). Didalam pemodelan statistika, reduksi dimensi dikenal sebagai teknik
pre-processing suatu model yang akan dikembangkan. Data luaran Global Circulation Model
(GCM) memiliki ukuran dimensi data yang tinggi (besar) disebabkan GCM adalah suatu model berbasis komputer yang terdiri atas berbagai persamaan numerik dan deterministik yang terpadu dan mengikuti kaidah-kaidah fisika dimana GCM mampu menduga perubahan unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut lintang dan bujur. Oleh karena itu, pada penelitian ini digunakan metode Analisis Komponen Utama (AKU) sebagai salah satu metode reduksi dimensi yang populer dalam ilmu statistika. Metode reduksi AKU diyakini mampu mempertahankan keragaman variabel asal sehingga keaslian data asal masih tetap ada disebabkan total keragaman yang dipakai adalah 90% untuk mendapatkan komponen utama yang optimal. Adapun domain grid data luaran GCM yang dipakai sebagai sampel penelitian adalah domain grid 3x3, 8x8, dan 12x12. Hasil penelitian menunjukkan bahwa total variabel prediktor yang dihasilkan dengan metode AKU pada domain grid 3×3 adalah 17 variabel, domain 8×8 adalah 34 variabel, dan domain 12×12 adalah 48 variabel. Semakin luas domain maka semakin banyak komponen utama yang dipakai untuk memperoleh keragaman lebih dari 90%.
Kata Kunci:GCM, Analisis Komponen Utama, Keragaman
1. Pendahuluan
Sampai saat ini, GCM (General Circulation Models) diakui banyak pihak sebagai alat penting dalam upaya memahami sistem iklim. GCM mampu menduga perubahan unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut lintang dan bujur (von Stroch et al. 1993 dalam Sutikno, 2008). Ukuran-ukuran grid yang besar ini tentu saja seringkali menjadi masalah bagi beberapa peneliti yang berkecimpung dibidang klimatologi dalam memprediksikan iklim maupun cuaca. Untuk daerah-daerah dengan topografi yang kompleks, di sepanjang garis pantai, dan daerah-daerah dengan tutupan lahan yang sangat heterogen, seperti Indonesia model GCM hasilnya kurang sensitif. Model GCM yang sesuai diterapkan di Indonesia adalah model dengan resolusi horisontal yang tinggi dan skema konveksi yang komprehensif. Untuk itu perlu diupayakan suatu teknik reduksi dimensi untuk memperkecil ukuran grid-grid pada data luaran GCM sehingga memudahkan peneliti yang ada untuk memprediksi iklim dan cuaca secara tepat.
Pada penelitian Manorang, et.al (2009) membandingkan metode AKU dan AKU Kernel untuk mereduksi dimensi data luaran GCM Kabupaten Indramayu. Berdasarkan penelitian yang dilakukan Manorang, et al, metode reduksi dimensi AKU memberikan hasil yang lebih baik dari metode AKU Kernel. Tertarik dengan penelitian Manorang, maka dalam penelitian
digunakan mampu menjelaskan lebih besar sama dengan 90% keragaman dari keragaman total. Penelitian ini diharapkan dapat digunakan BMKG untuk kajian dampak iklim dengan basis data luaran GCM, khususnya dalam penggunaan reduksi dimensi AKU.
Tinjauan Pustaka
Analisis Komponen Utama (AKU)
Analisis Komponen Utama adalah struktur yang menjelaskan varian kovarian yang terdiri atas sedikit kombinasi linier dari variabel asal (Johnson dan Wichern, 1998). Sharma (1996) menyatakan AKU adalah teknik untuk membentuk linier komposit variabel baru dari variabel asal. Sehingga variabel baru itu nantinya merupakan ringkasan/susutan dari variabel asal dengan tetap mampu menjelaskan semaksimal mungkin variabel asalnya. Jadi secara umum AKU adalah meringkas/menyusut variabel untuk lebih mempermudah interpretasi.
Variabel baru yang dihasilkan maksimal sebanyak variabel asalnya. Secara gometrik, AKU untuk menentukan sekumpulan sumbu ortogonal yang baru. Penjelasannya sebagai berikut :
1. Koordinat observasi pada sumbu akan menunjukkan nilai bagi variabel baru. Sumbu baru ini (variabel baru yang terbentuk) disebut PCs dan nilai pada PCs ini disebut principal
components scores.
2. Setiap variabel baru adalah kombinasi linier dari variabel asal. 3. Variabel baru pertama (PC ke-1) memuat varian maksimum data.
4. Variabel baru kedua (PC ke-2) memuat varian maksimum yang tidak termuat oleh variabel baru pertama (PC ke-1).
5. Variabel baru ke-p (PC ke-p) memuat varian maksimum yang tidak termuat dalam variabel baru sebelumnya (PC ke-1 sampai PC ke- (p-1)).
6. Variabel baru yang terbentuk tidak berkorelasi.
Secara aljabar AKU adalah kombinasi linier dari p variabel random X1, X2,…, Xp. Kombinasi
linier ini adalah seleksi dari koordinat baru dari rotasi variabel asal (X1, X2,…, Xp) sebagai
sumbu koordinat (Johnson dan Wichern,1998). Sumbu baru ini mampu menjelaskan variasi maksimum dan menghasilkan penjelasan yang lebih simpel dan hemat dari struktur kovarian.
Global Circulation Model (GCM)
GCM adalah suatu model berbasis komputer yang terdiri atas berbagai persamaan numerik dan deterministik yang terpadu dan mengikuti kaidah-kaidah fisika. Model ini menduga perubahan unsur-unsur cuaca dalam bentuk luaran grid-grid yang berukuran 100-500 km menurut lintang dan bujur (von Stroch et al. 1993 dalam Sutikno, 2008). GCM merupakan suatu alat penting dalam studi keragaman iklim dan perubahan iklim (Zorita dan Storch, 1999). Namun informasi GCM masih berskala global dan tidak untuk fenomena skala lebih kecil (lokal), sehingga sulit untuk memperoleh langsung informasi berskala lokal dari GCM. Resolusi GCM terlalu rendah untuk memprediksi iklim lokal yang dipengaruhi oleh sirkulasi atmosfir dan parameter lokal seperti topografi dan tataguna lahan, tetapi GCM masih mungkin digunakan untuk memperoleh informasi skala lokal atau regional bila teknik
3. Metodologi
Data yang digunakan adalah data sekunder yang diperoleh dari data luaran GCM model CSIRO-Mk3. Domain GCM yang digunakan adalah domain 3x3 , pada posisi 4.660 LS- 8.390 LS, 106.870 BT– 110.640 BT, domain 8x8 , pada posisi 0.930-13.990 LS, 101.120 BT - 114.380 BT; dan domain 12x12 , pada posisi 2.790 LU-17.720 LS, 97.500 BT – 118.1250 BT. Lokasi domain yang diambil adalah pada stasiun Amahai. Variabel prediktor meliputi: precipitable water (prw), tekanan permukaan laut (slp), komponen angin meridional (va), komponen zonal (ua), ketinggian geopotensial (zg), dan kelembaban spesifik (hus). Ketinggian (level) adalah 850 hPa, 500 hPa, dan 200 hPa.
Tabel 1 Variabel Prediktor yang diambil dari model luaran CSIRO-Mk3 dan pengkodingan.
Tahapan analisis data dalam penelitian ini yaitu :
1. Melakukan reduksi dimensi. Metode reduksi dimensi yaitu Analisis Komponen Utama. Berikut akan diuraikan langkah-langkah analisisnya:
1. Anggap sekumpulan observasi xj, dimana j: 1,2,...,m pada input data R n
.
2. Untuk satuan variabel asal tidak sama, seringkali dilakukan pembakuan (stadardization) dulu sebelum dibuat matriks varian-kovarian. Sehingga
1 0 n j j x
.3. Membuat matrik Varian Kovariansi Σ.
4. Menentukan nilai akar karakteristik (eigen value) dengan menghitung I 0. 5. Menentukan jumlah komponen utama yang dibangkitkan (dengan melihat nilai eigen
value). Keragaman yang lebih dari 90% menunjukkan banyaknya komponen utama
yang harus dibangkitkan.
6. Menghitung nilai komponen utama (scores) dari model komponen utama a'X
i i
Y ,
dimana ai adalah eigenvektor. PEMBAHASAN
Pra-pemrosesan Pemodelan Statistical Downscaling
Pra-pemrosesan pemodelan Statistical Downscaling (SD) adalah salah satu tahapan yang mengkaji luasan dan lokasi grid domain GCM yang optimum untuk penyusunan pemodelan SD. Pra-pemrosesan pemodelan SD berupa reduksi dimensi.
level) diambil satu atau lebih komponen utama dengan keragaman lebih dari 90% sebagai variabel prediktor.
4.2 Hasil Reduksi Dimensi menggunakan Metode AKU
Reduksi dimensi dengan metode AKU pada variabel HUSS ditunjukkan pada Tabel 2. Tabel 2 memberikan informasi kumulatif proporsi komponen utama variabel HUSS pada masing-masing grid.
Tabel 2 Nilai Eigen dan Kumulatif Proporsi Metode AKU pada Variabel HUSS domain 3×3,
8×8, dan 12×12
Keterangan: Kum= Kumulatif proporsi keragaman
Tabel 2 memberikan informasi bahwa jumlah komponen utama yang mempunyai keragaman ≥ 90% pada domain 3×3, 8×8 12×12, masing-masing adalah 1, 3, dan 5. Hal ini menunjukkan semakin luas domain maka semakin banyak komponen utama (PC) yang dipakai dan sebaliknya. Situasi ini mungkin tidak berlaku bagi variabel luaran GCM yang lain. Variabel luaran GCM yang satu dengan yang lain memiliki karakteristik yang berbeda-beda. Hal ini dimungkinkan karena setiap variabel luaran GCM memiliki level/ketinggian yang berbeda-beda pula.
Plot scores komponen utama variabel HUSS ditunjukkan pada gambar 1.
Gambar 1 memperlihatkan plot komponen utama masing-masing domain. Domain 3x3 dan 12x12 cenderung memiliki bentuk plot yang hampir menumpuk pada satu sisi. Sedangkan domain 8x8 memiliki bentuk plot yang menyebar secara merata.
Reduksi dimensi dengan metode PCA pada berbagai variabel luaran GCM selain variabel HUSS, dapat dilakukan dengan cara yang sama dengan reduksi dimensi PCA pada variabel HUSS.
Tabel 3 memperlihatkan jumlah komponen utama dengan keragaman ≥ 90% untuk setiap variabel luaran GCM pada domain 3×3, 8×8, dan 12×12.
Tabel 3 Jumlah PC dan Kumulatif Proporsi dengan Metode AKU pada Berbagai Variabel Luaran
GCM.
Keterangan: Kum= Kumulatif proporsi keragaman
Total variabel prediktor yang dihasilkan dengan metode AKU pada domain 3×3 adalah 17 variabel, domain 8×8 adalah 34 variabel, dan domain 12×12 adalah 48 variabel. Dapat disimpulkan bahwa semakin luas domain maka semakin banyak komponen utama yang dipakai untuk memperoleh keragaman lebih dari 90%. Semakin sedikit jumlah komponen dan mempunyai persentase keragaman yang besar menunjukkan antar variabel (grid) memiliki hubungan sangat erat dan sebaliknya.
Kesimpulan dan Saran Kesimpulan
Berdasarkan hasil analisis dan pembahasan didapatkan beberapa kesimpulan :
Prosedur mendapatkan komponen utama (PC) pada metode AKU dengan total variabel prediktor yang dibangkitkan dengan metode PCA pada domain 3×3 adalah 17 variabel, pada domain 8×8 adalah 34 variabel, dan pada domain 12×12 adalah 48 variabel. Hal ini menunjukkan bahwa semakin luas domain maka semakin banyak komponen utama yang dipakai untuk memperoleh keragaman lebih dari 90%.
Saran
Beberapa saran yang dapat direkomendasikan dalam memperbaiki penelitian ini diantaranya:
Daftar Pustaka
Johnson, R.A and Wichern, D.W. (1998). Applied Multivariate Statistical Analysis. 5th Ed. New Jersey: Prentice Hall.
Jolliffe, I.T. (1986). Principal Component Analysis, Second Ed. New York: Springer-Verlag. Khotimah, K, Sutikno, Otok, W.B (2009). “ Reduksi Dimensi Robust Dengan Estimator
MCD Untuk Pra- Pemrosesan Data Pemodelan Statistical Downscaling”. Prosiding Seminar Nasional Matematika dan Pendidikan Matematika 8 Agustus 2009 UNESA . Surabaya.
Manorang Y, Sutikno, Setiawan, Otok WB, (2009). “Analisis Komponen Utama Kernel Untuk Pra Pemrosesan Pemodelan Statistical Downscaling”. Prosiding Seminar Nasional Matematika dan Pendidikan Matematika 8 Agustus 2009 UNESA . Surabaya. Sutikno. (2008). “Statistical Downscaling Luaran GCM dan Pemanfaatannya untuk
Peramalan Produksi Padi” Disertasi. Bogor: Program Pascasarjana, Institut Pertanian
Bogor.
Wigena, A.H. (2006). “Pemodelan Statistical Downscaling dengan Regresi Projection
Pursuit untuk Peramalan Curah Hujan Bulanan” Disertasi. Bogor: Program
Pascasarjana, Institut Pertanian Bogor.
Zorita, E. and von Storch, H., (1999): “The analog method as a simple statistical downscaling technique: comparison with more complicated method”, Journal of Climate, 12, 2474-2489.
Profil Penulis
Ferry Kondo Lembang
Pada Tanggal 16 Februari 1984, Penulis dilahirkan di Kota Ambon sebagai anak ketiga dari empat bersaudara. Pendidikan formal penulis berawal di TK Efata Hative Kecil Kota Ambon selama satu tahun, dilanjutkan pada SDN 2 Hative Kecil Kota Ambon. SLTP negeri 3 Ambon merupakan lanjutan pendidikan formal penulis setelah menamatkan pendidilan di Sekolah Dasar. Pada Tahun 2001, setelah lulus dari SMA Negeri 5 Ambon, penulis melanjutkan pendidilan S1 di Jurusan Matematika UNPATTI. Setelah lulus S!, pada tahun 2008 penulis melanjutkan pendidikan pada Strata 2 (S2) pada Jurusan Statistika ITS Surabaya. Sampai sekarang penulis berstatus Dosen tetap pada jurusan matematika FMIPA UNPATTI dengan mengampuh beberapa mata kuliah Statistika diantaranya Metode Statistika, Statistika Matematika 1, dan Analisis Multivariat.