• Tidak ada hasil yang ditemukan

Pendahuluan

Beberapa kejadian alam secara alami hanya memiliki nilai non-negatif seperti contohnya curah hujan yang menjadi topik penelitian. Dalam statistika kejadian tersebut dapat dipandang sebagai peubah acak dengan rentang nilai0. Pendugaan nilai peubah acak dalam rentang nilai 0 dengan pendekatan pendugaan model linier yang dibangun pada Bab 2 tidak akan secara alami memperoleh dugaan selalu

≥0, dikarenakan teknik-teknik pendugaan tersebut berlandaskan respons berasal dari suatu peubah acak sebaran normal atau sebaran dengan rentang (∞,∞). Oleh karena itu pemodelan curah hujan dengan respons sebaran non-normal perlu dipertimbangkan untuk digunakan. Salah satu sebaran dengan rentang nilai 0 adalah sebaran Gamma 2-parameter.

Sebaran Gamma 2-parameter dapat dipandang sebagai rampatan

(generalized) dari sebaran eksponensial dengan nilai tengah 1/λ, (λ 0) yang merepresentasikan waktu tunggu sampai sebanyak a kejadian (Krishnamoorthy 2006). Menurut Das (1955) (di dalam Krishnamoorthy 2006) sebaran Gamma dipostulatkan dalam aplikasi curah hujan (presipitasi) dikarenakan presipitasi terjadi hanya ketika partikel air dapat terbentuk di sekitar debu dengan massa yang cukup, dan waktu tunggu untuk terjadinya akumulasi debu mirip dengan aspek waktu tunggu sebaran Gamma secara implisit. Bentuk dari sebaran Gamma tergantung dari parameter bentuk (shape), semakin mendekati nilai nol, bentuk sebaran akan menjulur ke kanan dan semakin menuju ∞ bentuk sebaran Gamma akan simetrik. Pemodelan linier dengan respons sebaran Gamma 2-parameter termasuk dalam kelas pemodelan linier terampat (Generalized Linear

Model/GLM), yang ditujukan untuk pemodelan dengan respons kontinu dan

menjulur (skewed) (Faraway 2006).

Model Linier Terampat dengan Respons Sebaran Gamma

Model linier terampat (GLM) merupakan rampatan dari model-model linier, dalam hal ini peubah respons berasal dari keluarga sebaran eskponensial dan adanya fungsi hubung yang menghubungkan antara nilai harapan dengan komponen sistematik dari model linier. Aspek penting dari rampatan semua model adalah keberadaan prediktor linier berdasarkan kombinasi linier dari peubah kovariat (peubah bebas/penjelas) dan adanya algoritma bersama untuk pendugaan parameter menggunakan metode kemungkinan maksimum. Komponen-komponen dari model linier terampat adalah sebagai berikut:

1. Komponen acak: Peubah respons (Y) berasal dari keluarga sebaran eksponensial denganE(Y) =µ.

2. Komponen sistematik:η=β0+∑1pxjβj

Fungsi kepekatan peubah acak dari keluarga sebaran eksponensial dituliskan dalam bentuk natural (McCullagh dan Nelder 1989) sebagai berikut:

fY(y;θ) =exp ( yθb(θ) a(φ) +c(y,φ) ) . (3.1)

dalam hal ini a(·), b(·) dan c(·) adalah fungsi tertentu,θadalah parameter kanonik, danφadalah parameter dispersi.

Perhatikan fungsi kepekatan sebaran Gamma 2-parameter untuk respons y

pada wilayah(0,∞)dituliskan sebagai:

fY(y;ν,ξ) =

νξ Γ(ξ)y

ξ−1exp(

−νy) (3.2) dalam hal iniνadalah parameter laju (rate) danξadalah parameter bentuk (shape). Untuk keperluan model linier terampat, nilaiνdiparameterisasi ulang denganν=ξµ. Dalam bentuk keluarga eksponensial dengan parameter θ = 1µ dan φ= 1ξ, fungsi kepekatan sebaran Gamma dapat ditulis:

fY(y;θ,φ) =exp ( −ξ y 1 µ −log 1 µ !

+ξlog(ξy)log(y)log(Γ(ξ))

)

(3.3)

Pendugaan Parameter

Pendugaan parameter model linier terampat dilakukan dengan menggunakan metode kemungkinan maksimum. Parameter βj dalam komponen sistematik digunakan untuk menduga nilai parameter µ sesuai dengan fungsi hubung yang digunakan. Untuk respons sebaran Gamma, fungsi hubung kanoniknya adalah

inverse/reciprocalyaitu 1µ. Hubunganµ dengan parameter dalam sebaran Gamma

adalahµ= ξν, dalam hal ini parameterξdianggap konstan. Solusi penduga secara numerik diperoleh melalui prosedurIterated Re-Weighted Least Squares(IRWLS) yang merupakan turunan dari aproksimasi metode Newton-Raphson (McCullagh dan Nelder 1989, Dobson 2002). Dengan metode IRWLS, solusi pendugaan dapat mencapai nilai maksimum dari fungsi kemungkinan apabila konvergen. Algoritma metode IRWLS adalah sebagai berikut:

1. Misalkanβradalah penduga ˆβsaat ini, hitung:

• ηˆr i :=xtiβr i=1, . . . ,n • µˆri :=g−1(ηˆr i) • θˆr i :=h−1(µˆri) • Vir :=a(φ)·b′′(θi)|θi=θˆr i • Zir:=ηˆr i+ (yi−µˆri) dηi dµi|ηi=ηˆ r i

23 • Wir:= Virdηi i|ηi=ηˆri 2−1

2. Regresikan Zir terhadap X dengan memberikan bobot (Wr

i)−1 untuk mendapatkan penduga baruβr+1dan ulangi Tahap 1 sampai

|βr

−βr+1

|cukup kecil.

Pengembangan Model Linier Terampat dengan Regularisasi L1

Solusi pendugaan parameter dalam pemodelan linier terampat dengan Regularisasi L1adalah (Friedmanet al.2010):

arg min βk ( −log[L(y;βk)]/n+λ p

k=1 |βk| ) . (3.4)

dalam hal iniL(y;βk)adalah fungsi kemungkinan keluarga sebaran eksponensial,λ adalahtuningparameter dalam regularisasi L1dannadalah banyaknya observasi.

Untuk mendapatkan nilai penduga parameter tidak dapat dilakukan secara deduktif kalkulus, tetapi dengan menggunakan metode optimisasi. Ada beberapa metode optimisasi numerik umum yang dapat digunakan untuk mendapatkan solusi optimisasi, salah satunya adalah metode Nelder-Mead. Metode Nelder-Mead atau metode downhill simplex merupakan metode yang hanya menggunakan fungsi untuk di-minimisasi/maksimisasi, kekar (robust) tetapi relatif lambat dan dapat konvergen ke titik non-statisioner apabila inisialiasi awal tidak tepat. Oleh karena itu dalam penelitian ini digunakan penggabungan metode IRWLS dan metode optimisasi untuk mendapatkan solusi pendugaan dari model linier terampat dengan Regularisasi L1 respons sebaran Gamma. Metode IRWLS pada nilai λ = 0

digunakan sebagai inisial awal dengan harapan metode optimisasi bergerak di sekitar fungsi kemungkinan yang maksimum. Algoritma yang digunakan adalah:

1. Pendugaan awal dengan metode IRWLS untuk λ = 0. Hasil koefisien pendugaan digunakan sebagai inisial awal metode optimisasi Nelder-Mead. 2. Lakukan pendugaan menggunakan metode optimisasi dengan metode

Nelder-Mead padaλtertentu yang ditetapkan.

Implementasi algoritma di atas dalam perangkat lunak komputasi statistik R disajikan pada Lampiran 5.

Perbandingan Teknik Regularisasi L1dengan Analisis Komponen Utama Data

Dua data kovariat terkondisi buruk digunakan dalam kajian ini seperti pada Bab 2, yaitu data presipitasi dari model GCM, yaitu luaran ensemble

dari banyak model CMIP5 (multi-model ensemble Phase 5 Couple Model

Intercomparisson Project) dengan skenario perubahan iklim moderat RCP

(Representative Concentration Pathways) 4.5 (Taylor et al. 2012) selanjutnya

disingkat sebagai CMIP5, dan data presipitasi hasil interpolasi kombinasi data observasi permukaan dan satelit dalam bentuk grid dari GPCP (Global Precipitation

Climatology Project) versi 2.2 (Adler et al. 2003) selanjutnya disingkat sebagai GPCP.

Metode

Tahapan kajian perbandingan teknik regularisasi L1 dengan teknik analisis

komponen utama pada model linier terampat sebaran Gamma adalah sebagai berikut:

1. Menetapkan skenario parameterβ

Parameterβdigunakan dua skenario, yaitu:

• kombinasi parameter β= 0.7 (perwakilan<1), 0, dan 3.0 (perwakilan

>1) masing-masing sebanyak 16, 17 dan 16.

• βseragam sebesar 0.7 (perwakilan<1) sebanyak 49. 2. Membangkitkan data respons

Data respons dibangkitkan dari sebaran Gamma dengan cara sebagai berikut:

• Tetapkan parameter shape ξ. Tiga nilai ξ digunakan dalam simulasi yaituξ=0.5, 1, dan 5.

• µ=1/Xβ.

• ν=ξ/µ

• BangkitkanyGamma(ξ,ν)

3. Menduga nilai dugaan model linier terampat sebaran Gamma dengan regularisasi L1

Nilai dugaan dengan teknik regularisasi L1digunakan dengan menggunakan

model µ = 1/(β0+β1x1+. . .+βkxk) dalam hal ini k adalah banyaknya kovariat yang terseleksi dengan menggunakan nilai validasi silang terkecil, dan xk adalah data presipitasi ke-k dari data kovariat luaran CMIP5 atau GPCP.

4. Menduga nilai dugaan dengan model linier terampat sebaran Gamma dengan analisis komponen utama

Nilai dugaan dengan regresi komponen utama digunakan dengan menggunakan model µ = 1/(β0+β1KU1+. . .+βkKUk) dalam hal ini

k adalah banyaknya komponen utama, dan KUk adalah data skor komponen utama ke-k dari data kovariat luaran CMIP5 atau GPCP.

5. Proses pembangkitan data dan pendugaan nilai tengah di ulang sebanyak 100 kali

6. Pemilihan Metode Pendugaan Terbaik

Metode pendugaan terbaik ditentukan melalui nilai penduga galat yang terkecil. Nilai Root Means Square Error (RMSE) digunakan untuk tujuan tersebut.

25

Hasil dan Pembahasan

Untuk menentukan teknik terbaik antara teknik regularisasi L1 dengan

analisis komponen utama, disusun skenario berdasarkan kemungkinan kovariat, nilai koefisien β pada model linier dan sebaran respons menggunakan sebaran Gamma. Skenario kemungkinan kovariat dan nilai koefisien β pada model linier digunakan skenario yang sama seperti pada Bab 2, yaitu skenario kovariat dari dua kemungkinan (data observasi GPCP dan data luaran CMIP5) dan dua skenario kemungkinan koefisien β berupa kombinasi (< 1, 0 dan > 1) dan β seragam

< 1. Tiga kemungkinan sebaran respons dari sebaran Gamma dibangkitkan untuk simulasi. Sebaran Gamma yang digunakan memiliki dua parameter, yaitu parameter bentuk (shape) dan parameter laju (rate). Parameter bentuk diasumsikan bernilai konstan, sedangkan parameter laju merupakan fungsi dari model linier. Pembangkitan respons dari sebaran Gamma disusun berdasarkan skenario pemilihan parameter bentuk yaituξ=0.5, 1, dan 5. Parameter bentukξ

1 memberikan bentuk sebaran seperti bentuk sebaran eksponensial, dan semakin besar nilaiξbentuk sebaran Gamma akan menuju ke bentuk sebaran simetrik seperti sebaran normal. Dengan demikian terdapat 12 skenario yang digunakan untuk menentukan metode/teknik yang terbaik antara teknik regularisai L1dengan analisis

komponen utama.

Sebaran nilai RMSE untuk 12 skenario disajikan pada Gambar 3.1 untuk skenario kovariat data observasi GPCP dan Gambar 3.2 untuk skenario kovariat luaran CMIP5. Secara umum sebaran nilai RMSE menunjukkan penggunaan teknik regularisasi L1 memiliki bentuk yang sama dengan sebaran nilai RMSE yang

diperoleh menggunakan analisis komponen utama. Hal ini berbeda sangat nyata dibanding dengan perbandingan antara teknik lasso (regularisasi L1 pada regresi

linier) dengan metode regresi komponen utama pada Bab 2 sebelumnya.

Dari 12 skenario yang dicoba dalam simulasi, rataan nilai RMSE yang diperoleh dari dugaan model dengan teknik regularisasi L1 tampak lebih kecil

dibanding dengan teknik analisis komponen utama tetapi perbedaannya tidak signifikan dan masih dalam selang kepercayaan yang sama. Tidak ada pola sebaran RMSE yang jelas untuk menentukan mana metode yang terbaik antara pemodelan linier terampat sebaran Gamma dengan teknik regularisasi L1 maupun dengan

teknik pereduksian dimensi menggunakan analisis komponen utama. Semua skenario memberikan perbandingan yang sama antara teknik regularisasi L1dengan

teknik analisis komponen utama.

Terdapat perbedaan rataan nilai RMSE yang diperoleh dari dua skenario nilai koefisienβ. Pada skenario nilai koefisienβseragam<1, rataan nilai RMSE selalu lebih kecil dibanding dengan skenario nilai koefisien kombinasi baik pada skenario kovariat GPCP maupun kovariat CMIP5. Tetapi semakin besar nilai parameter bentuk, teknik regularisasi L1 menunjukkan kecenderungan untuk mendapatkan

27

Simpulan

Pendugaan nilai tengah dari model dengan respons sebaran Gamma menggunakan pemodelan linier terampat memberikan nilai rataan RMSE yang sama baiknya antara teknik regularisasi L1 dengan analisis komponen utama.

Semakin besar parameter bentuk (ξ), rataan nilai RMSE yang diperoleh dengan teknik regularisasi L1 menunjukkan kecenderungan lebih kecil dibanding dengan

teknik analisis komponen utama. Di samping itu, rataan RMSE dari koefisien

β kombinasi selalu lebih besar dibanding dengan rataan RMSE dari koefisien

beta seragam <1. Keunggulan lain dengan teknik regularisasi L1 adalah dalam

menseleksi kovariat penting sehingga dapat menentukan peubah kovariat yang mempengaruhi respons secara langsung dibandingkan analisis komponen utama yang tidak bisa secara langsung.

Dokumen terkait