4 MODEL LINIER SEBARAN PARETO TERAMPAT - Pemodelan Linier Sebaran Gamma dan Pareto Terampat den

Pendahuluan

Pada Bab 3 dibahas metode pemodelan linier dengan respons non-negatif yaitu dengan menggunakan model linier terampat sebaran Gamma. Selain sebaran Gamma, terdapat sebaran lain yang dapat digunakan dalam pendugaan data yang menjulur ke kanan yaitu sebaran pareto terampat (generalized pareto/GP). Pendugaan model linier sebaran pareto terampat termasuk ke dalam pemodelan teori nilai ekstrim (extreme value theory/EVT).

Teori nilai ekstrim merupakan suatu metode dalam ilmu statistik untuk membangun teknik dan model yang menggambarkan sesuatu selain nilai tengah (Coles 2001). Teori ini umumnya digunakan untuk mengatasi masalah kejadian-kejadian ekstrim, dimana frekuensi terjadinya sangat rendah. Penentuan kejadian ekstrim ini tidak dapat dilakukan dengan pendekatan sebaran normal tetapi dengan suatu sebaran yang memiliki ekor yang cukup panjang (heavy tail). Terdapat dua metode untuk menjelaskan perilaku data ekstrim, yaitu metode Blok Maksima/Minima dan metode pelampauan ambang (Peak Over Threshold/POT). Keduanya didasarkan pada bentuk sebaran dan teknik pengambilan amatan ekstrim yang berbeda.

Metode Blok Maksima menggunakan sebaran nilai ekstrim terampat

(Generalized Extreme Value - GEV) dengan mengambil amatan-amatan ekstrim

(maksimum atau minimum) pada periode tertentu dari seluruh pengamatan. Terdapat tiga sebaran yang termasuk dalam kelompok sebaran GEV ini, yaitu sebaran Fr´echet, Gumbel, dan Weibull. Sedangkan metode pelampauan ambang menggunakan sebaran pareto terampat (Generalized Pareto Distribution - GPD) yang mengambil amatan-amatan ekstrim berupa nilai yang melampaui suatu nilai ambang yang telah ditetapkan.

Sebaran Pareto Terampat (GPD)

MisalX₁,X₂, . . . ,Xnadalah peubah acak dengan fungsi sebaran yang sama

F dan Mn=max_{X₁,X₂, . . . ,Xn}. Jika ada konstan sekuensial an>0 dan bn

sehingga Pr(Mn−bn)/anz→G(z) , n→∞ untuk fungsi sebaran non-degenerate G, maka G adalah anggota dari keluarga GEV.

Bentuk sebaran dari keluarga GEV memiliki fungsi sebaran (Coles 2001):

G(z) =exp ( − 1+ξ z₋µ σ −1/ξ) , untuk_{z: 1+ξ(z₋µ)/σ>0_} (4.1) dalam hal ini₋∞<µ<∞, σ>0 dan ₋∞<ξ<∞.

Jikaξ=0 (didekati menggunakan limit) akan menghasilkan sebaran dengan ekor yang sedang (Gumbel), jika ξ>0 menghasilkan sebaran dengan bagian ekor yang padat (Fr`echet) dan jikaξ<0 menghasilkan sebaran dengan bagian ekor yang pendek (Weibull).

JikaXmemenuhi sebaran GEV, maka sebaran(X₋u)dengan syaratX>u

termasuk sebaran keluarga GPD yang memiliki fungsi sebaran:

H(y) =1₋ 1+ξy ˜ σ −1/ξ , untuk_{y:y>0 dan(1+ξy/σ˜)>0_} (4.2) dalam hal ini ˜σ=ξ(u₋µ).

Pendugaan Parameter

Pendugaan parameter sebaran teori nilai ekstrim (GEV dan GPD) dilakukan melalui metode pendugaan kemungkinan maksimum (Coles 2001). Terdapat tiga parameter yang diduga dalam sebaran ini, yaitu parameter lokasi (µ), skala/scale (σ) dan bentuk/shape (ξ). Untuk sebaran pareto terampat, nilai ambang digunakan sebagai parameter lokasi (µ), sehingga pendugaan parameter hanya dilakukan pada parameter skala/scale (σ) dan bentuk/shape (ξ). Yee dan Stephenson (2007) melakukan pendugaan parameter sebaran GEV dan GPD dalam framework vektor model linier/aditif terampat (VGLM/VGAM) yang merupakan pengembangan metode model linier/aditif terampat untuk respons peubah ganda. Metode pendugaan parameter yang digunakan dalam Yee dan Stephenson (2007) adalah prosedurIteratively Reweighted Least Squareseperti dalam pemodelan linier terampat (lihat Bab 3). Pemodelan sebaran pareto terampat di dalam Yee dan Stephenson 2007, dilakukan dengan memodelkan peubah kovariat secara linier secara langsung terhadap parameter skalaσ (dapat menggunakan fungsi hubung), sedangkan parameter bentuk ξ diduga berupa nilai konstan. Terdapat batasan terhadap parameter bentukξ, dalam hal ini parameter bentuk ξyang dapat diduga oleh model linier sebaran pareto terampat adalahξ<1 karena fungsi kemungkinan dari sebaran pareto terampat tidak dapat didiferensialkan padaξ_≥1. Teknik ini diimplementasikan dalam paket VGAM pada perangkat lunak komputasi statistik R.

Teknik lain untuk menduga model linier sebaran pareto terampat adalah dengan menggunakan teknik optimisasi numerik umum seperti teknik optimisasi Nelder-Mead yang digunakan oleh Coles (2001) dalam menduga koefisienβdengan nilai awal untuk parameter beta adalah

√

6var(y)

π . Teknik ini diimplementasikan

dalam paket ismev pada perangkat lunak komputasi statistik R.

Perbandingan Metode IRWLS dengan Metode Optimisasi Nelder-Mead

Untuk menentukan nilai awal pada pengembangan model linier sebaran pareto terampat dengan teknik regularisasi L1 diperlukan perbandingan antara

metode IRWLS yang dikembangkan oleh Yee dan Stephenson (2007) dan metode_√

6var(y)

π yang dikembangkan oleh Coles (2001). Metodologi perbandingan yang

Data

Data yang digunakan untuk perbandingan adalah data simulasi terdiri dari data kovariat sebanyak 6 peubah yang saling bebas dan peubah respons yang dibangkitkan dari sebaran pareto terampat.

Metode

Tahapan kajian perbandingan metode pendugaan model linier sebaran pareto terampat menggunakan IRWLS dengan metode optimisasi Nelder-Mead adalah sebagai berikut:

1. Menetapkan skenario parameterβsecara sembarang sebanyak 6 buah, yaitu kombinasi parameter β= 0.7 (perwakilan<1), 1, dan 3.0 (perwakilan >1) masing-masing sebanyak 2.

2. Membangkitkan data kovariat

Data kovariat dibangkitkan sebanyak 6 peubah dengan 100 observasi dari sebaran X _∼ NormalGanda(µ,∑), dalam hal ini ∑ merupakan matriks identitas.

3. Membangkitkan data respons

Data respons dibangkitkan dari sebaran pareto terampat dengan cara sebagai berikut:

• Tetapkan parameter shapeξyaituξ=₋0.5 (secara sembarang).

• Tetapkan parameter lokasi (threshold) yaituµ=50 (secara sembarang).

• σ=exp(Xβ).

• Bangkitkany_∼GPD(µ,ξ,σ)sebanyak n=100.

4. Menduga nilai dugaan model linier sebaran pareto terampat dengan metode IRWLS dari paket VGAM pada perangkat lunak komputasi statistik R yaitu dengan menduga:σ=β0+β1x1+. . .+β6x6.

5. Menduga nilai dugaan model linier sebaran pareto terampat menggunakan metode optimisasi Nelder-Mead dengan nilai awal

√

6var(y)

π dari paket ismev

pada perangkat lunak komputasi statistik R yaitu dengan menduga:σ=β0+

β1x1+. . .+β6x6.

6. Proses pembangkitan data dan pendugaan parameterβdi ulang sebanyak 100 kali

7. Membuat plot sebaran penduga parameterβi

Hasil dan Pembahasan

Pemilihan nilai awal pengembangan regularisasi L1 model linier sebaran

pareto terampat menggunakan teknik optimisasi Nelder-Mead dilakukan dengan cara memperbandingkan metode pemodelan linier sebaran pareto terampat yang ada. Terdapat dua teknik pendugaan parameter dalam pemodelan linier sebaran pareto terampat, yaitu menggunakan teknik IRWLS (Yee dan Stephenson 2007) dan teknik optimisasi Nelder-Mead dengan nilai awal

√

6var(y)

digunakan untuk keperluan ini dalam kondisi ideal, yaitu kovariat saling bebas atau tidak terkondisi buruk.

Sebaran hasil pendugaan parameter β disajikan pada Gambar 4.1. Terlihat pada Gambar 4.1, pendugaan menggunakan metode IRWLS memperoleh hasil yang tidak bias dengan simpangan (ragam) yang kecil dibanding pendugaan parameter β menggunakan metode optimisasi Nelder-Mead. Pada pendugaan menggunakan metode optimisasi Nelder-Mead parameter β diduga sangat jauh dari nilai sebenarnya. Selain sangat jauh dari nilai sebenarnya, simpangan (ragam) pendugaannya juga sangat lebar. Oleh karena itu selanjutnya digunakan metode IRWLS untuk mendapatkan nilai awal pendugaan parameter β dalam pengembangan model linier sebaran pareto terampat dengan teknik regularisasi L1.

Gambar 4.1 Dugaan paramater β pada model linier sebaran pareto terampat menggunakan metode IRWLS pada paket VGAM dan metode optimisasi Nelder-Mead pada paket ismev

Pengembangan Teknik Regularisasi L1 pada Model Linier Sebaran Pareto Terampat

Seperti pengembangan teknik regularisasi L1 pada model linier terampat

sebaran Gamma, pengembangan teknik regularisasi L1 pada model linier sebaran

pareto terampat dilakukan dengan cara yang sama. Tahap pertama menentukan nilai awal parameter sebaran dengan menggunakan metode IRWLS sebagai nilai penduga yang baik pada pemodelan linier sebaran pareto terampat. Tahap kedua melakukan optimisasi Nelder-Mead dengan nilai awal yang diperoleh. Algoritma diimplementasikan ke dalam perangkat lunak komputasi statisik R disajikan pada Lampiran 6.

Hasil uji coba implementasi algoritma di atas untuk pemodelan linier sebaran pareto terampat dengan regularisasi L1 pada parameter pengatur λ =0 ternyata

memberikan dugaan seperti menggunakan nilai awal

√

6var(y)

π . Pada kasus ini, nilai

awal parameter menggunakan teknik IRWLS tidak memiliki pengaruh terhadap hasil akhir pendugaan koefisienβmenggunakan optimisasi Nelder-Mead.

Simpulan dan Saran

Pendugaan model linier sebaran pareto terampat dengan menggunakan metode IRWLS memberikan pendugaan parameter yang lebih baik dibanding dengan menggunakan teknik optimisasi Nelder-Mead dengan nilai awal

√

6var(y)

yang ditunjukkan oleh sebaran penduga βsecara empirik tak bias dan ragam yang kecil. Pengembangan teknik regularisasi L1menggunakan optimisasi Nelder-Mead

dengan nilai awal dari parameter yang diperoleh dengan metode IRWLS pada pemodelan linier sebaran pareto terampat belum memberikan hasil pendugaan parameter yang lebih baik. Oleh karena itu diperlukan metode lain untuk pengembangan regularisasi L1 pada pemodelan linier sebaran pareto terampat

misalnya dengan menggunakan teknik pendugaan bayesian (Park dan Casella 2008).

5 APLIKASI MODEL LINIER PADASTATISTICAL

Dalam dokumen Pemodelan Linier Sebaran Gamma dan Pareto Terampat dengan Regularisasi L1 pada Statistical Downscaling untuk Pendugaan Curah Hujan Bulanan Aplikasi Pada Pemodelan Curah Hujan di Kabupaten Indramayu (Halaman 51-57)