Pendahuluan
Pada Bab 3 dibahas metode pemodelan linier dengan respons non-negatif yaitu dengan menggunakan model linier terampat sebaran Gamma. Selain sebaran Gamma, terdapat sebaran lain yang dapat digunakan dalam pendugaan data yang menjulur ke kanan yaitu sebaran pareto terampat (generalized pareto/GP). Pendugaan model linier sebaran pareto terampat termasuk ke dalam pemodelan teori nilai ekstrim (extreme value theory/EVT).
Teori nilai ekstrim merupakan suatu metode dalam ilmu statistik untuk membangun teknik dan model yang menggambarkan sesuatu selain nilai tengah (Coles 2001). Teori ini umumnya digunakan untuk mengatasi masalah kejadian-kejadian ekstrim, dimana frekuensi terjadinya sangat rendah. Penentuan kejadian ekstrim ini tidak dapat dilakukan dengan pendekatan sebaran normal tetapi dengan suatu sebaran yang memiliki ekor yang cukup panjang (heavy tail). Terdapat dua metode untuk menjelaskan perilaku data ekstrim, yaitu metode Blok Maksima/Minima dan metode pelampauan ambang (Peak Over Threshold/POT). Keduanya didasarkan pada bentuk sebaran dan teknik pengambilan amatan ekstrim yang berbeda.
Metode Blok Maksima menggunakan sebaran nilai ekstrim terampat
(Generalized Extreme Value - GEV) dengan mengambil amatan-amatan ekstrim
(maksimum atau minimum) pada periode tertentu dari seluruh pengamatan. Terdapat tiga sebaran yang termasuk dalam kelompok sebaran GEV ini, yaitu sebaran Fr´echet, Gumbel, dan Weibull. Sedangkan metode pelampauan ambang menggunakan sebaran pareto terampat (Generalized Pareto Distribution - GPD) yang mengambil amatan-amatan ekstrim berupa nilai yang melampaui suatu nilai ambang yang telah ditetapkan.
Sebaran Pareto Terampat (GPD)
MisalX1,X2, . . . ,Xnadalah peubah acak dengan fungsi sebaran yang sama
F dan Mn=max{X1,X2, . . . ,Xn}. Jika ada konstan sekuensial an>0 dan bn
sehingga Pr(Mn−bn)/anz→G(z) , n→∞ untuk fungsi sebaran non-degenerate G, maka G adalah anggota dari keluarga GEV.
Bentuk sebaran dari keluarga GEV memiliki fungsi sebaran (Coles 2001):
G(z) =exp ( − 1+ξ z−µ σ −1/ξ) , untuk{z: 1+ξ(z−µ)/σ>0} (4.1) dalam hal ini−∞<µ<∞, σ>0 dan −∞<ξ<∞.
Jikaξ=0 (didekati menggunakan limit) akan menghasilkan sebaran dengan ekor yang sedang (Gumbel), jika ξ>0 menghasilkan sebaran dengan bagian ekor yang padat (Fr`echet) dan jikaξ<0 menghasilkan sebaran dengan bagian ekor yang pendek (Weibull).
JikaXmemenuhi sebaran GEV, maka sebaran(X−u)dengan syaratX>u
termasuk sebaran keluarga GPD yang memiliki fungsi sebaran:
H(y) =1− 1+ξy ˜ σ −1/ξ , untuk{y:y>0 dan(1+ξy/σ˜)>0} (4.2) dalam hal ini ˜σ=ξ(u−µ).
Pendugaan Parameter
Pendugaan parameter sebaran teori nilai ekstrim (GEV dan GPD) dilakukan melalui metode pendugaan kemungkinan maksimum (Coles 2001). Terdapat tiga parameter yang diduga dalam sebaran ini, yaitu parameter lokasi (µ), skala/scale (σ) dan bentuk/shape (ξ). Untuk sebaran pareto terampat, nilai ambang digunakan sebagai parameter lokasi (µ), sehingga pendugaan parameter hanya dilakukan pada parameter skala/scale (σ) dan bentuk/shape (ξ). Yee dan Stephenson (2007) melakukan pendugaan parameter sebaran GEV dan GPD dalam framework vektor model linier/aditif terampat (VGLM/VGAM) yang merupakan pengembangan metode model linier/aditif terampat untuk respons peubah ganda. Metode pendugaan parameter yang digunakan dalam Yee dan Stephenson (2007) adalah prosedurIteratively Reweighted Least Squareseperti dalam pemodelan linier terampat (lihat Bab 3). Pemodelan sebaran pareto terampat di dalam Yee dan Stephenson 2007, dilakukan dengan memodelkan peubah kovariat secara linier secara langsung terhadap parameter skalaσ (dapat menggunakan fungsi hubung), sedangkan parameter bentuk ξ diduga berupa nilai konstan. Terdapat batasan terhadap parameter bentukξ, dalam hal ini parameter bentuk ξyang dapat diduga oleh model linier sebaran pareto terampat adalahξ<1 karena fungsi kemungkinan dari sebaran pareto terampat tidak dapat didiferensialkan padaξ≥1. Teknik ini diimplementasikan dalam paket VGAM pada perangkat lunak komputasi statistik R.
Teknik lain untuk menduga model linier sebaran pareto terampat adalah dengan menggunakan teknik optimisasi numerik umum seperti teknik optimisasi Nelder-Mead yang digunakan oleh Coles (2001) dalam menduga koefisienβdengan nilai awal untuk parameter beta adalah
√
6var(y)
π . Teknik ini diimplementasikan
dalam paket ismev pada perangkat lunak komputasi statistik R.
Perbandingan Metode IRWLS dengan Metode Optimisasi Nelder-Mead
Untuk menentukan nilai awal pada pengembangan model linier sebaran pareto terampat dengan teknik regularisasi L1 diperlukan perbandingan antara
metode IRWLS yang dikembangkan oleh Yee dan Stephenson (2007) dan metode√
6var(y)
π yang dikembangkan oleh Coles (2001). Metodologi perbandingan yang
31
Data
Data yang digunakan untuk perbandingan adalah data simulasi terdiri dari data kovariat sebanyak 6 peubah yang saling bebas dan peubah respons yang dibangkitkan dari sebaran pareto terampat.
Metode
Tahapan kajian perbandingan metode pendugaan model linier sebaran pareto terampat menggunakan IRWLS dengan metode optimisasi Nelder-Mead adalah sebagai berikut:
1. Menetapkan skenario parameterβsecara sembarang sebanyak 6 buah, yaitu kombinasi parameter β= 0.7 (perwakilan<1), 1, dan 3.0 (perwakilan >1) masing-masing sebanyak 2.
2. Membangkitkan data kovariat
Data kovariat dibangkitkan sebanyak 6 peubah dengan 100 observasi dari sebaran X ∼ NormalGanda(µ,∑), dalam hal ini ∑ merupakan matriks identitas.
3. Membangkitkan data respons
Data respons dibangkitkan dari sebaran pareto terampat dengan cara sebagai berikut:
• Tetapkan parameter shapeξyaituξ=−0.5 (secara sembarang).
• Tetapkan parameter lokasi (threshold) yaituµ=50 (secara sembarang).
• σ=exp(Xβ).
• Bangkitkany∼GPD(µ,ξ,σ)sebanyak n=100.
4. Menduga nilai dugaan model linier sebaran pareto terampat dengan metode IRWLS dari paket VGAM pada perangkat lunak komputasi statistik R yaitu dengan menduga:σ=β0+β1x1+. . .+β6x6.
5. Menduga nilai dugaan model linier sebaran pareto terampat menggunakan metode optimisasi Nelder-Mead dengan nilai awal
√
6var(y)
π dari paket ismev
pada perangkat lunak komputasi statistik R yaitu dengan menduga:σ=β0+
β1x1+. . .+β6x6.
6. Proses pembangkitan data dan pendugaan parameterβdi ulang sebanyak 100 kali
7. Membuat plot sebaran penduga parameterβi
Hasil dan Pembahasan
Pemilihan nilai awal pengembangan regularisasi L1 model linier sebaran
pareto terampat menggunakan teknik optimisasi Nelder-Mead dilakukan dengan cara memperbandingkan metode pemodelan linier sebaran pareto terampat yang ada. Terdapat dua teknik pendugaan parameter dalam pemodelan linier sebaran pareto terampat, yaitu menggunakan teknik IRWLS (Yee dan Stephenson 2007) dan teknik optimisasi Nelder-Mead dengan nilai awal
√
6var(y)
digunakan untuk keperluan ini dalam kondisi ideal, yaitu kovariat saling bebas atau tidak terkondisi buruk.
Sebaran hasil pendugaan parameter β disajikan pada Gambar 4.1. Terlihat pada Gambar 4.1, pendugaan menggunakan metode IRWLS memperoleh hasil yang tidak bias dengan simpangan (ragam) yang kecil dibanding pendugaan parameter β menggunakan metode optimisasi Nelder-Mead. Pada pendugaan menggunakan metode optimisasi Nelder-Mead parameter β diduga sangat jauh dari nilai sebenarnya. Selain sangat jauh dari nilai sebenarnya, simpangan (ragam) pendugaannya juga sangat lebar. Oleh karena itu selanjutnya digunakan metode IRWLS untuk mendapatkan nilai awal pendugaan parameter β dalam pengembangan model linier sebaran pareto terampat dengan teknik regularisasi L1.
Gambar 4.1 Dugaan paramater β pada model linier sebaran pareto terampat menggunakan metode IRWLS pada paket VGAM dan metode optimisasi Nelder-Mead pada paket ismev
Pengembangan Teknik Regularisasi L1 pada Model Linier Sebaran Pareto Terampat
Seperti pengembangan teknik regularisasi L1 pada model linier terampat
sebaran Gamma, pengembangan teknik regularisasi L1 pada model linier sebaran
pareto terampat dilakukan dengan cara yang sama. Tahap pertama menentukan nilai awal parameter sebaran dengan menggunakan metode IRWLS sebagai nilai penduga yang baik pada pemodelan linier sebaran pareto terampat. Tahap kedua melakukan optimisasi Nelder-Mead dengan nilai awal yang diperoleh. Algoritma diimplementasikan ke dalam perangkat lunak komputasi statisik R disajikan pada Lampiran 6.
Hasil uji coba implementasi algoritma di atas untuk pemodelan linier sebaran pareto terampat dengan regularisasi L1 pada parameter pengatur λ =0 ternyata
memberikan dugaan seperti menggunakan nilai awal
√
6var(y)
π . Pada kasus ini, nilai
awal parameter menggunakan teknik IRWLS tidak memiliki pengaruh terhadap hasil akhir pendugaan koefisienβmenggunakan optimisasi Nelder-Mead.
33
Simpulan dan Saran
Pendugaan model linier sebaran pareto terampat dengan menggunakan metode IRWLS memberikan pendugaan parameter yang lebih baik dibanding dengan menggunakan teknik optimisasi Nelder-Mead dengan nilai awal
√
6var(y)
π
yang ditunjukkan oleh sebaran penduga βsecara empirik tak bias dan ragam yang kecil. Pengembangan teknik regularisasi L1menggunakan optimisasi Nelder-Mead
dengan nilai awal dari parameter yang diperoleh dengan metode IRWLS pada pemodelan linier sebaran pareto terampat belum memberikan hasil pendugaan parameter yang lebih baik. Oleh karena itu diperlukan metode lain untuk pengembangan regularisasi L1 pada pemodelan linier sebaran pareto terampat
misalnya dengan menggunakan teknik pendugaan bayesian (Park dan Casella 2008).