Estimasi Parameter Copula
Dan Aplikasinya Pada Klimatologi
Irwan Syahrir (1309 201 001
)
Dosen Pembimbing:
Dr. Ismaini Zaini, M.Si
Latar belakang
2
1. PENDAHULUAN
Analisis Statistik
Distribusi Normal
- Masalah lebih mudah dan sederhana
- Mudah perhitungan estimasi
Analisis hubungan
antara 2 (dua)
variabel
pengukuran dependensi antara variabel
Pearson
Korelasi
Asumsi
-Spearman
- Kendall
Kasus distribusi tidak normal
Latar belakang (lanjutan)
Pendekatan “Copula”
Mengapa?
- Mampu mengatasi dependensi variabel yang berdistribusi tak normal - Informasi struktur dependen lebih banyak
- Lebih fleksibel : distribusi marginal dari variabel dependen dapat
dibedakan atau bahkan dapat mengetahui distribusi variabel yang tidak diketahui. (Schölzel ,2008)
Kasus Multivariat
kompleks
Penelitian
- Biostatistic- Risk management - insurance/actuaria- Climatology/meteorology, etc
Ketidaknormalan diabaikan dalam perhitungan korelasi
Struktur dependensi
4
Latar belakang (lanjutan)
hidrology : Favre et al. (2004) dan Genest et al. (2007).
Keuangan dan asuransi : Cherubini et al. (2004) dan Mcneil et al. (2005) Ekonometrika dan time series: Patton (2002;2009).
Klimatologi : Schölzel (2008).
Schölzel (2008), menjelaskan pola distribusi dan fungsi densitas dari variabel random multivariat pada data temperatur, curah hujan dan kecepatan angin.
Penelitian dengan pendekatan Copula :
Sklar (1959)
Theorema Sklar’s Suatu cara untuk menjelaskan struktur dependensi vektor random Estimasi copula menyatakan bahwa setiap distribusi marginal harus
dihitung dan dimasukkan ke dalam estimasi distribusi multivariat
Metode Maximum Likelihood Estimation (MLE).
(Choroś et al. ,2010)
Estimasi
Parameter Copula
Pendekatan model parametrik,
semiparametrik dan non parametrik
(Charpentier et.al.,2006)
Kasus
Klimatologi
Copula
Archimedean
Gumbel
Clayton
Aplikasi Geoscience (Embrechts et al.,2001)6
•
Tujuan Penelitian
1. Menentukan estimasi parameter copula archimedean
2. Mengaplikasikan pada data klimatologi
Manfaat Penelitian
1. Memperkenalkan metode alternatif yaitu pendekatan copula
khususnya keluarga archimedean, yang dapat diaplikasikan pada
data iklim yang distribusinya tidak normal.
•
Batasan Masalah
1. Estimasi parameter copula dg pendekatan Kendall’s Tau
2. Parameter Copula gumbel dan Clayton
3. Variabel yang dilibatkan hanya dibatasi 2 (dua) variabel atau
bivariat, yaitu data kecepatan angin rata-rata dengan tekanan
udara diatas permukaan air laut dan kecepatan angin dengan
temperatur udara
2. Teori Copula
1
,...,
mX X
F
F
dengan domain
Suatu m dimensi vektor random X dengan fungsi distribusi
kumulatif
marginal (Marginal Cumulative Distribution
Function)
Variabel random multivariat
Asumsi
1
(
)
0
X
F
−∞ =
joint distribusi dari vektor random dapat
ditulis sebagai fungsi dari distribusi
marginalnya.
1( )
1
XF
∞ =
1 1( )
(
( ),....,
(
)
m X X X X mF
x
=
C
F
x
F
x
ℜ
Theorema Sklar’s
(1959)
fungsi yang menghubungkan margin univariat menjadi distribusi multivariat, dimana fungsi tersebut merupakan fungsi distribusi bersama dari variabel random uniform standar normal. (Nelsen ,1999)
fungsi distribusi bersama dari
transformasi variabel random
(
)
j j X jU
=
F
X
j=1,…,m 1 1 1 1 0 0( ,...,
)
...
( ,...,
)
...
m u u X m X m mC
u
u
=
∫ ∫
c
u
u
du
u
Distribusi fungsi copula
1 1
( )
(
( ),....,
(
)
m X X X X mF
x
=
C
F
x
F
x
[ ]
[ ] [ ]
: 0,1 ...
0,1
0,1
XC
x x
→
Uj
memiliki
distribusi
marginal
yg
uniform. Jika distribusi
marginalnya
kontinu, maka fungsi copula adalah unik
(nelsen,2006)
8(
)
j j X ju
=
F
x
setiap probabilitas densitas bersama dapat
dituliskan sebagai hasil dari probabilitas
densitas marginal dan densitas copula.
1 1 1
( )
( )...
(
).
( ,...,
)
m
X x X m X m
f
x
=
f
x
f
x
c
u
u
Fungsi distribusi multivariat
dengan marginal uniform standar
Fungsi copula
Keluarga Copula
Copula Students t
Fungsi densitas copula normal :
10 a. Copula Ellip b. Copula Archimedian
(
)
(
) (
)
1 2 1 1 , , 1 2 1 2 1 1 1 2 ( ), ( ) ( , ) ( ) ( ) X X u u c u u u u ρ ρϕ
ϕ
ϕ
− − − − Φ Φ = Φ ΦCopula ellip Copula normal
(
1 1)
1 2 1 2
( ,
)
( ),
(
)
C u u
ρ= Φ Φ
ρ −u
Φ
−u
Fungsi copula normal :
1 2 2 2 , , 1 2 2 2 1 2 1 2
1
1
( ,
)
exp
[
2
]
2(1
)
2
1
X X ρx x
x
x
x x
ϕ
ρ
ρ
π
ρ
=
−
+
−
−
−
dimanaFungsi distribusi kumulatif bivariat standar normal dengan korelasi ρ (sklar,1959)
1
Karakteristik Copula student’s t
Copula Students t
Dalam kasus bivariat copula t dapat dituliskan sebagai berikut:
1 1 1 ( ) ( ) 1 2 2 2 2 2 2 1 1 2 2 1 2 2 2 2 ( , , , ) (1 ) 2 2 x 1 (1 ) v v d t u t u t v v v C u u v v v x x x x dx dx v ρ π ρ ρ ρ − − −∞ −∞ + − + Γ = Γ − + − + −
∫
∫
1 v v t t −dimana ρ adalah koefisien korelasi, ν adalah jumlah derajat bebas.
Contoh pdf dari t-Copula dengan ρ=0,865 dan v =∞, 5, 2.5 (dari kiri ke kanan).
Copula Archimedian
(i) Clayton (ii) Frank (iii) Gumbel
1
X 1 1
C ( ,...,
u
u
m)
=
φ φ
−( ( ) ...
u
+ +
φ
(
u
m))
Fungsi copula archimedian
fungsi disebut fungsi generator dari copula (Nelsen ,2006)
( ) 1 (Clayton) 1 ( ) log (Frank) 1 ( ) ( log ) (Gumbel) C F F G C u F G u u e u e u u θ θ θ θ
φ
φ
φ
− = − − = − = −φ
12 1 X 1 2 1 2C ( ,
u u
)
=
φ φ
−( ( )
u
+
φ
(
u
))
Kasus bivariat3. Estimasi Copula
Estimasi parameter copula dapat diperoleh dengan metode Maximum
Likelihood Estimation (MLE) (Mikosch ,2006). Dengan mendeskripsikan
parameter yang diberikan copula dan distribusi marginal, estimasi ML diperoleh
dengan memaksimumkan fungsi log likelihood.
1 2 1 1 2 2 1
( ,
,...,
)
( ( ),
( ),...,
(
)
( )
d d d d i i if x x
x
c F x
F x
F x
f x
==
∏
1 2 1 2 1 2( ,
,...,
)
( ,
,...,
)
,...,
d d dC u u
u
c u u
u
u u
u
∂
=
∂ ∂
∂
densitas dari d-dimensi copulaC u u
( ,
1 2,...,
u
d; )
θ
1 2 1 1 2 2 1 1 2 2ln ( ,
f x x
; , )
θ ρ
=
ln ( ( ; ),
c F x
θ
F x
( ; ); ) ln
θ ρ
+
f x
( ; ) ln
θ
+
f x
( ; )
θ
model fungsi likelihood Copula
Menurut Genest dan rivest (1993) untuk mengkonstruksi
estimasi parameter COPULA dapat menggunakan observasi
nilai Kendall’s tau
1 0
( )
1 4
( )
u
du
u
φ
τ
φ
= +
′
∫
4. Estimasi Parameter Copula Archimedean
C
- Cuaca (weather)
- Iklim (climate)
besaran unsur fisika atmosferunsur cuaca atau
unsur iklim
- penerimaan radiasi
matahari
-
suhu udara
- kelembaban udara
-
tekanan udara
-
Kecepatan angin
- arah angin
- penutupan awan
- presipitasi (embun, hujan, salju)
- evaporasi.
Cuaca
keadaan udara pada saat tertentu dan di wilayah tertentu yang
relatif sempit dan pada jangka waktu yang singkat.
Iklim
keadaan cuaca rata-rata dalam waktu satu tahun yang dilakukan
dalam waktu yang lama dan meliputi wilayah yang luas.
Pengertian Cuaca dan Iklim
Tekanan udara adalah suatu gaya yang timbul akibat adanya berat dari lapisan udara.
Besarnya tekanan udara di setiap tempat pada suatu saat berubah-ubah. Makin tinggi suatu tempat dari permukaan laut, makin rendah tekanan udaranya. Besarnya tekanan udara diukur dengan barometer dan dinyatakan dengan milibar (mbar).
Angin adalah udara yang bergerak dari daerah bertekanan udara tinggi ke daerah
bertekanan udara rendah. Kecepatan angin dapat diukur dengan suatu alat yang disebut Anemometer
Temperatur Udara adalah tingkat atau derajat panas dari kegiatan molekul dalam
atmosfer yang dinyatakan dengan skala Celcius, Fahrenheit, atau skala Reamur.
16
Dari pengertian diatas dapat diketahui bahwa antara tekanan
udara,kecepatan angin dan temperatur udara saling berhubungan.
Perbedaan tekanan udara di suatu daerah akan mengakibatkan
adanya pergerakan angin dari daerah yang bertekanan tinggi ke
daerah yang bertekanan rendah.
5. Metodology
Data klimatologi
Kecepatan angin rata-rata
(km/jam)
Tekanan udara diatas
permukaan air laut (mbar)
Sumber data
Stasiun Surabaya/Perak
Data observasi harian
Tahun 2005-2009
Sampel : 1691 pengamatan
Aplikasi dataTemperatur udara ( C)
0τ
τ
Variabel penelitian:Kajian teori
18
A. Tujuan pertama
• Mendefinisikan fungsi distribusi bersama variabel random. • Menentukan fungsi distribusi Copula untuk kasus bivariat. • Menentukan fungsi likelihood Copula
• Mengestimasi parameter fungsi Copula dengan metode Maximum Likelihood Estimation (MLE).
• Mengestimasi parameter Copula Archimedean untuk keluarga Gumbel dan Clayton dengan pendekatan Kendall’s Tau
B. Tujuan kedua:
• Membuat scatter plot antara kedua variabel yaitu : i. Kecepatan angin rata-rata dan tekanan udara ii. Kecepatan angin rata-rata dan temperatur udara
• Menguji ketaknomalan data dengan menggunakan histogram dan uji Kolmogorov-Smirnov • Menghitung parameter dependensi antara kedua variabel dengan observasi nilai Kendall’s Tau
• Menghitung parameter pada Copula Archimedean khususnya Copula Gumbel dan Copula Clayton . • Menentukan estimasi fungsi Copula Archimedean pada keluarga Clayton dan Gumbel.
5. Hasil dan Pembahasan
1 2 1 1 2 2( ,
)
{ ( ),
(
)}
F x x
=
C F x
F x
Nelsen (2006)Fungsi distribusi
bivariat
1 1 1 2 1 1 2 2 1 2( ,
)
{
( ),
(
)}, ,
[0,1]
C u u
=
F F
−u
F
−u
u u
∈
Transformasi
Fungsi copula
2 1 2 1 2 1 2 1 2( ,
)
( ,
)
C u u
, ,
[0,1]
c u u
u u
u u
∂
=
∈
∂ ∂
Fungsi densitas copula
bivariat
1 2 1 1 2 2 1 1 2 2 1 2
( ,
)
{ ( ),
(
)} ( )
(
) , ,
f x x
=
c F x
F x
f x f x
x x
∈
20 1 2 1 1 2 2 1 1 2 2 1
{
(
),
(
)} (
)
(
)
n u u iL
c
F x
F x
f x
f
x
== Π
1 2 1 1 2 2 1 1 2 2ln ( ,
f x x
; , )
θ ρ
=
ln ( ( ; ),
c F x
θ
F x
( ; ); ) ln
θ ρ
+
f x
( ; ) ln
θ
+
f x
( ; )
θ
no closed form
Fungsi likelihood Copula
numerik
Observasi Kendall’s Tau.
Estimasi
parameter copula
Nelsen (2006)
Hasil dan Pembahasan
1 0( )
1 4
'( )
Cu
du
u
φ
τ
φ
= +
∫
Estimasi Parameter Copula Archimedean
( )u
φ
Fungsi generator copula21 1 0 1 1 0
( )
1 4
( )
(
1) /
=1+4
2
C C c C Cu
du
u
u
du
u
θ θφ
τ
φ
θ
θ
θ
− − −= +
′
−
=
−
+
∫
∫
1 0 1 1 0( )
1 4
( )
1
( log )
=1+4
( log( ))
/
G G G G Gu
du
u
u
du
u
u
θ θφ
τ
φ
θ
θ
−θ
= +
′
−
−
=
−
−
∫
∫
Gumbel:
Clayton :
1
(1
)
Gθ
τ
=
−
2
1
Cτ
θ
τ
=
−
22 Family Copula (Cθ) Parameter range Clayton Gumbel 1 1 2 1 2
( ,
)
(
1)
ClC
θu u
=
u
−θ+
u
−θ−
θθ
∈ − ∞[
1,]
\ 0{ }
(
)
1 1 2 1 2( , ) exp (log ) (log )
Gu
Cθ u u = − u θ + u θ θ
θ
∈ ∞[ ]
1,Fungsi Copula Keluarga Archimedean Versi Bivariat
5. Hasil dan Pembahasan (lanjutan)
Aplikasi Copula
. Plot-plot yang terkonsentrasi dalam satu area menunjukkan adanya korelasi yang berdekatan. Sedangkan plot-plot yang outlier menunjukkan hubungan yang sangat jauh antar kedua variabel. Hubungan dependensi antar kedua variabel tidak dapat hanya dideskripsikan dengan korelasi pearson karena banyaknya outlier pada scatter plot. Untuk mengatasi hal tersebut maka struktur dependensi dapat dijelaskan dengan korelasi yang berbasis pada rank yaitu korelasi kendall tau atau
Scatter plot wind ave vs SLP
Variabel Kolmogorov-Smirnov
Statistic df Sig.
Wind_ave 0,064 1691 0,000
SLP 0,046 1691 0,000
T mean 0.037 1691 0,029
Histogram Wind Ave (kecepatan angin, km/jam) Histogram SLP(Tekanan udara, Mbar)
24
b. Temperatur udara (T mean- 0C)
26 Grafik distribusi bivariat antara kecepatan angin dan tekanan udara
kedua variabel adalah dependen, meskipun tingkat dependensinya kecil. Plot antar keduanya menunjukkan terkonsentrasi pada beberapa ruang interval yaitu pada ujung scatter, tetapi pada bagian interval tertentu diantara keduanya plot tidak jelas. Bagian plot yang tidak jelas mengindikasikan tail dependence. Dari sini dapat didefinisikan beberapa copula yang memiliki karakteristik bentuk tail dependence.
28
Scatter plot rank antara Wind_ave dengan SLP pada transformasi uniform [0,1]
Scatter plot rank antara Wind_ave dengan T_mean pada transformasi uniform [0,1]
Scatter plot rank bivariat sampel random dari keluarga Gumbel dan Clayton
dengan θ = 2
Gumbel Copula Clayton Copula
Copula Gumbel Copula Clayton
Scatter plot rank bivariat sampel random dari keluarga Gumbel dan
30
Gumbel Copula Clayton Copula
Gumbel Copula Clayton Copula
Scatter plot rank bivariat sampel random dari keluarga Gumbel
dan Clayton dengan θ =10
Scatter plot rank bivariat sampel random dari keluarga Gumbel
Pearson Kendall Spearman
Correlation 0,1397741 0,1281978 0,1838372
p-value 7,84 x 10-9 7,772 x 10-15 2,554 x 10-14
Sebelum melakukani fitting model copula maka terlebih dulu mengestimasi koefisien korelasi dari kedua variabel tersebut dengan 3 metode, yaitu Pearson, Spearman dan Kendall.
α <0,05
Tabel pengukuran korelasi wind_ave vs SLP
Pearson Kendall Spearman
Korelasi 0,2069568 0,1474547 0,2120737
p-value 2,2 x 10-16 2,2 x 10-16 2,2 x 10-16
32 2 = 1 2(0,1281978) 1 0,1281978 = 0,294098 c τ θ τ − = − 1 1 1 = 1 0,1281978 = 1,147049 G θ τ = − −
Perhitungan parameter copula berbasis Kendall’s Tau Kecepatan angin vs tekanan udara
Kecepatan angin vs temperatur udara
2 = 1 2(0,1474547) 1 0,1474547 = 0,345213 c τ θ τ − = − 1 1 1 = 1 0,1474547 = 1,172958 G θ τ = − −
Parameter copula clayton Parameter copula gumbel Parameter copula clayton Parameter copula gumbel
• Copula Clayton 1 1 2 1 2 1 0,294098 0,294098 0,294098 1 2 1 2 ( , ) ( 1) ( , ) ( 1) Cl Cl C u u u u C u u u u θ θ θ θ θ − − − − = + − = + −
A. Kecepatan angin dan tekanan udara B. Kecepatan angin dan tekanan udara
• Copula Gumbel
(
)
11 2 1 2
( , ) exp (log ) (log )
Gu Cθ u u = − u θ + u θ θ
(
)
1 1,147049 1,147049 1,147049 1 2 1 2( , ) exp (log ) (log )
Gu Cθ u u = − u + u • Copula Clayton • Copula Gumbel 1 1 2 1 2 ( , ) ( 1) Cl Cθ u u = u−θ +u−θ − θ 1 0,345213 0,345213 0,345213 1 2 1 2 ( , ) ( 1) Cl Cθ u u = u− +u− −
(
)
1 1 2 1 2( , ) exp (log ) (log )
Gu Cθ u u = − u θ + u θ θ
(
)
1 1,172958 1,172958 1,172958 1 2 1 2( , ) exp (log ) (log )
Gu
Cθ u u = − u + u
34
Estimasi parameter θ dan nilai loglikelihood dihitung untuk mengetahui model struktur dependensi yang terbaik pada copula
Copula Estimate Std. error Z Log likelihood
Gumbel 1.112993 0.01904045 58.45411 22.87724
Clayton 0.1703254 0.03308843 5.147582 15.99025
Tabel Model Fitting Untuk Copula Archimedean Untuk Kecepatan Angin Dan Tekanan Udara
Copula Estimate Std. error Z Log likelihood
Gumbel 1,138937 0.01967057 57,90054 32.83936
Clayton 0.2613921 0.03432309 7.615633 37.29556
Tabel Model Fitting Untuk Copula Archimedean Untuk Kecepatan Angin Dan Temperatur Udara Model terbaik
Model terbaik
A. Kecepatan angin dan tekanan udara
B. Kecepatan angin dan tekanan udara
Copula Gumbel
(
)
11 2 1 2
( ,
)
exp
(log
)
(log
)
Gu
C
θu u
=
−
u
θ+
u
θ θ
(
)
1 1,147049 1,147049 1,147049 1 2 1 2( ,
)
exp
(log
)
(log
)
Gu
C
θu u
=
−
u
+
u
Copula Clayton
1 1 2 1 2( ,
)
(
1)
ClC
θu u
=
u
−θ+
u
−θ−
θ 1 0,345213 0,345213 0,345213 1 2 1 2( ,
)
(
1)
ClC
θu u
=
u
−+
u
−−
36
Scatter plot rank dari Copula Gumbel untuk variabel random
dengan parameter θ = 1,147049
Scatter plot rank antara Wind_ave dengan SLP pada transformasi
Scatter plot rank dari Copula Clayton untuk variabel random
dengan parameter θ = 0,345213
Scatter plot rank antara Wind_ave dengan T_mean
Kesimpulan
38 1. Variabel kecepatan angin rata-rata (wind_ave) dan tekanan udara diatas
permukaan air laut (SLP) memiliki distribusi yang tidak normal.
2. Copula archimedean dapat digunakan untuk menjelaskan struktur dependensi kedua variabel iklim tersebut.
3. Copula Archimedean dari keluarga Gumbel merupakan model terbaik untuk menjelaskan struktur dependensi antara variabel kecepatan angin rata-rata dan tekanan udara diatas permukaan air laut.
4. Copula Clayton merupakan model terbaik untuk variabel kecepatan angin rata-rata temperatur udara
Saran
1. Dalam penelitian ini peneliti menghitung estimasi parameter Copula Archimedean dengan pendekatan parametrik, padahal seringkali kasus yang muncul dalam analisis data adalah pola distribusi data termasuk katagori non parametrik. Oleh karena itu perlu adanya perhitungan estimasi dengan pendekatan non parametrik.
2. Perlu juga adanya penelitian pembanding dalam perhitungan estimasi dengan menggunakan keluarga Copula yang lain, misal: Copula Ellip yang meliputi Copula Normal dan Copula Student’s t.
3. Pada penelitian ini struktur dependensi antara kedua variabel dalam bentuk scatter plor rank tidak terlalu kelihatan dengan jelas karena dimungkinkan jumlah sampel data hanya pada observasi selama 5 tahun. Oleh karena itu pada penelitian berikutnya perlu ditambah sampel penelitian hingga 10 tahun atau lebih.