Pengenalan Copula
Sapto Wahyu Indratno
STATISTICS DISIVISION, FACULTY OF MATHEMATICS AND NATURALSCI
-ENCES, INSTITUTTEKNOLOGI BANDUNG
Daftar Isi
Bagian 1. Copula 1
Bab 1. Copula dan aplikasinya 3
1. Pendahuluan 3
2. Fungsi-fungsi distribusi 3
3. Konsep dasar dari Kebergantungan 9
4. Jenis-jenis Copula 10
5. Proses Estimasi Copula 10
6. Korelasi Linear 12
Bagian 1
BAB 1
Copula dan aplikasinya
1. Pendahuluan
Sebuah Copula adalah suatu fungsi multivariat yang terlahir dari se-buah distribusi gabungan. Copula merupakan alat yang dapat digunakan untuk menganalisa kebergantungan variabel-variabel acak dalam struk-tur yang digambarkan oleh fungsi gabungan terebut. Di sini strukstruk-tur kebergantungan variabel-variabel acak dalam distribusi gabungan dapat dilihat dari kebergantungan fungsi-fungsi marginalnya dalam fungsi Co-pula. Sehingga Copula dari sebuah distribusi multivariat dapat dipan-dang sebagai gambaran struktur kebergantungan dari distribusi multi-variat tersebut berdasarkan prilaku dari masing-masing fungsi marginal-nya.
Salah satu sifat Copula yang penting adalah invarian terhadap transformasi-transformasi yang menaik kuat pada marginal-marginalnya.
Copula dapat menyelesaikan suatu masalah yang sulit, seperti mencari sebuah distribusi multivariat, dengan melakukan dua langkah sederhana berikut: langkah pertama adalah memodelkan semua distribusi marginal-nya. Langkah kedua adalah mengestimasi Copula yang menggambarkan kebergantungan dari marginal-marginalnya.
Dalam industri keuangan dan asuransi struktur ketergantungan an-tara aset merupakan hal yang sangat penting untuk dipelajari. Keber-gantungan ini dianalisa untuk beberapa tujuan: pricing dan hedging dari intrumen kredit yang sensitif, basket derivatives dan structured produts, pengaturan portfolio kredit, pengukuran resiko kredit dan resiko pasar.
2. Fungsi-fungsi distribusi
Sebuah variabel acak X didefinisikan sebagai sebuah fungsi yang meng-aitkan sebuah bilangan real X(ξ) dengan setiap hasil eksperimen ξ dalam ruang sampel Ω
2.1. Univariat. Fungsi distribusi (kumulatif) F dari suatu variabel
acak X didefinisikan sebagai
FX(x) = P (X ≤ x), (2.1)
dimana
• FX(−∞) = 0dan FX(∞) = 1sehingga 0 ≤ FX(x) ≤ 1 ∀x, dan
• FX adalah fungsi yang kontinu kanan.
Jika FX kontinu juga dari kiri maka X adalah variabel acak kontinu.
AKIBAT1. Melalui sifat 0 ≤ F (X) ≤ 1 diperoleh 1. {x | F (x) < y} = ∅, ∀y ≤ 0, dan
2. {x | F (x) < y} = X, ∀y ≥ 1.
Sehingga P (F (X) ≤ y) = 0, ∀y ≤ 0, dan P (F (X) ≤ y) = 1, ∀y ≥ 1.
4 1. COPULA DAN APLIKASINYA
Pada umumnya fungsi distribusi FX tidak murni monoton naik,
seba-gai contoh fungsi distribusi untuk variabel acak diskret, sehingga definisi fungsi F−1yang klasik tidak dapat digunakan. Untuk mengatasi masalah
ini fungsi inversi FX yang diperumum diperkenalkan sebagai berikut:
DEFINISI 1 (Inversi yang diperumum). Misalkan X adalah sebuah variabel acak (kontinu atau diskret). Fungsi inversi yang diperumum dari FX didefinisikan sebagai berikut:
FX−1(u) = inf{x | F (x) > u}. (2.2) Perhatikan bahwa Definisi 1 dan kekontinuan kanan dari F mengaki-batkan
F−1(F (x)) = inf{w | F (w) ≥ F (x)} = x, ∀x ∈ X. (2.3) LEMA 1. Misalkan FX adalah sebuah fungsi distribusi yang monoton
naik murni, FX(x) < FX(y) ∀x < y, dari suatu variabel acak kontinu. Maka
FX−1 adalah fungsi yang monoton naik murni. BUKTI. (2.3) memberikan
dF (F−1(x)) dx = 1.
Aplikasikan aturan rantai pada ruas kiri persamaan di atas, kita peroleh dF (F−1(x)) dx = F 0(w)dF−1(x) dx = 1, (2.4) w = F−1(x), atau (F−1)0(x) = 1 F0(F−1(x)) > 0. (2.5) TEOREMA1 (Teorema CDF). Misalkan X adalah sebuah variabel acak kontinu dengan fungsi distribusi F (.). Misalkan X ditransfromasikan me-lalui fungsi kumulatifnya yaitu Y = F (X). Maka distribusi dari Y adalah seragam pada interval [0, 1], Y ∼ U [0, 1].
2. FUNGSI-FUNGSI DISTRIBUSI 5
BUKTI. Untuk membuktikan teorema ini kita gunakan definisi beri-kut:
DEFINISI 2. X ∼ U [0, 1] jika dan hanya jika
P (X ≤ x) = 0, x ≤ 0 x, 0 < x ≤ 1 1, x > 1. (2.6)
Dari Akibat 1 kita cukup menunjukkan P (Y < y) = y, ∀y ∈ [0, 1]. De-ngan menggunakan {x ∈ X | F (x) ≤ y} = {x ∈ X | F−1(F (x)) ≤ F−1(y)},
kita peroleh
P (Y ≤ y) = P (F (X) ≤ y) = P (F−1(F (X)) ≤ F−1(y))
= P (X ≤ F−1(y)) = F (F−1(y)) = y ∀y ∈ [0, 1]. (2.7) 2.1.1. Fungsi distribusi empirik. Misalkan X1, X2, . . . , Xn menyatakan
sampel acak yang berukuran n. Bagaimana cara mendapatkan distribusi dari sampel acak tersebut? Untuk menjawab pertanyaan tersebut, kita perhatikan informasi yang dapat kita peroleh dari sampel acak tersebut. Deskriptif Statistik dapat digunakan terlebih dahulu untuk mendapatkan sari numerik dari sampel acak tersebut. Di sini akan difokuskan pada informasi sampel acak yang didapatkan dari distribusi empirik. Fungsi distribusi empirik ini didefinisikan sebagai berikut:
DEFINISI 3. Misalkan X1, X2, . . . , Xn suatu sampel acak dari suatu
dis-tribusi X. Disdis-tribusi empirik dari sampel acak tersebut adalah
F (x) = n X i=1 1{Xi≤x} n . (2.8) GAMBAR2. (a) n = 5, (b) n = 50, (c) n = 500
Distribusi empirik ini adalah distribusi yang berdasarkan pada data. Gambar 2 mengilustrasikan bentuk dari distribusi empirik untuk bebera-pa ukuran sample acak yang diambil dari distribusi Gamma(3,1). Terlihat dalam Gambar 2 (a) sampel acak berukuran 5 menyebar pada interval [0, 5]
6 1. COPULA DAN APLIKASINYA
yang menghasilkan distribusi empirik yang jauh dari distribusi populasi-nya. Dalam Gambar 2 (b) dan (c) sampel acak mulai menyebar merata sehingga distribusi empiriknya semakin mendekati distribusi populasi-nya. Dari contoh ini terlihat bahwa kedekatan distribusi empirik dengan distribusi populasinya sangat bergantung pada banyaknya data dan pe-nyebaran data.
2.2. Pengkontinuan variabel acak diskret. Misalkan X adalah
vari-abel acak disktrit dan U adalah suatu varivari-abel acak dengan support [0, 1]. Definisikan X∗= X + (U − 1). Maka P (X + U − 1 ≤ s) = P (X + U ≤ [s] + 1 + (s − [s])) = ∞ X x=0 P (U ≤ s + 1 − x)P (X = x) = (2.9)
2.3. Univariat Normal. Fungsi densitas dan distribusi (kumulatif)
da-ri distda-ribusi Normal standar didefinisikan masing-masing sebagai beda-rikut:
φ(x) = √1 2πexp(− x2 2 ), −∞ < x < ∞ (2.10) dan Φ(x) = Z x −∞ φ(t)dt. (2.11)
Bila X ∼ N (µ, σ2), maka kita dapat menstandarkan variabel acak
ter-sebut melalui transformasi Y = X−µσ ∼ N (0, 1). Sehingga Y memiliki fungsi kepadatan sebagai berikut:
f (x) = 1
σφ(y), −∞ < x < ∞, (2.12) dimana y = x−µσ .
2.4. Bivariat. Suatu fungsi yang kontinu kanan F : R2 → [0, 1] kita
sebut fungsi distribusi bivariat bila memenuhi sifat-sifat berikut: • limxj→−∞F (x1, x2) = 0, j = 1, 2,
• limxj→∞, ∀jF (x1, x2) = 1
• untuk semua (x1, y1), (x2, y2)dengan x1< x2,y1< y2berlaku
F (x2, y2) − F (x1, y2) − F (x2, y1) + F (x1, y1) ≥ 0. (2.13) Misalkan X = X1 X2
adalah sebuah vektor acak yang berdistribusi
Bivariat Normal(µ, Σ), dimana µ =
µ1
µ2
adalah vektor mean, dan
Σ = σ2 1 ρσ1σ2 ρσ1σ2 σ22 (2.14)
adalah matriks kovariansi. Di sini ρ menyatakan korelasi antara X1 dan
X2.
Fungsi kepadatan peluang untuk bivariat normal ini adalah
f (x1, x2) = 1 2π|Σ|exp −(X − µ) 0Σ−1(X − µ) 2 . (2.15)
2. FUNGSI-FUNGSI DISTRIBUSI 7
Kebebasan bivariat Normal. Kebebasan antar variabel acak distribusi
bivariat Normal ini menyebabkan
Σ = σ2 1 0 0 σ2 2 dan Σ−1= 1 σ2 1 0 0 1 σ2 2 ! . (2.16)
Visualisasi kebebasan bivariat normal. Untuk memperoleh gambaran
GAMBAR 3. Kurva ketinggian fungsi bivariat normal baku dengan ρ = 0, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0
struktur kebergantungan X1 dan X2 kami sajikan Gambar bivariat
Nor-mal dengan µ = (0, 0) dan σ1 = σ2 = 1 dengan ρ = 0. Gambar 3
merep-resentasikan struktur kebergantungan X1 dan X2 ketika mereka saling
bebas. Terlihat data yang dibangkitkan dari distribusi bivariat normal baku dengan ρ = 0 mengikuti bentuk kurva ketinggian dari fungsi kepa-datan peluang distribusi bivariat normal baku dengan ρ = 0. Untuk kasus X1dan X2 yang saling bebas kita memiliki
P (X1≤ 0, X2≤ 0) ≈ 0, 5P (X1≤ 0),
seperti yang diperlihatkan pada Gambar 3. Terlihat bahwa data acak yang dibangkitkan berkumpul membentuk bola dua dimensi yang berpusat di titik (0, 0).
Bila kita naikkan nilai ρ nya struktur kebergantungan X1 dan X2 akan
berubah. Pada Gambar 4 terlihat bentuk penyebaran data acaknya ber-bentuk elips. Di sini kita memiliki
P (X1≤ 0, X2≤ 0) ≈ 0, 75P (X1≤ 0).
Dapat kita lihat untuk ρ → 1 data atau kurva ketinggiannya mendekati bentuk garis seperti yang diperlihatkan pada Gambar 5, dan
lim
ρ→1P (X1≤ 0, X2≤ 0) = P (X1≤ 0).
Hal ini menunjukkan parameter ρ sangat erat kaitannya dengan keber-gantungan antara dua variabel acak tersebut.
LEMA 2.
P (A ∩ B) ≤ min{P (A), P (B)}. (2.17) BUKTI. Bukti diperoleh melalui hubungan P (A ∩ B) ≤ P (A) dan P (A ∩
8 1. COPULA DAN APLIKASINYA
GAMBAR 4. Kurva ketinggian fungsi bivariat normal de-ngan ρ = 0, 8, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0, 8
GAMBAR 5. Kurva ketinggian fungsi bivariat normal
de-ngan ρ = 0, 99, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0, 99
2.5. Covariance. Misalkan
yt= αyt−1+ µ + t. (2.18)
Maka
E[y(t − h)yt] = E[(αyt−h−1+ µ + t−h)(αyt−1+ µ + t)] (2.19)
2.5.1. Peluang bersyarat. Misalkan X dan Y adalah variabel acak yang berdistribusi masing-masing FXdan FY, dan H adalah distribusi
gabung-an X dgabung-an Y . DEFINISI 4 (CDF bersyarat). P (X ≤ x | Y ≤ y) = P (X ≤ x, Y ≤ y) P (Y ≤ y) = H(x, y) FY(y) .
Terlihat dari Definisi 4 bahwa
P (X ≤ x | Y ≤ y) ≥ H(x, y). (2.20) Jika H ∈ C1 maka P (X ≤ x | Y = y) =limδ→0P (X ≤ x, y − δ ≤ Y ≤ y + δ) limδ→0P (y − δ ≤ Y ≤ y + δ) = ∂ ∂yH(x, y) fY(y) . (2.21)
3. KONSEP DASAR DARI KEBERGANTUNGAN 9
2.6. Multivariat. Suatu fungsi yang kontinu kanan F : Rm → [0, 1]
kita sebut fungsi distribusi bivariat bila memenuhi sifat-sifat berikut: • limxj→−∞F (x1, . . . , xm) = 0, j = 1, 2, . . . , m,
• limxj→∞, ∀jF (x1, . . . , m) = 1
• untuk semua (x1, x2, . . . , xm), (y1, y2, . . . , ym) dengan xi < yi, i =
1, 2, . . . , m, berlaku 2 X i1=1 2 X i2=1 . . . 2 X im=1 (−1)i1+i2+...+imF (x 1, x2, . . . , xm) ≥ 0, (2.22) dimana xi1 = xi dan
3. Konsep dasar dari Kebergantungan
Konsep-konsep yang akan ditampilkan adalah:
• Konsep dari kebergantungan pada kuadran yang positif dan pe-ngurutan concordance.
• Konsep dari kebergantungan dari kenaikan positif yang stokastik • Konsep dari total positivity of order 2 (T P2) dan max-infinite
divi-sibility
• Konsep dari kebergantungan ekor yang digunakan untuk meng-kontruksi dan menganalisa distribusi nilai ekstrim multivariat dan copulas.
• Konsep dari kebergantungan dari Kendall’s tau dan Spearman’s rho.
3.1. Kebergantungan Kuadran positif dan Orthan. Misalkan X =
(X1, X2) adalah sebuah vektor bivariat dengan cdf F . Di sini X atau F
dikatakan bergantung pada kuadran positif (PQD) jika
P (X1> a1 | X2> a2) ≥ P (X1> a1) ∀a1, a2∈ R. (3.1)
Dengan menggunakan hubungan
P (X1> a1, X2> a2) = 1 − P (X1≤ a1) − P (X2≤ a2) + P (X1≤ a1, X2≤ a2),
(3.2) kita dapat tuliskan hubungan (3.1) sebagai berikut
P (X1≤ a1 | X2≤ a2) ≥ P (X1≤ a1) ∀a1, a2∈ R. (3.3)
Hubungan (3.1) menyatakan bahwa peluang X1 > a1 akan lebih besar,
untuk setiap a1, bila informasi X2> a2, untuk setiap a2, diketahui
diban-ding tanpa informasi X2.
Contoh: Distribusi F (x, y) = FX(x)FY(y)[1 + θ(1 − FX(x))(1 − FY(y))], 0 ≤ θ ≤
1. Untuk melihat hubungan X dan Y secara visual misalkan X ∼ N (0, 1) dan Y ∼ N (2, 4). Kita bangkitkan data (xi, yi), i = 1, 2, . . . , 700, dari
distri-busi gabungan F (x, y).
Distribusi gabungan di atas dapat dituliskan sebagai C(u, v) = uv[1 + θ(1 − u)(1 − v)],dimana u = FX(x)dan v = FY(y). Kita peroleh
∂
∂uC(u, v) = −θ(1 − 2u)v
10 1. COPULA DAN APLIKASINYA
GAMBAR6. Struktur kebergantungan
4. Jenis-jenis Copula
Apakah ada hubungan frequency domain used in Fourier analysis de-ngan Distribution cumulative domain used in Copula? It seems to be similar to me based on the following :
The "frequency domain" is simply a different way to look at the data that you have in the time domain. When you listen to a symphony, the time domain description tells you what sound you hear in every given instant, while the frequency domain description tells you, roughly, what instru-ments are involved and the ways they are played.
4.1. Keluarga Bivariat dengan satu parameter. Dalam bagian ini
akan ditampilkan Copula bivariat dengan satu parameter yang memiliki sifat-sifat:
• kontinu secara absolut
• supportnya berada di seluruh [0, 1]2
• hasil interpolasi antara batas bawah dan batas atas Frechet.
5. Proses Estimasi Copula
Asumsikan Copula yang sebenarnya berasal dari sebuah keluarga Co-pula parametrik C = {Cθ, θ ∈ Θ}. Kita ingin mengestimasi Copula ini
berdasarkan data yang diasumsikan saling bebas dan memiliki distribusi yang identik. Untuk mengestimasi Copula ini dapat dilakukan dengan menggunakan parametrik marginal atau non-parametrik marginal.
Terlebih dahulu kita perkenalkan beberapa sifat-sifat fungsi distribusi (kumulatif):
LEMA3. Misalkan X memiliki distribusi F . Maka X dan F−1(U )dimana
U berdistribusi seragam (0, 1) memiliki distribusi yang sama.
BUKTI. P (F−1(U ) ≤ x) = P (U ≤ F (x)) = F (x) = P (X ≤ x). Dengan menggunakan Lema 3 kita dapatkan hubungan
F (x1, x2, . . . , xn) = P (X1≤ x1, X2≤ x2, . . . , Xn≤ xn)
= P (F1−1(U1) ≤ x1, . . . , Fn−1(Un) ≤ xn)
= P (U1≤ F1(x1), . . . , Un ≤ Fn(xn))
= P (U1≤ u1, . . . , Un ≤ un) = C(u1, u2, . . . , un),
(5.1)
5. PROSES ESTIMASI COPULA 11
Untuk n = 2 kita dapatkan, menggunakan u = F (x) dan v = G(y), kita peroleh f (x, y) = ∂ 2F (x, y) ∂x∂y = ∂2 ∂x∂yC(F (x), G(y)) = dF (x) dx dG(x) dy ∂2 ∂u∂vC(F (x), G(y)). (5.2) LEMA 4. Misalkan α(x) adalah fungsi yang monoton naik. Maka
P (α(X) ≤ x) = P (X ≤ α−1(x)) = F (α−1(x)). (5.3)
5.1. Copula dengan 2 peubah.
DEFINISI 5. Misalkan S1, S2 ⊂ R ∪ ∞, dan Λ : S1× S2 → R. Maka
Λ-volume dari B := [u1,1, u1,2] × [u2,1, u2,2] ⊂ S1× S2, dimana u1,1 < u1,2 dan
u2,1< u2,2, didefinisikan sebagai
VΛ(B) = Λ(u1,1, u2,1) − Λ(u1,1, u2,2) − Λ(u1,2, u2,1) + Λ(u1,2, u2,2)
= 2 X i1=1 2 X i2=1 (−1)i1+i2Λ(u 1,i1, u2,i2). (5.4)
DEFINISI 6. Λ : S1× S2 → R dikatakan memenuhi sifat 2-increasing
jika VΛ(B) ≥ 0untuk setiap B ⊂ S1× S2.
Apakah fungsi H(x, y) yang tidak turun terhadap x dan y adalah fungsi yang 2-increasing?
Jawabannya adalah negatif. Pandang contoh berikut: H(x, y) = max(x, y). Maka untuk y yang ditetapkan H(x1, y) ≤ H(x2, y) jika x1 ≤ x2. Demikian
juga bila xyang ditetapkan kita peroleh H(x, y1) ≤ H(x, y2) untuk setiap
y1≤ y2. Tetapi VH(I × I) = H(0, 0) − H(0, 1) − H(1, 0) + H(1, 1) = 0 − 1 − 1 + 1 =
−1 < 0.
Apakah fungsi H(x, y) yang 2-increasing mengakibatkan H(x, y) fungsi yang tidak turun terhadap x dan y? Pandang contoh H(x, y) = (2x − 1)(2y − 1). Kita memiliki
VH(B) = H(u1,1, u2,1) − H(u1,1, u2,2) − H(u1,2, u2,1) + H(u1,2, u2,2)
= (2u1,1− 1)(2u2,1− 1) − (2u1,1− 1)(2u2,2− 1)
− (2u1,2− 1)(2u2,1− 1) + (2u1,2− 1)(2u2,2− 1)
= 2(2u1,1− 1)(u2,1− u2,2) − 2(2u1,2− 1)(u2,1− u2,2)
= 2(u2,1− u2,2)(2u1,1− 2u1,2) ≥ 0.
(5.5)
Jadi H(x, y) fungsi yang 2-increasing. Tetapi untuk y ditetapkan (2x1−
1)(2y − 1) ≤ (2x2− 1)(2y − 1) untuk setiap x1≤ x2bila y ≥ 12.
DEFINISI7. Misalkan terdapat M1dan M2yang memenuhi M1= max S1
dan M2 = max S2. Maka fungsi-fungsi marginal F dan G dari Λ
masing-masing didefinisikan sebagai
F : S1→ R, F (x) = Λ(x, M2) (5.6)
dan
G : S2→ R, G(y) = Λ(M1, y). (5.7)
DEFINISI 8. Misalkan terdapat m1dan m2yang memenuhi m1= min S1
dan m2= min S2. Maka Λ : S1× S2→ R dikatakan memiliki sifat grounded
12 1. COPULA DAN APLIKASINYA
5.2. Sifat-sifat dari fungsi 2-increasing dan grounded. Misalkan Λ
memiliki sifat 2-increasing. Maka Λ memenuhi ketaksamaan-ketaksamaan berikut:
Λ(u1,2, u2,2) − Λ(u1,2, u2,1) ≥ Λ(u1,1, u2,2) − Λ(u1,1, u2,1) (5.8)
dan
Λ(u1,2, u2,2) − Λ(u1,1, u2,2) ≥ Λ(u1,2, u2,1) − Λ(u1,1, u2,1). (5.9)
Misalkan kita gunakan u2,1 = m2 dalam ketaksamaan (5.8) dan u1,1 =
m1 dalam ketaksamaan (5.9), dan Λ juga memiliki sifat grounded maka
kita peroleh
Λ(u1,2, v) ≥ Λ(u1,1, v) (5.10)
dan
Λ(w, u2,2) ≥ Λ(w, u2,1) (5.11)
untuk sembarang w ∈ S1 dan v ∈ S2.
Sehingga perpaduan antara sifat 2-increasing dan grounded akan men-ciptakan sifat baru yang kami sajikan dalam lema berikut:
LEMA 5. Setiap fungsi Λ : S1× S2→ R yang memiliki sifat 2-increasing
dan grounded adalah fungsi tidak turun di kedua argumennya. Dengan menggunakan Lema 5 kita peroleh
G(u2,2) − G(u2,1) = Λ(M1, u2,2) − Λ(M1, u2,1) ≥ Λ(u1,1, u2,2) − Λ(u1,1, u2,1) ≥ 0
(5.12) dan
F (u1,2) − F (u1,1) = Λ(u1,2, M2) − Λ(u1,1, M2) ≥ Λ(u1,2, u2,1) − Λ(u1,1, u2,1) ≥ 0.
(5.13) Sehingga didapat
|F (u1,2)−F (u1,1)|+|G(u2,2)−G(u2,1)| ≥ |Λ(u1,1, u2,2)+Λ(u1,2, u2,1)−2Λ(u1,1, u2,1)|
(5.14) DEFINISI 9. N-Copula adalah sebuah fungsi dengan N peubah yang menghubungkan distribusi-distribusi marginal dengan distribusi gabungan-nya.
6. Korelasi Linear
Korelasi adalah suatu ukuran kebergantungan antar dua variabel acak yang didefinisikan sebagai berikut:
ρXY =
Cov(X, Y ) σXσY
. (6.1)
Misalkan X ∼ N (0, 1) dan Y = X2. Kita ketahui bahwa m.g.f. dari
N (0, 1) adalah MX(t) = e t2 2 . Maka E(X) = M0 X(0) = 0, E(X 2) = M00 X(0) = et22 + t2e t2 2|t=0= 1dan E(X3) = M000 X(0) = te t2 2 + 2te t2 2 + t3e t2 2 |t=0= 0.Sehingga
Cov(X, Y ) = E(XY ) − E(X)E(Y ) = E(X3) − E(X)E(X2) = 0, (6.2) yang mengakibatkan ρXY = 0. Hal ini menunjukan secara umum nilai
korelasi yang nol tidak mengakibatkan kebebasan antara X dan Y . Syarat agar X dan Y saling bebas adalah jika Cov(φ1(X), φ2(Y )) = 0untuk setiap
fungsi φ1 dan φ2. Hal ini merupakan salah satu kelemahan pengukuran
6. KORELASI LINEAR 13
LEMA 6 (Hoeffding). Jika F menyatakan distribusi gabungan dari X dan Y dengan FX dan FY adalah masing-masing distribusi marginalnya,
maka
Cov(X, Y ) = E(XY ) − E(X)E(Y ) = Z ∞
−∞
Z ∞
−∞
[F (x, y) − FX(x)FY(y)]dxdy (6.3)
dengan anggapan E(XY ), E(X) dan E(Y ) terdefinisi.
BUKTI. Misalkan Z1= (X1, Y1)dan Z2= (X2, Y2)saling bebas yang
ber-asal dari distribusi F . Maka Cov(Z1, Z2) = 0yang memberikan
hubungan-hubungan
E[X1Y2] = E[X1]E[Y2]dan E[Y1X2] = E[Y1]E[X2]. (6.4)
Dengan menggunakan (6.4) dan E[X] = E[X1] = E[X2], kita peroleh
E[(X1− X2)(Y1− Y2)] = E[X1Y1− X1Y2− X2Y1+ X2Y2]
= E[X1Y1] − E[X1Y2] − E[X2Y1] + E[X2Y2]
= E[X1Y1] − E[X1]E[Y2] + E[X2Y2] − E[X2]E[Y1]
= E[X1Y1] − E[X1]E[Y1] + E[X2Y2] − E[X2]E[Y2]
= 2(E[X1Y1] − E[X1]E[Y1]).
(6.5) Definisikan I(u, x) = ( 1, jika u ≤ x 0, lainnnya. (6.6) Misalkan X1 < X2. Maka R∞
−∞(I(u, X1) − I(u, X2))du = X1− X2 < 0. Untuk
X1 > X2 kita dapatkan
R∞
−∞(I(u, X1) − I(u, X2))du = X2− X1 < 0. Kedua
hasil integral tersebut merupakan selisih antara X1 dan X2 yang bernilai
sama, sehingga urutan dapat diabaikan. Sehingga kita dapat menuliskan Z ∞
−∞
(I(u, X1) − I(u, X2))du = X1− X2. (6.7)
Dengan menggabungkan hasil-hasil di atas, kita dapatkan 2(E[X1Y1] − E[X1]E[Y1]) = E[(X1− X2)(Y1− Y2)]
= E[ Z Z
(I(u, X1) − I(u, X2))(I(v, Y1) − I(v, Y2))dudv]
= Z Z
E[(I(u, X1) − I(u, X2))(I(v, Y1) − I(v, Y2))]dudv.
(6.8) Misalkan H(u, v) = E[(I(u, X1) − I(u, X2))(I(v, Y1) − I(v, Y2))]. Maka kita
peroleh
H(u, v) =
Z Z Z Z
(I(u, x1)−I(u, x2))(I(v, y1)−I(v, y2))f (x1, y1)dx1dy1f (x2, y2)dx2y2.
(6.9) Marilah kita hitung integral di atas bagian perbagian. Kita dapat menu-liskan integral di atas sebagai:
H(u, v) = 2J1− 2J2, (6.10)
dimana J1=
Z Z Z Z
14 1. COPULA DAN APLIKASINYA
dan
J2=
Z Z Z Z
I(u, x1)I(v, y2)f (x1, y1)f (x2, y2)dx1dy2dx2dy1 (6.12)
Marilah kita hitung J1terlebih dahulu. Kita memiliki
Z Z I(u, x1)I(v, y1)f (x1, y1)f (x2, y2)dx1dy1= f (x2, y2) Z Z x1 −∞ f (s, y1)dsdy1 = f (x2, y2) Z y1 −∞ Z x1 −∞ f (s, t)dsdt = f (x2, y2)F (x1, y1). (6.13) Hal di atas menghasilkan
J1=
Z Z
f (x2, y2)F (x1, y1)dx2dy2= F (x1, y1). (6.14)
Untuk menghitung J2perhatikan integral berikut
Z Z I(u, x1)I(v, y2)f (x1, y1)f (x2, y2)dx1dy2= Z I(u, x1)f (x1, y1)dx1 Z I(v, y2)f (x2, y2)dy2 = Z x1 −∞ f (s, y1)ds Z y2 −∞ f (x2, t)dt. (6.15) Sehingga J2= Z Z x1 −∞ f (s, y1)dsdy1 Z Z y2 −∞ f (x2, t)dtdx2= FX(x1)FY(y2). (6.16)
Dari hasil-hasil di atas dapat disimpulkan
2(E[XY ] − E[X]E[Y ]) = 2 Z Z
(F (x, y) − FX(x)FY(y))dxdy. (6.17)
6.1. Keluarga Copula.
DEFINISI 10. Distribusi normal multivariabel untuk sebuah vektor
ber-dimensi k yaitu x = (X1, . . . , Xk)T, N (µ, Σ), didefiniskan sebagai berikut
Φρ(x1, . . . , xk) = Z x1 −∞ . . . Z xk −∞ 1 |2π|k/2|Σ|1/2exp(− 1 2(x − µ) TΣ−1(x − µ)), (6.18)
dimana Σi,j = Cov(Xi, Xj)dan |Σ| adalah determinan dari Σ.
Sebagai contoh untuk k = 2, dengan menggunakan persamaan Cov(X, Y ) = ρσXσY, kita peroleh Σ = σ2 1 ρσX1σX2 ρσX1σX2 σ 2 X2 , µ = µX1 µX2 , (6.19) dan |Σ| = σ2 X1σ 2 X2− σ 2 X1σ 2 X2ρ 2= σ2 X1σ 2 X2(1 − ρ 2). (6.20) LEMA7. Misalkan (X1, X2) ∼ N (µ, Σ). Maka distribusi bersyarat Xi|Xj =
a ∼ N (µ, Σ),dimana µ = µi+ ρσσji(a − µj)dan Σ = σi2(1 − ρ
6. KORELASI LINEAR 15
DEFINISI11 (Copula Gaussian multivariabel-MVN). Misalkan ρ adalah sebuah matrik simetrik, definit positif dengan diag(ρ) = 1 dan Φρ yaitu
dis-tribusi normal multivariabel standar dengan korelasi ρ. Copula Gaussian multivariabel didefinisikan sebagai berikut:
C(u1, . . . , CN; ρ) = Φρ(Φ−1(u1), . . . , Φ−1ρ (uN)) (6.21)
dengan fungsi densitas
c(u1, . . . , uN) = 1 |ρ|1/2exp −1 2ξ T(ρ−1− I)ξ , (6.22) dimana ξn= Φ−1(un).
DEFINISI 12. Copula bersyarat dari (x, y)|Ft−1, dimana x|Ft−1 ∼ F dan
y|Ft−1∼ G.
6.2. Simulasi Copula.
6.3. Estimasi Non-parametric. Misalkan
TABEL 1. Time series data
t 1 2 3 4 5 6 7 8 9 10
X1 3 2 3 7 9 1 4 8 10 15
X2 1 12 3.5 2 8.5 1.3 3.5 6.5 11 12.5
TABEL 2. Statistik terurut dari Time series data
t 1 2 3 4 5 6 7 8 9 10
X1(1) 1 2 3 2 8.5 1 3.5 6.5 10 12.5 X2(2) 3 12 3.5 7 9 1.3 4 8 11 15
Distribusi empirik Copulanya dapat dituliskan sebagai berikut:
ˆ C t1 10, t2 10 = 1 10 10 X t=1 1xt 1≤x(t1)1 , xt2≤x(t2)2 , (6.23) dimana 1 ≤ t1, t2≤ 10.
6.3.1. Simulasi random variabel generator.
0 Data (X1, Y1), . . . , (Xn, Yn), dimana Xi∼ F (x, α) dan Yi∼ G(y, β).
Ui= F (Xi)dan Vi= G(Yi), i = 1, 2, . . . , n.
1 Fungsi log-Likelihood Copula
log l(θ, α, β) = n X j=1 log c(uj, vj, θ) + n X j=1 log f (F−1(uj), α) + n X j=1 log g(G−1(vj), β) (6.24) 2 ˆα =argmaxα Pn j=1log f (F −1(u j), α) 3 ˆβ =argmaxβ Pn j=1log g(G−1(vj), β) 4 ˆθ =argmaxθlog l(θ, ˆα, ˆβ)
5 Gunakan ˆθuntuk menghitung ρs, ρτ dan membangkitkan data u