• Tidak ada hasil yang ditemukan

Pengenalan Copula. Sapto Wahyu Indratno

N/A
N/A
Protected

Academic year: 2021

Membagikan "Pengenalan Copula. Sapto Wahyu Indratno"

Copied!
19
0
0

Teks penuh

(1)

Pengenalan Copula

Sapto Wahyu Indratno

STATISTICS DISIVISION, FACULTY OF MATHEMATICS AND NATURALSCI

-ENCES, INSTITUTTEKNOLOGI BANDUNG

(2)
(3)

Daftar Isi

Bagian 1. Copula 1

Bab 1. Copula dan aplikasinya 3

1. Pendahuluan 3

2. Fungsi-fungsi distribusi 3

3. Konsep dasar dari Kebergantungan 9

4. Jenis-jenis Copula 10

5. Proses Estimasi Copula 10

6. Korelasi Linear 12

(4)
(5)

Bagian 1

(6)
(7)

BAB 1

Copula dan aplikasinya

1. Pendahuluan

Sebuah Copula adalah suatu fungsi multivariat yang terlahir dari se-buah distribusi gabungan. Copula merupakan alat yang dapat digunakan untuk menganalisa kebergantungan variabel-variabel acak dalam struk-tur yang digambarkan oleh fungsi gabungan terebut. Di sini strukstruk-tur kebergantungan variabel-variabel acak dalam distribusi gabungan dapat dilihat dari kebergantungan fungsi-fungsi marginalnya dalam fungsi Co-pula. Sehingga Copula dari sebuah distribusi multivariat dapat dipan-dang sebagai gambaran struktur kebergantungan dari distribusi multi-variat tersebut berdasarkan prilaku dari masing-masing fungsi marginal-nya.

Salah satu sifat Copula yang penting adalah invarian terhadap transformasi-transformasi yang menaik kuat pada marginal-marginalnya.

Copula dapat menyelesaikan suatu masalah yang sulit, seperti mencari sebuah distribusi multivariat, dengan melakukan dua langkah sederhana berikut: langkah pertama adalah memodelkan semua distribusi marginal-nya. Langkah kedua adalah mengestimasi Copula yang menggambarkan kebergantungan dari marginal-marginalnya.

Dalam industri keuangan dan asuransi struktur ketergantungan an-tara aset merupakan hal yang sangat penting untuk dipelajari. Keber-gantungan ini dianalisa untuk beberapa tujuan: pricing dan hedging dari intrumen kredit yang sensitif, basket derivatives dan structured produts, pengaturan portfolio kredit, pengukuran resiko kredit dan resiko pasar.

2. Fungsi-fungsi distribusi

Sebuah variabel acak X didefinisikan sebagai sebuah fungsi yang meng-aitkan sebuah bilangan real X(ξ) dengan setiap hasil eksperimen ξ dalam ruang sampel Ω

2.1. Univariat. Fungsi distribusi (kumulatif) F dari suatu variabel

acak X didefinisikan sebagai

FX(x) = P (X ≤ x), (2.1)

dimana

• FX(−∞) = 0dan FX(∞) = 1sehingga 0 ≤ FX(x) ≤ 1 ∀x, dan

• FX adalah fungsi yang kontinu kanan.

Jika FX kontinu juga dari kiri maka X adalah variabel acak kontinu.

AKIBAT1. Melalui sifat 0 ≤ F (X) ≤ 1 diperoleh 1. {x | F (x) < y} = ∅, ∀y ≤ 0, dan

2. {x | F (x) < y} = X, ∀y ≥ 1.

Sehingga P (F (X) ≤ y) = 0, ∀y ≤ 0, dan P (F (X) ≤ y) = 1, ∀y ≥ 1.

(8)

4 1. COPULA DAN APLIKASINYA

Pada umumnya fungsi distribusi FX tidak murni monoton naik,

seba-gai contoh fungsi distribusi untuk variabel acak diskret, sehingga definisi fungsi F−1yang klasik tidak dapat digunakan. Untuk mengatasi masalah

ini fungsi inversi FX yang diperumum diperkenalkan sebagai berikut:

DEFINISI 1 (Inversi yang diperumum). Misalkan X adalah sebuah variabel acak (kontinu atau diskret). Fungsi inversi yang diperumum dari FX didefinisikan sebagai berikut:

FX−1(u) = inf{x | F (x) > u}. (2.2) Perhatikan bahwa Definisi 1 dan kekontinuan kanan dari F mengaki-batkan

F−1(F (x)) = inf{w | F (w) ≥ F (x)} = x, ∀x ∈ X. (2.3) LEMA 1. Misalkan FX adalah sebuah fungsi distribusi yang monoton

naik murni, FX(x) < FX(y) ∀x < y, dari suatu variabel acak kontinu. Maka

FX−1 adalah fungsi yang monoton naik murni. BUKTI. (2.3) memberikan

dF (F−1(x)) dx = 1.

Aplikasikan aturan rantai pada ruas kiri persamaan di atas, kita peroleh dF (F−1(x)) dx = F 0(w)dF−1(x) dx = 1, (2.4) w = F−1(x), atau (F−1)0(x) = 1 F0(F−1(x)) > 0. (2.5)  TEOREMA1 (Teorema CDF). Misalkan X adalah sebuah variabel acak kontinu dengan fungsi distribusi F (.). Misalkan X ditransfromasikan me-lalui fungsi kumulatifnya yaitu Y = F (X). Maka distribusi dari Y adalah seragam pada interval [0, 1], Y ∼ U [0, 1].

(9)

2. FUNGSI-FUNGSI DISTRIBUSI 5

BUKTI. Untuk membuktikan teorema ini kita gunakan definisi beri-kut:

DEFINISI 2. X ∼ U [0, 1] jika dan hanya jika

P (X ≤ x) =    0, x ≤ 0 x, 0 < x ≤ 1 1, x > 1. (2.6)

Dari Akibat 1 kita cukup menunjukkan P (Y < y) = y, ∀y ∈ [0, 1]. De-ngan menggunakan {x ∈ X | F (x) ≤ y} = {x ∈ X | F−1(F (x)) ≤ F−1(y)},

kita peroleh

P (Y ≤ y) = P (F (X) ≤ y) = P (F−1(F (X)) ≤ F−1(y))

= P (X ≤ F−1(y)) = F (F−1(y)) = y ∀y ∈ [0, 1]. (2.7)  2.1.1. Fungsi distribusi empirik. Misalkan X1, X2, . . . , Xn menyatakan

sampel acak yang berukuran n. Bagaimana cara mendapatkan distribusi dari sampel acak tersebut? Untuk menjawab pertanyaan tersebut, kita perhatikan informasi yang dapat kita peroleh dari sampel acak tersebut. Deskriptif Statistik dapat digunakan terlebih dahulu untuk mendapatkan sari numerik dari sampel acak tersebut. Di sini akan difokuskan pada informasi sampel acak yang didapatkan dari distribusi empirik. Fungsi distribusi empirik ini didefinisikan sebagai berikut:

DEFINISI 3. Misalkan X1, X2, . . . , Xn suatu sampel acak dari suatu

dis-tribusi X. Disdis-tribusi empirik dari sampel acak tersebut adalah

F (x) = n X i=1 1{Xi≤x} n . (2.8) GAMBAR2. (a) n = 5, (b) n = 50, (c) n = 500

Distribusi empirik ini adalah distribusi yang berdasarkan pada data. Gambar 2 mengilustrasikan bentuk dari distribusi empirik untuk bebera-pa ukuran sample acak yang diambil dari distribusi Gamma(3,1). Terlihat dalam Gambar 2 (a) sampel acak berukuran 5 menyebar pada interval [0, 5]

(10)

6 1. COPULA DAN APLIKASINYA

yang menghasilkan distribusi empirik yang jauh dari distribusi populasi-nya. Dalam Gambar 2 (b) dan (c) sampel acak mulai menyebar merata sehingga distribusi empiriknya semakin mendekati distribusi populasi-nya. Dari contoh ini terlihat bahwa kedekatan distribusi empirik dengan distribusi populasinya sangat bergantung pada banyaknya data dan pe-nyebaran data.

2.2. Pengkontinuan variabel acak diskret. Misalkan X adalah

vari-abel acak disktrit dan U adalah suatu varivari-abel acak dengan support [0, 1]. Definisikan X∗= X + (U − 1). Maka P (X + U − 1 ≤ s) = P (X + U ≤ [s] + 1 + (s − [s])) = ∞ X x=0 P (U ≤ s + 1 − x)P (X = x) = (2.9)

2.3. Univariat Normal. Fungsi densitas dan distribusi (kumulatif)

da-ri distda-ribusi Normal standar didefinisikan masing-masing sebagai beda-rikut:

φ(x) = √1 2πexp(− x2 2 ), −∞ < x < ∞ (2.10) dan Φ(x) = Z x −∞ φ(t)dt. (2.11)

Bila X ∼ N (µ, σ2), maka kita dapat menstandarkan variabel acak

ter-sebut melalui transformasi Y = X−µσ ∼ N (0, 1). Sehingga Y memiliki fungsi kepadatan sebagai berikut:

f (x) = 1

σφ(y), −∞ < x < ∞, (2.12) dimana y = x−µσ .

2.4. Bivariat. Suatu fungsi yang kontinu kanan F : R2 → [0, 1] kita

sebut fungsi distribusi bivariat bila memenuhi sifat-sifat berikut: • limxj→−∞F (x1, x2) = 0, j = 1, 2,

• limxj→∞, ∀jF (x1, x2) = 1

• untuk semua (x1, y1), (x2, y2)dengan x1< x2,y1< y2berlaku

F (x2, y2) − F (x1, y2) − F (x2, y1) + F (x1, y1) ≥ 0. (2.13) Misalkan X =  X1 X2 

adalah sebuah vektor acak yang berdistribusi

Bivariat Normal(µ, Σ), dimana µ = 

µ1

µ2



adalah vektor mean, dan

Σ =  σ2 1 ρσ1σ2 ρσ1σ2 σ22  (2.14)

adalah matriks kovariansi. Di sini ρ menyatakan korelasi antara X1 dan

X2.

Fungsi kepadatan peluang untuk bivariat normal ini adalah

f (x1, x2) = 1 2π|Σ|exp  −(X − µ) 0Σ−1(X − µ) 2  . (2.15)

(11)

2. FUNGSI-FUNGSI DISTRIBUSI 7

Kebebasan bivariat Normal. Kebebasan antar variabel acak distribusi

bivariat Normal ini menyebabkan

Σ =  σ2 1 0 0 σ2 2  dan Σ−1= 1 σ2 1 0 0 1 σ2 2 ! . (2.16)

Visualisasi kebebasan bivariat normal. Untuk memperoleh gambaran

GAMBAR 3. Kurva ketinggian fungsi bivariat normal baku dengan ρ = 0, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0

struktur kebergantungan X1 dan X2 kami sajikan Gambar bivariat

Nor-mal dengan µ = (0, 0) dan σ1 = σ2 = 1 dengan ρ = 0. Gambar 3

merep-resentasikan struktur kebergantungan X1 dan X2 ketika mereka saling

bebas. Terlihat data yang dibangkitkan dari distribusi bivariat normal baku dengan ρ = 0 mengikuti bentuk kurva ketinggian dari fungsi kepa-datan peluang distribusi bivariat normal baku dengan ρ = 0. Untuk kasus X1dan X2 yang saling bebas kita memiliki

P (X1≤ 0, X2≤ 0) ≈ 0, 5P (X1≤ 0),

seperti yang diperlihatkan pada Gambar 3. Terlihat bahwa data acak yang dibangkitkan berkumpul membentuk bola dua dimensi yang berpusat di titik (0, 0).

Bila kita naikkan nilai ρ nya struktur kebergantungan X1 dan X2 akan

berubah. Pada Gambar 4 terlihat bentuk penyebaran data acaknya ber-bentuk elips. Di sini kita memiliki

P (X1≤ 0, X2≤ 0) ≈ 0, 75P (X1≤ 0).

Dapat kita lihat untuk ρ → 1 data atau kurva ketinggiannya mendekati bentuk garis seperti yang diperlihatkan pada Gambar 5, dan

lim

ρ→1P (X1≤ 0, X2≤ 0) = P (X1≤ 0).

Hal ini menunjukkan parameter ρ sangat erat kaitannya dengan keber-gantungan antara dua variabel acak tersebut.

LEMA 2.

P (A ∩ B) ≤ min{P (A), P (B)}. (2.17) BUKTI. Bukti diperoleh melalui hubungan P (A ∩ B) ≤ P (A) dan P (A ∩

(12)

8 1. COPULA DAN APLIKASINYA

GAMBAR 4. Kurva ketinggian fungsi bivariat normal de-ngan ρ = 0, 8, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0, 8

GAMBAR 5. Kurva ketinggian fungsi bivariat normal

de-ngan ρ = 0, 99, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0, 99

2.5. Covariance. Misalkan

yt= αyt−1+ µ + t. (2.18)

Maka

E[y(t − h)yt] = E[(αyt−h−1+ µ + t−h)(αyt−1+ µ + t)] (2.19)

2.5.1. Peluang bersyarat. Misalkan X dan Y adalah variabel acak yang berdistribusi masing-masing FXdan FY, dan H adalah distribusi

gabung-an X dgabung-an Y . DEFINISI 4 (CDF bersyarat). P (X ≤ x | Y ≤ y) = P (X ≤ x, Y ≤ y) P (Y ≤ y) = H(x, y) FY(y) .

Terlihat dari Definisi 4 bahwa

P (X ≤ x | Y ≤ y) ≥ H(x, y). (2.20) Jika H ∈ C1 maka P (X ≤ x | Y = y) =limδ→0P (X ≤ x, y − δ ≤ Y ≤ y + δ) limδ→0P (y − δ ≤ Y ≤ y + δ) = ∂ ∂yH(x, y) fY(y) . (2.21)

(13)

3. KONSEP DASAR DARI KEBERGANTUNGAN 9

2.6. Multivariat. Suatu fungsi yang kontinu kanan F : Rm → [0, 1]

kita sebut fungsi distribusi bivariat bila memenuhi sifat-sifat berikut: • limxj→−∞F (x1, . . . , xm) = 0, j = 1, 2, . . . , m,

• limxj→∞, ∀jF (x1, . . . , m) = 1

• untuk semua (x1, x2, . . . , xm), (y1, y2, . . . , ym) dengan xi < yi, i =

1, 2, . . . , m, berlaku 2 X i1=1 2 X i2=1 . . . 2 X im=1 (−1)i1+i2+...+imF (x 1, x2, . . . , xm) ≥ 0, (2.22) dimana xi1 = xi dan

3. Konsep dasar dari Kebergantungan

Konsep-konsep yang akan ditampilkan adalah:

• Konsep dari kebergantungan pada kuadran yang positif dan pe-ngurutan concordance.

• Konsep dari kebergantungan dari kenaikan positif yang stokastik • Konsep dari total positivity of order 2 (T P2) dan max-infinite

divi-sibility

• Konsep dari kebergantungan ekor yang digunakan untuk meng-kontruksi dan menganalisa distribusi nilai ekstrim multivariat dan copulas.

• Konsep dari kebergantungan dari Kendall’s tau dan Spearman’s rho.

3.1. Kebergantungan Kuadran positif dan Orthan. Misalkan X =

(X1, X2) adalah sebuah vektor bivariat dengan cdf F . Di sini X atau F

dikatakan bergantung pada kuadran positif (PQD) jika

P (X1> a1 | X2> a2) ≥ P (X1> a1) ∀a1, a2∈ R. (3.1)

Dengan menggunakan hubungan

P (X1> a1, X2> a2) = 1 − P (X1≤ a1) − P (X2≤ a2) + P (X1≤ a1, X2≤ a2),

(3.2) kita dapat tuliskan hubungan (3.1) sebagai berikut

P (X1≤ a1 | X2≤ a2) ≥ P (X1≤ a1) ∀a1, a2∈ R. (3.3)

Hubungan (3.1) menyatakan bahwa peluang X1 > a1 akan lebih besar,

untuk setiap a1, bila informasi X2> a2, untuk setiap a2, diketahui

diban-ding tanpa informasi X2.

Contoh: Distribusi F (x, y) = FX(x)FY(y)[1 + θ(1 − FX(x))(1 − FY(y))], 0 ≤ θ ≤

1. Untuk melihat hubungan X dan Y secara visual misalkan X ∼ N (0, 1) dan Y ∼ N (2, 4). Kita bangkitkan data (xi, yi), i = 1, 2, . . . , 700, dari

distri-busi gabungan F (x, y).

Distribusi gabungan di atas dapat dituliskan sebagai C(u, v) = uv[1 + θ(1 − u)(1 − v)],dimana u = FX(x)dan v = FY(y). Kita peroleh

∂uC(u, v) = −θ(1 − 2u)v

(14)

10 1. COPULA DAN APLIKASINYA

GAMBAR6. Struktur kebergantungan

4. Jenis-jenis Copula

Apakah ada hubungan frequency domain used in Fourier analysis de-ngan Distribution cumulative domain used in Copula? It seems to be similar to me based on the following :

The "frequency domain" is simply a different way to look at the data that you have in the time domain. When you listen to a symphony, the time domain description tells you what sound you hear in every given instant, while the frequency domain description tells you, roughly, what instru-ments are involved and the ways they are played.

4.1. Keluarga Bivariat dengan satu parameter. Dalam bagian ini

akan ditampilkan Copula bivariat dengan satu parameter yang memiliki sifat-sifat:

• kontinu secara absolut

• supportnya berada di seluruh [0, 1]2

• hasil interpolasi antara batas bawah dan batas atas Frechet.

5. Proses Estimasi Copula

Asumsikan Copula yang sebenarnya berasal dari sebuah keluarga Co-pula parametrik C = {Cθ, θ ∈ Θ}. Kita ingin mengestimasi Copula ini

berdasarkan data yang diasumsikan saling bebas dan memiliki distribusi yang identik. Untuk mengestimasi Copula ini dapat dilakukan dengan menggunakan parametrik marginal atau non-parametrik marginal.

Terlebih dahulu kita perkenalkan beberapa sifat-sifat fungsi distribusi (kumulatif):

LEMA3. Misalkan X memiliki distribusi F . Maka X dan F−1(U )dimana

U berdistribusi seragam (0, 1) memiliki distribusi yang sama.

BUKTI. P (F−1(U ) ≤ x) = P (U ≤ F (x)) = F (x) = P (X ≤ x).  Dengan menggunakan Lema 3 kita dapatkan hubungan

F (x1, x2, . . . , xn) = P (X1≤ x1, X2≤ x2, . . . , Xn≤ xn)

= P (F1−1(U1) ≤ x1, . . . , Fn−1(Un) ≤ xn)

= P (U1≤ F1(x1), . . . , Un ≤ Fn(xn))

= P (U1≤ u1, . . . , Un ≤ un) = C(u1, u2, . . . , un),

(5.1)

(15)

5. PROSES ESTIMASI COPULA 11

Untuk n = 2 kita dapatkan, menggunakan u = F (x) dan v = G(y), kita peroleh f (x, y) = ∂ 2F (x, y) ∂x∂y = ∂2 ∂x∂yC(F (x), G(y)) = dF (x) dx dG(x) dy ∂2 ∂u∂vC(F (x), G(y)). (5.2) LEMA 4. Misalkan α(x) adalah fungsi yang monoton naik. Maka

P (α(X) ≤ x) = P (X ≤ α−1(x)) = F (α−1(x)). (5.3)

5.1. Copula dengan 2 peubah.

DEFINISI 5. Misalkan S1, S2 ⊂ R ∪ ∞, dan Λ : S1× S2 → R. Maka

Λ-volume dari B := [u1,1, u1,2] × [u2,1, u2,2] ⊂ S1× S2, dimana u1,1 < u1,2 dan

u2,1< u2,2, didefinisikan sebagai

VΛ(B) = Λ(u1,1, u2,1) − Λ(u1,1, u2,2) − Λ(u1,2, u2,1) + Λ(u1,2, u2,2)

= 2 X i1=1 2 X i2=1 (−1)i1+i2Λ(u 1,i1, u2,i2). (5.4)

DEFINISI 6. Λ : S1× S2 → R dikatakan memenuhi sifat 2-increasing

jika VΛ(B) ≥ 0untuk setiap B ⊂ S1× S2.

Apakah fungsi H(x, y) yang tidak turun terhadap x dan y adalah fungsi yang 2-increasing?

Jawabannya adalah negatif. Pandang contoh berikut: H(x, y) = max(x, y). Maka untuk y yang ditetapkan H(x1, y) ≤ H(x2, y) jika x1 ≤ x2. Demikian

juga bila xyang ditetapkan kita peroleh H(x, y1) ≤ H(x, y2) untuk setiap

y1≤ y2. Tetapi VH(I × I) = H(0, 0) − H(0, 1) − H(1, 0) + H(1, 1) = 0 − 1 − 1 + 1 =

−1 < 0.

Apakah fungsi H(x, y) yang 2-increasing mengakibatkan H(x, y) fungsi yang tidak turun terhadap x dan y? Pandang contoh H(x, y) = (2x − 1)(2y − 1). Kita memiliki

VH(B) = H(u1,1, u2,1) − H(u1,1, u2,2) − H(u1,2, u2,1) + H(u1,2, u2,2)

= (2u1,1− 1)(2u2,1− 1) − (2u1,1− 1)(2u2,2− 1)

− (2u1,2− 1)(2u2,1− 1) + (2u1,2− 1)(2u2,2− 1)

= 2(2u1,1− 1)(u2,1− u2,2) − 2(2u1,2− 1)(u2,1− u2,2)

= 2(u2,1− u2,2)(2u1,1− 2u1,2) ≥ 0.

(5.5)

Jadi H(x, y) fungsi yang 2-increasing. Tetapi untuk y ditetapkan (2x1−

1)(2y − 1) ≤ (2x2− 1)(2y − 1) untuk setiap x1≤ x2bila y ≥ 12.

DEFINISI7. Misalkan terdapat M1dan M2yang memenuhi M1= max S1

dan M2 = max S2. Maka fungsi-fungsi marginal F dan G dari Λ

masing-masing didefinisikan sebagai

F : S1→ R, F (x) = Λ(x, M2) (5.6)

dan

G : S2→ R, G(y) = Λ(M1, y). (5.7)

DEFINISI 8. Misalkan terdapat m1dan m2yang memenuhi m1= min S1

dan m2= min S2. Maka Λ : S1× S2→ R dikatakan memiliki sifat grounded

(16)

12 1. COPULA DAN APLIKASINYA

5.2. Sifat-sifat dari fungsi 2-increasing dan grounded. Misalkan Λ

memiliki sifat 2-increasing. Maka Λ memenuhi ketaksamaan-ketaksamaan berikut:

Λ(u1,2, u2,2) − Λ(u1,2, u2,1) ≥ Λ(u1,1, u2,2) − Λ(u1,1, u2,1) (5.8)

dan

Λ(u1,2, u2,2) − Λ(u1,1, u2,2) ≥ Λ(u1,2, u2,1) − Λ(u1,1, u2,1). (5.9)

Misalkan kita gunakan u2,1 = m2 dalam ketaksamaan (5.8) dan u1,1 =

m1 dalam ketaksamaan (5.9), dan Λ juga memiliki sifat grounded maka

kita peroleh

Λ(u1,2, v) ≥ Λ(u1,1, v) (5.10)

dan

Λ(w, u2,2) ≥ Λ(w, u2,1) (5.11)

untuk sembarang w ∈ S1 dan v ∈ S2.

Sehingga perpaduan antara sifat 2-increasing dan grounded akan men-ciptakan sifat baru yang kami sajikan dalam lema berikut:

LEMA 5. Setiap fungsi Λ : S1× S2→ R yang memiliki sifat 2-increasing

dan grounded adalah fungsi tidak turun di kedua argumennya. Dengan menggunakan Lema 5 kita peroleh

G(u2,2) − G(u2,1) = Λ(M1, u2,2) − Λ(M1, u2,1) ≥ Λ(u1,1, u2,2) − Λ(u1,1, u2,1) ≥ 0

(5.12) dan

F (u1,2) − F (u1,1) = Λ(u1,2, M2) − Λ(u1,1, M2) ≥ Λ(u1,2, u2,1) − Λ(u1,1, u2,1) ≥ 0.

(5.13) Sehingga didapat

|F (u1,2)−F (u1,1)|+|G(u2,2)−G(u2,1)| ≥ |Λ(u1,1, u2,2)+Λ(u1,2, u2,1)−2Λ(u1,1, u2,1)|

(5.14) DEFINISI 9. N-Copula adalah sebuah fungsi dengan N peubah yang menghubungkan distribusi-distribusi marginal dengan distribusi gabungan-nya.

6. Korelasi Linear

Korelasi adalah suatu ukuran kebergantungan antar dua variabel acak yang didefinisikan sebagai berikut:

ρXY =

Cov(X, Y ) σXσY

. (6.1)

Misalkan X ∼ N (0, 1) dan Y = X2. Kita ketahui bahwa m.g.f. dari

N (0, 1) adalah MX(t) = e t2 2 . Maka E(X) = M0 X(0) = 0, E(X 2) = M00 X(0) = et22 + t2e t2 2|t=0= 1dan E(X3) = M000 X(0) = te t2 2 + 2te t2 2 + t3e t2 2 |t=0= 0.Sehingga

Cov(X, Y ) = E(XY ) − E(X)E(Y ) = E(X3) − E(X)E(X2) = 0, (6.2) yang mengakibatkan ρXY = 0. Hal ini menunjukan secara umum nilai

korelasi yang nol tidak mengakibatkan kebebasan antara X dan Y . Syarat agar X dan Y saling bebas adalah jika Cov(φ1(X), φ2(Y )) = 0untuk setiap

fungsi φ1 dan φ2. Hal ini merupakan salah satu kelemahan pengukuran

(17)

6. KORELASI LINEAR 13

LEMA 6 (Hoeffding). Jika F menyatakan distribusi gabungan dari X dan Y dengan FX dan FY adalah masing-masing distribusi marginalnya,

maka

Cov(X, Y ) = E(XY ) − E(X)E(Y ) = Z ∞

−∞

Z ∞

−∞

[F (x, y) − FX(x)FY(y)]dxdy (6.3)

dengan anggapan E(XY ), E(X) dan E(Y ) terdefinisi.

BUKTI. Misalkan Z1= (X1, Y1)dan Z2= (X2, Y2)saling bebas yang

ber-asal dari distribusi F . Maka Cov(Z1, Z2) = 0yang memberikan

hubungan-hubungan

E[X1Y2] = E[X1]E[Y2]dan E[Y1X2] = E[Y1]E[X2]. (6.4)

Dengan menggunakan (6.4) dan E[X] = E[X1] = E[X2], kita peroleh

E[(X1− X2)(Y1− Y2)] = E[X1Y1− X1Y2− X2Y1+ X2Y2]

= E[X1Y1] − E[X1Y2] − E[X2Y1] + E[X2Y2]

= E[X1Y1] − E[X1]E[Y2] + E[X2Y2] − E[X2]E[Y1]

= E[X1Y1] − E[X1]E[Y1] + E[X2Y2] − E[X2]E[Y2]

= 2(E[X1Y1] − E[X1]E[Y1]).

(6.5) Definisikan I(u, x) = ( 1, jika u ≤ x 0, lainnnya. (6.6) Misalkan X1 < X2. Maka R∞

−∞(I(u, X1) − I(u, X2))du = X1− X2 < 0. Untuk

X1 > X2 kita dapatkan

R∞

−∞(I(u, X1) − I(u, X2))du = X2− X1 < 0. Kedua

hasil integral tersebut merupakan selisih antara X1 dan X2 yang bernilai

sama, sehingga urutan dapat diabaikan. Sehingga kita dapat menuliskan Z ∞

−∞

(I(u, X1) − I(u, X2))du = X1− X2. (6.7)

Dengan menggabungkan hasil-hasil di atas, kita dapatkan 2(E[X1Y1] − E[X1]E[Y1]) = E[(X1− X2)(Y1− Y2)]

= E[ Z Z

(I(u, X1) − I(u, X2))(I(v, Y1) − I(v, Y2))dudv]

= Z Z

E[(I(u, X1) − I(u, X2))(I(v, Y1) − I(v, Y2))]dudv.

(6.8) Misalkan H(u, v) = E[(I(u, X1) − I(u, X2))(I(v, Y1) − I(v, Y2))]. Maka kita

peroleh

H(u, v) =

Z Z Z Z

(I(u, x1)−I(u, x2))(I(v, y1)−I(v, y2))f (x1, y1)dx1dy1f (x2, y2)dx2y2.

(6.9) Marilah kita hitung integral di atas bagian perbagian. Kita dapat menu-liskan integral di atas sebagai:

H(u, v) = 2J1− 2J2, (6.10)

dimana J1=

Z Z Z Z

(18)

14 1. COPULA DAN APLIKASINYA

dan

J2=

Z Z Z Z

I(u, x1)I(v, y2)f (x1, y1)f (x2, y2)dx1dy2dx2dy1 (6.12)

Marilah kita hitung J1terlebih dahulu. Kita memiliki

Z Z I(u, x1)I(v, y1)f (x1, y1)f (x2, y2)dx1dy1= f (x2, y2) Z Z x1 −∞ f (s, y1)dsdy1 = f (x2, y2) Z y1 −∞ Z x1 −∞ f (s, t)dsdt = f (x2, y2)F (x1, y1). (6.13) Hal di atas menghasilkan

J1=

Z Z

f (x2, y2)F (x1, y1)dx2dy2= F (x1, y1). (6.14)

Untuk menghitung J2perhatikan integral berikut

Z Z I(u, x1)I(v, y2)f (x1, y1)f (x2, y2)dx1dy2= Z I(u, x1)f (x1, y1)dx1 Z I(v, y2)f (x2, y2)dy2 = Z x1 −∞ f (s, y1)ds Z y2 −∞ f (x2, t)dt. (6.15) Sehingga J2= Z Z x1 −∞ f (s, y1)dsdy1 Z Z y2 −∞ f (x2, t)dtdx2= FX(x1)FY(y2). (6.16)

Dari hasil-hasil di atas dapat disimpulkan

2(E[XY ] − E[X]E[Y ]) = 2 Z Z

(F (x, y) − FX(x)FY(y))dxdy. (6.17)



6.1. Keluarga Copula.

DEFINISI 10. Distribusi normal multivariabel untuk sebuah vektor

ber-dimensi k yaitu x = (X1, . . . , Xk)T, N (µ, Σ), didefiniskan sebagai berikut

Φρ(x1, . . . , xk) = Z x1 −∞ . . . Z xk −∞ 1 |2π|k/2|Σ|1/2exp(− 1 2(x − µ) TΣ−1(x − µ)), (6.18)

dimana Σi,j = Cov(Xi, Xj)dan |Σ| adalah determinan dari Σ.

Sebagai contoh untuk k = 2, dengan menggunakan persamaan Cov(X, Y ) = ρσXσY, kita peroleh Σ =  σ2 1 ρσX1σX2 ρσX1σX2 σ 2 X2  , µ =  µX1 µX2  , (6.19) dan |Σ| = σ2 X1σ 2 X2− σ 2 X1σ 2 X2ρ 2= σ2 X1σ 2 X2(1 − ρ 2). (6.20) LEMA7. Misalkan (X1, X2) ∼ N (µ, Σ). Maka distribusi bersyarat Xi|Xj =

a ∼ N (µ, Σ),dimana µ = µi+ ρσσji(a − µj)dan Σ = σi2(1 − ρ

(19)

6. KORELASI LINEAR 15

DEFINISI11 (Copula Gaussian multivariabel-MVN). Misalkan ρ adalah sebuah matrik simetrik, definit positif dengan diag(ρ) = 1 dan Φρ yaitu

dis-tribusi normal multivariabel standar dengan korelasi ρ. Copula Gaussian multivariabel didefinisikan sebagai berikut:

C(u1, . . . , CN; ρ) = Φρ(Φ−1(u1), . . . , Φ−1ρ (uN)) (6.21)

dengan fungsi densitas

c(u1, . . . , uN) = 1 |ρ|1/2exp  −1 2ξ T−1− I)ξ  , (6.22) dimana ξn= Φ−1(un).

DEFINISI 12. Copula bersyarat dari (x, y)|Ft−1, dimana x|Ft−1 ∼ F dan

y|Ft−1∼ G.

6.2. Simulasi Copula.

6.3. Estimasi Non-parametric. Misalkan

TABEL 1. Time series data

t 1 2 3 4 5 6 7 8 9 10

X1 3 2 3 7 9 1 4 8 10 15

X2 1 12 3.5 2 8.5 1.3 3.5 6.5 11 12.5

TABEL 2. Statistik terurut dari Time series data

t 1 2 3 4 5 6 7 8 9 10

X1(1) 1 2 3 2 8.5 1 3.5 6.5 10 12.5 X2(2) 3 12 3.5 7 9 1.3 4 8 11 15

Distribusi empirik Copulanya dapat dituliskan sebagai berikut:

ˆ C t1 10, t2 10  = 1 10 10 X t=1 1xt 1≤x(t1)1 , xt2≤x(t2)2 , (6.23) dimana 1 ≤ t1, t2≤ 10.

6.3.1. Simulasi random variabel generator.

0 Data (X1, Y1), . . . , (Xn, Yn), dimana Xi∼ F (x, α) dan Yi∼ G(y, β).

Ui= F (Xi)dan Vi= G(Yi), i = 1, 2, . . . , n.

1 Fungsi log-Likelihood Copula

log l(θ, α, β) = n X j=1 log c(uj, vj, θ) + n X j=1 log f (F−1(uj), α) + n X j=1 log g(G−1(vj), β) (6.24) 2 ˆα =argmaxα Pn j=1log f (F −1(u j), α) 3 ˆβ =argmaxβ Pn j=1log g(G−1(vj), β) 4 ˆθ =argmaxθlog l(θ, ˆα, ˆβ)

5 Gunakan ˆθuntuk menghitung ρs, ρτ dan membangkitkan data u

Gambar

Gambar 2 mengilustrasikan bentuk dari distribusi empirik untuk bebera- bebera-pa ukuran sample acak yang diambil dari distribusi Gamma(3,1)

Referensi

Dokumen terkait