• Tidak ada hasil yang ditemukan

ANALISIS KOMPONEN UTAMA

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS KOMPONEN UTAMA"

Copied!
38
0
0

Teks penuh

(1)

LOGO

Hazmira Yozza

(2)

Analisis Komponen Utama

Karl Pearson (1901)

 Memperkenalkan AKU

 Belum memberikan metode prak-tis perhitungan untuk kasus

Suatu analisis statistika yang berguna untuk mereduksi p peubah menjadi r peubah baru yang disebut Komponen Utama(r ≤ p) dengan tetap mempertahankan

besarnya keragaman dari peubah asal

Hotelling (1933)



Memberikan metode perhitungan

praktis dalam menentukan KU

Company Logo

tis perhitungan untuk kasus dengan lebih dari dua peubah

praktis dalam menentukan KU



Dalam prakteknya, masih

terbatas untuk sedikit peubah

Perkembangan Komputer

(3)

Dilakukan pengamatan/pengukuran p peubah (X1, X2, …, Xp) terhadap n objek pengamatan

Diperoleh data : Objek X1 X2 … Xp 1 x x … x Company Logo 1 x11 x21 … xp1 2 x12 x22 … xp2 3 x13 x23 … xp3 : : : : n x1n x2n … xpn

(4)

X

1

, X

2

, …, X

p AKU

Y

1

, Y

2

, …, Y

r

1. Y

1

, Y

2

, …, Y

r

adalah kombinasi linier dari peubah asal

Y

1

= a

11

X

1

+ a

12

X

2

+…+ a

1p

X

p

= a

1T

X

:

Y

r

= a

r1

X

1

+ a

r2

X

2

+ …+a

rp

X

p =

a

rT

X

2. Y , Y , …, Y tidak saling berkorelasi

Y = A X

2. Y

1

, Y

2

, …, Y

r

tidak saling berkorelasi

3. Y

1

, Y

2

, …, Y

r

tertata menurut pentingnya

Var(Y

1

) ≥ Var(Y

2

) ≥ … ≥ Var(Y

r

) ≥ 0

diharapkan k KU pertama (k sekecil mungkin) sudah mampu menjelaskan sebahagian besar keragaman data

0

)

,

cov(

0

)

,

(

=

=

j i j i

Y

Y

Y

Y

corr

(5)

AKU tidak selalu berhasil dalam mereduksi

banyaknya peubah

AKU tidak bermanfaat bila peubah-peubah yang

dianalisis tidak saling berkorelasi. Dalam hal ini,

KU yang dihasilkan akan sama dengan peubah

asal, tapi terurut berdasarkan pentingnya peubah

tersebut (atau terurut berdasarkan keragamannya)

Company Logo

tersebut (atau terurut berdasarkan keragamannya)

Hasil terbaik adalah jika terdapat korelasi yang

tinggi antar peubah → Pembentukan matriks

korelasi mrp analisis pendahuluan pada AKU

(6)

Pembentukan Komponen Utama Pertama

Komponen Utama Pertama

Peubah Asal

X = [X1, X2, …, Xp]

dengan ∑ = Var(X) (matriks ragam peragam dari X)

Komponen Utama Pertama

Y

1

= a

11

X

1

+ a

12

X

2

+ …+a

1p

X

p

= a

1 T

X

diinginkan Y1 dengan Var (Y1) maksimum

Var(Y

1

) = Var(a

1T

X) = a

1T

Var(X) a

1

= a

1T

a

1

Kendala

a

1T

a

(7)

Masalah : menentukan a sehingga diperoleh :

Max

a

1T

a

1

Kendala

a

1T

a

1

= 1

Max f(a

1 λ)=

a

1T

a

1

– λ(

a

1T

a

1

– 1)

Agar f maksimum, maka :

Company Logo

Agar f maksimum, maka :

dan

(2)

(1)

0 = ∂ ∂ 1 a f

(

1( −1)

)

=0 ∂ ∂ 1 T 1 1 T 1 1 a a Σa a a λ

0

)

(

2

2

0

0

2

2

1 1 1

=

=

=

+

1 1 1 1 1

a

I

a

a

a

Σa

λ

λ

λ

Σ

Σ

0 = ∂ ∂ λ f

(

1( −1)

)

=0 ∂ ∂ 1 T 1 1 T 1 Σa a a a λ λ

1

0

1

1 1

=

=

+

1 1

a

a

a

a

T T

(8)

Pembentukan Komponen Utama Pertama

Persamaan (1)

1

)

0

(

λ

=

1

a

I

Σ

λ1 : akar karakteristik dari ∑

a

1

: vektor karakteristik

padanannya

Persamaan (1)

0

)

(

Σ

λ

1

I

a

1

=

1 1 1 1 1 1 1 1

)

0

(

λ

λ

λ

λ

λ

=

=

=

=

=

1 1 1 1 1 1

a

a

Ia

a

a

a

Ia

a

a

I

T T T

Σ

Σ

Σ

1

1

a

1

=

a

T

(kalikan dengan a

1 T

)

(dari (2) diketahui )

Fs yang akan dimaksimumkan Agar maksimum, maka λ1 λ1 : akar karakteristik terbesar dari ∑ a1 : vektor karakteristik padanannya

(9)

KU Kedua

Y

2

= a

21

X

1

+ a

22

X

2

+…+ a

2p

X

p

= a

2 T

X

Syarat :



Y

2

memiliki keragaman terbesar kedua setelah Y1

Var(Y

2

) = Var(a

2T

X) = a

2T

Var(X) a

2

= a

2T

a

2





Y tidak berkorelasi dengan Y

a

2T

a

2

= 1

Company Logo



Y

2

tidak berkorelasi dengan Y

1

0

0

)

(

0

)

,

(

)

,

(

)

,

(

1 2 1 2 1 2 1 2 1 2

=

=

=

=

=

Σa

a

a

X

a

X

a

X

a

T T T T

Var

Cov

Corr

Y

Y

Y

Y

Cov

(10)

Pembentukan Komponen Utama Kedua

0

1 2

Σa

=

a

T

Dari Persamaan (1)

1 1 1 1

a

a

Σa

a

a

Σa

T T 1 2 2 1

λ

λ

=

=

Jika maka

(a2 dan a1 saling orthogonal)

1 1 1

a

a

a

a

Σa

a

T 2 1 1 2 2

λ

λ

=

=

0

1 2

Σa

=

a

T

0

0

2 2 2 1

=

=

=

1 1 1

a

a

Σa

a

a

a

T T T

λ

(11)

Masalah : menentukan a

2

sehingga diperoleh :

Max

a

2 T

∑ a

2

Kendala

a

2 T

a

2

= 1

a

2 T

a

1

= 0

Company Logo

0

2

=

a

f

Masalah : menentukan a

2

, λ

2

dan δ sehingga diperoleh :

Max f(a

2,λ,δ)=

a

2T

∑ a

2

– λ

2

(a

2T

a

2

– 1)- δ

a2

T a1

Agar f maksimum, maka :

; dan

=

0

λ

f

0

=

δ

f

(12)

Pembentukan Komponen Utama Kedua

0 2 = ∂ ∂ a f

(

2 2 2( 2 2 1) 2 1

)

0 2 = − − − ∂ ∂ a a a a Σa a a T T T λ δ 0 2 = ∂ ∂ λ f

0

1

2 2

+

=

a

T

a

(3)

(

2 2 2( 2 2 1) 2 1

)

0 2 = − − − ∂ ∂ a a a a Σa a T λ T δ T λ

(4)

0

2

2

2 2 2

a

a

1

=

Σa

λ

δ

0 = ∂ ∂ δ f

0

0

2 1 1 2

a

=

a

a

=

a

T T

(

2 22( 2 2 −1)− 2 1

)

= 0 ∂ ∂ a a a a Σa a T λ T δ T δ

(5)

Kalikan (3) dengan a1T 0 1 ; (6)

0

2

2

2 2 2

1

=

T 1 T 1 T 1

Σa

a

a

a

a

a

λ

δ

0

2

2

−δ

=

Σa

a

T 1

a

Σa

2

=

a

a

2

=

0

T 1 T 1

0

=

δ

(6) Subs ke (3) : (7)

2

Σa

2

2

λ

2

a

2

=

0

(

Σ

λ

2

I

)

a

2

=

0

(13)

Persamaan (7)

2

2

)

0

(

Σ

λ

I

a

=

λ2 : akar karakteristik dari ∑

a

2

: vektor karakteristik

padanannya

Persamaan (7)

0

)

(

Σ

λ

2

I

a

2

=

Company Logo 2 2 2 2 2 2 2 2 2 2 2 2 2 2

)

0

(

λ

λ

λ

λ

λ

=

=

=

=

=

a

a

Ia

a

a

a

Ia

a

a

I

T T T

Σ

Σ

Σ

1

2 2

a

=

a

T

(kalikan dengan a

2 T

)

(dengan mensubst (6) ke (4) didapat :

Fs yang akan dimaksimumkan

Agar maksimum, maka :

λ2 : akar karakteristik ke-2 terbesar dari ∑ a2 : vektor karakteristik padanannya

(14)

Pembentukan KU berikutnya

Dilakukan dengan pendekatan yang sama dengan

Pembentukan komponen utama 1 dan 2

Didapat bahwa :

λi : akar karakteristik ke-i terbesar dari ∑

a

i

: vektor karakteristik padanannya

(15)

 Tentukan a1, a2, …,ar yang merupakan vektor karakteristik yang berpadanan dengan akar karakteristik tak nol dari

matriks ragam peragam ∑, λ1, λ2, …, λr1 ≥ λ2 ≥ … ≥ λr ≥0

 Tentukan matrisk ∑. Karena data yang dimiliki adalah data contoh, maka matriks ∑ ini diduga dari matriks ragam

peragam contoh S

Company Logo

 Tentukan Komponen Utama :

Y1 = a11X1 + a12 X2 +…+ a1p Xp= a1TX :

Yr = ap1X1 + ap2 X2 + …+app Xp = arTX

 Ortonormalkan vektor a1, a2, …,ar Orthogonalkan dengan POGS

(16)

Keragaman Total KU

Y

1

= a

11

X

1

+ a

12

X

2

+…+ a

1p

X

p

= a

1T

X

:

Y

r

= a

p1

X

1

+ a

p2

X

2

+ …+a

pp

X

p

= a

rT

Xc

X

a

a

X

a

X

a

T T 1 T T 1

=

=

Y

Y

M

M

M

2 2 2 1

atau

a

X

a

T

T

r r r

Y

M

M

M

Bila dinyatakan maka :

A

=

[

a

1

,

a

2

,

L

,

a

r

]

X

A

Y

=

T

ΣA

A

A

X

A

X

A

Y

T T T

=

=

=

)

(

)

(

)

(

Var

Var

Var

=

r

λ

λ

λ

L

M

O

M

M

L

L

0

0

0

0

0

0

)

(

2 1

Y

Var

(17)

)

Y

trace

keragaman

Total

=

=

r i

λ

=

=

r

λ

λ

λ

L

M

O

M

M

L

L

0

0

0

0

0

0

)

(

2 1

Y

Λ Var

Misal

Company Logo

)

(

1

Λ

Y

trace

keragaman

Total

=

=

= i i

λ

X

Σ

Σ

AA

ΣA

A

Λ

T T

keragaman

total

Var

trace

trace

trace

)

trace(

=

=

=

=

=

= p i i

X

1

)

(

)

(

)

(

)

(

(18)

Bila Var(Yi) = λi, maka dapat dikatakan bahwa :



KU Yi mampu menerangkan dari total

keragaman seluruh komponen utama



KU Yi mampu menerangkan dari total

keragaman data asal

= r i i i 1 λ λ

= r i i i 1 λ λ

Dg demikian, k KU pertama, Y1, Y2, …, Yk mampu

Keragaman Total KU

Dg demikian, k KU pertama, Y1, Y2, …, Yk mampu

menerangkan dari total keragaman data asal

= = r i i k i i 1 1 λ λ

Bila nilai ini sudah cukup besar, maka cukup digunakan

k KU saja.

(19)



Pilih KU dengan akar karakteristik lebih besar dari 1

(hanya jika menggunakan matriks korelasi)



Pilih k KU sehingga



Scree plot

% 80 1 1 >

= = r i i k i i λ λ Company Logo



Scree plot

i λi 1 2 3 4 2 KU curam landai

(20)

Peubah berbeda satuan atau keragaman sangat

berbeda

• Peubah yang memiliki keragaman lebih besar dianggap

lebih penting dibanding yang lain

• Pada kondisi ini, peubah dibakukan dulu sehingga setiap

peubah memiliki nilai tengah 0 dan ragam 1

j ij ij

s

X

X

Z

=

Jd semua peubah sama pentingnya

• Matriks S menjadi matriks korelasi R

• Penurunan matematis sama shg prosedur analisis sama

• a

i

dan λ

i

yang diperoleh berbeda

• Total keragaman Y = total keragaman Z = p = # peubah

j ij

s

=

1

1

1

2 1 2 21 1 12

L

M

O

M

M

L

L

p p p p

r

r

r

r

r

r

(21)

)

(

X

x

A

T

=

Y

Skor komponen untuk objek ke-m

Skor komponen

Company Logo

)

(

x

x

A

T

m

=

m

y

(22)

Beberapa catatan

1.

Dugaan KU



∑ diduga dari S, sehingga yang didapat dalam

analisis adalah dan



Tidak ada asumsi tentang X, sehingga sifat dari

penduga tidak dapat diturunkan



AKU dipandang sebagai suatu teksik statistika

r

λ

λ

ˆ

,...,

ˆ

1

a

ˆ

1

,...,

a

ˆ

r



AKU dipandang sebagai suatu teksik statistika

yang tidak didasarkan pada suatu model

apapun, shg KU yang diperoleh tetap dipandang

sebagai KU, bukan hanya sekedar dugaan

(23)

2. Akar karakteristik 0



Terjadi jika terdapat keterkaitan linier antara

peubah (jarang terjadi)



KU yang dihasilkan tidak digunakan

3.

Akar karakteristik kecil

Company Logo

3.

Akar karakteristik kecil



Terjadi jika terdapat korelasi yang cukup erat

antar peubah.

(24)

Output AKU

1.

Diinterpretasikan langsung

2.

Sebagai input bagi analisis statistika lainnya



Analisis Regresi (jk terjadi multikolonier antara

peubah)



Analisis gerombol untuk mengelompokkan objek



Analisis diskriminan

(25)

 Tentukan λ1, λ2, …, λr dan a1, a2, …,ar yang merupakan akar dari matriks S (atau matriks R) dimana λ1 ≥ λ2 ≥ … ≥ λr ≥0 dan a1, a2, …,ar saling orthogonal

 Tentukan matrisk ragam peragam S (dan/atau matriks korelasi R) dari data

 Periksa (dari matriks korelasinya) apakah peubah perlu ditransformasi dengan AKU

 Tentukan banyaknya KU yang dapat diambil

Company Logo

 Tentukan Komponen Utama :

Y1 = a11X1 + a12 X2 +…+ a1p Xp= a1TX :

Yk = ak1X1 + ak2 X2 + …+akp Xp = akTX

 Tentukan banyaknya KU yang dapat diambil

 Periksa apakah KU yang dihasilkan memiliki interpretasi yang berarti

(26)

Contoh Penerapan AKU

Dilakukan pengukuran morfologi tubuh terhadap 49 ekor burung betet . Peubah yang diukur adalah :

X1 = Total panjang burung X2 = bentangan sayap

X3 = Panjang paruh dan kepala X4 = Panjang tulang sayap atas

X5 = Panjang keel of sternum (tulang tempat melekatnya otot untuk terbang) Diperoleh data : Diperoleh data : Objek X1 X2 X3 X4 X5 1 156 245 31.6 18.5 20.5 2 154 240 30.4 17.9 19.6 3 153 240 31.0 18.4 20.6 : : : : : : 49 164 248 32.3 18.8 20.9

(27)

X1 X2 X3 X4 X5 X1 13.2527 X2 8.7985 25.6828 X3 1.9221 1.8886 0.6316 X4 1.3306 1.6394 0.3443 0.3184 X5 2.1922 2.2745 0.4147 0.3394 0.9828 Company Logo • Nilainya relatif lebih besar jika

dibanding-kan dengan ragam peubah-peubah lain

• Terdapat kecendrungan bahwa dua peubah (X1 dan X2) akan mendominasi pemben-tukan KU

Bakukan Data • .

• Matriks ragam

peragam (Z) adalah matriks korelasi dari X j j ij ij s X X Z = − MTB>Cova X1-X5 m1

(28)

Data Baku

Objek Z1 Z2 Z3 Z4 Z5 Objek X1 X2 X3 X4 X5 1 156 245 31.6 18.5 20.5 2 154 240 30.4 17.9 19.6 3 153 240 31.0 18.4 20.6 : : : : : : 49 164 248 32.3 18.8 20.9 Rata2 157.98 241.33 31.46 18.47 20.83 Stdev 3.65 5.07 0.79 0.56 0.99 26176 . 0 07 . 5 33 . 241 240 2 2 23 23 − = − = − = s X X Z 1 -0.54172 0.72486 0.17718 0.05425 -0.32937 2 -1.08902 -0.26176 -1.33272 -1.00904 -1.23720 3 -1.36267 -0.26176 -0.57777 -0.1229 -0.22850 : 49 1.64750 1.31683 1.05796 0.585895 0.074108 6 MTB>Center ‘x1’-’x5’ c6-c10

(29)

X1 X2 X3 X4 X5 X1 1.00000 X2 0.73496 1.00000 X3 0.66181 0.67374 1.00000 X4 0.64528 0.76851 0.76319 1.00000 Company Logo X4 0.64528 0.76851 0.76319 1.00000 X5 0.60512 0.52901 0.52627 0.60665 1.00000

• Korelasi antar peubah cukup besar

• AKU akan berguna dalam mereduksi data

• Untuk selanjutnya, AKU dilakukan dengan menggunakan matriks ini

(30)

Penentuan Akar dan Vektor Karakteristik

KU λi Z1 Z2 Z3 Z4 Z5 % %kum Y1 3.61598 0.452 0.462 0.451 0.471 0.397 72.3% 72.3% Y2 0.53150 0.051 -0.300 -0.325 -0.185 0.876 10.6% 82.9% Y3 0.38642 0.690 0.341 -0.454 -0.411 -0.178 7.7% 90.7% Y4 0.30157 -0.420 0.548 -0.606 0.388 0.069 6.0% 96.7% Y5 0.16453 0.374 -0.530 -0.343 0.652 -0.192 3.2% 100% a1 T

MTB>Eigen m2 c11 m3 (lakukan analisis eigen untuk matriks m2, akar karakteristik di c11, vektor karakteristik di m3)

5 4 3 2 1 . Z . Z . Z . Z Z . Y 0 452 0 462 0 451 0 471 0 397 1 = + + + + 5 4 3 2 1 2 0.051Z 0.300 Z 0.325 Z 0.185 Z 0.876 Z Y = + 5 4 3 2 1 3 0.690 Z 0.341Z 0.454 Z 0.411Z 0.178 Z Y = + 5 4 3 2 1 4 0.420Z 0.548Z 0.606Z 0.388Z 0.069Z Y = + + + 5 4 3 2 1 5 0.374 Z - 0.530 Z - 0.343 Z 0.652 Z - 0.192 Z Y = +

(31)

1. Berdasarkan nilai akar karakteristik

• Hanya Y1 yang akar karakteristiknya lebih dari 1 • Diambil hanya KU-1, Y1

2. Berdasarkan % keragam yang dijelaskan KU

Company Logo

• Y1, Y2, …, Y5 mampu menjelaskan sebesar masing-masing 72.3%, 10.6%, 7.7%, 6.0% dan 3.2% dari total keragaman data asal

• Bila 72.3% dianggap cukup besar, gunakan anya Y1

• Bila tidak, gunakan juga Y2. Y1 dan Y2 mampu menjelaskan 86.9% dari total keragaman data (sudah cukup besar)

(32)

4 3 2 E ig e n v a lu e Scree Plot of X1, ..., X5

Berapa KU

3. Berdasarkan scree plot

curam landai 5 4 3 2 1 1 0 Component Number E • Diambil 1 KU, Y1

(33)

5 4 3 2 1

.

Z

.

Z

.

Z

.

Z

Z

.

Y

0

452

0

462

0

451

0

471

0

397

1

=

+

+

+

+

5 4 3 2 1 2

0

.

051

Z

0

.

300

Z

0

.

325

Z

0

.

185

Z

0

.

876

Z

Y

=

+

5 4 3 2 1 3

0

.

690

Z

0

.

341

Z

0

.

454

Z

0

.

411

Z

0

.

178

Z

Y

=

+

5 4 3 2 1 4

0

.

420

Z

0

.

548

Z

0

.

606

Z

0

.

388

Z

0

.

069

Z

Y

=

+

+

+

192

0

652

0

343

0

530

0

374

0

.

Z

-

.

Z

-

.

Z

.

Z

-

.

Z

Y

=

+

Company Logo 5 4 3 2 1 5

0

.

374

Z

-

0

.

530

Z

-

0

.

343

Z

0

.

652

Z

-

0

.

192

Z

Y

=

+

(34)

Skor Komponen

Objek Y1 Y2 Y3 Y4 Y5 1 0.06429 -0.600837 -0.171233 0.515826 0.548790 2 -2.18031 -0.442301 0.400070 0.645460 0.231077 3 -1.14557 0.01925 -0.676127 0.716298 0.208871 : 49 2.13422 -0.697546 0.851168 -0.380029 0.077126 49 2.13422 -0.697546 0.851168 -0.380029 0.077126 064 . 0 ) 329 . 0 ( 397 0 ) 054 . 0 ( 471 0 ) 177 . 0 ( 451 0 ) 725 . 0 ( 462 0 ) 542 . 0 ( 452 0 397 0 471 0 451 0 462 0 452 0 11 = − + + + + − = + + + + = . . . . . Z . Z . Z . Z . Z . Y 11 21 31 41 51

(35)

3 2 1 Surv iv ors Non-surv iv ors Company Logo 4 3 2 1 0 -1 -2 -3 -4 -5 0 -1 -2 Y1 Y 2

(36)

Stat>Multivariate>Principle Components

Isikan nama peubah atau kolom tempat menyimpan peubah

Isikan banyak KU yang akan

AKU dengan Minitab

Company Logo

Isikan banyak KU yang akan dihitung skornya(max sama dengan banyak peubah asal)

Pilih (hanya salah satu) matriks yang digunakan sebagai dasar analisis (default : matriks korelasi)

Option untuk membuat grafik Option untuk menyimpan hasil perhitungan

(37)

Menampilkan scree plot Menampilkan diagram

pencar antara skor KU-1 dan skor KU-2

Company Logo

Menampilkan plot

loading untuk KU-1 dan KU-2

(38)

Isikan kolom-kolom untuk menyimpan koefisien (vektor karakteristik) (banyak kolom harus sama dengan banyaknya peubah asal)

Isikan kolom-kolom untuk menyimpan skor komponen (banyak kolom harus sama

dengan banyaknya KU) •Diperlukan jika output AKU akan dianalisis lebih lanjut

Isikan kolom (hanya 1 kolom) untuk menyimpan akar karakteristik

Referensi

Dokumen terkait

Περί των μυστηρίων | Περί της εαυτού καθόδου | Περί της προς Λακεδαιμονίους ειρήνης | Κατά Αλκιβιάδου | Αποσπάσματα Περί των

Persiapan dan penyaluran obat dan produk steril adalah merupakan kegiatan mendistribusikan/penyerahan obat baik steril maupun non steril sejak setelah

Dalam penelitian ini dapat diketahui bahwa pelaksanaan Satuan Sabhara Polres Kudus dalam menyelenggarakan pengamanan terhadap Objek Vital di Kabupaten Kudus guna

Penelitian yang dilakukan oleh Rahayu (2010) tentang pengaruh pengungkapan Corporate Social Responsibility (CSR) dan kepemilikan manajerial sebagai proksi Good

Bagi hasil yang diterapkan oleh depot Pak ‘D’ berdasarkan hasil wawancara penulis sangat beragam, sistem bagi hasilnya mengacu kepada omsetnya, berasaranya berkisar mulai

Kondisi sosial orang tua yang menyebabkan angka putus sekolah meliputi tingkat pendidikan dan jenis pekerjaan. Latar pendidikan orang tua yang berhasil dihimpun oleh

Berdasarkan hasil analisis dan pembahasan penelitian ini dapat disimpulkan bahwa pengendalian diri, motivasi tidak mempunyai pengaruh signifikan dan minat belajar mempunyai

Batas minimal adalah batas di mana manusia tidak boleh menetapkan hukum yang berada di bawah ketentuan minimal yang sudah ditetapkan dalam Al-Qur’an, namun ia boleh menetapkan