• Tidak ada hasil yang ditemukan

BAB 2 LANDASAN TEORI. Analisis Komponen Utama (AKU, Principal Componen Analysis) bermula dari

N/A
N/A
Protected

Academic year: 2022

Membagikan "BAB 2 LANDASAN TEORI. Analisis Komponen Utama (AKU, Principal Componen Analysis) bermula dari"

Copied!
14
0
0

Teks penuh

(1)

LANDASAN TEORI

2.1 Analisis Komponen Utama 2.1.1 Pengantar.

Analisis Komponen Utama (AKU, Principal Componen Analysis) bermula dari tulisan Karl Pearson pada tahun 1901 untuk peubah non-stokastik. Analisis ini kemudian ditetapkan menjadi peubah stokastik oleh Harold Hotelling pada tahun 1933. Analisis ini merupakan analisis tertua. Perhitungan dalam ana- lisis ini pada waktu tersebut merupakan pekerjaan yang sukar walaupun hanya menggunakan beberapa peubah. Analisis ini baru berkembang penggunaannya setelah tersedianya fasilitas komputasi elektronik. Satu buku yang khusus mem- bahas AKU telah ditulis oleh Jolliffe 1986.

Analisis komponen utama merupakan an atheoretic approach yang meng- hasilkan kombinasi linear dari variabel-variabel yang diperoleh dari mereduksi variabel asli/awal yang banyak sekali. Di dalam proses mereduksi, diperoleh variabel yang lebih sedikit akan tetapi masih mengandung informasi yang ter- muat dalam data asli/awal. Variabel hasil mereduksi tersebut dinamakan faktor yang juga disebut komponen atau faktor komponen.

Secara teknis, analisis komponen utama merupakan suatu teknik mereduk- si data multivariat (multivariable) yang mengubah (mentranformasi) suatu ma- triks data/asli menjadi suatu set kombinasi linier yang lebih sedikit akan tetapi menyerap sebagian besar jumlah varian dari data awal.

(2)

Tujuan utamanya ialah menjelaskan sebanyak mungkin jumlah varian data asli dengan sedikit mungkin komponen utama yang disebut faktor.

Analisis Komponen Utama biasanya digunakan untuk :

1. Identifikasi peubah baru yang mendasari data peubah ganda

2. Mengurangi banyaknya dimensi himpunan peubah yang biasanya terdiri atas peubah yang banyak dan saling berkolerasi dengan mempertahankan sebanyak mungkin keragaman dalam himpunan data tersebut, dan

3. Menghilangkan peubah-peubah asal yang mempunyai sumbangan infor- masi yang relatif kecil.

Peubah baru yang dimaksud di atas disebut komponen utama yang mem- punyai ciri sebagai berikut:

1. merupakan kombinasi linier peubah-peubah asal,

2. jumlah kuadrat koefisien dalam kombinasi linier tersebut berrnilai satu,

3. tidak berkorelasi, dan

4. mempunyai ragam berurut dari yang terbesar ke yang terkecil.

Peubah-peubah baru ini memanfaatkan informasi dari peubah-peubah asal dan nilai yang nantinya diperoleh dari masing-masing objek merupakan ordinat objek-objek tersebut dalam peubah baru yang merupakan suatu sumbu koordi- nat. Tidak adanya korelasi antar peubah baru ini merupakan sifat yang diingikan karena peubah-peubah tersebut mengukur dimensi-dimensi yang berbeda dalam

(3)

data. Ragam suatu peubah merupakan sifat yang penting yang digunakan dalam suatu analisis. Makin beragam suatu peubah makin besar perannya dalam pemi- lahan antar objek. Dari peubah-peubah baru tersebut yang terurut keragaman- nya, diharapkan beberapa peubah baru pertama akan dapat menjelaskan dengan baik keragaman yang ada dalam data asal. Jika dua komponen utama pertama dari masing-masing objek digambar dalam diagram pencar maka akan diperoleh gambaran posisi objek dengan hampiran jarak Euclid dari objek asal.

AKU tidak selalu bermanfaat digunakan untuk mereduksi banyaknya peubah asal menjadi beberapa peubah baru yang dapat menjelaskan dengan baik ke- ragaman data asal. Bila tidak ada korelasi antara peubah asal, AKU tidak akan memberikan hasil yang diinginkan, karena peubah baru yang diperoleh hanyalah peubah asal yang ditata berdasarkan besar keragamannya. Makin erat korelasi (baik positif maupun negatif) antar peubah, makin baik pula hasil yang diper- oleh dari AKU. Dalam analisis eksplorasi ini tidak ada anggapan tentang sebaran peubah acaknya, tidak ada hipotesis yang diuji, dan juga tidak ada model yang mendasarinya.

Bila pendekatan pearson dapat dikaitkan dengan masalah ruang vektor, yaitu mencari ruang vektor optimum, pendekatan Hotelling dapat dikaitkan de- ngan masalah peubah acak, yaitu peubah acak baru yang tertata keragaman- nya dan tidak berkorelasi, maka pendekatan lainnya ialah dari sisi komputasi.

Gourlay dan Watson 1973 menggunakan metode kuasa untuk memperoleh skor komponen utama suatu objek dengan sekuens penggunaan bergantian antara regresi linier sederhana dengan kalibrasi.

(4)

2.1.2 Prosedur.

Andaikan X0 = (X1, X2, ..., Xp) merupakan vektor peubah acak asal yang di- amati dengan matriks kovarianP

= [σij], maka komponen utama pertama yang dilambangkan oleh Y1 didefinisikan sebagai :

Y1 =P

aijXj = a10

X,

yang memaksimumkan ragam Y1, yaitu a10P

a1, dengan kendala a10a1= 1.

Komponen utama kedua, dilambangkan oleh Y2 didefinisikan sebagai :

Y1 = a20

X,

yang memaksimumkan ragam Y2, dengan kendala a20

a2 = 1, dan tidak ada kore- lasi antara Y1 dan Y2 (kovarian Y1 dan Y2 yaitu a10P

a2 = 0 yang nantinya akan berarti a10

a2 = 0).

Komponen utama yang ketiga dilambangkan oleh Y3 didefinisikan sebagai:

Y3 = a30X, yang memaksimumkan ragam Y3, dengan kendala a30a3 = 1, dan tidak ada korelasi antara Y1 dan Y3 (kovarian Y1 dan Y3 yaitu a10P

a3 = 0 yang nantinya akan berarti a10a3 = 0),dan tidak ada korelasi antara Y2 dan Y3 (kovari- an Y2 dan Y3 yaitu a20P

a3 = 0 yang nantinya akan berarti a20a3 = 0). Demikian seterusnya untuk komponen utama ke-4 sampai yang ke-p.

Dengan menggunakan pengganda Lagrange diperoleh a1, a2, .., ap sebagai eigenvektor yang berpandanan dengan eigenvalue λ1 ≥ λ2 ≥ ...λp dari matriks kovarian P

. Nilai eigenvalue ke-i merupakan komponen utama ke-i. Karena

(5)

solusi bagi vektor a merupakan eigenvektor maka vektor ini tidak bersifat khas, misalnya penggandaanya dengan -1 juga akan merupakan solusinya.

Salah satu ukuran kesesuaian untuk memperoleh gambaran layak tidaknya penggunaan k komponen utama pertama yang digunakan untuk interpretasi atau analisis lanjutannya ialah persentase keragaman yang dapat dijelaskan oleh k komponen utama pertama tersebut, yaitu (λ1 + λ2+ ... + λk)/(λ1 + λ2 + ... + λp)x100%; dimana λ1 + λ2 + ... + λk merupakan eigenvalue, matriks yang di- tata dari yang terbesar ke yang terkecil. Makin besar nilai ukuran kesesuaian tersebut, makin layak k komponen utama pertama tersebut digunakan. Ada peneliti yang menggunakan petunjuk praktis untuk menggunakan k komponen utama pertama bila keragaman yang dapat dijelaskannya ≥ 80%. Bila matriks kovarian yang digunakan merupakan matriks korelasi, banyak peneliti dibidang sosial yang mengabaikan komponen utama yang berpadanan dengan eigenvalue yang kurang dari 1.

Interpretasi dari peubah baru yang diperoleh, komponen utama, kadangkala mudah, kadang sukar, bahkan kadangkala dapat pula meragukan. Chatfield dan Collins 1980 memberikan contoh kemungkinan tersebut. Tidak ada jaminan bahwa komponen utama ini mudah diinterpretasikan selain bahwa komponen- komponen utama ini merupakan peubah-peubah baru (dengan segala sifat yang diinginkan) yang diharapkan dapat mereduksi banyaknya peubah-peubah asal.

Tampaknya pemahaman masalah yang dihadapi dan penggunaan informasi dalam data asal misalnya matriks korelasi akan dapat membantu upaya pengambilan simpulan yang layak. Untuk menginterpretasikan komponen utama ke-i biasanya digunakan unsur-unsur dalam eigenvektor ai, yang bernilai relatif besar (baik positif maupun negatif) yang digunakan untuk memperoleh peubah-peubah asal

(6)

yang relatif berperan dalam menentukan komponen utama ini dan kemudian mencoba untuk menginterpretasikannya.

Dalam beberapa program kemasan komputer, untuk membandingkan unsur- unsur eigenvektor sebagai koefisisen dari peubah asal yang terkait pada kom- ponen utama, maka diberikan sebagai hasilnya ialah eigenvektor yang sudah digandakan dengan value dari eigenvalue padanannya. Penggandaan ini dapat dikaitkan dengan bobot pentingnya suatu komponen utama. Bila digunakan ma- triks korelasi dalam analisis ini maka besaran unsur-unsur tersebut merupakan korelasi antara peubah asal dengan komponen utamanya.

Hasil analisis ini, misalnya penggambaran objek yang disajikan dalam ru- ang berdimensi rendah, katakanlah ≤ 3 dimensi, dapat pula digunakan un- tuk melihat pengelompokan antar objek, dengan ukuran kedekatan yang meru- pakan pendekatan jarak Euclid dari objek-objek asal dengan menggunakan se- mua peubah asal yang diamati. Bila suatu komponen utama mempunyai eigen- value = 0, berarti peubah baru ini tidak memiliki keragaman, atau peubah baru ini merupakan suatu konstanta, maka ada keterkaitan linier antar peubah yang diamati. Bila nilai (p-1) peubah asal diketahui maka nilai peubah lainnya akan dapat diperoleh. Dalam bidang sosial ekonomi yang umumnya mengamati banyak peubah, hal ini digunakan untuk melihat adanya kolinieritas ganda dari peubah yang diamati, yang digunakan untuk menghilangkan peubah yang tidak memberikan tambahan informasi setelah ada peubah lainnya.

(7)

2.2 Matriks 2.2.1 Defenisi.

Matriks adalah suatu kumpulan angka-angka, sering disebut elemen-elemen yang disusun secara teratur menurut baris dan kolom sehingga berbentuk persegi panjang, dimana panjang dan lebarnya ditunjukkan oleh banyaknya kolom dan baris serta dibatasi tanda ”[ ]” atau ”( )”.

Sebuah matriks dinotasikan dengan simbol huruf besar seperti Amxn, X, atau Z dan sebagainya. Sebuah matriks yang berukuran m baris dan n kolom dengan aij dapat dituliskan sebagai berikut :

Amxn=



a11 a12 . . . a1n

a21 a22 . . . a2n

... . ..

am1 am2 . . . amn



atau juga dapat ditulis :

A = [aij] i = 1, 2, ....m; j = 1, 2, .., n Contoh :

A2x3 =

a11 a12 a13

a21 a22 a23



Disebut matriks A dengan 2 baris dan 3 kolom. Jika A sebuah matriks, kita gunakan aij untuk menyatakan elemen yang terdapat didalam baris i dan kolam j dari A. Dalam contoh ini i = 1, 2 dan j = 1, 2, 3 atau dapat ditulis

A = [aij]; i = 1, 2; j = 1, 2, 3

(8)

2.2.2 Operasi Matriks.

Perkalian skalar

Defenisi :

Jika A = [aij] adalah matriks mxn dan r adalah suatu skalar, maka hasil kali A dari r adalah B = [bij] matriks mxn dengan bij = raij (1 ≤ i ≤ m, 1 ≤ j ≤ n).

contoh :

A=

2 7 9 3



dengan diberikan r = 4 maka

4A= 4

2 7 9 3



=

8 28 36 12



Perkalian Matriks

Definisi :

Jika A = [aij] adalah matriks mxp dan B = [bij] adalah matriks pxn maka hasil kali dari matriks A dan matriks B yang ditulis dengan AB adalah C matriks mxn. Secara matematik dapat ditulis sebagai berikut :

Cij = ai1b1j+ ai2b2j+ ... + ai1b1j =Pp

k=1aikbkj

Penjumlahan Matriks

Jika A = [aij] adalah matriks mxp dan B = [bij] adalah matriks mxp maka penjumlahan matriks dari matriks A dan matriks B yang ditulis dengan C = [cij] = aij + bij

Pengurangan Matriks

Jika A = [aij] adalah matriks mxp dan B = [bij] adalah matriks mxp maka

(9)

pengurangan matriks dari matriks A dan matriks B yang ditulis dengan C = [cij] dimana cij = aij − bij(i = 1, 2, .., m; j = 1, 2, .., n).

Teorema

Jika A = [aij] adalah matriks nxn yang mengandung sebaris bilangan nol, maka |A| = 0.

Contoh :

A3x3=

"1 2 3 2 1 4 0 0 0

#

→ |A| = 0

Matriks Segitiga

Matriks A = [aij] suatu matriks bujur sangkar dikatakan segitiga bawah (lower tringular) jika aij = 0 untuk i < j dan matriks A = [aij] suatu matriks bujur sangkar dikatakan segitiga atas (upper tringular) jika aij = 0 untuk i > j.

Contoh :

Segitiga bawah A=



5 0 0 0

−1 2 0 0 3 1 3 0 2 1 4 1

, Segitiga atas B=



−1 2 4 1 0 1 3 −1

0 0 2 5

0 0 0 5



Teorema

Jika A adalah matriks segitiga nxn, maka |A| adalah hasil kali elemen-elemen pada diagonal utama, yakni |A| = a11a22...ann

Contoh :

A4x4=



2 7 −3 8

0 −3 7 5

0 0 6 7

0 0 0 1

, |A| = (2)(−3)(6)(1) = −36

(10)

Teorema :

jika A adalah sembarang matriks kuadrat, maka |A| = |At|

Teorema :

jika A dan B adalah matriks kuadrat yang ordonya sama, mka |AB| = |A||B|

Contoh : A2x2=

3 1 2 1



, B2x2=

−1 3 5 8



, AB2x2=

2 17 3 14



|A||B| = (1)(−23) =

−23 |AB| = −23

sehingga det (AB) = det (A) det (B)

2.3 Eigenvalue dan Eigenvektor

Definisi

Jika A adalah matriks nxn, maka vektor tak nol X didalam Rndinamakan eigenvektor dari A jika AX adalah kelipatan skalar dari X; yakni,

AX = λX

Untuk suatu skalar λ. Skalar λ dinamakan nilai eigen(eigenvalue) dari A dan X dikatakan eigenvektor yang bersesuaian dengan λ.

Untuk mencari nilai eigen matriks A yang berukuran nxn:

Anxn=



a11 a12 . . . a1n

a21 a22 . . . a2n

... . ..

an1 an2 . . . ann

,

Inxn=



1 0 . . . 0 0 1 . . . 0

... . ..

0 0 . . . 1

,

(11)

X =

 X1

X2

... Xn



AX = λX, X 6= 0 AX = λIX λIX − AX = 0 (λI − A)X = 0

X 6= 0 → |λI − A| = 0

untuk memperoleh nilai λ

|λI − A| = 0

λ − a11 . . . −a1n

... . ..

an1 . . . λ − ann

 = 0

f (λ) = a0λn+ a1λn−1+ ... + an−1λ + an= 0

n buah akar λ1, λ2, ..., λn

Jika eigenvalue λnadalah substitusi pada persamaan (λI −A)X = 0, maka solusi dari eigenvektor Xn adalah (λnI − A)Xn= 0.

Definisi

Misalkan A = [aij] matriks nxn. Determinan

f (λ) = det(λIn− A) =



λ − a11 a12 . . . a1n

a21 λ − a22 . . . a2n

... . ..

an1 an2 . . . λ − ann



Dikatakan karakteristik polinom dari A, persamaan

(12)

f (λ) = det(λIn− A) = 0

dikatakan persamaan karakteristik dari A.

Definisi

Matriks kuadrat A dinamakan didiagonalisasi (diagonalizable) jika terdapat matriks P yang dapat dibalik sehingga P−1AP diagonal, matriks P dikatakan mendiagonalisasi B.

Teorema : Jika A adalah matriks nxn, maka pernyataan-pernyataan berikut eki- valen satu sama lain.

1. A dapat didiagonalisasi

2. A mempunyai n vektor eigen bebas linier

2.4 Matriks Korelasi

Misalnya pada persamaan :

Y = β0+ β1X1+ ... + βpXP +  persamaan tersebut dinyatakan sebagai :

Y = (β0+ β1X¯1+ β2X¯2+ ... + βpX¯P) + β1(X1− ¯X1) + β2(X2− ¯X2) + ... + βp(Xp− ¯Xp) + 

dengan ¯Xj, j = 1, 2, .., p adalah nilai tengah yang dihitung dari data. Persamaan dapat ditulis :

Y = β0+ β1(X1− ¯X1) + β2(X2 − ¯X2) + ... + βp(Xp− ¯Xp) + 

dimana

(13)

β0 = β0+ β1X¯1+ β2X¯2+ ... + βpX¯P)

jika β0 = ¯Y ,

Y − β0 = β1(X1− ¯X1) + β2(X2 − ¯X2) + ... + βp(Xp − ¯Xp) + 

matriks XtX untuk model ini adalah :

XtX=



S11 S12 . . . S1p

S21 S22 . . . S2p

... . ..

Sp1 Sp2 . . . Spp



dengan

Sij = Xn

(xiu− ¯xi)(xju− ¯xj), i = 1, 2, ...nj = 1, 2, ...p

kemudian bagi setiap peubah dengan jumlah kuadrat terkoreksinya, dan na- makan peubah barunya :

zij = xij−¯xj

Sjj , Sij =Pn

i=1(xij− ¯xj)2 dan yi = √xi−¯y

Syy, Syy =Pn

i=1(yi− ¯y)2

i = 1, 2, .., n dan j = 1, 2, .., p

ini akan mengubah model diatas kedalam bentuk baru :

y1Syy1/2 = β1S111/2Z1+ β2S221/2+ ... + βpSpp1/2+ 

atau

y1 = b1Z1+ b2Z2+ ... + bpZp+ ∗

(14)

dengan bj = βj

S

jj

Syy

1/2

, j = 1, 2, ...p

melalui metode kuadrat terkecil, nilai dugaan parameter ˆb pada persamaan diatas dapat ditentukan yaitu :

ˆb = (ZtZ)−1ZtY

matriks ZtZ merupakan matriks korelasi yaitu :

ZtZ=





1 r12 r13 . . . r1p

r21 1 r23 . . . r2p

r31 r32 1 . . . r3p

... . ..

rp1 rp2 rp3 . . . 1





dengan

r ij = P n i=1

 x

ui

−¯ x

i

S

ii



( x

uj

−¯ x

j

S

jj

)

,

hubungan antara koefisien antara regresi data awal ( ˆβj) dengan koefisien regresi yang dibakukan ˆbj adalah :

βˆj = ˆbj

Syy

Sjj

1/2

, j = 1, 2, .., p dan ˆβ0 = ¯y −Pp

j=1βˆjx¯j

dengan ¯y dan ¯x merupakan nilai rata-rata dari y dan nilai rata-rata dari x.

Referensi

Dokumen terkait

Selain dikembangkan di klub-klub Wushu, dikembangkan juga senam Taiji di klub-klub khusus Taiji yang tidak menekankan pada kompetisi Wushu, misalnya di klub PORPI

Berdasarkan latar belakang yang telah diuraikan di atas, maka rumusan masalah dalam penelitian ini adalah bagaimana pengaruh pendapatan ibu rumah tangga Sebagai pekerja

perwakilan/organisasi asing sebanyak 56 kali tidak ada peningkatan dan penurunan ( tetap seperti bulan Oktober), sedangkan patroli ke kawasan pariwisata,

Penelitian ini dimaksudkan untuk menganalisis dampak perubahan tata guna lahan di Daerah Aliran Sungai (DAS) Beringin terhadap debit banjir yang ada..

fungsi SKPD Analisis Gambaran Pelayanan SKPD Penyempurnaan Rancangan Renja SKPD kab/kota Persiapan Penyusunan Renja SKPD hasil evaluasi capaian Renstra SKPD kab/kota

- Upaya tambahan pengawasan yang dilakukan oleh Penyewa yaitu dengan mengirimkan surveyor, loading master, serta mewajibkan Pemilik Kapal untuk melakukan pemasangan

Analisa input output terdiri dari tiga bagian yaitu (1) analisis kinerja yang terdiri dari kontribusi output, kontribusi permintaan akhir, kontribusi input antara; (2)

 Ya. Lokasi Departemen Pengendali SI. Beri tanda cawang √ pada kotak yang disediakan dan mencerminkan jawaban yang sesuai dengan jawaban bapak/ ibu).. Bagaimana