ANALISIS FAKTOR
(FACTOR ANALYSIS)
PENDAHULUAN
Analisis faktor: mengkaji hubungan internal dari gugus variabel Data: peubah-peubah yang dianalisis berkorelasi tinggi didalam grupnya sendiri dan berkorelasi
rendah dengan yang berbeda grup Tujuan: untuk mempelajari beberapa sifat yang mendasar namun tidak dapat terobservasi
kuantitasnya Tokoh: Charles Spearman yang mengemukakan dalil bahwa korelasi internal dapat diwakili dengan menggunakan sebuah peubah atau faktor yang dinamakan dengan faktor g. Selanjutnya faktor ini dikenal sebagai faktor ’kepintaran umum’ (general intelegence)
FORMULASI MODEL
FAKTOR
Misal vektor acak X dengan p komponen memiliki rataan µ dan matriks peragam (covariance) Σ.
Pada umumnya model analisis faktor adalah:
X1 - µ1 = l11F1 + l12F2 + … +l1mFm + ε1 X2 - µ2 = l21F1 + l22F2 + … +l2mFm + ε2 : : : Xp - µp = lp1F1 + lp2F2 + … +lpmFm + εp
FORMULASI MODEL
FAKTOR
(lanjutan)
Dalam bentuk matriks:
(X - µ) = L F + ε
(px1) (pxm) (mx1) (px1)
Keterangan:
µ = vektor rataan L = matriks konstanta yang tidak diketahui
nilainya (loading factor)
F = vektor acak ε = vektor unsur galat (faktor khusus)
FORMULASI MODEL
FAKTOR
(lanjutan)Dengan asumsi:
E(F) = 0, E(ε) = 0
Cov(F) = E(FF’) = I
Cov(ε) = E(ε ε’) = ψ = diag(ψ
1,
ψ
2,…, ψ
p)
F dan ε saling bebas
Cov(ε,F) = E(ε,F) = 0
FORMULASI MODEL
FAKTOR
(lanjutan)
Struktur peragam dari model faktor orthogonal: Cov(X) = LL’ + ψ atau var(Xi) = l2i + … + l2im + ψi cov(Xi,Xk) = li1 lk1 + … + lim lkm Cov(X,F) = L atau cov(Xi,Fj) = lij
FORMULASI MODEL
FAKTOR
(lanjutan)
Pembuktian struktur peragam:
.1 Cov(X-µ) = cov(L F+ε) = cov(L F)+cov(ε)+2cov(L F+ε) = L cov(F) L’+ ψ +2L cov(L F+ε) = L L’+ ψ .2 Cov(X,F) = cov(L F+ε ; F) = cov(L F ; F)+cov(ε ; F) = L cov(F) = L (korelasi antara X dengan faktor)
FORMULASI MODEL
FAKTOR
(lanjutan)
Komunalitas ke-i merupakan bagian
dari ragam peubah ke-i yang dapat
dijelaskan oleh m faktor umum.
h
i2= l
i12+ l
i22+ … + l
im2dan
PERMASALAHAN
Ada tiga hal penting yang menjadi pokok permasalahan dalam analisis faktor,
yaitu: Mengidentifikasi struktur
Menduga parameter (loading faktor dan ragam sistematik
PENDUGAAN PARAMETER
Metode
Metode non-iteratif Metode iteratif
Metode kemungkinan maksimum
Metode kuadrat terkecil tak terboboti
Metode komponen utama iteratif Harris
Metode analisis faktor alpha Metode komponen utama
Metode faktor utama
Analisis Citra
KONSEP PENDUGAAN
Metode Komponen Utama
Misalkan R adalah matriks korelasi contoh berukuran pxp, karena matriks R simetrik dan
definit positif maka bisa dituliskan sebagai
berikut:
R = Γ Λ Γ’
dengan:
Λ= diag(λ1,λ2,…λp) dan λ1>λ2>…>λp>0 adalah
akar ciri dari matriks R, serta Γ Γ’= Γ’ Γ =Ip
Γ= matriks orthogonal pxp yang kolom-kolomnya
adalah vektor ciri matriks R yaitu,
T1,T2,…,Tp yang berpadanan dengan vektor ciri λ1,λ2,…,λp
Metode Komponen Utama (lanjutan)
Misalkan k adalah banyaknya komponen utama yang dipilih, maka matriks L^ didefinisikan sebagai berikut:
(pxp)
L^ = |√λ1Γ1|√λ2Γ2|…|√λkΓk|
R didekati dengan L^ L^ ‘=Σki=1λiΓiΓi’
dimana Γi adalah kolom ke-i pada matriks
Metode Komponen Utama (lanjutan) Matriks diagonal ragam
khusus ψ diduga
dengan ψ^, yaitu
matriks diagonal yang unsurnya diambil dari
R= L^ L^ ‘
2 2 2 2 11
0
0
0
1
0
0
...
0
1
ˆ
ph
h
h
. . . Metode Komponen Utama (lanjutan)
Ukuran kebaikan suai dari model faktor adalah sebagai berikut:
RMS_overall = √(1/p(1-p))Σip=1Σjp=1resij2
Semakin kecil nilai RMS_overall mengindikasikan kebaikan suai yang tinggi. Model terbaik berdasarkan kriteria ini adalah jika diperoleh RMS-overall < 0.05 dengan banyaknya faktor bersama yang paling sedikit.
ILUSTRASI
Data harga saham terdiri dari n=100 harga mingguan dengan p=5 saham. Dengan menggunakan metode
AKU didapatkan dua komponen
utama. Secara spesifik penduga
loading faktor adalah koefisien
komponen utama (vektor ciri dari R) dibandingkan dengan akar kuadrat dari akar ciri yang bersesuaian.
Tabel pendugaan loading faktor,komunalitas dan total proporsi keragaman yang dijelaskan dari setiap faktor untuk m=1 dan m=2
Variabel
Solusi satu faktor
Solusi dua faktor
.1 Allied Chemical .2 DuPont .3 Union Carbide .4 Exxon .5 Texaco 0.783 0.773 0.794 0.713 0.712 0.39 0.40 0.37 0.49 0.49 0.783 0.773 0.794 0.713 0.712 -0.217 -0.458 -0.234 0.472 0.524 0.34 0.19 0.31 0.27 0.22 Total proporsi kumulatif keragaman yang dapat dijelaskan 0.571 0.571 0.733 1
F
2 ~ 1 ~ i i h 1F
F
2 2 ~ 1 ~ i i h Proporsi untuk total keragaman dengan menggunakan solusi dua faktor lebih besar daripada hanya menggunakan satu faktor.
Faktor pertama merepresentasikan kondisi ekonomi secara umum dan dapat disebut faktor pasar. Faktor kedua merupakan kontras antra saham perusahaan kimia dengan saham perusahaan minyak (pada faktor perusahaan kimia memiliki
loading negatif yang relatif besar dan perusahaan minyak memiliki loading positif yang relatif besar). Dengan demikian faktor kedua dapat disebut faktor industri karena sebagai
pembeda harga saham di industri yang berbeda.
Komunalitas Dengan m=2, Matriks residual untuk solusi 2 faktor
adalah
66
.
0
)
217
.
0
(
)
783
.
0
(
~
~
~
2 2 2 12 2 11 2
ih
0 232 . 0 017 . 0 012 . 0 017 . 0 232 . 0 0 019 . 0 055 . 0 069 . 0 017 . 0 019 . 0 0 122 . 0 164 . 0 012 . 0 055 . 0 122 . 0 0 127 . 0 017 . 0 069 . 0 164 . 0 127 . 0 0 ~ ' ~ ~ L L R Metode Kemungkinanan Maksimum
Metode kemungkinan maksimum (MKM)
mengasumsikan bahwa matriks ragam-peragam atau matriks korelasi semua peubah bersifat non-singular. Fungsi kepekatan bagi S adalah:
L(S)=c
dengan c adalah konstanta. Sehingga log-likelihood dari
L dan ψ, jika Σ = LL’ + ψ adalah:
Penduga kemungkinan maksimum bagi L dan ψ diperoleh dengan memaksimumkan persamaan diatas
dengan kendala k(k-1)/2 persyaratan keunikan
(Johnson&Wichern,1998). ) ( 2 1 2 1 2 1 2 1 n p n tr 1 S n e S |]} ) ' ( | ln } ) ' [( { 2 1 ln c n tr LL 1S LL 1S
Penentuan banyaknya faktor bersama
Uji Nisbah Kemungkinan (likelihood ratio test)
Hipotesis nol yang diuji pada uji nisbah kemungkinan ini adalah:
H0: Σ = LL’+ψ, r(L)=k diketahui
Misalkan , dan = + adalah penduga kemungkinan maksimum bagi
L, ψ dan Σ, jika H0 benar, maka nilai
maksimum untuk log dari fungsi kemungkinannya adalah:
L
L
^L
Uji Nisbah Kemungkinan (likelihood ratio test): (lanjutan)
tr S S S S
n c LH * 1 ln 1 2 1 ln 0 p n c 2 1 * L LH 0 ln 2 ln 2 Statistik uji nisbah kemungkinan yaitu
Menyebar khi-kuadrat dengan db 12
p k
2 p k
Jadi, hipotesis nol ditolak jika db p k p k
H L L 0 2 2 1 ; 2 ln 2
Penentuan banyaknya faktor bersama
(lanjutan)
Akaike’s information Criterion(AIC)
Statistik AIC untuk model dengan k faktor didefinisikan sebagai berikut:
AIC(k)=-2ln L(k)+[2p(k+1)-k(k-1)]
Model berfaktor k dengan k adalah nilai yang berpadanan dengan AIC (k) yang paling kecil dianggap sebagai
Data harga saham dianalisa kembali dengan menggunakan metode maksimum likelihood dengan tetap memakai dua model faktor
Komunalitas dengan menggunakan metode maksimum likelihood adalah:
Matriks residualnya adalah:
50 . 0 ) 189 . 0 ( ) 684 . 0 ( ˆ ˆ ˆ 2 2 2 2 2 1 2 i i i h 0 000 . 0 004 . 0 000 . 0 004 , 0 000 . 0 0 031 . 0 004 . 0 024 . 0 004 . 0 031 . 0 0 003 . 0 004 . 0 000 . 0 004 . 0 003 . 0 0 005 . 0 004 . 0 024 . 0 004 . 0 005 . 0 0 ' ˆ ˆL L R
Tabel pendugaan faktor loading, komunalitas, ragam khusus dan total proporsi keragaman contoh yang dapat dijelaskan
Variabel Maksimum likelihood Komponen utama
Penduga faktor Penduga faktor
.1 Allied Chemical .2 DuPont .3 Union Karbide .4 Exxon .5 Texaco 0.684 0.694 0.681 0.621 0.792 0.189 0.517 0.248 -0.073 -0.442 0.50 0.25 0.47 0.61 0.18 0.783 0.773 0.794 0.713 0.712 -0.217 -0.458 -0.234 0.412 0.524 0.34 0.19 0.31 0.27 0.22 Total proporsi kumulatif keragaman contaoh yang dapat dijelaskan 0.485 0.598 0.571 0.733 2 ~ 1 ~ i i h ~2 1 ~ i i h
Interpretasi
Elemen matriks residual pada maximum likelihood lebih kecil dari pada matriks residual pemfaktoran komponen utama. Total proporsi kumulatif keragaman pada faktor komponen utama lebih besar dibandingkan faktor maximum likelihood. Maka tidak mengherankan bila kriteria pemfaktoran komponen utama lebih dipilih. Loading yang didapatkan dari analisis
faktor komponen utama berhubungan
dengan komponen utama yang
Lanjutan
…
Pada solusi maximum likelihood semua
variabel pada faktor pertama memiliki loading
yang positif dan relatif besar. Faktor tersebut
disebut faktor pasar. Faktor loading yang
kedua memiliki tanda yang konsisten dengan
kontras atau faktor industri, tapi
magnitudo-nya relatif kecil dibeberapa kasus. Mungkin
dapat diidentifikasikan bahwa faktor ini adalah
pembandingan antara DuPont dan Texaco
ROTASI FAKTOR
Dipergunakan untuk memudahkan
interpretasi
Merupakan transformasi ortogonal
dari loading factors
L*= LT
dimana TT’=T’T=I
Beberapa jenis transformasi yaitu,
varimax, oblique, quartimax, dan
ROTASI FAKTOR
(lanjutan)
Rotasi Varimax Merupakan rotasi yang paling sering dipergunakan pada aplikasi. Merupakan transformasi ortogonal yang diperoleh dengan cara memaksimumkan:
k j p i p i i ij i ij h l p h l p 1 1 2 1 2 2 2 * 1 1ROTASI FAKTOR
(lanjutan)
Rotasi Oblique
Digunakan
apabila
transformasi
ortogonal terhadap matriks loading
faktor menghasilkan faktor yang
masih sulit diinterpretasikan.
ROTASI FAKTOR
(lanjutan)
Rotasi quartimax Transformasi ortogonal dengan tujuan
memperoleh
yang memaksimumkan
j iji
l* 4
L
Adalah matriks loading faktor yang ingin ditransformasi menggunakan matriksortogonal menjadi L* L sehingga j j i ij ij i j ij i ij i l Pk l Pk l Pk l Pk 2 * 4 * 2 * 4 * 1 1 1 1 Mencapai maximum.
Data harga saham dianalisa kembali dengan menggunakan metode maksimum likelihood dengan tetap memakai dua model faktor
Komunalitas dengan menggunakan metode maksimum likelihood adalah:
Matriks residualnya adalah: 50 . 0 ) 189 . 0 ( ) 684 . 0 ( ˆ ˆ ˆ 2 2 2 2 2 1 2 i i i h 0 000 . 0 004 . 0 000 . 0 004 , 0 000 . 0 0 031 . 0 004 . 0 024 . 0 004 . 0 031 . 0 0 003 . 0 004 . 0 000 . 0 004 . 0 003 . 0 0 005 . 0 004 . 0 024 . 0 004 . 0 005 . 0 0 ' ˆ ˆL L R
Tabel pendugaan faktor loading, komunalitas, ragam khusus dan total proporsi keragaman contoh yang dapat dijelaskan
Variabel Maksimum likelihood Komponen utama
Penduga faktor Penduga faktor .1 Allied Chemical .2 DuPont .3 Union Karbide .4 Exxon .5 Texaco 0.684 0.694 0.681 0.621 0.792 0.189 0.517 0.248 -0.073 -0.442 0.50 0.25 0.47 0.61 0.18 0.783 0.773 0.794 0.713 0.712 -0.217 -0.458 -0.234 0.412 0.524 0.34 0.19 0.31 0.27 0.22 Total proporsi kumulatif keragaman contaoh yang dapat dijelaskan 0.485 0.598 0.571 0.733 2 ~ 1 ~ i i h 2 ~ 1 ~ i i h 1 F F2 F1 F2
Interpretasi
Elemen matriks residual pada maximum likelihood lebih kecil dari pada matriks residual pemfaktoran komponen utama. Total proporsi kumulatif keragaman pada faktor komponen utama lebih besar dibandingkan faktor maximum likelihood. Maka tidak mengherankan bila kriteria pemfaktoran komponen utama lebih dipilih. Loading yang didapatkan dari analisis
faktor komponen utama berhubungan
dengan komponen utama yang