PROPERTY DAN PERDAGANGAN SEBAGAI
SEKTOR DOMINAN PADA DATA BURSA SAHAM
DENGAN Principal Component Analysis (PCA)
Oleh :
Hannaa a A Parhusip,a us p, Devae a Widyanantodya a to da1 dan Bernadetae adeta Desinovaes o a Kr2 Program Studi Statistika Matematika
Fakultas Sains dan Matematika (FSM)
Universitas Kristen Satya Wacana (UKSW) (www uksw edu) Universitas Kristen Satya Wacana (UKSW) (www.uksw.edu)
Masalah
Masalah
Data dengan variabel banyak dapat membingungkan
dalam formulasi masalah
pada suatu model matematika
pada suatu model matematika
Oleh karena itu diperlukan cara memilih variabel
yang dominan untuk mereduksi banyaknya variabel.
Pada makalah ini dibahas tentang cara memilih sektor
‐
METODE : PCA (Principal Component Analysis)
Pada
makalah
ini
dibahas
tentang
cara
memilih
sektor
‐
sektor
saham
domina
yang
ada
di
Indonesia.
Data
diambil
dari
Bursa
Efek
Jakarta
(
BEJ
)
dan
menggunakan
data
pada
b l
d
Principal
Component
Analysis
Secara
aljabar
j
PCA
merupakan
p
suatu
kombinasi
linear
khusus
untuk
p
variabel
random
X
1,
.
.
.
,
Xp.
Secara
geometri,
kombinasi
linear
menyatakan
pemilihan
sistem koordinat baru yang diperoleh dari merotasi
sistem
koordinat
baru
yang
diperoleh
dari
merotasi
sistem
mula
‐
mula
X
1,
.
.
.
,
Xp
sebagai
sumbu
‐
sumbu
koordinat.
Sumbu
koordinat
yang
baru
sangat
d
k k
(
k
tergantung
dari
matriks
kovariansi.
(atau
matrik
korelasi).
Matriks
kovariansi
pada
makalah
ini
Def
inisi 1:
(
Peressini
1988)
Def
inisi 1:
(
Peressini
,1988)
Misalkan
sebuah matriks simetri
a
ijMisalkan
sebuah
matriks
simetri
maka
matriks
positif
tegas
(
definite
positive
) jika dan hanya jika semua nilai
a
ij
n
n
a
ijpositive
)
jika
dan
hanya
jika
semua
nilai
eigennya
positif
.
Untuk
negatif
tegas
Teo
rema 1.
(halaman 358,
Johnson
and
Wichern
,
2007)
Sebutlah matriks
X
= [
X
Xp
] adalah matriks
Sebutlah
matriks
X
= [
X
1,
.
.
.
,
Xp
] adalah
matriks
yang
vektor
‐
vektor
kolomnya
adalah
vektor
random
(dianggap
berdistribusi
normal)
yang
mempunyai
matriks
kovariansi
(simetris
dan
positif
tegas
(
positive
definite
))
dengan
nilai
eigen
dan
sebutlah
vektor eigen yang bersesuaian untuk setiap
0
vektor
eigen
yang
bersesuaian
untuk
setiap
adalah
yang
saling
ortogonal.
Komponen
prinsip
ke
‐
i
adalah
0
...
2
1
p
0
...
2
1
p
p
e
e
11,...,
, ,
p,
...
2 21 1
1i pi p
T i
i
e
X
e
X
e
X
e
X
De
ngan
g
pem
p
ilih
an
ini
V
(
Y
)
e
T
e
i
1 2
(1 b)
Var
(
Y
i)
e
i
e
i
i,
i
=1,2,...,
p
(1.b)
Cov
Y
i,
Y
k
=
k
0
,
.
(1.c)
T
i
e
e
e
iT
e
k
0
M
ETODE PEN
ELITI
AN
M
ETODE PEN
ELITI
AN
• Data : data saham Januari 2008 – 2010. Data setiap
vektor-vektor kolom dianggap sebagai variabel random yang
vektor kolom dianggap sebagai variabel random yang
berdistribusi normal.
• Menyusun matriks kovariansi
M
hit
il i i
d
kt
i
V kt
i
• Menghitung nilai eigen dan vektor eigen Vektor eigen
sebagai penyusun koefisien pada komponen prinsip.
• Menyatakan variabel prinsip sebagai kombinasi linear dari
variabel mula-mula
• Menentukan koefisisen korelasi antara komponen prinsip
dan variabel mula mula dengan persamaan
dan variabel mula mula dengan persamaan
p pi i
T i
i
e
X
e
X
e
X
e
X
T
abel 4.
Mat
riks kovaria
ns
i (
S
)
4.
A
NALI
SA DAN
PEM
BAHAS
AN
T
abel 4.
Mat
riks kovaria
ns
i (
S
)
1
S
S
2S
3S
4S
5S
6S
7S
8PEM
BAHAS
AN
1
S
S
2 3S
4S
5S
6S
7S
80.0251 0.0292 0.0285 0.0229 0.0250 0.0287 0.0010 0.0227
0.0292 0.0471 0.0445 0.0420 0.0402 0.0354 0.0011 0.0268
0 0285 0 0445 0 0644 0 0397 0 0382 0 0346 0 0047 0 0280 0.0285 0.0445 0.0644 0.0397 0.0382 0.0346 0.0047 0.0280
0.0229 0.0420 0.0397 0.0398 0.0363 0.0286 0.0034 0.0213
0.0250 0.0402 0.0382 0.0363 0.0356 0.0303 0.0024 0.0232
0.0287 0.0354 0.0346 0.0286 0.0303 0.0346 0.0031 0.0256
0.0010 0.0011 0.0047 0.0034 0.0024 0.0031 0.0357 0.0008
Tampak
bahwa
matriks
kovariansi
S
adalah
matriks
simetris.
Kita
dapat
mencari
nilai
eigen
sebagaimana
ditunjukkan
pada
Bab
2
dan
dengan
menggunakan
bantuan
MATLAB
maka nilai
eigen
adalah
bantuan
MATLAB
maka
nilai
eigen
adalah
1 2 3 4 5 6 7 8
Sedangkan
vektor
eigen
untuk
tiap
nilai
eigen
diperoleh
berturut
‐
turut
ditunjukkan
tiap
kolom
pada
0
.
2312
0
.
0358
0
.
0191
0
.
0154
0
.
0029
0
.
0008
0
.
0006
0
.
0003
87 6
5 4
3 2
1
p
j
p
p
Tabel
5
dan
dapat
ditunjukkan
bahwa
vektor
eigen
T
abel
5
. Nilai Vektor
eigen
untuk data Tabel
3
T
abel
5
.
Nilai Vektor
eigen
untuk data
Tabel
3
1
u
u
2u
3
4
u
u
5u
6
7
u
u
80.4043 0.6699 0.1841 ‐0.1714 ‐0.2206 0.4298 ‐0.0566 0.2965 ‐0.6881 0.3835 ‐0.2473 ‐0.0466 0.3426 ‐0.0002 ‐0.0703 0.4402
1
u
u
2u
3 4u
5 6 7u
80.6881 0.3835 0.2473 0.0466 0.3426 0.0002 0.0703 0.4402
0.0070 0.0086 0.0249 ‐0.0667 ‐0.5731 ‐0.6643 0.0763 0.4683
0.5947 ‐0.0871 ‐0.3955 0.1113 0.5286 ‐0.2029 0.0152 0.3861 ‐0.0354 ‐0.2525 0.8242 0.0760 0.3240 0.0055 ‐0.0212 0.3800 ‐0.0487 ‐0.5485 ‐0.2184 ‐0.5459 ‐0.1750 0.4399 ‐0.0096 0.3562
Ol
eh karena itu
kom
ponen p
p
p
ri
nsip a
p
d
alah
8 7 6 5 4 3 2 11 0.4043 X 0.6881X 0.0070 X 0.5947 X 0.0354 X 0.0487 X 0.0402 X 0.0635 X
Y
8 7 6 5 4 3 2 1
2 0.6699 X 0.3835 X 0.0086 X 0.0871X 0.2525 X 0.5485 X 0.0456 X 0.1726 X
Y
8 7 6 5 4 3 2 1
3 0.1841X 0.2473 X 0.0249 X 0.3955 X 0.8242 X 0.2184 X 0.0044 X 0.1445 X
Y
8 7 6 5 4 3 2 1
4 0.1714 X 0.0466 X 0.0667 X 0.1113 X 0.0760 X 0.5459 X 0.0324 X 0.8043 X Y4 0.1714 X1 0.0466 X2 0.0667 X3 0.1113 X4 0.0760 X5 0.5459 X6 0.0324 X7 0.8043 X8
Y
8 7 6 5 4 3 2 1
5 0.2206 X 0.3426 X 0.5731X 0.5286 X 0.3240 X 0.1750 X 0.0360 X 0.2987 X
Y
8 7 6 5 4 3 2 1
6 0.4298 X 0.0002 X 0.6643 X 0.2029 X 0.0055 X 0.4399 X 0.1035 X 0.3585 X
Y
8 7 6 5 4 3 2 1
7 0.0566 X 0.0703 X 0.0763 X 0.0152 X 0.0212 X 0.0096 X 0.9910 X 0.0563 X
Y
8 7 6 5 4 3 2 1
8 0.2965 X 0.4402 X 0.4683 X 0.3861X 0.3800 X 0.3562 X 0.0336 X 0.2785 X
Y
Dapat ditunjukkan bahwa dan saling bebas linear ,
i,j
=1,..,8. Oleh karena itu sebagaimana disebutkan pada Bab 2
diperoleh bahwa Cov(
) = 0
i
Y
Y
jY
Y
Untuk
s
e
lanjutnya
k
or
elasi
antara
antara
komponen
prinsip
t
d
i b l
l
l b t
t t
t d l h
pertama
dan
variabel
mula
‐
mula
bert
u
rut
‐
turut
adalah
= 0.0442; = 0.0419; = 0.0027
11 1 11 , 1 1 s e X Y
22 1 21 , 2 1 s e X Y
33 1 31 , 3 1 s e X Y = 0.0301; = 0.2132; = 0.3266
44 1 41 , 4 1 s e X Y
55 1 51 , 5 1 s e X Y
66 1 21 , 6 1 s e X Y = 0.9931; = 0.8682
77 1 21 , 7 1
s
e
X Y
88 1 21 , 8 1s
e
X Y
Karena
nilai
kor
ela
si
variabel
(
pr
operti
)
dan
(
perdaga
n
gan
)
dekat
dengan
1,
m
a
ka
variabel
dan
sebagai
var
ia
bel yang paling berpeng
ar
uh terhadap nilai s
ah
am
7
X
X
88 X
7
X
Ke
simpul
an d
a
n
Sa
ran
Ke
simpul
an d
a
n
Sa
ran
Pada
makalah
ini
ini
telah
ditunjukkan
analisa
variabel
dengan
menggunakan
Principal
Component
Analysis
untuk
8
variabel
mengenai
sektor
– sektor
yang
memiliki nilai sahan cukup tinggi Variabel tersebut
memiliki
nilai
sahan
cukup
tinggi.
Variabel
tersebut
adalah
pertanian,
industri
dasar,
aneka
industri,
barang
konsumsi,
keuangan,
pertambangan,
properti,
dan
perdagangan.
Seluruh
variabel
diuji
untuk
mendapatkan
variabel
yang
dominan.
Diperoleh
bahwa
properti
dan
perdagangan
adalah variabel yang dominan yang
perdagangan
adalah
variabel
yang
dominan
yang