Analisis Teori Matrik Acak untuk data Saham dan IHSG
Yun Hariadi
Dept. Dynamical System Bandung Fe Institute
Abstrak
Melalui teori matrik acak paper ini memfokuskan pada perilaku vektor eigen pada saat nilai eigen berada di luar batas matrik acak dengan menggunakan kumpulan data saham dalam rentang waktu dan kepadatan data yang berbeda. Hasil yang diperoleh menunjukkan kesesuaian antara perilaku nilai eigen dengan vektor eigen dalam bentuk distribusi. Proyeksi vektor eigen terhadap IHSG menunjukkan tingkat kesesuaian yang tinggi pada saat nilai eigen terbesar dan kemudian tingkat kesesuain ini menurun drastis pada nilai eigen terbesar ke dua meskipun masih di luar batas atas matrik acak. Dengan perhitungan IPR (Inverse Participation Ratio) diperoleh bahwa lebih dari separoh saham berkontribusi dalam pembentukkan nilai eigen terbesar. Dan kumpulan saham yang berperan dalam pembentukkan nilai eigen terbesar ini didominasi oleh saham-saham likuid LQ45.
Kata kunci: teori matrik acak, vektor eigen, nilai eigen, IPR.
1. Pendahuluan
Paper ini mengembangkan paper sebelumnya [1] dengan lebih memfokuskan pada vektor eigen. Vektor eigen ini penting untuk melihat lebih jauh tentang perilaku nilai eigen yang berada di luar batas matrik acak. Beberapa kemungkinan yang bisa diperoleh dalam analisis pada vektor eigen ini adalah jumlah saham yang berperan penting dalam pembentukkan nilai eigen di luar matrik acak dan kumpulan saham yang bersesuaian dengan indeks saham gabungan. Untuk yang terakhir ini berguna dalam penyusunan portfolio. Teori matrik acak telah digunakan secara luas khususnya terhadap obyek yang melibatkan interaksi di dalamnya, parkir [2] partikel[3], optimasi portfolio [4], korelasi data keuangan dan saham [4],[5],[6].
Hasil analisis pada paper ini menunjukkan bahwa lebih dari separoh saham dalam data berkontribusi dalam pembentukkan nilai eigen terbesar. Dan kumpulan saham yang berperan dalam pembentukkan nilai eigen di luar batas matrik acak dan nilai eigen terbesar di dominasi oleh saham-saham likuid LQ45.
Paper ini tersusun atas dua bagian, pada bagian pertama akan diketengahkan metodologi dalam teori matrik acak dan beberapa turunannya meliputi IPR, model portfolio sederhana melaui proyeksi vektor eigen terbesar terhadap IHSG. Bagian ke dua merupakan analisis dari hasil yang diperoleh dengan menggunakan metodologi teori matrik acak. Dan akan ditutup dengan kesimpulan. Data yang digunakan mencakup 78 saham dalam rentang waktu 5/31/2000 s.d 2/3/2006.
2. Metode
Untuk matrik A yang berukuran nxn bisa kita peroleh nilai eigen λ dan vektor eigen x yang bisa kita tulis
x Ax=λ …(i)
Sedangkan untuk data deret waktu akan kita susun melalui matrik korelasi antar saham. Misalkan untuk saham j=1…N dengan perubahan waktu Δt dan nilai saham j pada saat t adalah Sj(t), nilai return didefinisikan sebagai
) ( ln ) ( ln ) (t S t t S t Gj ≡ j +Δ − j …(ii)
Nilai return dinormalkan
j j j j G t G t g σ − ≡ ( ) ) ( …(iii) Dengan 2 2 j j j = G − G σ Dan ) ( ) (t g t g Cij = i j …(iv)
Persamaan ini bisa ditulis sebagai
T
GG L
C = 1 ...(v)
Dengan G=
{
gjm ≡gj(mΔt),j =1…N,m=0…L−1}
Dan untuk matrik acak ukuran LxNT
AA L
Q Q 1 2 1 1 min max/ = + ± λ …(viii)
Sedangkan untuk vektor eigen dari matrik acak akan memenuhi
( )
⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − = 2 exp 2 1 2 u u P π …(ix)Hubungan antara nilai eigen terbesar dengan vektor eigen Proyeksi vektor eigen pada nilai eigen terbesar untuk
) ( ) ( 78 1 78 78 t G u t G j j j
∑
= = …(x)Selanjutnya sekumpulan saham yang tergabung dalam data ini akan dilihat hubungan korelasinya dengan IHSG pada nilai eigen terbesar, akan dilihat juga hubungan tersebut pada nilai eigen dalam rentang matrik acak.
Untuk melihat berapa banyak saham yang tergabung dalam data1 tersebut memberi sumbangan dalam pembentukkan nilai eigen akan dilihat melalui fungsi Inverse
Participation Ratio (IPR)
[ ]
∑
= ≡ N l k l k u I 1 4 …(xi) Dengan k lu merupakan vektor eigen dari nilai eigen. Nilai eigen yang kecil akan
menghasilkan IPR yang relatif lebih besar. Dan nilai k
I
/
1 menyatakan jumlah saham yang berkontribusi dalam pembentukkan nilai eigen terbesar.
Data
data rentang waktu Δt
1a 5/31/2000 s.d 5/31/2002 4x/hari 1b 5/31/2002 s.d 5/31/2004 4x/hari 1c 5/31/2004 s.d 12/29/2004 4x/hari 2a 5/31/2000 s.d 5/31/2002 1hari 2b 5/31/2002 s.d 5/31/2004 1hari 2c 5/31/2004 s.d 2/3/2006 1hari
data yang digunakan dalam analisis ini terdiri dari 78 saham yaitu:
'aali','admg','amfg','antm','asii','auto','bbca','bbld','bbni','bcic','bdmn','bfin','bhit','bksl','bl ta','bmtr','bnbr','bnga','bnii','bnli','brpt','bumi','cmnp','ctra','ctrs','davo','duti','epmt','fasw'
,'ggrm','gjtl','gsmf','hero','hits','hmsp','imas','inco','indf','inkp','inpc','intp','isat','jihd','jrpt' ,'kija','klbf','lpbn','lpkr','lsip','medc','mega','mkdo','mlbi','mppa','myor','nisp','plin','pnbn' ,'pnin','pnlf','rals','rmba','shda','smar','smcb','smgr','smma','smra','tcid','tlkm','tins','tkim', 'tspc','turi','ultj','unic','untr','unvr', dan 'ihsg'
3. Analisis
Perilaku distribusi peluang nilai eigen dari data 1a dan 1b tidak menunjukkan perbedaan yang berarti. Hadirnya nilai eigen yang berada di luar batas matrik acak berada pada nilai yang hampir sama untuk ke dua kondisi dan perbedaan antara data. Dalam kasus ini menunjukkan bahwa perbedaan kerapan data dalam selang waktu yang sama tidak memberi perbedaan yang cukup besar, namun untuk perbedaan kerapatan yang cukup tinggi (detik atau menit) hal ini masih perlu diuji.
Secara umum, sebagian besar data saham berada di dalam rentang batas matrik acak ]
,
[λ+ λ− . Analisis selanjutnya akan kita fokuskan pada kondisi nilai eigen berada di luar rentang matrik acak. Nilai yang berada di luar batas matrik acak merupakan informasi yang berguna dalam melihat hubungan antara saham yang tergabung dalam data tersebut. data λ λ+ 78 1 I78 1a 4.85 38 1b 6.21 44 1c 6.16 41 2a 4.94 38 2b 6.18 44 2c 6.59 43 Tabel 1
Perbandingan antara λ78 λ+ untuk melihat sejauh mana data berbeda dengan matrik acak, besarnya perbandingan tersebut menyatakan “informasi”. Hal ini bisa menjadi pembanding antara satu data
dengan data lainnya, terlihat bahwa kerapatan data tidak begitu berpengaruh terhadap perbedaan
+
λ
Gambar 1
Distribusi peluang nilai eigen λ jika dibandingkan dengan matrik acak, terlihat sebagian besar dari data saham memiliki nilai eigen yang mendekati dengan matrik acak (tanda *). Dan terdapat sebagian
kecil data yang berada di luar batas nilai eigen dari matrik acak.
Selanjutnya kita lihat pengaruh dari vektor eigen pada beberapa kondisi nilai eigen. Lebih khusus, analisis pada vektor eigen ini ingin menjawab apakah antara nilai eigen dengan vektor eigen berhubungan positif. Artinya, apakah ada kesesuaian antara nilai eigen di luar rentagn matrik acak dengan perilaku vektor eigennya?
Hasil yang ditunjukkan oleh gambar 2a menyatakan bahwa nilai eigen berhubungan positif dengan vektor eigen dalam hal penyimpangan terhadap matrik acak. Terlihat untuk perilaku vektor eigen pada saat berada dalam rentang matrik acak, distribusinya akan berimpit dengan distribusi normal ini sesuai dengan persamaan (ix). Namun pada saat nilai eigen berada di luar matrik acak, distribusi vektor eigen menyimpang dari distribusi matrik acak. Menarik kita amati perilaku vektor eigen ini jika nilai eigen berada di luar rentang matrik acak. Ternyata penyimpangan terhadap distribusi acak akan lebih besar pada nilai eigen di atas batas matrik acak dibandingkan dengan yang di bawah matrik acak.
Sekali lagi penyimpangan ini menegaskan bahwa nilai eigen yang berada di rentang matrik acak merupakan informasi yang sifatnya berguna (bukan gangguan) dibanding dengan nilai eigen yang berada dalam rentang matrik acak.
Gambar 2a
Berbagai macam distribusi peluang dari vektor eigen untuk data 1b. perhatikan penyimpangan distribusi vektor eigen pada saat nilai eigennya berada di luar batas matrik acak, baik pada saat di
bawah batas nilai eigen matrik acak λ<λ− dan pada saat di atas batas nilai eigen matrik acak
λ λ+ <
Lantas bagaimana perilaku distribusi vektor eigen untuk nilai eigen terbesar untuk masing-masing data?.
Ternyata untuk data dalam selang waktu yang sama namun berbeda kepadatannya menunjukkan adanya kemiripan bentuk distribusi vektor eigen. Dan jelas terjadi perbedaan antara data yang berbeda selang waktunya. Perbedaan selang waktu menyebabkan perbedaan penyimpangan terhadap distribusi matrik acak (persamaan ix). Dan tentu saja besarnya penyimpangan terhadap matrik acak ini menyatakan kadar informasi.
Gambar 2b
Distribusi peluang dari vektor eigen untuk nilai eigen yang paling besar menyimpang dari batas maksimal matrik acak untuk beberapa data yang berbeda kerapatannya. Perhatikan bahwa distribusi peluang vektor eigen tidak begitu berbeda antara data yang memiliki perbedaan kerapatan (kanan atas
dan kanan bawah). Dan jelas berbeda untuk selang waktu yang berbeda (kiri atas dan kiri bawah)
Pertanyaan selanjutnya dari penyimpangan vektor eigen untuk nilai eigen terbesar adalah, tentang berapa banyak unsur vektor eigen ini yang berkontribusi besar dalam penyimpangan? Dari gambar 2a&2b kita hanya bisa melihat bahwa terjadi penyimpangan untuk nilai eigen terbesar.
Untuk hal ini kita bisa menjawabnya berdasarkan pengaruh vektor eigen dalam analisis IPR. Terlihat pada gambar 3 bahwa nilai IPR yang besar berada pada nilai eigen terkecil dan menyimpang di bawah batas matrik acak. Dan kita perhatikan bahwa untuk nilai eigen yang berada dalam rentang matrik acak, nilai IPRnya mengumpul/tidak begitu menyimpang. Sedangkan untuk nilai eigen yang menyimpang di atas batas atas matrik acak, nilai IPR nya relatif tidak berbeda dengan data matrik acak. Juga bisa kita lihat bahwa ternyata lebih banyak nilai eigen yang di bawah rentang matrik acak dibandingkan dengan nilai eigen yang berada di atas rentang matrik acak.
Berapa banyak kumpulan saham tersebut yang berperan besar dalam pembentukkan vektor eigen yang menyimpang tersebut (pada nilai eigen terbesar)? Hal ini bisa kita lihat pada tabel 1, pada kolom 1 I , menyatakan jumlah saham yang berperan dalam 78 pembentukkan nilai eigen terbesar tersebut, dan kita peroleh lebih dari separoh saham berperan dalam nilai eigen terbesar.
Juga bisa kita lihat bahwa kepadatan data tidak begitu berpengaruh terhadap pembentukkan IPR(gambar 3) dan 1 I (tabel 1 kolom 3). Hasil ini mirip dengan 78 yang kita peroleh pada gambar 2b.
Gambar 3
Hampir mirip dengan gambar 2b, bahwa perilaku dari nilai eigen yang menyimpang dari batas matrik acak (ditandai dengan daerah berwarna gelap) juga menunjukkan kemiripan pada data yang dalam rentang waktu sama meski memiliki kerapatan data yang berbeda. Namun secara umum bisa dilihat
bahwa IPR cukup besar dihasilkan pada nilai eigen di bawah batas minimal matrik acak.
Selanjutnya kita akan melihat hubungan antara kumpulan data saham dengan IHSG. Melalui persamaan (x) kita akan melihat bagaimana susunan saham ini bersesuaian dengan IHSG.
Jika kita amati hasil yang diperoleh dari persamaan (x) untuk nilai eigen yang berbeda-beda makin menegaskan peran dari nilai eigen terbesar. Terlihat untuk nilai eigen terbesar λ78yang membentuk 78
G memiliki kesesuaian dengan IHSG, hal ini
terlihat dengan nilai fitting yang mendekati 1. bandingkan dengan hasil yang diperoleh untuk nilai eigen yang lain. Bahkan untuk nilai eigen lainnya yang berada di atas batas matrik acak pun (λ77), fitting antara 77
Gambar 4a
Proyeksi vektor eigen terhadap IHSG untuk nilai eigen yang berbeda-beda. Untuk nilai eigen terbesar,proyeksi vektor eigen G78dengan IHSG membentuk kemiringan yang jauh lebih besar dibandingkan dengan nilai eigen yang lainnya. Bahkan terhadap nilai eigen G77yang sama-sama di
luar batas maksimal matrik acak.
Selanjutnya bagaimana perilaku 78
G terhadap IHSG untuk beberapa rentang waktu
tertentu? Hasil ditunjukkan pada gambar 4b. terlihat bahwa untuk rentang waktu berbeda-beda menunjukkan kemiringan yang hampir mirip. Dan untuk rentang waktu 5/31/04 s.d 2/3/06 terjadi kemiringan terbesar yang mendekati 1.
Secara umum hasil yang kita peroleh pada fitting antara 78
G dengan IHSG
menyatakan kesesuaian antara sekumpulan saham (78 saham) terhadap IHSG. IHSG sebagai indek saham gabungan yang mencakup keseluruhan saham dan 78
G yang
mencakup 78 saham ternyata memiliki nilai fitting yang mendekati 1. hal ini menunjukkan bahwa ke 78 data saham memiliki peran yang cukup penting dalam pembentukkan IHSG. Pertanyaan ini bisa dilanjutkan tentang jumlah saham yang terlibat sebagai pembanding terhadap IHSG. Apakah pengurangan atau penambahan saham akan berakibat ketepatan fitting terhadap IHSG?
Gambar 4b
Proyeksi vektor eigen terhadap IHSG untuk nilai eigen terbesar pada rentang waktu yang berbeda-beda, kemiringan atau tingkat kesesuaian ditunjukkan oleh α. Perhatikan bahwa untuk keseluruhan rentang
waktu (kanan bawah) fitting antara G78 dengan IHSG masih mendekati 1.
Selanjutnya kita akan melihat susunan saham yang berperan besar dalam pembentukkan nilai eigen besar sehingga berada di luar batas matrik acak. Pada analisis untuk semua saham kita peroleh bahwa hanya terdapat dua nilai eigen terbesar yang berada di luar batas matrik acak, yaitu λ77&λ78. Dari nilai eigen ini kita akan melihat unsur-unsur terbesar dalam vektor eigen, tabel 2a menampilkan lima unsur vektor eigen terbesar untuk setiap nilai eigen di luar batas matrik acak.
78
u
asii tlkm tlkm asii tlkm asii
auto klbf asii auto klbf tlkm
untr ggrm klbf untr ggrm untr
tlkm untr untr tlkm untr klbf
klbf bbca ggrm klbf bbca isat
77
saham-saham likuid sebagai saham penyusun vektor eigen terbesar u78& u77. Perbedaan rentang waktu menyebabkan urutan saham berubah tetapi tidak sampai mengganti dengan saham baru.
Selanjutnya apakah terjadi perbedaan antara susunan di atas dengan hanya memfokuskan pada nilai eigen terbesar?
78
u
asii tlkm tlkm asii tlkm asii auto klbf asii auto klbf tlkm
untr ggrm klbf untr ggrm untr
tlkm untr untr tlkm untr klbf klbf bbca ggrm klbf bbca isat isat asii isat isat asii ggrm ggrm isat auto ggrm isat auto hmsp smcb hmsp hmsp smcb pnbn epmt intp pnbn epmt intp indf
rals pnbn rals rals pnbn rals
1a 1b 1c 2a 2b 2c
Tabel 2b
Sepuluh unsur vektor eigen terbesar u78. Jika kita bandingkan dengan tabel 2a, terjadi perbedaan terhadap saham yang terlibat pada saham ke-6 s.d ke-10. namun semuanya masih dalam dominasi
saham-saham likuid.
Dengan hanya terdapat dua nilai eigen yang di luar batas atas matrik acak menyulitkan untuk melakukan klasifikasi terhadap kumpulan saham. Hasil yang kita peroleh dan ditampilkan pada tabel 2a&2b memberi informasi bahwa pengelompokkan saham yang kita peroleh baik berdasarkan semua nilai eigen yang ada di luar batas atas matrik acak maupun hanya pada nilai eigen terbesar menunjukkan bahwa secara keseluruhan didominasi oleh saham-saham likuid.
4. Kesimpulan
Terdapat sebagian kecil dari nilai eigen yang berada di luar batas matrik acak, untuk keseluruhan data yang dianalisis terdapat dua nilai eigen yang berada di atas batas matrik acak. Hasil analisis menunjukkan bahwa perbedaan kerapatan data tidak berpengaruh terhadap jumlah nilai eigen yang berada di luar batas atas matrik acak dan tidak berpengaruh juga terhadap perbandingan nilai eigen maksimal dari data terhadap nilai eigen maksimal dari matrik acak.
Analisis dengan menggunakan teori matrik acak akan memfokuskan diri pada nilai eigen yang berada di luar batas matrik acak, sehingga jumlah nilai eigen yang berada di luar batas matrik acak menjadi variabel yang penting dalam analisis. Variabel yang ada di luar batas matrik acak dikategorikan sebagai informasi yang berguna sedangkan variabel yang berada dalam rentang matrik acak merupakan informasi yang sifatnya gangguan. Hal ini bisa dilihat dengan lebih jelas pada hasil yang ditampilkan dalam gambar 4a&4b.
Analisis selanjutnya dengan menggunakan vektor eigen menunjukkan kesesuaian antara sifat nilai eigen dengan vektor eigen. Kesesuaian ini ditunjukkan oleh perilaku
distribusi vektor eigen yang bersesuaian dengan nilai eigen. Hasil yang diperoleh pada analisis vektor eigen juga menunjukkan hasil yang mirip dengan nilai eigen, yaitu tidak berpengaruhnya kepadatan data terhadap perilaku distribusi vektor eigen. Hal ini bisa dilihat pada tabel 1 dan gambar 2a.
Dari perhitungan IPR bisa diperoleh jumlah saham yang berkontribusi dalam pembentukkan nilai eigen terbesar (nilai eigen yang berada di luar batas matrik acak). pada tabel 1 kolom ke tiga terlihat bahwa separoh lebih dari saham yang tergabung dalam data berkontribusi dalam pembentukkan nilai eigen terbesar. Juga bisa kita amati bahwa kepadatan data tidak berpengaruh terhadap jumlah saham yang berkontribusi dalam pembentukkan nilai eigen terbesar. Juga bisa kita lihat bahwa nilai IPR terbesar diperoleh pada saat nilai eigen terkecil, dan nilai eigen ini juga berada di bawah batas matrik acak.
Proyeksi vektor eigen terhadap IHSG bertujuan melihat kesesuaian antara sekumpulan saham yang tergabung dalam data terhadap IHSG. Hasil analisis menunjukkan bahwa pada nilai eigen terbesar maka proyeksi vektor eigen terhadap IHSG memiliki tingkat kesesuaian yang tinggi (α ≈1). Dan kondisi ini sangat sensitif terhadap perubahan, untuk nilai eigen terbesar ke dua yang juga berada di luar matrik acak tingkat kesesuaian ini menjadi begitu rendah (α ≈0) yang tidak begitu berbeda dengan kondisi nilai eigen yang berada dalam rentang matrik acak. secara umum ini makin menegaskan bahwa informasi yang berguna berada pada nilai eigen yang berada di luar matrik acak.
Pengelompokkan saham berdasarkan vektor eigen terbesar menunjukkan dominasi dari saham-saham likuid yang tergabung dalam LQ45. Hal ini ditunjukkan baik oleh dua nilai eigen yang berada di luar matrik acak maupun hanya pada nilai eigen terbesar. Hal ini menunjukkan bahwa saham-saham tersebut berperan penting dalam pembentukkan nilai eigen terbesar dan di luar matrik acak.
Daftar Pustaka
1. Hariadi, Y.,&Surya, Y. LQ45* dalam TMA. Working Paper Bandung Fe Institute. WP2004i.(2004).
2. Abul-Magd, A.Y. Modelling gap-size distribution of parked cars using random-matrix theory. Elsevier B.V. doi:10.1016/j.physa.2005.10.059. (2006). 3. Zieglera. K. & Kolokolovab, L. Light scattering in an ensemble of complex
particles:a random-matrix approach. Elsevier. doi:10.1016/j.jqsrt.2004.01.006. (2004).