2
BAB II
LANDASAN TEORI
2.1 TEORI UMUM 2.1.1 Pasar Modal
Menurut definisi oleh Bursa Efek Indonesia (www.idx.co.id), pasar modal adalah pasar untuk berbagai instrumen keuangan jangka panjang yang bisa diperjualbelikan, baik surat utang (obligasi), ekuiti (saham), reksa dana, instrumen derivatif maupun instrumen lainnya.
Sementara itu, Undang-Undang Pasar Modal No. 8 tahun 1995 tentang Pasar Modal mendefinisikan pasar modal sebagai kegiatan yang bersangkutan dengan penawaran umum dan perdagangan efek, perusahaan publik yang berkaitan dengan efek yang diterbitkannya, serta lembaga dan profesi yang berkaitan dengan efek.
Sedangkan definisi pasar atau bursa modal oleh Kamus Besar Bahasa Indonesia (KBBI) adalah kegiatan memperjualbelikan surat berharga yang berjangka waktu lebih dari satu tahun.
Dengan demikian, secara umum pasar modal dapat didefinisikan sebagai suatu kegiatan penawaran dan perdagangan efek atau surat berharga, yang mencakup surat utang (obligasi), ekuitas (saham), reksa dana, dan berbagai instrumen derivatif maupun instrumen lain, dengan jangka waktu lebih dari satu tahun.
Menurut Bursa Efek Indonesia, pasar modal memiliki peran yang sangat penting dalam perekonomian, dimana pasar modal menjadi sarana pendanaan usaha dan sarana bagi perusahan untuk memperoleh dana tambahan, untuk pengembangan usaha atau modal kerja, dari investasi masyarakat. Di sisi masyarakat sendiri, pasar modal menjadi sarana untuk berinvestasi pada berbagai instrumen keuangan. Masyarakat dapat mengalokasikan dana yang dimilikinya berdasarkan karakteristik keuntungan dan risiko dari masing-masing instrumen.
2.1.2 Saham
Menurut Bursa Efek Indonesia (www.idx.co.id), saham dapat didefinisikan sebagai tanda penyertaan modal seseorang atau pihak (badan usaha) dalam suatu perusahaan atau perseroan terbatas. Sementara itu, berdasarkan definisi oleh Kamus Besar Bahasa Indonesia (KBBI), saham adalah hak yang dimiliki orang (pemegang saham) terhadap perusahaan berkat penyerahan bagian modal sehingga dianggap berbagi dalam pemilikan dan pengawasan.
Menurut BEI, saham merupakan salah satu instrumen pasar keuangan yang paling popular karena saham mampu memberikan tingkat keuntungan yang menarik bagi para investor. Dalam perdagangan saham sehari-hari, harga saham terus berfluktuasi. Harga saham dibentuk oleh permintaan dan penawaran terhadap saham yang bersangkutan, baik yang sifatnya spesifik terhadap saham tersebut, seperti kinerja perusahaan atau industri dimana perusahaan bergerak, maupun faktor makro seperti tingkat suku bunga, inflasi, kondisi sosial politik, dan sebagainya.
2.1.3 Indeks Harga Saham
Berdasarkan definisi oleh BEI, indeks harga saham adalah indikator atau cerminan pergerakan harga saham yang menjadi salah satu pedoman bagi investor untuk melakukan investasi di pasar modal, khususnya saham.
Hingga saat ini, Bursa Efek Indonesia memiliki 11 jenis indeks harga saham, yaitu sebagai berikut:
1. Indeks Harga Saham Gabungan (IHSG)
Indeks ini menggunakan semua Perusahaan Tercatat sebagai komponen perhitungan indeksnya. Agar IHSG dapat memberi gambaran kondisi pasar yang wajar, Bursa Efek Indonesia berwenang mengeluarkan atau tidak memasukkan satu atau beberapa Perusahaan Tercatat dari perhitungan IHSG dengan pertimbangan bahwa apabila jumlah pemilikan saham oleh publik (free float) terhadap perusahaan yang bersangkutan relatif kecil sementara kapitalisasi pasarnya cukup besar, perubahan harga saham Perusahaan Tercatat tersebut berpotensi mempengaruhi kewajaran pergerakan IHSG.
2. Indeks Sektoral
Indeks sektoral menggunakan semua Perusahaan Tercatat yang termasuk dalam masing-masing sektor. Saat ini terdapat 10 sektor di BEI, yaitu sektor Pertanian, Pertambangan, Industri Dasar, Aneka Industri, Barang Konsumsi, Properti, Infrastruktur, Keuangan, Perdangangan dan Jasa, dan Manufatur.
3. Indeks LQ45
Indeks LQ45 terdiri dari 45 saham Perusahaan Tercatat yang dipilih berdasarkan pertimbangan likuiditas dan kapitalisasi pasar, dengan kriteria-kriteria yang sudah ditentukan. Review dan penggantian saham dilakukan setiap 6 bulan.
4. Jakarta Islamic Index (JII)
Indeks ini menggunakan 30 saham yang dipilih dari saham-saham yang masuk dalam kriteria syariah (Daftar Efek Syariah yang diterbitkan oleh Bapepam-LK) dengan mempertimbangkan kapitalisasi pasar dan likuiditas.
5. Indeks Kompas100
Indeks ini terdiri dari 100 saham Perusahaan Tercatat yang dipilih berdasarkan pertimbangan likuiditas dan kapitalisasi pasar, dengan kriteria-kriteria yang sudah ditentukan. Review dan penggantian saham dilakukan setiap 6 bulan.
6. Indeks BISNIS-27
Indeks yang diluncurkan oleh kerja sama antara BEI dan harian Bisnis Indonesia ini terdiri dari 27 saham Perusahaan Tercatat yang dipilih berdasarkan kriteria fundamental, teknikal atau likuiditas transaksi dan Akuntabilitas dan tata kelola perusahaan.
7. Indeks PEFINDO25
Indeks PEFINDO25 diluncurkan oleh kerja sama antara BEI dan lembaga rating PEFINDO untuk memberikan tambahan informasi bagi pemodal khususnya untuk saham-saham emiten kecil menengah.
Indeks ini terdiri dari 25 saham Perusahaan Tercatat yang dipilih dengan mempertimbangkan kriteria-kriteria seperti: Total Aset, tingkat pengembalian modal dan opini akuntan public, serta faktor likuiditas dan jumlah saham yang dimiliki publik.
8. Indeks SRI-KEHATI
Indeks ini dibentuk atas kerja sama antara BEI dengan Yayasan Keanekaragaman Hayati Indonesia (KEHATI) dengan harapan mampu memberi tambahan informasi kepada investor. SRI merupakan singkatan dari Sustainable Responsible Investment. Indeks ini terdiri dari 25 saham Perusahaan Tercatat yang dipilih dengan mempertimbangkan kriteri-kriteria seperti: Total Aset, Price Earning
Ratio (PER) dan Free Float.
9. Indeks Papan Utama
Indeks ini menggunakan saham-saham Perusahaan Tercatat yang masuk dalam Papan Utama.
10. Indeks Papan Pengembangan
Indeks ini menggunakan saham-saham Perusahaan Tercatat yang masuk dalam Papan Pengembangan.
11. Indeks Individual
Indeks individual merupakan indeks harga saham masing-masing Perusahaan Tercatat.
2.2 TEORI KHUSUS 2.2.1 Prediksi Saham
Prediksi saham merupakan salah satu akvititas predictive modeling yang mencakup proses pengumpulan data, formulasi model prediksi, dan kemudian pelaksanaan prediksi serta validasi model. Predictive modeling dasarnya melibatkan sejumlah teknik data mining dan statistik untuk menganalisa fakta-fakta masa kini dan historikal untuk memprediksi kejadian di masa depan (Mishra, Das, Mausumi, & Mishra, 2010).
2.2.1.1 Data yang Digunakan
Dalam aktivitas prediksi saham, data yang digunakan pada dasarnya terbagi dalam dua kategori, yaitu data teknikal dan data fundamental (Hellström & Holmström, 1998). Data teknikal adalah data harga saham itu sendiri, yang terdiri dari harga pembukaan, harga penutupan, harga tertinggi, dan harga terendah dari saham yang bersangkutan. Sementara itu, data fundamental adalah data yang memiliki pengaruh terhadap harga saham yang diperdagangkan. Data fundamental dapat berupa:
• Ekonomi makro, seperti inflasi, nilai suku bunga, dan sebagainya.
• Kondisi industri dimana perusahaan bergerak, misalnya harga saham lain dalam sektor industri yang sama, harga komoditas yang terkait, seperti minyak, logam, atau nilai tukar mata uang.
• Kondisi dari perusahaan yang menerbitkan saham, yaitu dalam kaitan dengan data finansial perusahaan, seperti net profit
margin, debt ratio, dan lain-lain.
2.2.1.2 Teknik Prediksi Saham
Secara umum, teknik-teknik prediksi saham dibagi dalam empat jenis: 1) pendekatan teknikal, 2) pendekatan fundamental, 3) prediksi deret waktu, dan 4) metode berbasis machine learning. Pendekatan teknikal merupakan pendekatan grafikal dimana prediksi dilakukan berdasarkan harga historikal dari saham yang bersangkutan. Sementara itu, pendekatan fundamental dilakukan dengan mencari harga saham yang sesungguhnya, membandingkannya dengan tingkat perdagangan yang sedang terjadi, dan merekomendasikan pembelian saham yang diperdagangkan dengan harga yang lebih rendah dari harga sesungguhnya.
Pada pendekatan deret waktu, suatu model prediksi linear dibangun berdasarkan pola harga historikal saham, bisa dengan melibatkan hanya satu variabel saja (univariate) atau beberapa variabel (multivariate). Salah satu teknik prediksi deret waktu yang terkenal adalah ARIMA yang bersifat univariate.
Terakhir, metode prediksi dengan memanfaatkan teknik machine
learning dilakukan dengan mempelajari sejumlah sampel data untuk
menghasilkan suatu ekspresi atau fungsi yang dapat menghasilkan data prediksi. Beberapa contoh algoritma machine learning yang telah dikembangkan, antara lain K-nearest neighbor classification, Naïve
Bayes, neural network, Support Vector Machines (SVM) dan Least Squares Support Vector Machines (LSSVM).
Untuk membangun model prediksi dengan metode machine
learning, perlu disediakan suatu data set yang berisi variabel atau deret
waktu yang menjadi objek prediksi serta variabel-variabel lain yang relevan jika ada. Data set tersebut kemudian dibagi menjadi dua, yaitu
training dan testing set (Huang, Lai, Nakamori, & Wang, 2004). Training set digunakan untuk membangun model dan prosesnya disebut
proses training. Ketika proses training, model akan “mempelajari” pola dari data di dalam training set, yakni bagaimana data-data yang relevan (variabel input) dapat menghasilkan data yang akan diprediksi (variabel
output). Dalam hal ini, variabel output dalam training set telah diketahui
nilainya. Proses training biasanya juga mencakup penentuan parameter yang tepat bagi model.
Setelah model dihasilkan, model akan digunakan pada proses
testing, dimana berdasarkan data dari variabel input di dalam testing set,
model akan benar-benar memprediksi variabel output. Dalam hal ini, variabel output dalam testing set seolah-olah belum diketahui nilainya. Kinerja prediksi dari model kemudian akan diukur dengan membandingkan data hasil prediksi dengan data aktual di dalam testing
set.
Pada kebanyakan kasus, akan jauh lebih baik apabila dilakukan estimasi awal terhadap kinerja model sebelum digunakan dalam proses
dimana model yang dihasilkan memiliki kompleksitas yang terlalu tinggi akibat terlalu memperhitungkan bias atau varian di dalam data (Hellström & Holmström, 1998). Proses estimasi awal terhadap kinerja model ini disebut sebagai proses validation dan data set yang digunakan disebut validation set (Huang, Lai, Nakamori, & Wang, 2004). Mekanisme di dalam proses validation pada dasarnya sama dengan pada proses testing.
2.2.2 Support Vector Machines (SVM)
Pada dasarnya, pendekatan SVM bertujuan untuk menghasilkan suatu
optimal separating hyperplane untuk pattern recognition. Rumusan asli SVM
oleh Vapnik & Lerner pada tahun 1963 dan Vapnik & Chervonenkis pada tahun 1964 ditujukan bagi data yang sifatnya linear atau separable (Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002). Pengembangan untuk kasus nonlinear kemudian diperkenalkan oleh Vapnik pada tahun 1995 (Vapnik, 2000). Selanjutnya, pada tahun 1997, versi SVM untuk regresi diperkenalkan oleh Vapnik, Steven Golowich, dan Alex Smola (Basak, Pal, & Patranabis, 2007). SVM regresi merupakan versi SVM yang paling banyak digunakan terutama untuk prediksi deret waktu, termasuk prediksi finansial seperti harga saham.
2.2.2.1 SVM Linear
Misalkan data training yang direpresentasikan dengan
, , … , , , , 1, 1 (2.1)
. 0 (2.2) Untuk suatu training set, bisa diperoleh lebih dari satu
hyperplane seperti contoh pada Gambar 2.1 di bawah.
Gambar 2.1 Contoh Banyaknya Alternatif Hyperplane untuk Suatu Masalah Klasifikasi (Suykens et al., 2002)
Gambar 2.2 Pendefinisian Hyperplane yang Unik Berdasarkan Konsep
Optimal Hyperplane (Suykens et al., 2002)
Model SVM bertujuan untuk membangun suatu fungsi yang menghasilkan hyperplane yang optimal, yaitu hyperplane dengan margin terbesar (Gambar 2.2), yang dirumuskan sebagai berikut:
· 1 jika 1,
· 1 jika 1,
· 1, 1, 2, … , (2.3) Dengan tetap memenuhi kondisi (2.2), suatu hyperplane yang optimal harus memecahkan masalah pemrograman kuadratik, yaitu mencapai nilai minimum untuk fungsi berikut:
· 1, 1, 2, … , (2.4)
Φ 1
2 · (2.5)
Solusi untuk masalah di atas dapat diperoleh dengan fungsi Lagrange:
, , 1
2 · · 1 (2.6)
dimana adalah Lagrange multipliers. Fungsi Lagrange di atas harus diminimalkan untuk w dan b dan dimaksimalkan untuk 0.
max min
, , , (2.7)
Dengan demikian, , , dan harus memenuhi kondisi berikut: , ,
0
, ,
0
Dari persamaan-persamaan di atas, diperoleh karakteristik dari
hyperplane optimal, yaitu koefisien harus memenuhi Persamaan (2.8)
dan hyperplane optimal merupakan kombinasi linear dari vektor-vektor dalam training set (Persamaan (2.9)).
, 0, 1, … , (2.9)
Karena hanya support vectors yang bisa memberikan nilai bukan nol untuk koefisien bagi , maka Persamaan (2.9) dapat dirumuskan secara lebih spesifik sebagai berikut:
, 0, 1, … , (2.10)
Berdasarkan teori Kühn-Tucker, hyperplane optimal juga harus memenuhi kondisi
· 1 0, 1, … , (2.11)
Dengan mensubstitusikan persamaan ke dalam fungsi Lagrange dan mengikuti kondisi Kühn-Tucker, diperoleh fungsi
1
2 ·
,
(2.12)
dimana persyaratan pada Persamaan (2.8) harus tetap dipenuhi.
Dengan demikian, untuk memperoleh hyperplane optimal, harus diselesaikan suatu masalah pemrograman kuadratik, yakni memaksimalkan bentuk kuadratik (2.12) dalam batasan Persamaan (2.8). Aturan separasi berdasarkan hyperplane optimal yang diperoleh selanjutnya dapat dihasilkan dari fungsi berikut:
dimana adalah support vectors, adalah koefisien Lagrange yang bersangkutan, dan adalah konstanta (threshold) yang dapat diperoleh dari rumus
1
2 · 1 · 1 (2.14)
dimana 1 merepresentasikan support vector yang masuk dalam kelas pertama dan 1 merepresentasikan support vector yang masuk ke dalam kelas kedua.
2.2.2.2 SVM Nonlinear
Untuk memperoleh hyperplane yang optimal untuk kasus dimana data tidak dapat dipisahkan secara linear, Vapnik menambahkan suatu variabel nonnegative 0 serta fungsi
dengan parameter 0.
Fungsi kemudian diminimalkan dengan menuruti ketentuan
· 1 , 1, 2, … , (2.15)
Generalized optimal hyperplane ditentukan oleh vektor
dengan meminimalkan fungsi
Φ , 1
2 · (2.16)
Teknik untuk memecahkan masalah kuadratik di sini hampir sama dengan yang digunakan dalam kasus separable, dimana untuk menemukan koefisien dari generalized optimal hyperplane, harus dicari parameter , 1, … , , yang memaksimalkan bentuk kuadratik yang sama dengan kasus separable, yaitu
1
2 ·
,
namun dengan syarat yang sedikit berbeda, yakni 0 , 1, … ,
0
Sama seperti pada kasus separable, hanya beberapa koefisien , 1, … , yang tidak sama dengan nol, yaitu yang menghasilkan support
vectors.
Vapnik kemudian mengembangkan teori SVM lebih jauh dengan memperkenalkan teknik nonlinear yang dilakukan dengan memetakan data input ke dalam ruang fitur dengan dimensi yang lebih tinggi, dan tanpa batas (Gambar 2.3). Hyperplane pemisah kemudian akan dibangun pada ruang fitur high dimensional tersebut.
non nam fitu unt den Gambar 2.3 Dengan nlinear di da mun ekuival ur high-dime Koefisi tuk fungsi ngan memen Pemetaan In n teknik kern alam ruang in len dengan ensional. ien dapat nuhi syarat Input Space p Spac nel tersebut nput, yaitu decision fun t diperoleh pada High D ce , dibangun d nction yang dengan me Dimensional decision fun linear di da ncari nilai m Feature nction yang (2.17) alam ruang maksimum (2.18) (2.19)
Fungsi ini sama dengan fungsi untuk memperoleh hyperplane optimal kecuali pada bagian inner products, dimana inner products
· digantikan dengan , .
Terdapat beberapa pilihan fungsi Kernel ·,· , antara lain (Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002):
• SVM linear
, ·
• SVM polynomial dengan derajat .
, ·
• Kernel RBF
, exp ⁄
• Kernel MLP
, tanh ·
2.2.2.3 SVM untuk Estimasi Fungsi (SVM Regresi)
Pada dasarnya SVM dibagi menjadi dua kategori, yakni SVM klasifikasi, yang telah diuraikan pada subbab 2.2.2.1 dan 2.2.2.2, dan SVM regresi (Basak, Pal, & Patranabis, 2007). SVM regresi intinya bertujuan untuk mengestimasi fungsi dependensi dari variabel dependen berdasarkan sekumpulan variabel independen (StatSoft, Inc., 2013).
Pada ε-SVM regresi, fungsi f(x) yang diperoleh harus menghasilkan deviasi maksimal ε dari target yang diobservasi, yi, untuk
keseluruhan data pada training set, namun dengan flatness yang sebesar mungkin. Rumusan ε-SVM regresi untuk kasus linear, yaitu:
· , 1, 2, … , (2.20)
Flatness pada rumusan di atas dapat diperoleh dengan
meminimalkan panjang dari vektor , yakni dengan meminimalkan · dan memenuhi kriteria:
·
· (2.21)
Pada kasus dimana tidak dapat dihasilkan fungsi f yang mampu memprediksi seluruh pasangan (xi, yi) dengan presisi ε, maka dengan
mengadaptasi loss function dengan soft margin, diperkenalkan slack
variables dan . Dengan demikian optimasi kemudian dapat
diperoleh dengan meminimalkan: 1
2 · (2.22)
dan memenuhi kriteria: · ·
, 0
(2.23)
Konstanta C berfungsi sebagai trade-off antara flatness dari fungsi f dengan batas toleransi dari deviasi yang lebih besar daripada ε. Untuk memecahkan permasalahan optimasi di atas, digunakan fungsi Langrange sehingga diperoleh rumusan sebagai berikut:
1
2 · ·
·
dimana , , , > 0. Untuk memperoleh nilai optimal, berlaku kondisi berikut:
0 (2.25)
0 (2.26)
0 (2.27)
Dengan mensubstitusikan Persamaan (2.25), (2.26), dan (2.27) ke dalam Persamaan (2.24), diperoleh rumusan optimasi dengan memaksimalkan: 1 2 · , (2.28) dan memenuhi: 0 , 0, (2.29)
Dengan tereliminasinya variabel , , Persamaan (2.26) dapat dituliskan kembali menjadi:
(2.30)
· (2.31)
Konstanta dapat dihitung menggunakan rumus:
· untuk 0,
· untuk 0,
(2.32)
Pada kasus nonlinear, dapat diaplikasikan trik kernel, sehingga Persamaan (2.30) dan (2.31) dituliskan kembali menjadi:
(2.33)
, (2.34)
Teknik kernel yang dapat digunakan sama seperti yang telah disebutkan pada subbab 2.2.2.2, yakni linear, polinomial, RBF, dan MLP. Namun, teknik yang paling banyak digunakan adalah RBF karena cenderung memberikan hasil yang lebih baik.
2.2.3 Least Squares Support Vector Machines (LSSVM)
LSSVM merupakan versi modifikasi dari SVM oleh Suykens et al. (2002) yang bertujuan untuk memecahkan persamaan-persamaan linear dengan cara yang lebih sederhana dibandingkan masalah pemrograman kuadratik yang dihadapi dalam SVM Vapnik (Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002). Selain kompleksitas kalkulasi yang lebih rendah, proses training LSSVM dalam permalasahan berskala besar juga lebih cepat dan menggunakan resource komputasi yang lebih sedikit dibandingkan SVM (Mustaffa & Yusof, 2011). Selain itu, untuk penggunaan kernel RBF, jumlah
parameter yang harus dioptimalkan pada LSSVM juga lebih sedikit dibandingkan SVM, dimana pada LSSVM hanya dua variabel yang perlu ditentukan, yaitu ( , ), sedangkan pada SVM terdapat tiga parameter, yaitu ( , , ) (Ou & Wang, 2009; Suykens, Gestel, Brabanter, Moor, & Vandewalle, 2002).
Sama seperti pada SVM, LSSVM dapat digunakan untuk permasalahan klasifikasi dan regresi baik pada kasus linear maupun nonlinear. Pada kasus nonlinear, teknik kernel juga dapat diaplikasikan di dalam LSSVM. Pilihan kernel yang dapat digunakan sama seperti pada SVM, yakni linear, polinomial, RBF, dan MLP.
2.2.3.1 LSSVM untuk Klasifikasi
Pada permasalahan klasifikasi, decision function dari model dalam primal space dirumuskan sebagai berikut:
sign · φ x b (2.35)
dimana · adalah pemetaan ke ruang fitur high
dimensional seperti pada SVM standar. Berikut adalah rumusan
problema optimasi dalam LSSVM yang diperkenalkan oleh Suykens et al. (2002): min , , , 1 2 · 1 2 (2.36) sedemikian sehingga · 1 , 1, … , (2.37)
Terlihat dua hal yang membedakan hasil modifikasi ini terhadap formulasi asli oleh Vapnik. Yang pertama adalah pada penggunaan
fungsi persamaan yang menggantikan pertidaksamaan dimana nilai 1 di bagian kanan lebih merupakan suatu nilai target alih-alih nilai threshold. Untuk mentolerir kesalahan, persamaan dilengkapi dengan suatu variabel kesalahan yang memiliki peran yang sama seperti variabel dalam rumus SVM. Perbedaan kedua yaitu pada penggunaan fungsi kuadrat untuk variabel kesalahan tersebut.
Untuk kasus nonlinear, diturunkan rumus Lagrangian berikut:
, , ; , · 1 (2.38)
dimana nilai adalah Lagrange multipliers, yang bisa bernilai positif maupun negatif. Untuk mencapai nilai optimal, kondisi berikut harus terpenuhi: 0 0 0 0 , 1, … , 0 · 1 0, 1, … , (2.39)
Dengan mengeliminasi dan , diperoleh sistem linear: 0 Ω ⁄ 0 1 (2.40) dimana: · ; … ; · ; … ; 1 1; … ; 1
; … ; ; … ;
dan Ω . Trik kernel dapat diaplikasikan di dalam matriks Ω:
Ω ·
, untuk , 1, … , .
Dengan demikian, model LSSVM yang dihasilkan dalam dual
space adalah sebagai berikut:
sign , (2.41)
2.2.3.2 LSSVM untuk Estimasi Fungsi
Penurunan rumus pada LSSVM untuk estimasi fungsi pada dasarnya sama seperti pada LSSVM untuk klasifikasi karena LSSVM klasifikasi sebenarnya dapat dipahami sebagai kasus regresi dengan target +1 dan -1.
Misalkan decision function dari model LSSVM dalam primal
space dirumuskan sebagai berikut (Suykens, Gestel, Brabanter, Moor, &
Vandewalle, 2002):
· φ x (2.42)
dimana · adalah pemetaan ke ruang fitur high
dimensional seperti pada SVM standar. Maka, dapat dirumuskan
min , , , 1 2 · 1 2 (2.43) sedemikian sehingga · , 1, … , (2.44)
Rumus Lagrangian yang dibangun untuk kasus nonlinear sebagai berikut:
, , ; , · (2.45)
dimana nilai adalah Lagrange multipliers. Kondisi optimal yang harus dipenuhi antara lain:
0
0 0 0 , 1, … ,
0 · 0, 1, … ,
(2.46)
Setelah mengeliminasi dan , diperoleh:
0 1 Ω ⁄ 0 (2.47) dimana: ; … ; 1 1; … ; 1 ; … ;
Trik kernel dapat diaplikasikan sebagai berikut:
Ω ·
untuk , 1, … , .
Dengan demikian, fungsi estimasi yang dihasilkan adalah:
, (2.48)
2.2.4 Autoregressive Integrated Moving Average (ARIMA)
ARIMA adalah suatu model prediksi deret waktu univariate, dimana ARIMA hanya menggunakan satu variabel atau deret waktu dan model dihasilkan dengan membangun suatu fungsi linear berdasarkan nilai-nilai historikal dan/atau loncatan-loncatan acak di dalam deret waktu (Tsitsika, Maravelias, & Haralabous, 2007).
ARIMA merupakan salah satu model prediksi deret waktu yang paling banyak digunakan karena fleksibilitasnya dalam merepresentasikan berbagai bentuk deret waktu, antara lain autoregressive murni (AR), moving average murni (MA), dan kombinasi antara AR dan MA (ARMA) (Abdullah, 2012).
Pembangunan model ARIMA melibatkan tiga tahap utama (Abdullah, 2012; Tsitsika, Maravelias, & Haralabous, 2007). Tahap pertama adalah identifikasi model, yaitu menentukan apakah deret waktu bersifat stasioner dan tranformasi yang diperlukan, dalam hal ini berupa derajat diferensiasi (d), apabila deret waktu belum stasioner.
Tahap selanjutnya adalah estimasi parameter, yakni menentukan apakah deret waktu merupakan deret autoregresif (AR), moving average (MA), atau keduanya, yang dinotasikan dalam orde p dan q. Pada kasus
seasonal ARIMA, serangkaian parameter serupa juga perlu ditentukan untuk
umum untuk seasonal ARIMA dalah ARIMA (p, d, q) x (P, D, Q)s dimana s
adalah periode (Ayinde & Abdulwahab, 2013).
Langkah terakhir adalah pengecekan diagnostik untuk melakukan verifikasi terhadap model. Model yang baik diharapkan memiliki residual yang mengandung white noise. Statistik Q oleh Ljung-Box biasanya digunakan untuk menguji normalitas residual yang dihasilkan model ARIMA (Abdullah, 2012), yakni dengan menguji hipotesis berikut:
Ho : Kesalahan bersifat acak (white noise)
H1 : Kesalahan tidak bersifat acak (bukan white noise)
Agar suatu model ARIMA dianggap baik, nilai statistik Q yang dihasilkan harus lebih kecil dibandingkan nilai kritikal dari distribusi
chi-square dengan derajat kebebasan s, dimana s adalah jumlah koefisien dalam
pengujian (Clement, 2013). Dengan kata lain, model ARIMA dikatakan baik apabila hipotesa nol (H0) diterima.
Selain statistik Q Ljung-Box, indikator lain yakni Bayesian
information criterion (BIC) juga digunakan umum dalam pemilihan model
ARIMA. Sama seperti statistik Q Ljung-Box, indikator BIC juga bertujuan untuk mengukur kecocokan model dengan deret waktunya (Clement, 2013). Semakin kecil nilai BIC berarti model semakin dekat dengan deret waktunya.
2.3 PENELITIAN SEBELUMNYA
Banyak peneliti mencoba untuk melakukan prediksi tren harga saham dengan menerapkan pendekatan statistik dan grafikal (Abdullah, 2012; Moghaddasi & Badr, 2008; Jakaša, Andročec, & Sprčić, 2011). Namun
pendekatan tersebut kurang efektif dibandingkan prediksi dengan pendekatan yang berbasis kecerdasan komputasi. Besarnya data yang dihasilkan oleh pasar modal secara tidak langsung menuntut peneliti untuk memanfaatkan teknik data
mining (Prasanna & Ezhilmaran, 2013).
Cukup banyak penelitian yang telah dilakukan terkait prediksi harga saham dengan pendekatan data mining. Salah satunya adalah penelitian oleh (Olaniyi, Adewole, & Jimoh, 2011) yang mengkombinasikan metode regression
analysis dan moving average untuk memprediksi tren harga saham dari tiga bank
di Nigeria dengan menggunakan data harga seluruh saham yang diperdagangkan di Nigerian Stock Exchange. Selain oleh (Olaniyi, Adewole, & Jimoh, 2011), penelitian tentang prediksi saham pada Nigerian Stock Exchange juga dilakukan oleh (Akinwale, Arogundade, & Adekoya, 2009) dengan menggunakan algoritma
error back propagation dan regression analysis. Penelitian yang serupa juga
dilakukan oleh (Magaji, Waziri, Isah, & R., 2012) dengan metode Naïve Bayes. Penelitian lain oleh (Kannan, Sekar, Sathik, & Arumugam, 2010) mengusulkan algoritma yang dapat memprediksi apakah harga penutupan saham di hari yang bersangkutan akan mengalami peningkatan atau penurunan dari hari sebelumnya. Algoritma tersebut dibangun dengan mengkombinasikan lima metode analisis saham, yaitu Typical Price (TP), Bollinger Bands, Relative
Strength Index (RSI), CMI dan Moving Average (MA).
Selain itu, pada tahun 2011, Kara, Boyacioglu, & Baykan melakukan penelitian yang membandingkan kinerja ANN dan SVM dalam memprediksi pergerakan indeks harga saham di Istanbul Stock exchange, sementara Kumar &
Thenmozhi (2005) yang membandingkan teknik SVM dan Random Forest dalam memprediksi pergerakan indeks saham S&P CNX NIFTY Market Index.
Beberapa penelitian lain yang secara spesifik relevan terhadap penelitian ini, antara lain penelitian oleh (Deng & Yeh, 2011) yang memanfaatkan LSSVM untuk mengestimasi biaya produksi, (Gestel, et al., 2001) yang melakukan prediksi terhadapat beberapa macam data finansial dan memperoleh hasil prediksi yang lebih akurat menggunakan LSSVM dibandingkan dengan model AR dan model nonparametrik lain, serta (Yu, Chen, Wang, & Lai, 2009) yang memprediksi pergerakan harga saham dan menyimpulkan bahwa model LSSVM memiliki kinerja prediksi yang lebih baik dibandingkan model ARIMA, LDA, BPNN, dan SVM.
Sementara itu, penelitian yang lebih komprehensif dilakukan oleh Ou & Wang (2009) yang membandingkan kinerja sepuluh teknik data mining dalam memprediksi arah pergerakan indeks Hang Seng berdasarkan lima faktor, yaitu harga pembukaan, harga penutupan, indeks S&P 500, dan harga kurs antara dolar HK dan dolar AS. Sepuluh teknik yang dibandingkan adalah Linear discriminant
analysis (LDA), Quadratic discriminant analysis (QDA), K-nearest neighbor classification, Naïve Bayes berbasis kernel, Logit model, Tree based classification, neural network, Bayesian classification dengan Gaussian process, Support vector machines (SVM) dan Least squares support vector machines
(LSSVM). Hasil perbandingan menunjukkan bahwa model SVM dan LSSVM menghasilkan akurasi prediksi yang jauh lebih baik dibandingkan model lainnya, dan di antara kedua model tersebut, SVM menghasilkan prediksi yang lebih baik
daripada LSSVM untuk prediksi in-sample, sedangkan untuk prediksi