ESTIMASI MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) PADA INDEKS HARGA SAHAM GABUNGAN (IHSG)

(1)

ESTIMASI MULTIVARIATE ADAPTIVE

REGRESSION SPLINES (MARS) PADA INDEKS HARGA

SAHAM GABUNGAN (IHSG)

Skripsi

disusun sebagai salah satu syarat

untuk memperoleh gelar Sarjana Sains

Program Studi Matematika

oleh

Elisa Desi Asriani

4111412007

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS NEGERI SEMARANG

(2)

(3)

(4)

(5)

v

MOTTO DAN PERSEMBAHAN

MOTTO

Sesungguhnya sesudah kesulitan itu ada kemudahan (QS. Al-Insyirah: 6).

Maka nikmat Tuhan kamu manakah yang kamu dustakan? (QS. Ar-Rahman: 55)

Bukanlah hidup kalau tidak ada masalah, bukanlah sukses kalau tidak melalui

rintangan, bukanlah lulus kalau tidak ada ujian, dan bukanlah berhasil kalau

tidak berusaha.

PERSEMBAHAN

Untuk kedua orang tua tercinta Ibu Surati dan Bapak

Santoso

Untuk Kakak dan Adikku tersayang, Elina Ninda Pamela

dan Elfan Handi Ardana

Untuk keluarga besar tercinta

Untuk sahabat-sahabatku Septi, Rizki, Vera, Nina, Uus

Untuk teman-teman Matematika Angkatan 2012

Untuk teman-teman Kos “Wisma Purnama Indah” Untuk teman-teman PKL BPS Kabupaten Jepara

Untuk teman-teman KKN Alternatif 2A Hidroponik Boja

(6)

KATA PENGANTAR

Puji syukur kehadirat Allah SWT yang telah memberikan nikmat dan

karunia-Nya serta kemudahan sehingga penulis dapat menyelesaikan skripsi yang berjudul

“Estimasi Multivariate Adaptive Regression Splines (MARS) pada Indeks Harga

Saham Gabungan (IHSG)”.

Penyusunan skripsi ini dapat diselesaikan berkat kerjasama, bantuan, dan

dorongan dari berbagai pihak. Oleh karena itu penulis mengucapkan terima kasih

kepada :

1. Prof. Dr. Fathur Rokhman, M.Hum., Rektor Universitas Negeri Semarang.

2. Prof. Dr. Zaenuri, S.E., M.Si., Akt., Dekan FMIPA Universitas Negeri

Semarang.

3. Drs. Arief Agoestanto, M.Si., Ketua Jurusan Matematika FMIPA Universitas

Negeri Semarang.

4. Drs. Mashuri, M.Si., Ketua Prodi Matematika FMIPA Universitas Negeri

Semarang.

5. Drs. Sugiman, M.Si., selaku Dosen Pembimbing I yang telah memberikan

bimbingan, pengarahan, nasehat, saran dan dorongan selama penyusunan

skripsi ini.

6. Putriaji Hendikawati, S.Si., M.Pd., M.Sc., selaku Dosen Pembimbing II yang

telah memberikan bimbingan, pengarahan, nasehat, saran dan dorongan

(7)

vii

7. Drs. Arief Agoestanto, M.Si., selaku Dosen Penguji yang telah memberikan

penilaian dan saran dalam perbaikan skripsi ini.

8. Prof. Dr. St. Budi Waluya, M.Si., selaku Dosen Wali saya sejak Semester 1

hingga sekarang yang telah memberikan bimbingan dan arahan.

9. Staf Dosen Matematika Universitas Negeri Semarang yang telah membekali

penulis dengan berbagai ilmu selama mengikuti perkuliahan sampai akhir

penulisan skripsi ini.

10. Staf Tata Usaha Universitas Negeri Semarang yang telah banyak membantu

penulis selama mengikuti perkuliahan dan penulisan skripsi ini.

11. Ibu dan Bapak tercinta, Ibu Surati dan Bapak Santoso yang senantiasa

memberikan dukungan dan doa yang tiada putusnya.

12. Kakak dan Adik tersayang, Elina Ninda Pamela dan Elfan Handi Ardana yang

selalu memberikan semangat dan doa.

13. Sahabat dan teman terbaikku, Nur Septiani yang setia membantu, menemani,

selalu ada dalam susah maupun senang, serta selalu memberikan motivasi,

semangat, dan doa.

14. Sahabat dan teman terbaik di kos, Rizki Nurul Anifah yang setia membantu,

menemani disaat susah maupun senang, menghibur, memberikan semangat,

nasehat, dan doa.

15. Adik kos ku tersayang, Verannita Octaviani yang setia membantu, menemani

disaat susah maupun senang, menghibur, memberikan semangat, dan doa.

16. Teman sekamarku Nina Faradina dan Uswatun Khasanah yang senatiasa

(8)

17. Kakak-kakak Rizal Yunianto Ghofar, Kishartini, dan Yani Puspita Kristiani

yang membantu dalam skripsi ini, memberikan pengarahan, motivasi,

semangat, dan doa.

18. Teman-teman Matematika angkatan 2012 yang berjuang bersama untuk

mewujudkan cita-cita.

19. Teman-teman kos “Wisma Purnama Indah” yang memberikan dukungan, semangat, dan doa.

20. Teman-teman PKL BPS Kabupaten Jepara yang memberikan semangat dan

doa.

21. Teman-teman KKN Alternatif 2A 2015 Hidroponik, Dusun Segunung,

Banjarejo, Boja, Kendal yang memberikan semangat dan doa.

22. Semua pihak yang tidak dapat disebutkan satu per satu yang telah

memberikan bantuan.

Penulis menyadari bahwa dalam penyusunan skripsi ini masih terdapat banyak

kekurangan. Oleh karena itu, penulis mengharapkan saran dan kritik yang

membangun dari pembaca.

Semarang, 9 Februari 2016

(9)

ix

ABSTRAK

Asriani, Elisa Desi. 2016. Estimasi Multivariate Adaptive Regression Splines (MARS) pada Indeks Harga Saham Gabungan (IHSG). Skripsi, Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Semarang. Pembimbing Utama Drs. Sugiman, M.Si. dan Pembimbing Pendamping Putriaji Hendikawati, S.Si., M.Pd., M.Sc.

Kata kunci: Regresi Nonparametrik, Estimasi, IHSG, MARS, GCV.

Analisis regresi nonparametrik digunakan apabila salah satu asumsi parameter regresi tidak terpenuhi dan tidak diketahui bentuk kurva regresi. Indeks harga saham gabungan (IHSG) merupakan suatu rangkaian informasi historis mengenai pergerakan saham gabungan sampai tanggal tertentu, digunakan para investor untuk melihat kenaikan atau penurunan harga saham. Variabel ekonomi yang mempengaruhi IHSG diantaranya yaitu inflasi, tingkat suku bunga di Indonesia, nilai tukar (kurs) rupiah terhadap dolar Amerika, indeks saham Dow Jones, indeks saham Nikkei 225, dan indeks saham Hang Seng. Metode MARS merupakan salah satu metode yang menggunakan pendekatan regresi nonparametrik dan data berdimensi tinggi yaitu data yang memiliki jumlah variabel prediktor sebesar dan sampel data yang berukuran . MARS merupakan salah satu metode yang sangat cocok untuk menganalisis IHSG karena nonparametrik untuk data berdimensi tinggi. Penelitian ini bertujuan untuk mengetahui: (1) estimasi terbaik MARS pada variabel prediktor IHSG menggunakan kriteria GCV; (2) besar tingkat pentingnya variabel-variabel prediktor terhadap model terbaik yang diperoleh.

Metode analisis MARS pada IHSG dengan melakukan pengujian parameter model regresi nonparametrik, standarisasi, dan model MARS diperoleh dari kombinasi nilai fungsi basis (BF), Maksimum Interaksi (MI), dan Minimum Observasi (MO) secara trial and error. Hasil penelitian estimasi MARS terbaik pada IHSG adalah BF=18, MI=1, dan MO=1, GCV terkecil 0,05640 dengan bentuk

persamaan Y = − , + , ∗BF − , ∗BF − , ∗BF +

, ∗_{BF + ,} ∗_{BF − ,} ∗_{BF + ,} ∗_{BF −}

, ∗_BF _{. Variabel prediktor yang tingkat pentingnya secara signifikan yaitu} Inflasi ; nilai tukar (kurs) tengah rupiah terhadap dolar Amerika ; indeks saham Dow Jones ; tingkat suku bunga di Indonesia ; dan indeks saham Nikkei 225 dengan tingkat pentingnya masing-masing sebesar 100%; 86,54114%; 84,31259%; 38,18755%; dan 32,75410%.

(10)

DAFTAR ISI

Halaman

HALAMAN JUDUL ... i

PENYATAAN KEASLIAN TULISAN ... iii

HALAMAN PENGESAHAN ... iv

MOTTO DAN PERSEMBAHAN ... v

KATA PENGANTAR ... vi

ABSTRAK ... ix

DAFTAR ISI ... x

DAFTAR TABEL ... xiv

DAFTAR SIMBOL ... xv

DAFTAR GAMBAR ... xvii

DAFTAR LAMPIRAN ... xix

BAB 1 PENDAHULUAN 1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 7

1.3 Batasan Masalah ... 7

1.4 Tujuan Penelitian ... 7

(11)

xi BAB 2 TINJAUAN PUSTAKA

2.1 Indeks Harga Saham Gabungan (IHSG) ... 10

2.1.1 Inflasi ... 10

2.1.2 Tingkat Suku Bunga di Indonesia ... 11

2.1.3 Nilai Tukar (Kurs) Rupiah ... 13

2.1.4 Indeks Dow Jones ... 13

2.1.5 Indeks Nikkei 225 ... 14

2.1.6 Indeks Hang Seng ... 15

2.2 Skala Pengukuran ... 16

2.3 Analisis Regresi ... 17

2.3.1 Regresi Nonparametrik ... 18

2.3.1.1Regresi Splines ... 19

2.3.1.2Basis B-Spline ... 20

2.3.1.3Recursive Partitioning Regression (RPR) ... 24

2.3.1.4Multivariate Adaptive Regression Splines (MARS) ... 26

2.4 Pengujian Parameter Model Regresi ... 35

2.5 Estimasi Parameter ... 38

2.6 Generalized Cross Validation (GCV) ... 40

2.7 Algoritma MARS ... 40

2.8 Pemilihan Model MARS Terbaik ... 43

2.9 Pengujian Signifikansi Model MARS ... 45

2.10Penelitian Terdahulu ... 47

(12)

BAB 3 METODE PENELITIAN

3.1 Studi Pustaka ... 57

3.2 Perumusan Masalah ... 58

3.3 Pengumpulan Data ... 58

3.4 Pemecahan Masalah ... 59

3.4.1 Variabel Penelitian ... 59

3.4.2 Software yang Digunakan ... 60

3.4.3 Metode Analisis ... 60

3.4.4 Flowchart Penentuan Model MARS ... 62

3.5 Penarikan Kesimpulan ... 63

BAB 4 HASIL DAN PEMBAHASAN 4.1 Hasil ... 64

4.1.1 Statistik Deskriptif Indeks Harga Saham Gabungan (IHSG) di Indonesia... 64

4.1.2 Statistik Deskriptif Inflasi di Indonesia ... 66

4.1.3 Statistik Deskriptif Suku Bunga di Indonesia ... 67

4.1.4 Statistik Deskriptif Kurs Tengah Rupiah terhadap Dolar Amerika ... 69

4.1.5 Statistik Deskriptif Indeks Dow Jones ... 71

4.1.6 Statistik Deskriptif Indeks Nikkei 225 ... 73

4.1.7 Statistik Deskriptif Indeks Hang Seng ... 75

4.1.8 Uji Asumsi Model Regresi ... 77

(13)

xiii

4.1.8.2Uji Homoskedastisitas ... 80

4.1.8.3Uji Autokorelasi ... 81

4.1.8.4Uji Multikolinieritas ... 82

4.1.9 Estimasi Model MARS ... 84

4.1.10 Model MARS Terbaik ... 85

4.1.11 Pengujian Signifikansi Model MARS ... 86

4.1.11.1 Pengujian Koefisien Regresi Simultan ... 87

4.1.11.2 Pengujian Koefisiensi Regresi Parsial ... 88

4.1.12 Interpretasi Model MARS ... 90

4.1.13 Tingkat Kepentingan Variabel Prediktor ... 92

4.2 Pembahasan ... 93

BAB 5 PENUTUP 5.1 Kesimpulan ... 98

5.2 Saran ... 99

DAFTAR PUSTAKA ... 100

(14)

DAFTAR TABEL

Tabel Halaman

Tabel 4.1 Statistik Deskriptif Variabel IHSG ... 65

Tabel 4.2 Statistik Deskriptif Variabel Inflasi ... 66

Tabel 4.3 Statistik Deskriptif Variabel Suku Bunga di Indonesia ... 68

Tabel 4.4 Statistik Deskriptif Variabel Kurs Tengah Rupiah ... 69

Tabel 4.5 Statistik Deskriptif Variabel Indeks Dow Jones ... 71

Tabel 4.6 Statistik Deskriptif Variabel Indeks Nikkei 225 ... 73

Tabel 4.7 Statistik Deskriptif Variabel Indeks Hang Seng ... 75

Tabel 4.8 One-Sample Kolmogorov-Smirnov Test ... 79

Tabel 4.9 Koefisien Korelasi Pada Regresi... 81

Tabel 4.10 Model Summary ... 82

Tabel 4.11 ... 83

Tabel 4.12 Hasil seleksi Model MARS Menggunakan Kriteria GCV ... 84

Tabel 4.13 MARS Regression ... 87

Tabel 4.14 MARS Regression ... 88

(15)

xv

DAFTAR SIMBOL

: data Indeks Harga Saham Gabungan (IHSG) di Indonesia

: data Inflasi di Indonesia

: data Suku Bunga di Indonesia

: data Kurs (Tengah) Rupiah terhadap Dollar Amerika di Indonesia

: data Indeks Saham Dow Jones

: data Indeks Saham Nikkei 225

: data Indeks Saham Hang Seng

: data Standarisasi Indeks Harga Saham Gabungan (IHSG) di Indonesia

: data Standarisasi Inflasi di Indonesia

: data Standarisasi Suku Bunga di Indonesia

: data Standarisasi Kurs (Tengah) Rupiah terhadap Dollar Amerika di Indonesia

: data Standarisasi Indeks Saham Dow Jones

: data Standarisasi Indeks Saham Nikkei 225

: data Standarisasi Indeks Saham Hang Seng

BF : fungsi basis (Basis Function)

MI : maksimum Interaksi

MO : minimum Observasi

n : jumlah Sampel

p : jumlah Prediktor

LLt : laju Inflasi di Periode Waktu ke t

IHKt : nilai Indeks Harga Konsumen di Periode Waktu ke-t IHKt− : nilai Indeks Harga Konsumen di Periode Waktu ke t −

: variabel respon pada amatan ke-

: fungsi smooth yang tidak diketahui

: error ke- yang saling bebas

(16)

: koefisien dari fungsi basis ke m

: maksimum fungsi basis

: derajat Interaksi ke m

: nilai 1 atau -1 jika data berada di sebelah kanan atau kiri knot

, : variabel prediktor dari p dengan observasi ke n : nilai knot dari variabel prediktor ,

: semua fungsi basis untuk satu variabel

, : semua fungsi basis untuk interaksi antar dua variabel

, , : semua fungsi basis untuk interaksi antar tiga variabel

(17)

xvii

DAFTAR GAMBAR

Gambar Halaman

Gambar 2.1Menu Utama SPM 7 ... 53

Gambar 2.2Tampilan Membuka Dokumen... 54

Gambar 2.3 Tampilan Variabel-variabel... 54

Gambar 2.4 Data dalam SPM 7... 55

Gambar 2.5 MARS dalam SPM 7 ... 55

Gambar 2.6 Model dalam SPM 7 ... 56

Gambar 2.7 Options and Limits dalam SPM 7 ... 56

Gambar 3.1Flowchart Penentuan Model Akhir ... 62

Gambar 4.1 Grafik IHSG di Indonesia ... 65

Gambar 4.2 Grafik Inflasi di Indonesia... 66

Gambar 4.3 Scatterplot antara IHSG dengan Inflasi ... 67

Gambar 4.4 Grafik Suku Bunga di Indonesia ... 68

Gambar 4.5 Scatterplot antara IHSG dengan Suku Bunga di Indonesia .... 69

Gambar 4.6 Grafik Kurs Tengah Rupiah di Indonesia ... 70

Gambar 4.7 Scatterplot antara IHSG dengan Kurs Tengah Rupiah ... 72

(18)

Gambar 4.9 Grafik Indeks Nikkei 225 ... 74

Gambar 4.10 Scatterplot antara IHSG dengan Indeks Nikkei 225 ... 75

Gambar 4.11 Grafik Indeks Hang Seng ... 76

Gambar 4.12 Scatterplot antara IHSG dengan Indeks Hang Seng ... 77

(19)

xix

DAFTAR LAMPIRAN

Lampiran Halaman

1. Data Penelitian Asli ... 103

2. Output Pengolahan Data Menggunakan SPSS 16 ... 105

3. Tabel Durbin-Watson dengan = , ... 108

4. Tabel F dengan = , ... 109

5. Data Penelitian setelah Standarisasi ... 110

6. Output Simulasi Model MARS trial and error ... 115

7. Output Simulasi Model MARS terbaik ... 212

(20)

(21)

1

BAB 1

PENDAHULUAN

1.1

Latar Belakang

Di era globalisasi ini, hampir semua negara menaruh perhatian besar

terhadap pasar modal karena memiliki peranan strategis bagi penguatan ketahanan

ekonomi suatu negara. Pasar modal yang ada di Indonesia merupakan pasar yang

sedang berkembang yang dalam perkembangannya sangat rentan terhadap kondisi

makroekonomi secara umum. Krisis ekonomi yang dimulai tahun 1998 merupakan

awal runtuhnya pilar-pilar perekonomian nasional Indonesia. Ini ditandai dengan

turunnya kepercayaan masyarakat terhadap perbankan Indonesia dalam bentuk

penarikan dana besar-besaran (rush) oleh deposan untuk kemudian disimpan di luar negeri. Dampak lain dari menurunnya kepercayaan masyarakat berimbas sampai ke

pasar modal. Harga-harga saham menurun secara tajam sehingga menimbulkan

kerugian yang cukup signifikan bagi investor.

Pertumbuhan ekonomi yang terjadi di Indonesia cukup pesat dan telah

mengubah pola pikir masyarakat di bidang ekonomi dan investasi. Investasi dalam

bentuk saham merupakan investasi yang banyak dipilih para investor. Salah satu

indikator yang menunjukkan pergerakan harga saham adalah Indeks Harga Saham

Gabungan (IHSG). Indeks Harga Saham Gabungan (IHSG) sering digunakan

sebagai acuan para investor untuk melihat representasi harga saham keseluruhan

(22)

diperlukan suatu metode analisis (Sunariyah dalam Astuti et al., 2013).

Metode analisis sebelumnya pada pergerakan indeks harga saham di suatu

negara tidak terlepas dari kondisi perekonomian negara itu secara makro. Indeks

harga saham sangat dipengaruhi variabel-variabel makro seperti tingkat suku bunga

di Indonesia, nilai tukar (kurs) rupiah terhadap dolar Amerika, dan Inflasi. Pada

umumnya bursa efek yang berada dalam satu kawasan juga dapat mempengaruhi

karena letak geografisnya yang saling berdekatan seperti Nikkei 225 di Jepang dan

Hang Seng di Hongkong yang memiliki pengaruh yang kuat terhadap kinerja Bursa

Efek Indonesia (Astuti et al., 2013).

Analisis regresi merupakan salah satu metode statistika yang dapat

menggambarkan ketergantungan atau mencari hubungan fungsional antara satu

variabel respon (variabel dependen) dengan satu atau lebih variabel prediktor

(variabel independen). Dalam hal ini, indeks harga saham gabungan (IHSG) adalah

variabel respon dan variabel prediktornya adalah faktor-faktor yang mempengaruhi

indeks harga saham gabungan (IHSG) yaitu inflasi, tingkat suku bunga di

Indonesia, nilai tukar (kurs) tengah rupiah bulanan terhadap dolar Amerika, indeks

saham Dow Jones, indeks saham Nikkei 225, dan indeks saham Hang Seng.

Penelitian sebelumnya mengenai indeks harga saham gabungan telah

dilakukan oleh beberapa penelitian seperti Puspitasari et al. (2012) dan Astuti et al.

(2013). Penelitian yang dilakukan oleh Puspitasari et al. (2012) membandingkan hasil peramalan data IHSG menggunakan metode time series klasik, regresi parametrik linier, dan regresi nonparametrik kernel. Hasil analisis regresi

(23)

nilai MSE terkecil. Pada metode regresi nonparametrik kernel, pemilihan

bandwidth optimal lebih penting dibanding pemilihan fungsi yang digunakan.

Penelitian yang dilakukan oleh Astuti et al. (2013) melakukan analisis pengaruh antara variabel tingkat suku bunga di Indonesia, nilai tukar (kurs), inflasi,

Indeks Nikkei 225, dan Indeks Hang Seng. Hasilnya bahwa variabel tingkat suku

bunga di Indonesia, nilai tukar (kurs), dan inflasi memiliki pengaruh signifikan

terhadap IHSG. Artinya jika variabel tersebut mengalami peningkatan maka akan

diikuti peningkatan nilai IHSG dan begitu sebaliknya.

Berdasarkan penelitian Puspitasari et al. (2012) dan Astuti et al. (2013) dalam menjelaskan pola hubungan variabel respon dengan variabel prediktor dapat

digunakan pendekatan kurva regresi. Pendekatan kurva regresi yang sering

digunakan adalah pendekatan regresi parametrik, dimana diasumsikan bentuk

kurva regresi diketahui (seperti linier, kuadratik, dan kubik) berdasarkan teori yang

dapat memberikan informasi hubungan (Draper dan Smith, 1992). Namun, tidak

semua pola hubungan dapat didekati dengan pendekatan parametrik, karena tidak

adanya suatu informasi mengenai bentuk hubungan variabel respon dan variabel

prediktor. Jika bentuk kurva tidak diketahui dan pola menyebar maka kurva regresi

dapat diduga menggunakan pendekatan model regresi nonparametrik. Apalagi tes

nonparametrik tidak memerlukan pengukuran seperti yang dibutuhkan untuk

menyelesaikan tes parametrik, tes nonparametrik paling berlaku untuk data dalam

skala ordinal, dan berlaku juga untuk sampel data skala nominal. Regresi

nonparametrik memiliki fleksibilitas yang tinggi dalam mengestimasi kurva

(24)

estimasi kurva regresi, tanpa dipengaruhi oleh faktor subyektifitas dari perancangan

penelitian (Eubank, 1988).

Salah satu metode regresi nonparametrik adalah Multivariate Adaptive Regression Splines (MARS) yang pertama kali dipopulerkan oleh Friedman (1991). Karena MARS merupakan metode regresi nonparametrik sehingga model MARS

tidak bergantung pada asumsi tertentu. Model MARS berguna untuk mengatasi

permasalahan data yang berdimensi tinggi, yaitu data yang memiliki jumlah

variabel prediktor sebesar dan sampel data yang berukuran

. MARS merupakan pengembangan dari pendekatan Recursive Partitioning Regression (RPR) yang dikombinasikan dengan metode Spline sehingga model yang dihasilkan kontinu pada knot yaitu garis regresi selalu menyambung, dimana

tiap knot selalu menyambung dengan fungsi basisnya.

MARS merupakan metodologi regresi komputasional yang menyediakan

pendekatan sistematik membangun model regresi yang menghasilkan model

kontinu untuk data berdimensi tinggi dimana data tersebut mengandung Multiple Partitions dan interaksi antara variabel prediktor. Metode MARS mengatasi kelemahan Recursive Partitioning Regression (RPR) dimana sebelumnya model yang dihasilkan RPR tidak kontinu terhadap knots, sedangkan MARS mampu

menghasilkan model yang kontinu terhadap knots. MARS banyak diadopsi oleh

bidang ilmu komputer sebagai Conpetitor metode lain seperti jaringan syaraf tiruan dan Generalized Adaptive Models (Hastie dan Tibsjirani dalam Souri, 2009).

Salah satu penelitian mengenai model MARS yaitu penelitian yang

(25)

faktor penyebab penyakit diare diantaranya variabel prediktornya meliputi

persentase keluarga yang memiliki jamban sehat , persentase keluarga yang

menggunakan air bersih , persentase TUPM (Tempat Umum dan Pengelolaan

Makanan) sehat , rata-rata lama sekolah , persentase melek huruf

penduduk usia di atas 10 tahun , rata-rata jiwa per rumah tangga , dan

persentase penduduk miskin . Dapat diketahui bahwa variabel yang

berpengaruh terhadap pemyakit diare adalah persentase keluarga yang

menggunakan air bersih , persentase TUPM (Tempat Umum dan Pengelolaan

Makanan) sehat , dan persentase melek huruf penduduk usia di atas 10 tahun

. Penelitian yang dilakukan guna menekan angka penyebaran diare

menggunakan pendekatan kurva regresi nonparametrik menggunakan model

Multivariate Adaptive Regression Splines (MARS) karena data berdimensi tinggi dan memodelkan variabel-variabel prediktor yang mempengaruhi kesakitan diare.

Untuk mendapatkan model MARS terbaik dilakukan dengan cara

mengkombinasikan Maksimum Fungsi basis (BF), Maksimum Interaksi (MI), dan

Minimum Observasi (MO) secara trial and error dan melihat Generalized Cross Validation (GCV) minimum.

Berdasarkan penelitian yang dilakukan oleh Wasis Wicaksono et al.

(2014) menggunakan model MARS untuk memodelkan dan mengetahui

faktor-faktor yang mempengaruhi kesakitan diare termasuk ke dalam data yang

(26)

bunga di Indonesia, sedangkan yang mempengaruhi IHSG dibidang mikro ekonomi

yaitu variabel indeks Dow Jones, indeks Nikkei 225, dan indeks Hang Seng

menggunakan pendekatan regresi nonparametrik kernel karena data berdimensi

tinggi. Oleh karena itu, berdasarkan penelitian yang dilakukan oleh Wasis

Wicaksono et al. (2014), Puspitasari et al. (2012), dan Astuti et al. (2013) tersebut maka model MARS juga cocok digunakan untuk data Indeks Harga Saham

Gabungan (IHSG) dan faktor-faktor yang mempengaruhi IHSG dalam bidang

makro maupun mikro dengan pendekatan regresi nonparametrik, dengan skala

nominal, dan data berdimensi tinggi.

Sehingga, penulis akan menganalisis faktor-faktor yang mempengaruhi

indeks harga saham gabungan (IHSG) menggunakan model Multivariate Adaptive Regression Splines (MARS), karena dengan pendekatan kurva regresi nonparametrik data tersebut berdimensi tinggi, memodelkan variabel-variabel

prediktor yang mempengaruhi IHSG, dan pemilihan model terbaik pada Indeks

Harga Saham Gabungan (IHSG) model MARS menggunakan kriteria Generalized Cross Validation (GCV) minimum.

Berdasarkan uraian tersebut penulis mengambil judul “Estimasi Multivariate Adaptive Regression Splines (MARS) pada Indeks Harga Saham

Gabungan (IHSG)”. Harapannya dengan adanya penelitian ini dapat menekan kerugian para investor dan meningkatkan kepercayaan investor terhadap perbankan

(27)

1.2

Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka permasalahan

penelitian ini dirumuskan sebagai berikut.

1. Bagaimana estimasi Multivariate Adaptive Regression Splines (MARS) pada variabel prediktor Indeks Harga Saham Gabungan (IHSG) terbaik

menggunakan kriteria Generalized Cross Validation (GCV) ?

2. Berapa besar tingkat pentingnya variabel-variabel prediktor terhadap model

terbaik yang diperoleh ?

1.3

Batasan Masalah

Berdasarkan permasalahan yang telah diuraikan, batasan masalah dalam

penelitian ini yaitu hanya mengkaji faktor ekonomi yang mempengaruhi IHSG

yaitu inflasi, tingkat suku bunga di Indonesia, nilai tukar (kurs) tengah rupiah

bulanan terhadap dolar Amerika, indeks saham Dow Jones, indeks saham Nikkei

225, dan indeks saham Hang Seng dari Bulan September 2010 hingga September

2015.

1.4

Tujuan Penelitian

Berdasarkan permasalahan di atas, maka tujuan penelitian ini adalah

sebagai berikut.

1. Mengetahui estimasi Multivariate Adaptive Regression Splines (MARS) pada variabel prediktor Indeks Harga Saham Gabungan (IHSG) terbaik

(28)

2. Mengetahui besar tingkat pentingnya variabel-variabel prediktor terhadap

model terbaik yang diperoleh.

1.5

Manfaat Penelitian

Manfaat yang akan diperoleh dari penelitian ini adalah sebagai berikut.

1. Bagi penulis

a. Menambah dan memperkaya pengetahuan mengenai model Multivariate Adaptive Regression Splines (MARS) serta penerapannya pada Indeks Harga Saham Gabungan (IHSG).

b. Membantu mengaplikasikan ilmu yang telah diperoleh selama di perkuliahan

sehingga menunjang kesiapan untuk terjun ke dalam dunia kerja.

2. Bagi Mahasiswa Matematika

a. Menambah pengetahuan mengenai model Multivariate Adaptive Regression Splines (MARS).

b. Memberikan suatu metode alternatif untuk melakukan pemodelan regresi

nonparametrik menggunakan model Multivariate Adaptive Regression Splines (MARS).

3. Bagi Jurusan Matematika

a. Sebagai bahan studi kasus bagi pembaca dan acuan bagi mahasiswa serta

dapat memberikan bahan referensi bagi pihak perpustakaan.

b. Sebagai bahan bacaan yang dapat menambah ilmu pengetahuan bagi pembaca

(29)

4. Bagi Bank Indonesia

a. Pemodelan kasus Indeks Harga Saham Gabungan (IHSG) dapat membantu

untuk melihat representasi harga saham keseluruhan dan variabel prediktor

yang mempengaruhinya.

b. Sebagai acuan dan informasi para investor mengenai naik turunnya harga

saham.

5. Bagi peneliti selanjutnya

Diharapkan dengan adanya penelitian ini dapat digunakan sebagai bahan

(30)

BAB 2

TINJAUAN PUSTAKA

2.1

Indeks Harga Saham Gabungan (IHSG)

Menurut Sunariyah dalam Astuti et al. (2013) indeks harga saham gabungan (IHSG) adalah suatu rangkaian informasi historis mengenai pergerakan

saham gabungan sampai tanggal tertentu dan mencerminkan suatu nilai yang

berfungsi sebagai pengukur kinerja suatu saham gabungan di bursa efek. Beberapa

faktor makro dan mikro ekonomi yang mempengaruhi indeks harga saham

gabungan (IHSG) yaitu inflasi, tingkat suku bunga di Indonesia, nilai tukar (kurs)

tengah rupiah bulanan terhadap dolar Amerika, indeks saham Dow Jones, indeks

saham Nikkei 225, dan indeks saham Hang Seng.

2.1.1 Inflasi

Menurut Insukindro (1987) inflasi merupakan kecenderungan kenaikan

harga secara umum dan terus menerus. Jika hanya terjadi kenaikan

harga-harga pada satu atau dua sektor, maka belum bisa dikatakan sebagai kenaikan

inflasi. Kenaikan inflasi terjadi jika hampir semua sektor mengalami kenaikan

harga. Terdapat beberapa cara untuk menghitung inflasi, yaitu.

a. Menggunakan Harga Umum

b. Menggunakan Angka Deflator

c. Menggunakan Indeks Harga Konsumen

(31)

e. Menggunakan Indeks Harga dalam Negeri dan Luar Negeri

Dari kelima cara di atas, cara yang paling efektif untuk menghitung inflasi yaitu

menggunakan indeks harga konsumen (IHK) karena mudahnya mendapatkan harga

konsumen dari waktu ke waktu. Berikut rumus untuk menghitung inflasi dengan

menggunakan indeks harga konsumen.

= − −

−

dimana :

: laju inflasi di periode waktu ke-t

: nilai indeks harga konsumen di periode waktu ke-t

− : nilai indeks harga saham konsumen di periode waktu ke- −

2.1.2 Tingkat Suku Bunga di Indonesia

Menurut Kasmir (1998) suku bunga dapat diartikan sebagai balas jasa

yang diberikan oleh bank berdasarkan prinsip konvensional kepada nasabah yang

membeli atau menjual produknya. Sedangkan tingkat suku bunga atau BI rate

menurut publikasi yang dilakukan oleh Bank Indonesia yaitu suku bunga kebijakan

yang mencerminkan sikap kebijakan moneter yang ditetapkan oleh Bank Indonesia

dan diumumkan kepada publik (www.bi.go.id/id/moneter/bi-rate/penjelasan/

contens/default.aspx).

Tingkat bunga, Sunariyah (2006: 80), dinyatakan sebagai presentase uang

pokok per unit waktu. Bunga merupakan suatu ukuran harga sumber daya yang

(32)

biasanya dinyatakan dalam satuan tahun (satu tahun investasi) atau bisa lebih

pendek dari satu tahun. Uang pokok berarti jumlah uang yang diterima dari kreditur

kepada debitur. Menurut ekonom klasikal, permintaan dan penawaran investasi

pada pasar modal menentukan tingkat bunga.

Tingkat bunga akan menentukan keseimbangan antara jumlah tabungan

dan permintaan investasi. Tingkat bunga itu sendiri ditentukan oleh dua kekuatan,

yaitu penawaran tabungan dan permintaan investasi modal (terutama dari sektor

bisnis). Tingkat bunga pada dasarnya berperan sebagai pendorong utama agar

masyarakat bersedia menabung. Jumlah tabungan akan ditentukan oleh tinggi

rendahnya tingkat bunga. Semakin tinggi suku bunga, akan semakin tinggi pula

minat masyarakat untuk menabung, dan sebaliknya. Tinggi rendahnya penawaran

dana investasi ditentukan oleh tinggi rendahnya suku bunga tabungan masyarakat.

BI Rate adalah suku bunga kebijakan yang mencerminkan sikap atau

stance kebijakan moneter yang ditetapkan oleh Bank Indonesia dan diumumkan kepada publik. BI Rate diumumkan oleh Dewan Gubernur Bank Indonesia setiap

Rapat Dewan Gubernur bulanan dan diimplementasikan pada operasi moneter yang

dilakukan Bank Indonesia melalui pengelolaan likuiditas (liquidity management) di pasar uang untuk mencapai sasaran operasional kebijakan moneter.

Sasaran operasional kebijakan moneter dicerminkan pada perkembangan

suku bunga Pasar Uang Antar Bank Overnight (PUAB O/N). Pergerakan di suku bunga PUAB ini diharapkan diikuti oleh perkembangan di suku bunga deposito,

dan pada gilirannya suku bunga kredit perbankan. Dengan mempertimbangkan pula

(33)

menaikkan BI Rate apabila inflasi ke depan diperkirakan melampaui sasaran yang

telah ditetapkan, sebaliknya Bank Indonesia akan menurunkan BI Rate apabila

inflasi ke depan diperkirakan di bawah sasaran yang telah ditetapkan.

2.1.3 Nilai Tukar (Kurs) Rupiah

Menurut Mankiw yang diterjemahkan oleh Liza dan Nurmawan (2006)

menyebutkan bahwa kurs antar dua negara adalah tingkat harga yang disepakati

penduduk kedua Negara untuk saling melakukan perdagangan. Kurs dibedakan

menjadi kurs nominal dan kurs riil. Kurs nominal yaitu harga relatif dari mata uang

dua Negara. Sedangkan kurs riil adalah harga dari barang-barang diantara dua

Negara. Kurs riil menyatakan tingkat dimana bisa memperdagangkan

barang-barang dari suatu Negara untuk barang-barang-barang-barang dari Negara lain. Menurut publikasi

bank Indonesia, nilai kurs dibedakan menjadi dua, yaitu Kurs Transaksi BI dan

Kurs Uang Kertas Asing (UKA) BI. Kurs transaksi BI disajikan dalam bentuk kurs

jual dan kurs beli valas terhadap rupiah, digunakan sebagai acuan transaksi BI

dengan pihak ketiga seperti pemerintah. Sedangkan kurs UKA BI adalah kurs yang

digunakan sebagai indikasi transaksi bank antara Bank Indonesia dengan pihak

ketiga (www.bi.go.id/id/moneter/informasi-kurs/contens/default.aspx).

2.1.4 Indeks Dow Jones

Dow Jones Industrial Average (DJIA) adalah salah satu indeks pasar saham

yang didirikan oleh editor The Wall Street Journal dan pendiri Dow Jones dan

Company Charles Dow. Dow membuat indeks ini sebagai suatu cara untuk mengukur

(34)

Cara penghitungan indeks Dow Jones sebagai berikut.

= ∑

Dimana ∑ adalah jumlah seluruh harga saham dan divisor adalah angka yang

ditentukan oleh Dow Jones sebagai pembagi. Angka pembagi ini selalu

diperbaharui dan disesuaikan dengan perkembangan pasar yang terjadi seperti stock split, pembayaran dividen, pengumuman bonus, dan berita ekonomi lain.

2.1.5 Indeks Nikkei 225

Nikkei 225 adalah sebuah indeks pasar saham di Bursa Efek Tokyo. Indeks

ini telah dihitung oleh harian Nihon Keizai Shimbun (Nikkei) sejak 7 September

1950. Metode perhitungannya menggunakan perhitungan harga rata-rata (unit

dalam yen), dan komponen saham perusahaan yang tercantum dalam indeks akan

ditinjau setahun sekali. Saham perusahaan yang tercatat dalam Indeks Nikkei 225

merupakan saham yang paling aktif diperdagangkan dalam bursa efek Tokyo. Saat

ini, Nikkei adalah indeks yang paling banyak digunakan sebagai panduan bagi

investor ketika akan berinvestasi.

Indeks ini merupakan gabungan dari 225 perusahaan yang terpilih, dengan

persyaratan tertentu. Perusahaan yang terpilih merupakan perusahaan yang

memiliki aset yang besar dan memiliki kredibilitas yang baik di market. Metode

Perhitungan Indeks Nikkei 225 menggunakan rumus sebagai berikut.

(35)

Dimana ∑ jumlah seluruh harga saham yang tercatat di Indeks Nikkei 225 dan

divisor adalah angka yang ditentukan oleh otoritas bursa sebagai bilangan pembagi.

Nilai divisor berdasar perhitungan otoritas bursa per April 2009 adalah sebesar

24.656. Bagi saham-saham yang harganya kurang dari 50 yen, maka harga

sahamnya akan dihitung 50 yen (www.en.wikipedia.org).

2.1.6 Indeks Hang Seng

Hang Seng Index (HSI) adalah indeks komulatif dari 38 saham blue chip

dari Hong Kong stock Market yang merupakan salah satu indeks saham terpercaya, digunakan para investor dan fund manager untuk berinvestasi. Ke-38 constituent stock yang dijadikan indikator berasal dari berbagai sektor seperti Industri,

Finance, Properties, dan sebagainya. Keseluruhan dari nilai saham-saham ini merupakan 70% dari nilai kapitalisasi seluruh nilai saham yang tercatat pada The Stock Exchange of Hong Kong Ltd. (SEHK). Karena itu naik atau turunnya indeks HIS merupakan refleksi performance dari keseluruhan saham-saham yang diperdagangkan. Pemilik lisensi dari Hang Seng Stock index adalah HIS Service Limited, yang merupakan subsidiary dari Hang Seng Bank. HIS pertamakali diperdagangkan pada 24 November 1969.

Hang Seng merupakan indeks saham utama Hongkong yang dihitung

memakai metode value weighted. Indeks Hang Seng dihitung berdasarkan nilai dasar 100 pada tanggal 31 Juli 1964. Indeks ini dibagi menjadi empat subindeks,

yaitu perdagangan dan industri, keuangan, utilitas, dan properti. Hang Seng

merupakan indeks saham kedelapan terbesar di dunia dengan market capitalization

(36)

2.2

Skala Pengukuran

Dalam analisis regresi data dibedakan menjadi dua jenis yaitu kuantitatif

dan kualitatif. Variabel kuantitatif adalah variabel yang dilaporkan dalam bentuk

angka atau metrik. Sedangkan variabel kualitatif adalah variabel yang dilaporkan

tidak dalam keadaan angka atau tidak dalam metrik (Widarjono, 2010).

Menurut Santoso dan Ashari (2005), pengukuran data adalah pemberian

angka pada suatu peristiwa sesuai dengan aturan-aturan tertentu. Dalam

pengukuran akan membentuk suatu skala dan kemudian mentransfer pengamatan

terhadap ciri-ciri kepada skala tersebut. Secara umum, skala pengukuran

dikelompokan menjadi 4 sebagai berikut.

1. Skala Nominal

Skala nominal adalah pemberian skala dimana skala digunakan hanya untuk

membedakan suatu ukuran dari ukuran yang lain tanpa memberikan atribut

lebih besar atau lebih kecil. Skala ini bersifat sejajar atau sama antara

masing-masing skala.

2. Skala Ordinal

Skala ordinal digunakan untuk menyatakan suatu objek untuk memiliki satu

sifat yang dapat dibandingkan dengan objek yang lain. Skala ini lebih baik

daripada skala nominal karena memberikan nilai lebih besar dan lebih kecil,

tetapi tidak dapat mencari selisih atau perbedaan antar skala.

3. Skala Interval

Skala interval adalah skala yang memiliki ciri-ciri skala ordinal tetapi jarak

(37)

mancari perbedaan atau jarak dari masing-masing skala. Pengukuran dari

skala ini biasanya menggunakan alat ukur sehingga jarak masing-masing bisa

dicari. Kelemahan dari skala ini adalah tidak memiliki asal mula yang unik

karena nilai nol bukan merupakan nilai yang mutlak.

4. Skala Rasio

Skala rasio merupakan pengukuran suatu objek dalam dua tolok ukur yang

berbeda berkaitan satu sama lain dengan rasio tetap. Skala rasio

mencerminkan nilai sebenarnya dari data.

Berdasarkan skala pengukuran dalam analisis regresi tersebut, data Indeks

Harga Saham Gabungan (IHSG) merupakan data skala nominal yang termasuk ke

dalam pendekatan regresi nonparametrik.

2.3

Analisis Regresi

Istilah “regresi” pertama kali dikemukakan oleh Sir Francis Galton

(1822-1911), seorang antropolog dan ahli meteorologi terkenal dari Inggris. Dalam

makalahnya yang berjudul “Regression towards mediocrity in hereditary stature”,

yang dimuat dalam Journal of the Anthropological Institute, volume 15, halaman 246 sampai dengan 263, tahun 1885.

Galton menjelaskan bahwa biji keturunan tidak cenderung menyerupai biji

induknya dalam hal besarnya, namun lebih medioker (lebih mendekati rata-rata)

lebih kecil daripada induknya, kalau induknya besar dan lebih besar daripada

(38)

Dalam analisis regresi, diperlukan suatu model yang digunakan untuk

mengetahui hubungan antara variabel tidak bebas (respon) dengan satu atau lebih

variabel bebas (prediktor) dan untuk melakukan peramalan terhadap variabel

respon. Model regresi dapat diperoleh dengan melakukan estimasi terhadap

parameter-parameternya menggunakan metode tertentu. Adapun metode yang

dapat digunakan untuk mengestimasi parameter model regresi, khususnya

parameter model regresi linier (sederhana dan berganda) adalah dengan metode

kuadrat terkecil (least square) dan metode kemungkinan maksimum (maximum likelihood), (Kutner et al., 2004).

2.3.1 Regresi Nonparametrik

Menurut Eubank (1988), pendekatan nonparametrik merupakan metode

pendugaan model yang dilakukan berdasarkan pendekatan yang tidak terikat asumsi

bentuk kurva regresi tertentu dimana kurva regresi hanya diasumsikan smooth

(mulus), artinya termuat di dalam suatu ruang fungsi tertentu sehingga regresi

nonparametrik memiliki fleksibilitas yang tinggi karena data diharapkan mencari

sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor subyektifitas

peneliti. Penggunaan statistik nonparametrik mengabaikan asumsi-asumsi yang

melandasi penggunaan metode statistika parametrik. Tidak semua pola hubungan

dapat didekati dengan pendekatan parametrik, karena tidak adanya suatu informasi

mengenai bentuk hubungan variabel respon dan variabel prediktor. Jika bentuk

kurva tidak diketahui dan pola menyebar maka kurva regresi dapat diduga

menggunakan pendekatan model regresi nonparametrik. Apalagi tes nonparametrik

(39)

parametrik, tes nonparametrik paling berlaku untuk data dalam skala ordinal, dan

berlaku juga untuk sampel data skala nominal. Secara umum model regresi

nonparametrik dapat dituliskan sebagai berikut.

= +

dengan :

: variabel respon pada amatan ke-

: fungsi smooth yang tidak diketahui

: error ke- yang saling bebas

Fungsi regresi hanya diasumsikan termuat dalam suatu ruang fungsi

tertentu, dimana pemilihan ruang fungsi tersebut biasanya dimotivasi oleh sifat

kemulusan (smoothness) yang dimiliki oleh fungsi tersebut. Salah satu pendekatan dalam regresi nonparametrik adalah regresi spline. Spline mempunyai

keunggulan dalam mengatasi pola data yang menunjukkan naik atau turun yang

tajam dengan bantuan titik-titik knot, serta kurva yang dihasilkan relatif mulus

(Hardle, 1990).

2.3.1.1 Regresi Spline

Regresi spline merupakan salah satu metode regresi nonparametrik yang

bertujuan untuk memperkecil keragaman dan mengestimasi perilaku data yang

cenderung berbeda. Pendekatan spline memiliki kemampuan untuk mengatasi pola

data yang menunjukkan naik turun yang tajam dengan bantuan titik-titik knot, serta

(40)

menunjukkan terjadinya perubahan spline untuk menyesuaikan diri secara efektif

terhadap karakteristik lokal dari suatu fungsi atau data. Spline merupakan potongan

(piecewise) polinomial orde dan memiliki turunan yang kontinu dengan knot sampai orde − (Friedman, 1991). Dalam spline univariat dengan K knot

memiliki fungsi basis sebagai berikut.

{ } , { − ₊}

Sehingga model spline dapat ditulis menjadi

= + + + + ∑ − +

=

dimana dan , , … , merupakan titik-titik knot. Sedangkan fungsi dari

truncated power − ₊ adalah

− ₊ = { −_{; −} ; − >

dimana menunjukkan orde polinomial dari fungsi spline. Di setiap titik knot,

diharapkan adanya dari fungsi basis antar satu region dengan region lainnya. Oleh karena itu pada umumnya fungsi basis yang dipilih adalah berbentuk polinomial

dengan turunan − yang kontinu disetiap titik knot.

2.3.1.2 Basis B-Spline

Model regresi = + ∶ = , , . . , , merupakan residual dan

adalah kurva regresi. B-Spline mengatasi kelemahan regresi spline yaitu saat

order spline tinggi, knot yang banyak dan knot yang terlalu dekat akan membentuk

matriks dalam perhitungan yang hampir singular, sehingga persamaan tidak dapat

diselesaikan. Apabila digunakan pendekatan kurva spline truncated dikatakan

.

(41)

regresi nonparametrik, maka kurva regresi dapat ditulis sebagai berikut (Eubank,

1988).

= ∑ − ₊

=

∑ − +−

=

dengan , = , , . . , , dengan < < < adalah titik knot dan

(integer non negatif). Nilai m menunjukkan derajat spline truncated, yang juga merupakan potongan polinomial berderajat − dengan − turunan kontinu

di titik knot. Jika kurva regresi g didekati dengan fungsi B–Spline maka g dapat ditulis menjadi.

= ∑ − ,

+

=

dengan _{− ,} merupakan basis B-Spline.

Cara membangun fungsi B-spline orde m dengan titik-titk knot < < <

< adalah dengan terlebih dahulu mendefinisikan knot tambahan sebanyak 2m,

yaitu ₋ ₋ , … , ₋ , , … , ₊ dimana ₋ ₋ = = = dan ₊ =

= + = , biasanya diambil dari nilai minimum t dan diambil dari nilai

maksimum t. Fungsi B-Spline didefinisikan secara rekursif sebagai berikut. (Botella

dan Shariff, 2003).

− = −

+ − − , − +

+ −

+ − + + , −

, = { , <_{, < ,} +

dengan m adalah derajat dari B–Spline. Untuk = memberikan fungsi B–Spline linier = memberikan fungsi B–Spline kuadratik dan = memberikan

.

(42)

fungsi B–Spline kubik. Untuk mengestimasi koefisien γ dapat didefinisikan matriks sebagai berikut.

� = , _{= ,…,}

=− − ,…,�

atau dapat ditulis sebagai berikut.

� = [ − − , − − , ,

− − , − − , ,

]

Jadi � adalah sebuah matriks berukuran × + .

Sebagai gambaran untuk menjelaskan fungsi B–Spline, misalnya B–Spline linier = ), dengan satu titik knot, pada = , dengan nilai minimum 1

dan nilai maksimum 10. Maka langkahnya adalah menentukan knot tambahan

sebanyak , yaitu diambil dari nilai minimum 1 dan maksimum 10, sehingga knot

menjadi ₋ = = , = , = = , maka matriks yang akan dibentuk

adalah � = _{− ,} , _, , _, , = , , … , yaitu sebuah matriks

dengan ukuran × . Dengan persamaan (2.7), _{− ,} dapat ditulis sebagai

berikut.

− , = −₋ − , + ₋− ,

− , didefinisikan bernilai 0 karena − = (Eubank, 1988). Dan ,

akan bernilai 1 pada t bernilai = sampai dengan = , dan bernilai 0 untuk

yang lain, sehingga dapat ditulis seperti persamaan (2.8) sebagai berikut.

− , = { −

, <

.

(43)

Sedangkan untuk basis _, dengan menggunakan persamaan (2.10) dapat

ditulis sebagai berikut.

, = −₋ , + ₋− ,

dan dapat juga ditulis seperti persamaan (2.12) sebagai berikut.

, = { −

, <

−

, <

Untuk basis _, dapat menggunakan persamaan (2.11) dan dapat ditulis sebagai

berikut.

, = −₋ , + ₋− ,

, = −₋ ,

dan dapat ditulis juga seperti persamaan (2.10) sebagai berikut.

, = {

, <

−

, <

Untuk kurva B–Spline kuadratik dengan 2 titik knot, misalnya pada = dan = dapat dicari dengan cara yang serupa, dengan hasil sebagai berikut.

− , =

{

− −

, <

[ − ] , <

, <

Dengan cara sama, dapat dibuat kurva B–Spline dengan berbagai dan beberapa titik knots.

.

(44)

2.3.1.3 Recursive Partitioning Regression (RPR)

Perhitungan komputasi sangat diperlukan dalam pengolahan data, karena

akan selalu memperoleh hasil yang sesuai dengan algoritmanya. Recursive Partitioning Regression (RPR) merupakan salah satu dari program komputasi yang memiliki keunggulan dalam mengolah data yang berdimensi tinggi. Tujuan dari

RPR adalah menggunakan data untuk mengestimasi subregion dan parameter yang berasosiasi pada setiap subregion.

Pendekatan RPR dimulai dengan menghasilkan model yang memiliki

sejumlah fungsi basis untuk meningkatkan kecocokan model.

̂ _{= ∑}

=

merupakan koefisien dari fungsi basis ke- dan fungsi basis diambil dari

= [ ]

dimana adalah fungsi indikator yang memiliki nilai satu jika dan bernilai

0 untuk .

Misalkan _� adalah prosedur perhitungan lack-of-fit dan fungsi dan [ ] adalah fungsi yang memiliki nilai positif, yaitu

[ ] = { ,_,

Maka menurut Friedman (1991), RPR dapat diimplementasikan ke dalan forward stepwise sesuai dengan algoritma berikut.

.

(45)

Algoritma 1 ←

= � �o: ∗ ← ∞

= − �o:

= :

{ , ( ) > }

← ∑ + [+ − ] + [− − ]

≠

← min ,…, +

< ∗_{, ℎ} ∗_← _; ∗_{← ;} ∗ _{← ;} ∗_←

�n� for

← ∗ [− ∗− ∗ ]₊

+ ← ∗ [+ ∗− ∗ ]+ �n� for

�n� algorithm

Fungsi basis pada RPR memiliki bentuk

= ∏ [ . ( , − )]

=

dengan :

: dejarat interaksi

: tanda pada titik knot (nilainya ± 1)

(46)

, : variabel prediktor

: nilai knots dari variabel prediktor _,

Fungsi basis pada persamaan (2.21) ternyata masih memiliki kelemahan

yaitu tidak kontinu pada knot. Namun fungsi basis tersebut memiliki kesamaan

bentuk dengan fungsi basis dari truncated power pada orde = . Sehingga diperoleh persamaan fungsi basis spline multivariate sebagai berikut.

= ∏ [ . ( , − )]

=

2.3.1.4 Multivariate Adaptive Regression Splines (MARS)

Beberapa modifikasi dilakukan Friedman untuk mengatasi kelemahan

metode Recursive Partitioning Regression (RPR). Dalam mengatasi kelemahan

Recursive Partitioning Regression (RPR)untuk mengidentifikasi fungsi linier dan aditif, Friedman mengusulkan untuk tidak menghapus fungsi basis awal atau induk

(parent) selama pemilihan subregion berlangsung. Jadi, pada iterasi berikutnya

parent dan pilahan subregion dapat dipilah lebih lanjut, sehingga diperoleh

subregion yang saling tumpah tindih. Dengan modifikasi ini, Recursive Partitioning Regression (RPR)dapat menghasilkan model linier dengan pemilihan berulang pada peubah prediktor yang berbeda. Disamping itu dihasilkan pula model

yang lebih fleksibel. Untuk mengatasi adanya diskontinu pada titik knot yang disebabkan perkalian fungsi peubah tunggal H[η], Friedman mengusulkan untuk

mengganti H[η] dengan regresi linier splines berordo satu dengan sisi kiri (-) dan sisi kanan (+) (Friedman, 1991).

(47)

Spline adalah salah satu jenis potongan polinomial, yaitu polinomial yang

memiliki sifat tersegmen. Sifat tersegmen ini memberikan fleksibilitas lebih dari

polinomial biasa, sehingga memungkinkan untuk menyesuaikan diri secara lebih

efektif terhadap karakteristik lokal dari suatu fungsi atau data. Secara umum, fungsi

spline berorde adalah sembarang fungsi yang dinyatakan sebagai berikut.

| = ∑ +

−

=

∑ − +−

ℎ

=

��ngan, − +−

= { − _, − , _<

dengan :

�an adalah konstanta riil

, … , ℎ adalah titik-titik knot.

Maka fungsi spline di atas menunjukkan fungsi S merupakan potongan polinomial berorde k pada subinterval [ , ₊ ], memiliki turunan kontinu

tingkat − , − merupakan fungsi tangga dengan titik–titik lompatan

, … , ℎ, dan fungsi adalah adalah suatu polinomial dengan orde di luar

[ , ].

Recursive Partitioing Regression (RPR) merupakan pendekatan dari fungsi f(t) yang tidak diketahui.

̂ _{= ∑}

=

.

(48)

dengan, = [ ], I[. ] menunjukkan fungsi indikator yang mempunyai

nilai 1 (satu) jika pernyataan benar dan 0 (nol) jika salah, merupakan

koefisien (konstanta) yang ditentukan dalam subregion.

Penentuan knots pada regresi dummy atau regresi kategori dilakukan

secara manual, karena memiliki dimensi data yang rendah dan hal ini tidak akan

mengalami kesulitan, sedangkan untuk data yang berdimensi tinggi terdapat

kesulitan. Untuk mengatasi hal tersebut digunakan model Recursive Partitioning Regression (RPR)karena penentuan knots tergantung (otomatis) dari data. Namun demikian model ini masih terdapat kelemahan yaitu model yang dihasilkan tidak

kontinu pada knots, dan untuk mengatasinya digunakan model MARS.

Multivariate Adaptive Regression Splines (MARS) merupakan pendekatan untuk regresi multivariate nonparametrik yang dikembangkan oleh Friedman. Model MARS merupakan salah satu metode yang fleksibel untuk pemodelan

regresi dengan data berdimensi tinggi dengan variabel prediktor ( ) dimana

dan ukuran sampel . MARS merupakan pengembangan

dari pendekatan Recursive Partitioning Regression (RPR) dan rekursif. Beberapa hal yang perlu diperhatikan dalam menggunakan model MARS sebagai berikut

(Nisa’ dan Budiantara, 2012).

1. Knot

(49)

2. Basis Function / Fungsi Basis (BF)

Basis Function yaitu suatu fungsi yang digunakan untuk menjelaskan hubungan antara variabel respon dan variabel prediktor. Fungsi basis ini

merupakan fungsi parametrik yang didefinisikan pada tiap region. Pada umumnya fungsi basis yang dipilih adalah berbentuk polinomial dengan

turunan yang kontinu pada setiap titik knot. Friedman menyarankan jumlah

maksimum fungsi basis (BF) adalah 2-4 kali jumlah variabel prediktornya.

3. Interaction / Interaksi

Interaksi merupakan hasil perkalian silang antara variabel yang saling

berkorelasi. Friedman membatasi jumlah maksimum interaksi (MI) yang

diperbolehkan yaitu 1, 2, dan 3. Apabila terdapat lebih dari 3 interaksi, maka

akan menimbulkan interpretasi model yang sangat kompleks dan sulit untuk

diinterpretasikan. Maksimum interaksi (MI) yaitu untuk maksimum garis BF

yang dapat melewati knotnya. MI = artinya bahwa di dalam modelnya

maksimum garis BF dapat melewati 1 titik knot, MI = artinya bahwa di

dalam modelnya maksimum garis BF dapat melewati 2 titik knot, dan MI =

artinya bahwa di dalam modelnya maksimum garis BF dapat melewati 3

titik knot.

Pemodelan MARS ditentukan berdasarkan trial and error untuk kombinasi BF, MI, dan MO untuk mendapatkan nilai dari parameter pemulus yang

minimum. MO yaitu minimum jarak antara knot atau minimum observasi antara

knot (MO) sebesar 0, 1, 2, dan 3. M = artinya bahwa di dalam modelnya jarak

(50)

titik knot 1, M = artinya bahwa di dalam modelnya minimum jarak antara titik

knot 2, dan M = artinya bahwa di dalam modelnya minimum jarak antara titik

knot 3 (Nisa’ dan Budiantara, 2012).

Didefinisikan variabel respon dan variabel prediktor , , �an

maka estimator model MARS dapat ditulis sebagai berikut (Otok et al., 2008).

̂ ₌ _{+ ∑} _∏[ _{. (} _, ₋ _)]

= =

dengan :

: fungsi basis induk

: koefisien dari fungsi basis ke-m

: maksimum fungsi basis (nonconstant fungsi basis) : derajat interaksi ke m

: nilainya atau − jika data berada di sebelah kanan atau kiri titik knot

, : variabel prediktor dari dengan observasi m

: nilai knots dari variabel prediktor _,

MARS merupakan pengembangan dari pendekatan Recursive Partitioning Regression (RPR) yang dikombinasikan dengan metode spline, menggunakan algoritma forward stepwise untuk memperoleh fungsi basis dengan cara memodifikasi Algoritma 1 dengan fungsi basis truncated power pada orde = seperti yang terlihat pada Algoritma 2 berikut.

Algoritma 2 ← ; ←

> �∶ ∗ ← ∞

(51)

= − �o:

{ , ⃒

{ ⃒ ( ) > }

← ∑ + [+ − ]++ + [− − ]+

−

=

← min ,…, +

< ∗ _← _; ∗ _{← ;} ∗_{← ;} ∗ _{← �n� if}

�n� for

← ∗ [+ ∗− ∗ ]₊

+ ← ∗ [− ∗− ∗ ]+ �n� loop

�n� algorithm

setelah mendapatkan sejumlah fungsi basis pada Algoritma 2, maka untuk

menyederhanakan fungsi basis dilakukan algoritma backward stepwise agar memenuhi fungsi basis yang memiliki kontribusi kecil terhadap respon dari forward stepwise seperti yang tertera pada Algoritma 3.

Algoritma 3

∗ _{= [ , , … ,}

�]; ∗ ← ∗

∗ _←

{� ⃒ ∗_} (∑ ∗

(52)

= � to �o; � ← ∞; ← ∗

= ; ← − { }

←

⃒ �LOF ( ∑_∗ )

< , ℎ ← ; ∗ _←

< ∗_{, ℎ} ∗_← _; _; ∗ _←

�n� for

← ∗ [+ ∗− ∗ ]₊

+ ← ∗ [− ∗− ∗ ]+ �n� loop

�n� algorithm

sehingga model MARS dinyatakan dalam persamaan berikut:

= + ∑ ∏[ . ( , − )]

= =

+ i

= + ∑ + i

=

dengan = ∏ ₌ [ . ( _, − )]

Dari model MARS pada persamaan (2.22) dalam bentuk matriks dapat

ditulis sebagai berikut (Otok et al., 2008).

= � +

.

(53)

dengan :

= . , , … ,

= , , , … ,

� =

[

∏[ . ( , − )]

=

… ∏[ . ( , − )]

=

∏[ . ( , − )]

=

… ∏[ . ( , − )]

= ⋱

∏[ . ( , − )]

=

… ∏[ . ( , − )]

= ]

Menurut Budiantara et al. (2006) penjabaran model MARS yaitu

̂ ₌ _{+ ∑} ₌ _∏ ₌ _[ _{. (} _, ₋ _)]

̂ ₌ _{+ ∑} _[ _{. (} _, ₋ _)]

=

+ ∑ [ . ( , − )][ . ( , − )]

=

+ ∑ [ . ( , − )]

=

[ . ( ,

− )][ . ( , − )] +

̂ ₌ ₊ _{+ ( , ) +} _{( , , ) +}

Misal diambil BF = 6 dan MI = 2, maka persamaan (2.30) dapat ditulis sebagai

berikut.

̂ ₌ _{+ ∑} _∏[ _{. (} _, ₋ _)]

= =

.

(54)

̂ ₌ _{+ [ . (} _, ₋ _{)] + [ . (} _, ₋ _)]

+ [ . ( , − )] + [ . ( , − )]

+ [ . ( , − )][ . ( , − )]

Menurut Budiantara et al. (2006) dari persamaan (2.28) menunjukkan bahwa penjumlahan pertama meliputi semua fungsi basis untuk satu variabel, penjumlahan

kedua meliputi semua fungsi basis untuk interaksi antara dua variabel, penjumlahan

ketiga meliputi semua fungsi basis untuk interaksi antara tiga variabel dan

seterusnya. Dari model MARS pada persamaan (2.27) dapat dijabarkan berikut.

= ∑ =

merupakan penjumlahan semua fungsi basis untuk satu variabel dan

merupakan spline dengan derajat = yang merepresentasikan fungsi univariat.

Setiap fungsi bivariat dapat ditulis sebagai berikut.

( , ) = ∑ ( , )

=

(55)

yang merepresentasikan penjumlahan semua fungsi basis dua variabel �an .

Untuk fungsi trivariat pada penjumlahan yang ketiga diperoleh dengan

menjumlahkan semua fungsi basis untuk tiga variabel, yang dituliskan sebagai

berikut.

( , , ) = ∑ ( , , )

=

2.4

Pengujian Parameter Model Regresi

Regresi parametrik memiliki asumsi-asumsi yang harus terpenuhi dan

apabila salah satu asumsi tidak terpenuhi maka merupakan regresi nonparametrik.

Asumsi regresi klasik terdiri dari sebagai berikut.

1. Normalitas

Apabila asumsi ini terpenuhi, berarti data yang diambil berasal dari populasi

normal yang berarti bahwa ~ , � . Asumsi kenormalan data diuji dengan

menggunakan uji Kolmogorov-Smirnov. - Hipotesis :

: Residual berdistribusi normal

: Residual tidak berdistribusi normal

- Tingkat signifikansi =0,05

- Statistik uji :

D = supremum |S_x− F |

Sx = probabilitas kumulatif normal

F = probabilitas kumulatif empiris

- Daerah kritis : di tolak apabila nilai D > D_{t e} _,� atau sign < .

(56)

Kenormalan distribusi dari residual dapat pula dilakukan dengan melihat

grafik Normal P-P Plot. Jika asumsi kenormalan dipenuhi, maka harga-harga

residual akan didistribusikan secara random dan terkumpul disekitar garis lurus

yang melalui titik nol.

2. Kesamaan Varian (Homoskedastisitas)

Uji Heterokedastisitas bertujuan menguji apakah dalam model regresi terjadi

ketidaksamaan variansi dari residual satu pengamatan yang lain. Jika variansi dari

residual satu pengamatan ke pengamatan lain tetap, maka disebut dengan

Homoskedastisitas. Sedangkan, apabila antara pengamatan satu ke pengamatan lain

berbeda disebut dengan Heteroskedastisitas. Model yang baik adalah model yang

Homoskedastisitas dan tidak terjadi Heterokedastisitas.

Ada beberapa cara untuk mendeteksi ada atau tidaknyaheterokedastisitas :

a. Uji Glejser

Uji Glejser menggunakan nilai mutlak dari residual (absolut residual) sebagai variabel dependen untuk diregresikan dengan variabel independen. Jika nilai

signifikansi antara variabel independen dengan absolut residual lebih dari 0,05

maka tidak terjadi masalah heteroskedastisitas.

- Hipotesis :

: Tidak ada gejala heteroskedastisitas

: Ada gejala heteroskedastisitas

- Tingkat signifikansi = ,

- Statistik uji : | | = + +

(57)

3. Autokorelasi

Autokorelasiadalah ketergantungan antara residual yang ada sedangkan pada

asumsi kenormalan dinyatakan bahwa residual ( = − ̂ ) pada

variabel-variabel random todak saling berkorelasi atau independen. Salah satu cara untuk

mengetahui apakah error berkorelasi atau tidak adalah dengan pengujian stastistik

Durbin-Watson.

- Hipotesis :

: Tidak terjadi autokorelasi

: Terjadi autokorelasi

- Tingkat signifikansi = ,

- Statistik uji : =∑= � −�− ∑₌ �

- Daerah kritis :

Jika < atau > − , berarti terdapat autokorelasi

Jika < < − , berarti tidak terdapat autokorelasi

Jika < < atau − < < − , tidak ditarik kesimpulan.

4. Multikolinieritas

Multikolinieritas adalah kejadian yang menginformasikan terjadinya

hubungan antara variabel-variabel bebas dan yang terjadi adalah hubungan yang

cukup erat. Sehingga informasi yang dihasilkan dari variabel-variabel yang saling

berhubungan (kolinier) sangat mirip dan sulit dipisahkan pengaruhnya. Hal ini juga

akan mengahasilkan perkiraan keberatian koefisien yang diperoleh. Cara

mengetahui adanya multikolinieritas, dengan memakai harga Faktor Inflasi Varian

(58)

= −

dimana = , , , … ,

= koefisien determinasi ke- (kuadrat dari koefisien korelasi).

Nilai VIF yang semakin besar akan menunjukkan multikolinieritas yang lebih

kompleks. Jika nilai VIF < 10, maka secara signifikan dapat disimpulkan bahwa

tidak terdapat multikolinieritas (Neter, Wasserman, & Kutner, 1989).

2.5

Estimasi Parameter

Menurut Otok et al., (2008) menjelaskan bahwa misalkan menunjukkan variabel respon tunggal tergantung pada variabel prediktor , dimana =

, … , , maka model regresi dapat ditulis sebagai berikut

= , … , +

atas beberapa domain. , … , ⊂ Variabel random diasumsikan

mempunyai rata-rata nol dan variansi �_�.

Estimasi dari kurva regresi secara umum diperoleh melalui penalized least squares (PLS) yakni meminimumkan persamaan berikut

∑( − ) + ∫( )

=

dengan = , maka persamaan (2.35) dapat ditulis sebagai berikut

∑( − )

=

Dari persamaan (2.27), maka ̂ = � , sehingga persamaan (2.36) menjadi

.

(59)

∑( − � ) =

= ( − � ) ( − � ) =

Untuk memperoleh estinator ̂ digunakan metode kuadrat metode kuadrat terkecil

yaitu meminimumkan T, sehingga dinyatakan sebagai berikut.

= ( − � ) ( − � )

= � ₋ �_�� ₋ �_{� +} �_��_�

= � ₋ �_�� ₊ �_��_�

Untuk memperoleh persamaan normal, dilakukan dengan menurunkan parsial

terhadap dengan hasil sebagai berikut.

�

� = − �� + �� =

−�� _{+ �}�_{� =}

−�� _{= �}�_�

Karena �adalah matriks non singular dan parameter smoothing = , maka

̂ = ��_� − _��

dengan � = [ , ( _, − ) ], = , … , , �an = , … , .

Sedangkan estimasi modelnya diperoleh dari persamaan (2.27) yaitu

̂ = �̂

̂ = � ��_� − _��

̂ = �

dengan � = � �� − ��didefinisikan sebagai matriks Hat berukuran × .

(60)

2.6

Generalized Cross Validation

(GCV)

Menurut Jerome H. Friedman (1991) menyebutkan bahwa dalam metode

MARS, Generalized Cross Validation (GCV) adalah kriteria yang paling baik untuk seleksi model tebaik. Nilai GCV didefinisikan sebagai berikut.

= ∑ [ − ̂= ]

[ − ( ̂)]

dimana:

: variabel respon ke

̂ : nilai taksiran variabel respon pada fungsi basis

: banyaknya data

( ̂) : +

: Trace [ − ] +

: nilai ketika setiap fungsi basis mencapai optimasi

2.7

Algoritma MARS

Pembentukan model Multivariate Adaptive Regression Splines (MARS) diawali menentukan knot dan fungsi basis setiap variabel prediktor dengan cara mem-plot setiap variabel prediktor dengan variabel respon. Jumlah knot yang optimum akan menghasilkan model MARS yang baik sehingga kemudian

dilakukan tahap maju (forward) dan tahap mundur (backward) algoritma recursive partitioning yang dimodifikasi, dimana jumlah knot yang optimum disesuaikan

(61)

dengan perilaku data. Gambaran secara umum algoritma MARS adalah sebagai

berikut (Friedman, 1991).

1. Forward Stepwise

Pada model MARS, pemilihan model menggunaan metode stepwise yang terdiri dari forward dan backward. Forward stepwise dilakukan untuk mendapatkan jumlah fungsi basis maksimum dan kriteria pemilihan fungsi basis adalah

meminimumkan Average Sum of Square Residual (ASR). Untuk memenuhi konsep parsemoni dari forward stepwise dengan meminimumkan nilai Generalized Cross-Validation (GCV) (Friedman, 1991).

Pada tahap ini dimungkinkan untuk memasukkan fungsi basis baru ke dalam

model. Maksimal fungsi basis yang akan masuk di dalam model ditentukan oleh

peneliti. Berikut adalah langkah yang dilakukan dalam forward stepwise. a. Misalkan = sebagai fungsi basis awal.

b. Tentukan pasangan fungsi basis dan yang merupakan kombinasi prediktor

dan knot sehingga model memiliki jumlah kuadrat sisaan minimum.

c. Misalkan adalah salah satu fungsi basis yang sudah ada didalam model

sebelumnya. Jika fungsi basis telah dimasukkan, te