Pemodelan Regresi Nonparametrik Dengan B – Spline Dan Mars

(1)

PEMODELAN REGRESI NONPARAMETRIK

DENGAN B – SPLINE DAN MARS

SARAH MAHDIA

090823001

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

(2)

PERSETUJUAN

Judul : PEMODELAN REGRESI NONPARAMETRIK DENGAN

B – SPLINE DAN MARS

Kategori : SKRIPSI

Nama : SARAH MAHDIA

Nomor Induk Mahasiswa : 090823001

Program Studi : S1 STATISTIKA EKSTENSI

Departemen : MATEMATIKA

Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM

(FMIPA) UNIVERSITAS SUMATERA UTARA

Diluluskan di Medan, Juli 2011

Komisi Pembimbing:

Pembimbing 2, pembimbing 1,

Drs. Pasukat Sembiring, M.Si Prof. Suwarno Ariswoyo, M.Si

NIP. 195311319850031002 NIP. 195003211980031001

diketahui/ disetujui oleh

Departemen Matematika FMIPA USU

(3)

PERNYATAAN

PEMODELAN REGRESI NONPARAMETRIK DENGAN B – SPLINE DAN MARS.

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, Juli 2011

SARAH MAHDIA 090823001

(4)

PENGHARGAAN

Syukur Alhamdulillah penulis ucapkan kehadirat ALLAH SWT yang telah memberikan rahmat dan hidayah serta karunia sehingga penyusunan skripsi ini dapat diselesaikan dengan baik dan tepat waktu.

Adapun tujuan dari penulisan skripsi ini adalah merupakan salah satu syarat untuk menyelesaikan Program S1 Statistika Ekstensi pada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara.

Sebagai salah satu perwujudan dari proses pendidikan kemahasiswaan, penyusunan skripsi ini disajikan berdasarkan pembahasan oleh penulis.

Selama dalam penyusunan skripsi ini penulis telah banyak memperoleh bantuan dan bimbingan, untuk itu pada kesempatan ini penulis mau mengucapkan terima kasih yang sebesar-besarnya kepada:

1. Bapak Drs. Suwarno Ariswoyo, M.Si selaku pembimbing 1 pada penulisan skripsi ini yang telah bersedia memberikan arahan, bimbingan dan petunjuk kepada penulis dalam penyelesaian skripsi ini.

2. Bapak Drs. Pasukat Sembiring, M.Si selaku pembimbing 2 pada penulisan skripsi ini yang telah bersedia memberikan arahan, bimbingan dan petunjuk kepada penulis dalam penyelesaian skripsi ini.

3. Bapak Drs. Henry Rani Sitepu, M.Si dan Bapak Drs. H. Haluddin Panjaitan selaku dosen penguji yang telah memberikan masukan dalam penyelesaian skripsi ini.

4. Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU.

5. Bapak Prof. Dr. Tulus, M.Si selaku Ketua Departemen Matematika FMIPA USU. 6. Bapak Drs. Pengarapan Bangun, M.Si selaku Ketua Pelaksana Jurusan Progam

S1 – Statistika Ekstensi.

7. Kepada Ayahanda Dr. H. Hamonangan Nainggolan,M.Sc dan Ibunda Hj. Jusridawati Situmeang yang telah memberikan motivasi dan kekuatan dalam menyelesaikan skripsi, serta Abangku Yasser Hudan, adik-adikku Pauzi Ibrahim, Aisyah Hudaya, dan Maulana As-salam atas dukungan yang telah diberikan.

(5)

9. Semua pihak yang terkait dalam penyelesaian skripsi ini.

Sepenuhnya penulis menyadari bahwa dalam penyusunan skripsi ini masih banyak terdapat kekurangan. Untuk itu penulis mengharapkan saran dan kritik yang bersifat membangun, dimana saran dan kritik tersebut dapat dimanfaatkan untuk kemajuan ilmu pengetahuan pada saat ini dan yang akan datang.

Semoga penulisan skripsi ini dapat memberikan manfaat dan berguna bagi pembaca dan penulis khususnya. Akhir kata penulis mengucapkan banyak terima kasih.

Medan, Juli 2011

(6)

ABSTRAK

Analisa regresi digunakan untuk melihat pengaruh variabel independen terhadap variabel dependent dengan terlebih dahulu melihat pola hubungan variabel tersebut. Hal ini dapat dilakukan dengan melalui dua pendekatan. Pendekatan yang paling umum dan seringkali digunakan adalah pendekatan parametrik. Pendekatan parametrik mengasumsikan bentuk model yang sudah ditentukan. Apalabila tidak ada informasi apapun tentang bentuk dari fungsi regresi, maka pendekatan yang digunakan adalah pendekatan nonparametrik (Hardle, 1990). Karena pendekatan tidak bergantung pada asumsi bentuk kurva tertentu, sehingga memberikan fleksibilitas yang lebih besar. Tujuan penelitian ini adalah mendapatkan model terbaik mengenai nilai ujian tengah semester (UTS) terhadap nilai ujian akhir semester (UAS) mahasiswa Jurusan Kimia Industri semester genap tahun ajaran 2009 / 2010, Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara dengan analisis regresi linear sederhana, kuadratik, dan kubik, sedangkan regresi nonparametrik digunakan B – Spline dan Multivariate Adaptive Regression Splines (MARS). Secara keseluruhan, model terbaik dipilih berdasarkan koefisien determinasi terbesar. Namun demikian untuk MARS, model terbaik dipilih berdasarkan pada GCV, minimum MSA, dan koefisien determinasi terbesar.

(7)

ABSTRACT

Regression analysis is constructed for capturing the influences of independent variables to

dependent ones. It can be done by looking at the relationship between those variables. This task

of approximating the mean function can be done essentially in two ways. The quiet often use

parametric approach is to assume that the mean curve has some prespecified functional forms.

Alternatively, nonparametrik approach, .i.e., without reference to a specific form, is used when

there is no information of the regression function form (Hardle, 1990). Therefore nonparametric

approach has more flexibilities than the parametric on. The aim of this research is to find the

best fit model that captures relationship between admission test score to the GPA. The purpose

of this research is to obtain the best model abaout mark on midterm against final exam score

student majoring in industrial chemistry second 2009/2010 academic year,Faculty of

Mathematics and Natural Science northem Sumatera with a simple linear, quadratic,and cubic

regression analysis. Those two approaches were used here. In the parametric approach, we use

simple linear, quadric cubic regression, and in the nonparametric ones, we use B – Spline and

Multivariate Adaptive Regression Splines (MARS). Overall, the best model was chosen based on

the maximum determinant coefficient. However, for MARS, the best model was chosen based on

the GCV, minimum MSE, maximum determinant coefficient.

(8)

DAFTAR ISI

Halaman

Persetujuan i

Pernyataan ii

Penghargaan iii

Abstrak v

Abstract vi

Daftara Isi vii

Daftar Tabel viii

Bab I Pendahuluan 1

1.1LatarBelakang 1

1.2Perumusan Masalah 2

1.3Tinjauan Pustaka 2

1.4Tujuan Penelitian 3

1.5Kontribusi Penelitian 3

1.6Metode Penelitian 3

Bab II Landasan Teori 4

2.1 Model Regresi Nonparametrik 4

2.2 Rgresi Spline 6

2.3 Basis B - Spline 7

2.4 Multivariate Adaptive Regression Splines (MARS) 10

2.5 Memilih Persamaan Regresi Terbaik 13

Bab III Pembahasan 16

3. Data dan Pembahasan 16

3.1 Pola Hubungan Nilai UTS Terhadap UAS dengan Pemodelan B – Spline. 25

3.2 Pola Hubungan Nilai UTS Terhadap UAS dengan Pemodelan MARS. 27

Bab IV Kesimpulan dan Saran 29

4.1 Kesimpulan 29

4.2 Saran 30

(9)

Daftar Tabel

Halaman

(10)

ABSTRAK

Analisa regresi digunakan untuk melihat pengaruh variabel independen terhadap variabel dependent dengan terlebih dahulu melihat pola hubungan variabel tersebut. Hal ini dapat dilakukan dengan melalui dua pendekatan. Pendekatan yang paling umum dan seringkali digunakan adalah pendekatan parametrik. Pendekatan parametrik mengasumsikan bentuk model yang sudah ditentukan. Apalabila tidak ada informasi apapun tentang bentuk dari fungsi regresi, maka pendekatan yang digunakan adalah pendekatan nonparametrik (Hardle, 1990). Karena pendekatan tidak bergantung pada asumsi bentuk kurva tertentu, sehingga memberikan fleksibilitas yang lebih besar. Tujuan penelitian ini adalah mendapatkan model terbaik mengenai nilai ujian tengah semester (UTS) terhadap nilai ujian akhir semester (UAS) mahasiswa Jurusan Kimia Industri semester genap tahun ajaran 2009 / 2010, Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara dengan analisis regresi linear sederhana, kuadratik, dan kubik, sedangkan regresi nonparametrik digunakan B – Spline dan Multivariate Adaptive Regression Splines (MARS). Secara keseluruhan, model terbaik dipilih berdasarkan koefisien determinasi terbesar. Namun demikian untuk MARS, model terbaik dipilih berdasarkan pada GCV, minimum MSA, dan koefisien determinasi terbesar.

(11)