UNIVERSITAS BINA NUSANTARA
_________________________________________________________________________
Program Studi Ganda Teknik Informatika - Statistika Skripsi Sarjana Program Ganda Semester Ganjil 2005/2006
ANALISIS PENENTUAN NILAI PARAMETER RIDGE
REGRESSION K YANG OPTIMUM DENGANR LANGUAGE
Jessica Kusuma Dewi (0500603134)
ABSTRAK
Saat ini, statistika telah banyak diterapkan di segala bidang. Salah satu metode statistika yang banyak digunakan adalah persamaan regresi yang digunakan untuk peramalan. Salah satu masalah yang sering terjadi pada persamaan linier regresi berganda adalah multikolinieritas atau adanya hubungan di antara peubah-peubah bebas pada persamaan regresi. Masalah multikolinieritas dapat diatasi dengan menggunakan metode ridge regression. Pada umumnya penentuan parameter k pada metode ridge regression dengan menggunakan ridge trace yang bersifat subjektif sehingga penentuan nilai parameter k dapat berbeda-beda antara individu yang satu dengan yang lain. Penulis melihat masalah ini dan menawarkan solusi untuk menentukan nilai optimum dari parameter k dengan menggunakan algoritma yang berdasarkan metode Newton-Raphson dengan meminimumkan fungsi mean squared estimation error dan fungsi mean squared prediction error.
Tujuan dari penulisan skripsi ini adalah untuk menganalisis penentuan nilai parameter ridge regression k yang optimum sehingga dapat mengestimasi persamaan yang tepat pada regresi linier berganda dengan masalah multikolinieritas di antara peubah-peubah bebasnya.
Tahapan analisis yang dilakukan meliputi studi kepustakaan, perencanaan prosedur analisis dan perancangan program statistika yang digunakan untuk membantu pengolahan data agar hasil analisis lebih tepat dan akurat.
Hasil yang diperoleh dari analisis ini adalah estimasi koefisien regresi linier berganda yang tepat dengan menggunakan metode ridge regression dan nilai parameter k optimum sebagai solusi dari masalah multikolinieritas di antara peubah-peubah bebas persamaan tersebut.
Kata kunci :
Ridge Regression, Parameter k, Mean Squared Error, Newton-Rhapson Method.
brought to you by CORE View metadata, citation and similar papers at core.ac.uk
provided by Binus University Repository
KATA PENGANTAR
Segala puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas segala berkat, kasih, dan penyertaan-Nya dalam pembuatan skripsi ini, sehingga penulisan skripsi ini dapat terselesaikan dengan baik. Skripsi yang berjudul
”Perancangan Program Aplikasi Untuk Menentukan Parameter K Pada Ridge Regression”
ini disusun sebagai salah satu syarat dalam menyelesaikan program studi ganda Teknik Informatika dan Statistika, jenjang pendidikan Strata 1 di Universitas Bina Nusantara, Jakarta.
Penulisan skripsi ini tidak terlepas dari keterlibatan pihak-pihak yang telah banyak membantu. Untuk itu penulis mengucapkan banyak terima kasih antara lain ditujukan kepada:
1. Rektor Universitas Bina Nusantara, Bapak Prof. Dr. Drs. Gerardus Polla, M.App.Sc.
yang telah memberikan kesempatan kepada penulis untuk mendapatkan pengajaran dan juga memberikan kesempatan untuk membuat penulisan skripsi ini.
2. Dekan Fakultas MIPA, Bapak Wikaria Gazali, S.Si.,MT yang telah memberikan dukungan dalam penulisan skripsi ini.
3. Ketua Jurusan Teknik Informatika, Bapak Ir. Sablin Yusuf, M.Sc,M.ComSc. yang juga telah membimbing kami selama mendapat pengajaran.
4. Ketua Jurusan Statistika, Bapak Ngarap Imanuel Manik, Drs., M.Kom banyak membimbing saya selama dalam proses perkuliahan.
5. Dosen Pembimbing, Bapak Stanislaus S. Uyanto, Ph.D dan Bapak Ngarap Imanuel Manik, Drs., M.Kom yang telah banyak memberikan pengarahan selama penulisan skripsi sehingga penulisan skripsi ini dapat terselesaikan dengan baik.
6. Para dosen yang selama ini telah memberikan bimbingan pengajaran kepada penulis dimana bimbingan ini merupakan bekal bagi penulis dalam melakukan penulisan skripsi ini.
7. Orang tua beserta keluarga penulis yang telah banyak memberikan dorongan, baik dorongan spiritual maupun material selama penulisan skripsi ini.
8. Rekan-rekan penulis yang telah memberikan dorongan moril dan banyak membantu penulis dalam menyelesaikan penulisan skripsi ini.
9. Semua pihak yang telah membantu penulis dalam menyelesaikan penulisan skripsi ini yang tidak dapat penulis sebutkan satu per satu.
Dengan segala keterbatasan yang dimiliki, penulis menyadari bahwa dalam penulisan skripsi ini masih banyak terdapat kekurangan dan kelemahan. Oleh karena itu, penulis mengharapkan saran dan kritik yang membangun dari semua pihak guna kesempurnaan materi maupun cara penulisan skripsi ini.
Akhir kata, penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak dalam upaya menambah wawasan dan ilmu pengetahuan.
Jakarta, 25 Januari 2006 Penulis
DAFTAR ISI
Halaman
Abstrak iv
Kata Pengantar v
Daftar Isi vi
Daftar Tabel viii
Daftar Gambar ix
Daftar Lampiran x
BAB 1 PENDAHULUAN 1
1.1 Latar Belakang Masalah 1
1.2 Perumusan Masalah 3
1.3 Ruang Lingkup Penelitian 4
1.4 Tujuan Penelitian 4
1.4.1 Tujuan Umum Penelitian 4
1.4.2 Tujuan Khusus Penelitian 5
1.5 Manfaat Penelitian 5
1.6 Definisi Operasional 6
1.7 Sistematika Penulisan 7
BAB 2 LANDASAN TEORI 8
2.1 Regresi 8
2.1.1 Pengertian Persamaan Regresi 8 2.1.2 Pengertian Regresi Linier dan Regresi Non Linier 8
2.1.3 Regresi Linier Sederhana 8
2.1.3.1 Pengertian Regresi Linier Sederhana 8 2.1.3.2 Persamaan Regresi Linier Sederhana 9 2.1.3.3 Pendugaan Koefisien Regresi 9
2.1.4 Regresi Linier Berganda 10
2.1.4.1 Pengertian Regresi Linier Berganda 10
2.1.4.2 Persamaan Regresi Linier Berganda 10 2.1.5 Pendugaan Koefisien Regresi Berganda 11
2.1.6 Koefisien Korelasi 13
2.1.7 Koefisien Determinasi 14
2.1.8 Masalah Regresi Linier Berganda 15
2.1.8.1 Otokorelasi 16
2.1.8.2 Heterokedastisitas 17
2.1.8.3 Multikolinieritas 18
2.2 Variance Inflation Factor 21
2.3 Ridge Regression 22
2.3.1 Standarized Regression Model 23
2.3.2 Keakuratan Ridge Regression 26
2.3.3 Ridge Trace 28
2.4 Metode Newton-Rhapson 29
2.5 R Language 30
2.6 Penelitian Relevan 30
BAB 3 METODOLOGI ANALISIS 31
3.1 Analisis Permasalahan 31
3.2 Tahapan Analisis 31
3.3 Teknik Pengadaan Data 32
3.4 Teknik Analisis Data 33
3.4.1 Koefisien Korelasi 34
3.4.2 Variance Inflation Factor 34
3.4.3 Ridge Regression 34
3.4.4 Mean Squared Estimation Error dan Mean Squared Prediction Error
35
BAB 4 HASIL DAN PEMBAHASAN 36
4.1 Proses Analisis Data Longley 36
4.1.1 Penyajian Data Set Longley 36
4.1.2 Proses Koefisien Korelas 37 4.1.3 Proses Variance Inflation Factor 38
4.1.4 Proses Menghitung k Optimum 39
4.2 Proses Analisis Data Kandungan Lemak dengan Tiga Peubah 53
4.2.1 Penyajian Data 53
4.2.2 Proses Koefisien Korelasi 54
4.2.3 Proses Variance Inflation Factor 56
4.2.4 Proses Menghitung k Optimum 57
4.3 Spesifikasi Sarana Untuk Analisis 70
4.3.1 Perangkat Keras 70
4.3.2 Perangkat Lunak 70
BAB 5 SIMPULAN DAN SARAN
5.1 Simpulan 71
5.2 Saran 71
DAFTAR ACUAN 73
DAFTAR PUSTAKA 74
RIWAYAT HIDUP 75
LAMPIRAN
DAFTAR TABEL
Halaman
Tabel 4.1 Data Longley 36
Tabel 4.2 Matriks Regresi X 40
Tabel 4.3 Matriks Transpose X 40
Tabel 4.4 Matriks X Transpose * X 41
Tabel 4.5 Data Kandungan Lemak dengan 3 Peubah 54
Tabel 4.6 Matriks X Transpose 2 58
Tabel 4.7 Perbandingan Nilai Fungsi MSEE 69
Tabel 4.8 Perbandingan Nilai Fungsi MSPE 69
DAFTAR GAMBAR
Halaman
Gambar 2.1 Contoh Ridge Trace 28
Gambar 4.1 Ridge Trace Data Longley (MSEE) 51
Gambar 4.2 Ridge Trace Data Longley (MSPE) 52
Gambar 4.3 Ridge Trace Data Kandungan Lemak (MSEE) 67 Gambar 4.4 Ridge Trace Data Kandungan Lemak (MSPE) 68
DAFTAR LAMPIRAN
Halaman
Lampiran 1 Listing Program Data Longley L.1 Lampiran 2 Listing Program Data Kandungan Lemak L.2