FUNGSI KERNEL PADA METODE REGRESI NON-PARAMETRIK
SKRIPSI
INDRI HAFSARI 090823018
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
FUNGSI KERNEL PADA METODE REGRESI NON-PARAMETRIK
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar sarjana sains
INDRI HAFSARI 090823018
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
PERSETUJUAN
Judul : FUNGSI KERNEL PADA METODE REGRESI
NON-PARAMETRIK
Kategori : SKRIPSI
Nama : INDRI HAFSARI
Nomor Induk Mahasiswa : 090823018
Program Studi : S1 STATISTIKA EKSTENSI
Departemen : MATEMATIKA
Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM
(FMIPA) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, Juli 2011
Komisi Pembimbing:
Pembimbing 2, pembimbing 1,
Drs. Djakaria Sebayang, M.Si Prof. Dr. Drs. Iryanto, M.Si
NIP. 195112271985031002 NIP. 194604041971071001
diketahui/ disetujui oleh
Departemen Matematika FMIPA USU
PERNYATAAN
FUNGSI KERNEL PADA METODE REGRESI NON-PARAMETRIK
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan
ringkasan yang masing-masing disebutkan sumbernya.
Medan, Juli 2011
INDRI HAFSARI 090823018
PENGHARGAAN
Syukur Alhamdulillah penulis ucapkan kehadirat ALLAH SWT yang telah memberikan rahmat
dan hidayah serta karunia sehingga penyusunan skripsi ini dapat diselesaikan dengan baik dan
tepat waktu.
Adapun tujuan dari penulisan skripsi ini adalah merupakan salah satu syarat untuk
menyelesaikan Program S1 Statistika Ekstensi pada Fakultas Matematika dan Ilmu Pengetahuan
Alam Universitas Sumatera Utara.
Sebagai salah satu perwujudan dari proses pendidikan kemahasiswaan, penyusunan
skripsi ini disajikan berdasarkan pembahasan oleh penulis.
Selama dalam penyusunan skripsi ini penulis telah banyak memperoleh bantuan dan
bimbingan, untuk itu pada kesempatan ini penulis mau mengucapkan terima kasih yang
sebesar-besarnya kepada:
1. Bapak Prof. Dr. Drs. Iryanto, M.Si selaku pembimbing 1 pada penulisan skripsi ini yang telah bersedia memberikan arahan, bimbingan dan petunjuk kepada penulis dalam penyelesaian skripsi ini.
2. Bapak Drs. Djakaria Sebayang, M.Si selaku pembimbing 2 pada penulisan skripsi ini yang telah bersedia memberikan arahan, bimbingan dan petunjuk kepada penulis dalam penyelesaian skripsi ini.
3. Bapak Drs. Ujian Sinulingga, M.Si dan Ibu Dra. Elly Rosmaini, M.Si selaku dosen penguji yang telah memberikan masukan dalam penyelesaian skripsi ini.
4. Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU.
5. Bapak Prof. Dr. Tulus, M.Si selaku Ketua Departemen Matematika FMIPA USU. 6. Bapak Drs. Pengarapan Bangun, M.Si selaku Ketua Pelaksana Jurusan Progam
S1Statistika Ekstensi.
7. Kepada Ayahanda M. Jamil dan Ibunda Elfidarna serta adik-adik atas bimbingan moral dan materil yang telah diberikan.
8. Seluruh staf pengajar di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara Khususnya Departemen Matematika Jurusan Statistika Ekstensi.
Sepenuhnya penulis menyadari bahwa dalam penyusunan skripsi ini masih banyak
terdapat kekurangan. Untuk itu penulis mengharapkan saran dan kritik yang bersifat
membangun, dimana saran dan kritik tersebut dapat dimanfaatkan untuk kemajuan ilmu
pengetahuan pada saat ini dan yang akan datang.
Semoga penulisan skripsi ini dapat memberikan manfaat dan berguna bagi pembaca dan
penulis khususnya. Akhir kata penulis mengucapkan banyak terima kasih.
Medan, Juli 2011
ABSTRAK
Statistik nonparametrik merupakan kumpulan metode untuk analisis data yang menawarkan
sebuah pendekatan dengan cara-cara pengambilan keputusan. Ada beberapa metode dalam
mengestimasi regresi nonparametrik salah satunya metode kernel. Metode kernel tersebut
digunakan untuk mengestimasi fungsi regresi bila sebuah data Y diberikan. Metode ini juga
digunakan untuk mengestimasi fungsi regresi yang sulit diprediksi bentuknya. Metode kernel
memiliki beberapa fungsi, diantaranya Gaussian, Norm, Quadratik, Spline, Multi quadratic dan
lain-lain. Pemilihan bandwith dilakukan dengan cara meminimumkan bias dan varians. Dalam
penelitian ini digunakan salah satu dari fungsi tersebut yaitu fungsi kernel Gaussian. Karena
fungsi ini memiliki kemudahan dalam penggunaannya. Data yang digunakan dalam penelitian ini
adalah data nonparametrik. Dari hasil penelitian yang dapat dilakukan hanyalah memprediksi
dengan kata lain hasil perhitungan hanya berupa harapan. Dari hasil penelitian didapat SSE
sebesar 3.23 x 10-8. Pengestimasian dalam tulisan ini menggunakan excel.
ABSTRACT
Nonparametric statistics is a collection of methods for data analysis offers an approach to ways of decision making. There are several methods in estimating the nonparametric regression kernel methods one of them. Kernel method is used to estimate the regression function when a data Y is given. This method is also used to estimate the regression function are difficult to predict its form. Kernel method has several functions, including Gaussian, Norm, Quadratik, Spline, Multi quadratic and others. The selection of bandwidth is done by minimizing bias and variance. This study used one of these functions is the Gaussian kernel function. Since this function has the ease of use. The data used in this study is nonparametric data. From the results of research can do is predict the results of calculations in other words just a hope. Research results obtained from the SSE at 3:23 x 10-8. Estimating in this paper using excel.
DAFTAR ISI
Halaman
Persetujuan i
Pernyataan ii
Penghargaan iii
Abstrak v
Abstract vi
Daftara Isi vii
Daftar Tabel viii
Daftar Gambar ix
Bab I Pendahuluan 1
1.1LatarBelakang 1
1.2Perumusan Masalah 2
1.3Tinjauan Pustaka 2
1.4Tujuan Penelitian 3
1.5Kontribusi Penelitian 3
1.6Metode Penelitian 4
Bab II Landasan Teori 5
2.1 Regresi Non-Parametrik 5
2.2 Rgresi Kernel 7
2.3 Fungsi Kernel 8
2.4 Pemilihan Bandwith 12
2.5 Solver 13
Bab III Pembahasan 15
3.1 Pembahasan 15
Bab IV Kesimpulan dan Saran 26
4.1 Kesimpulan 26
4.2 Saran 26
Daftar Tabel
Halaman
Tabel 1. Contoh data 15
Tabel 2. Nilai K(x, X1)-K(x, X5) 18
Tabel 3. Nilai kuadrat kesalahan 20
Daftar Gambar
Halaman
Gambar 1. Grafik Gaussian 9
Gambar 2. Grafik Norm 9
Gambar 3. Grafik Quadratic 10
Gambar 4. Grafik Multi quadratic 10
Gambar 5. Grafik Spline 11
Gambar 6. Grafik Epanechnikov 11
Gambar 7. Grafik Tri-cube 12
Gambar 8. Contoh kurva bandwith 13
Gambar 9. Posisi perangkat solver 14
Gambar 10. Grafik Gaussian kernel 16
Gambar 11. Formulasi fungsi excel y menggunakan formula regresi kernel untuk x = 0 18
Gambar 12. Tahap petama penggunaan MS Excel Solver 22
Gambar 13. Tahapan kedua penggunaan MS Excel Solver 22
Gambar 14. Tahapan ketiga penggunaan MS Excel Solver 23
ABSTRAK
Statistik nonparametrik merupakan kumpulan metode untuk analisis data yang menawarkan
sebuah pendekatan dengan cara-cara pengambilan keputusan. Ada beberapa metode dalam
mengestimasi regresi nonparametrik salah satunya metode kernel. Metode kernel tersebut
digunakan untuk mengestimasi fungsi regresi bila sebuah data Y diberikan. Metode ini juga
digunakan untuk mengestimasi fungsi regresi yang sulit diprediksi bentuknya. Metode kernel
memiliki beberapa fungsi, diantaranya Gaussian, Norm, Quadratik, Spline, Multi quadratic dan
lain-lain. Pemilihan bandwith dilakukan dengan cara meminimumkan bias dan varians. Dalam
penelitian ini digunakan salah satu dari fungsi tersebut yaitu fungsi kernel Gaussian. Karena
fungsi ini memiliki kemudahan dalam penggunaannya. Data yang digunakan dalam penelitian ini
adalah data nonparametrik. Dari hasil penelitian yang dapat dilakukan hanyalah memprediksi
dengan kata lain hasil perhitungan hanya berupa harapan. Dari hasil penelitian didapat SSE
sebesar 3.23 x 10-8. Pengestimasian dalam tulisan ini menggunakan excel.
ABSTRACT
Nonparametric statistics is a collection of methods for data analysis offers an approach to ways of decision making. There are several methods in estimating the nonparametric regression kernel methods one of them. Kernel method is used to estimate the regression function when a data Y is given. This method is also used to estimate the regression function are difficult to predict its form. Kernel method has several functions, including Gaussian, Norm, Quadratik, Spline, Multi quadratic and others. The selection of bandwidth is done by minimizing bias and variance. This study used one of these functions is the Gaussian kernel function. Since this function has the ease of use. The data used in this study is nonparametric data. From the results of research can do is predict the results of calculations in other words just a hope. Research results obtained from the SSE at 3:23 x 10-8. Estimating in this paper using excel.
BAB I
PENDAHULUAN
1.1Latar Belakang
Analisis regresi merupakan analisis dalam statistika yang sangat banyak digunakan untuk
melihat hubungan antara Y variabel respon dengan X variabel-variabel prediktornya. Untuk
sebuah sampel berukuran n data pengamatan (X1, Y1),…, (Xn, Yn), hubungan antara
variabel-variabel tersebut dapat dinyatakan dengan model regresi Y = m(X) + ε. Dimana m adalah fungsi
matematik yang disebut sebagai fungsi regresi yang tidak diketahui dan ε adalah error.
Ada beberapa metode pendekatan regresi nonparametrik diantaranya spline, kernel,
k-nearest neigborhood dan lain-lain. Diantara metode-metode pendekatan tersebut, regresi
nonparametrik dengan pendekatan spline dan kernel merupakan metode yang sering digunakan.
Kedua metode tersebut memiliki keunggulan masing-masing. Pendekatan kernel memiliki
bentuk yang lebih fleksibel dan perhitungan matematisnya mudah disesuaikan. Sedangkan
pendekatan spline dapat menyesuaikan diri secara efektif terhadap data tersebut, sehingga
didapatkan hasil yang mendekati kebenaran.
Statistika nonparametrik adalah suatu cabang ilmu statistik yang mempelajari
prosedur-prosedur inferensial dengan kesahihan yang tidak bergantung kepada asumsi-asumsi yang kaku.
Misalnya syarat kenormalan suatu data, atau ragam yang sama, dan lain-lain. Tetapi cukup pada
asumsi yang umum. Terdapat dua tipe utama prosedur statistik yang dianggap nonparametrik
yaitu nonparametrik murni dan bebas sebaran.
Berdasarkan uraian diatas, penulis mengambil judul “Fungsi Kernel Pada Metode
1.2 Perumusan Masalah
Sesuai dengan latar belakang yang telah dikemukakan sebelumnya, maka masalah yang akan
dibahas dalam penelitian ini adalah bagaimana model fungsi kernel pada metode regresi
nonparametrik.
1.3 Tinjauan Pustaka
Regresi kernel adalah teknik statistik nonparametrik untuk menaksir nilai ekspektasi bersyarat
suatu variabel random. Nilai ekspektasi ini lazim dinotasikan E(Y|X) [7]. Tujuan regresi kernel
adalah mendapatkan hubungan nonlinier antara X dengan Y. Ekspektasi bersyarat Y terhadap X
dinyatakan sebagai berikut:
E(Y|X) = m(X) atau yˆ= m(x) (1)
Persamaan m(x) tidak dapat diwujudkan, tetapi yˆ dapat dihitung (Pada regresi linier,
E(Y|X) = X b atau yˆ = X b). Penaksir respon, yaitu yˆ= m(x), dapat dihitung menggunakan
formula sebagai berikut :
(2)
Keterangan: K adalah kernel
Tingkat kemulusan mˆ ditentukan oleh fungsi kernel K dan lebar jendela h yang disebut h
parameter pemulus, tetapi pengaruh kernel K tidak sedominan parameter pemulus h. Nilai h kecil
memberikan grafik yang kurang mulus sedangkan nilai h besar memberikan grafik yang sangat
mulus [2].
Dalam jurnal Suyono, Subanar [1] dan Suparti, Sudargo [2] menguraikan tentang model
regresi Y = m(X) + ε dengan ε bebas random tidak terobservasi yang diasumsikan tidak
berkorelasi dengan mean 0. Dalam regresi nonparametrik fungsi regresi m umumnya hanya
diasumsikan termuat dalam suatu ruang fungsi yang berdimensi tak hingga.
Terdapat beberapa macam teknik smoothing antara lain regressogram, barisan estimator
ortogonal dan estimator kernel. Estimator kernel untuk fungsi regresi m diberikan pada persaman
(2).
Kriteria pemilihan fungsi kernel yang baik berdasarkan pada resiko kernel minimum
yang dapat diperoleh dari kernel optimal atau kernel-kernel dengan variansi minimum [3].
Solver yang digunakan untuk membantu dalam hal perhitungan yang terdapat dalam
program Microsoft Excel [4].
1.4 Tujuan Penelitian
Tujuan penelitian ini adalah untuk mengetahui peranan model fungsi kernel pada metode regresi
non-parametrik.
1.5 Kontribusi Penelitian
Hasil penelitian ini diharapkan dapat memperkaya dan menambah wawasan dalam bidang
1.6 Metode Penelitian
Metode yang digunakan dalam penelitian ini adalah:
- Melakukan studi literatur dari buku, jurnal dan artikel tentang fungsi kernel dan metode
regresi non-parametrik.
- Mendefinisikan fungsi kernel dalam bidang regresi non-parametrik.
BAB II
LANDASAN TEORI
2.1 Regresi Non-Parametrik
Statistik nonparametrik disebut juga statistik bebas sebaran. Statistik nonparametrik tidak
mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik dapat digunakan pada
data yang memiliki sebaran normal atau tidak. Statistik nonparametrik biasanya digunakan untuk
melakukan analisis pada data nominal atau ordinal.
Metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan
mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistik parametrik, terutama
yang berkaitan dengan distribusi normal. Nama lain yang sering digunakan untuk statistik
nonparametrik adalah statistik bebas distribusi.
Analisa regresi adalah Analisis statistik yang mempelajari bagaimana membangun
sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan suatu
fenomena alami atas dasar fenomena yang lain. Analisa regresi merupakan salah satu teknik
statistik yang digunakan secara luas dalam ilmu pengetahuan terapan. Regresi di samping
digunakan untuk mengetahui bentuk hubungan antar peubah regresi, juga dapat dipergunakan
untuk peramalan.
Dalam banyak hal, pengamatan-pengamatan yang akan dikaji tidak selalu memenuhi
asumsi-asumsi yang mendasari uji-uji parametrik sehingga kerap kali dibutuhkan teknik-teknik
inferensial dengan validitas yang tidak bergantung pada asumsi-asumsi yang kaku. Dalam hal
walaupun tidak diperlukan pemenuhan asumsi kenormalan galat dan hanya berlandaskan
asumsi-asumsi yang sangat umum. Penggunaan regresi nonparametrik dilandasi pada asumsi-asumsi :
a. contoh yang diambil bersifat acak dan kontinu .
b. regresi (Y|X) bersifat linier.
c. semua nilai Xi saling bebas.
d. data diasumsikan tidak berdistribusi normal.
Contoh regresi non parametrik adalah uji tanda (sign test), uji jenjang bertanda wilcoxon,
metode theil, metode deret fourier, uji chi square dan lain-lain.
Perbandingan statistik nonparametrik dan statistik parametrik. Kekurangan dan kelebihan
setiap pemilihan prosedur pengujian data, apakah itu menggunakan nonparametrik atau
parametrik memiliki kelebihan dan kekurangan masing-masing. Berikut adalah kelebihan dan
kekurangan masing-masing prosedur :
Kelebihan statistik nonparametrik dibandingkan dengan statistik parametrik ialah :
1. Asumsi yang digunakan minimum sehingga mengurangi kesalahan penggunaan.
2. Perhitungan dapat dilakukan dengan cepat dan mudah.
3. Konsep dan metode nonparametrik mudah dipahami bahkan oleh seseorang dengan
kemampuan matematik yang minim.
4. Dapat diterapkan pada skala peubah kualitatif (nominal dan ordinal).
Kekurangan statistik nonparametrik dibandingkan dengan statistik parametrik ialah :
1. Bila digunakan pada data yang dapat diuji menggunakan statistika parametrik maka hasil
pengujian menggunakan statistik nonparametrik menyebabkan pemborosan informasi.
2. Pekerjaan hitung-menghitung (aritmetik) karena memerlukan ketelitian terkadang
menjemukan.
2. Bila data telah diukur menggunakan skala nominal atau ordinal.
3. Bila asumsi-asumsi yang diperlukan pada suatu prosedur pengujian parametrik tidak
terpenuhi.
4. Bila penghitungan harus dilakukan secara manual.
Menurut jenisnya data terdiri dari data kualitatif dan kuantitatif. Data kuantitatif adalah
data yang diukur dalam suatu skala numerik (angka). Data kuantitatif dapat dibedakan
menjadi:
1. Data interval yaitu data yang diukur dengan jarak diantara dua titik pada skala yang
sudah diketahui.
2. Data rasio yaitu data yang diukur dengan dengan suatu proporsi.
Data kualitatif adalah data yang tidak dapat diukur dalam skala numerik. Namun dalam
statistik semua data harus dalam bentuk angka, maka data kualitatif umumnya dikuantifikasi agar
dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasifikasi data dalam bentuk kategori.
Data kualitatif dapat dibedaka menjadi:
1. Data nominal yaitu data yang dinyatakan dalam bentuk kategori.
2. Data ordinal yaitu data yang dinyatakan dalam bentuk kategori, namun posisi data
tidak sama derajatnya karena dinyatakan dalam skala peringkat.
2.2 Regresi Kernel
Regresi kernel adalah teknik non-parametrik dalam statistik untuk memperkirakan
ekspektasi bersyarat dari variabel acak. Tujuannya adalah untuk menemukan hubungan
non-linear antara sepasang variabel acak X dan Y, untuk mendapatkan dan menggunakan bobot yang
sesuai.
Dalam setiap regresi nonparametrik, harapan bersyarat dari variabel Y relatif terhadap
variabel X dapat ditulis E(Y|X) = m(X) atau E(Y|X = x) = dy
Untuk mengestimasi m sebagai rata-rata tertimbang secara lokal, menggunakan kernel
sebagai fungsi pembobotan. Penaksir Nadaraya-Watson (2):
Ada tiga macam estimasi kernel yaitu:
1. Nadaraya-watson
Pada [5], [6] menjelaskan fungsi kernel, dinotasikan K(t) merupakan suatu fungsi yang pada
pemanfaatannya diberlakukan pada setiap titik data. Fungsi ini mempunyai tiga sifat, yaitu :
b.
∫
Kriteria pemilihan fungsi kernel yang baik berdasarkan pada resiko kernel minimum
yang dapat diperoleh dari kernel optimal atau kernel-kernel dengan variansi minimum. Berikut
diberikan 7 macam fungsi kernel:
3. Quadratic
Gambar 3. Grafik Quadratic
4. Muti Quadratic
5. Spline
7. Tri-cube
Memilih bandwidth yang sesuai (parameter smoothing) adalah bagian penting dari regresi
nonparametrik. Untuk mendapatkan bandwidth yang tepat maka harus ditemukan keseimbangan
antara varians dan bias. Formula untuk bias asimtotik dan varians dari prediksi saat
menggunakan estimasi Nadaraya-Watson (2).
Telah diketahui secara umum, bahwa permasalahan utama pada kernel smoothing bukan
terletak pada pemilihan kernel tetapi pada pemilihan bandwidth. Pemilihan bandwidth optimum
lebih ditekankan pada penyeimbangan antara bias dan varians. Satu perumusan masalah yang
dapat memperlihatkan hubungan antara bias dan varians adalah mean square error – MSE karena
itu dengan meminimumkan MSE maka permasalah antara bias dan varians di atas dapat
diminimumkan juga.
Bandwidth dari kernel adalah parameter bebas yang menunjukkan pengaruh yang kuat
pada perkiraan yang dihasilkan. Untuk menggambarkan efeknya, lihat gambar dibawah ini
Gambar 8. Contoh kurva bandwith
Kurva abu-abu menyatakan kepadatan normal dengan mean 0 dan varians 1. Sebagai
perbandingan, kurva merah undersmoothed (tidak mulus) karena mengandung terlalu banyak
data palsu yang timbul dari menggunakan bandwidth h = 0,05 yang terlalu kecil. Kurva hijau
oversmoothed (terlalu mulus) karena menggunakan bandwidth h = 2 mengaburkan banyak
struktur yang mendasarinya. Kurva hitam dianggap optimal karena mendekati data sebenarnya.
Kriteria optimalitas yang paling umum digunakan untuk pemilihan parameter ini adalah
kesalahan kuadrat rata-rata. Jika bandwidth tidak tetap tetapi bervariasi tergantung pada estimasi
atau sampel, ini menghasilkan metode yang sangat kuat yang dikenal sebagai estimasi kernel
bandwidth yang adaptif.
2.5 Solver
Solver merupakan salah satu perangkat tambahan (add-ins) yang digunakan untuk memecahkan
kasus yang rumit yang terdapat dalam program aplikasi Microsoft Excel. Perangkat solver
memungkinkan dalam menghitung nilai yang dibutuhkan untuk mencapai hasil yang terdapat
pada satu sel atau sederetan sel (range). Dengan kata lain, solver dapat menangani masalah yang
melibatkan banyak sel variabel dan membantu mencari kombinasi variabel untuk meminimalkan
atau memaksimalkan nilai satu sel target. Solver memungkinkan untuk mendefinisikan sendiri
Solver merupakan perangkat atau vasilitas tambahan (add-ins) yang belum tentu ada pada
program excel setelah menginstal Microsoft office. Perangkat ini dapat diperiksa pada grup
analisis dalam ribbon data seperti diperlihatkan pada gambar berikut ini.
BAB III
PEMBAHASAN
3.1 Pembahasan
Regresi kernel adalah teknik estimasi sesuai dengan data yang dimiliki. Diberikan suatu data,
ingin dicari fungsi regresi seperti fungsi yang paling sesuai dengan data yang dimiliki di
titik-titik data. Mungkin juga ingin menginterpolasi dan memperkiraan sedikit di luar data tersebut.
Ide regresi kernel adalah menempatkan satu set fungsi tertimbang identik yang disebut
kernel lokal untuk setiap titik data pengamatan. Kernel akan menetapkan bobot untuk setiap
lokasi berdasarkan jarak dari titik data.
Jika diberikan data sebagai berikut:
Table 1. Contoh data
1 2 3 4 5
1 1.2 3.2 4 5.1
23 17 12 27 8
Dari data tersebut ingin didapatkan kurva-fitting fungsi untuk data. Ada banyak cara
untuk melakukan kurva regresi dan kernel hanyalah salah satunya.
Dalam regresi kernel, apa yang harus dilakukan adalah untuk meletakkan sebuah kernel
(semacam fungsi benjolan) untuk setiap titik data X. Grafik berikut menunjukkan Gaussian
Gambar 10. Grafik Gaussian kernel
Dengan menempatkan kernel pada data asli Xi, sekarang dapat memperpanjang nilai data
asli Xi menjadi nilai yang jauh lebih kecil dari x pada langkah kecil tertentu x. Sebagai contoh,
gunakan x = 0,1. Untuk titik data pertama X1 = 1, kita dapat melihat nilai kernel pada setiap
langkah x kecil.
Rumus Fungsi Kernel Gaussian
(4)
Keteranagan: x = jangkauan
X = nilai data X
Y = nilai data Y
Penggunaan fungsi kernel Gaussian dikarenakan fungsi ini yang lebih mudah dalam
penggunaanya. Sedangkan fungsi spline, epanechnikov dan tri-cube memerlukan syarat dalam
pengerjaannya setelah itu perhitungan bisa dilanjutkan.
Dalam contoh ini, notasi titik data pengamatan (X, Y), sedangkan estimasi dan titik
domain sampling dinotasikan dengan (x, y). Dalam contoh sederhana ini hanya memiliki 5 titik
data tetapi dapat membuat titik sampling sebanyak yang diinginkan dengan menetapkan
sampling rate x.
Diasumsikan bahwa lebar kernel α =0,5, maka kernel dapat dihitung sebagai berikut:
dan seterusnya.
Prosedur yang sama dapat dilakukan untuk semua titik data Xi. Sebagai titik data telah
memiliki jangkauan Xi dari 1 sampai 5.1, dapat memperpanjang domain x antara 0 dan 6. Maka
nilai estimasi Yj sebesar nilai domain Xj yang diberikan oleh rumus regresi kernel juga disebut
Nadaraya-Watson kernel.
Para nominator dari rumus regresi kernel adalah array jumlah produk kernel dan berat,
Gambar berikut menunjukkan formulasi fungsi excel y diperkirakan menggunakan formula
regresi kernel untuk x = 0
Gambar 11. Formulasi fungsi excel y menggunakan formula regresi kernel untuk x = 0.
Table 2. Nilai K(x, X1)-K(x, X5).
2.8 0.00153 0.0059760 0.7261490 0.0561348 0.0000254 1.0000000 2.9 0.00073 0.0030887 0.8352702 0.0889216 0.0000625 1.0000000 3 0.00034 0.0015338 0.9231163 0.1353353 0.0001477 1.0000000 3.1 0.00015 0.0007318 0.9801987 0.1978987 0.0003355 1.0000000 3.2 0.00006 0.0003355 1.0000000 0.2780373 0.0007318 1.0000000 3.3 0.00003 0.0001477 0.9801987 0.3753111 0.0015338 1.0000000 3.4 0.00001 0.0000625 0.9231163 0.4867523 0.0030887 1.0000000 3.5 0.00000 0.0000254 0.8352702 0.6065307 0.0059760 1.0000000 3.6 0.00000 0.0000099 0.7261490 0.7261490 0.0111090 1.0000000 3.7 0.00000 0.0000037 0.6065307 0.8352702 0.0198411 1.0000000 3.8 0.00000 0.0000013 0.4867523 0.9231163 0.0340475 1.0000000 3.9 0.00000 0.0000005 0.3753111 0.9801987 0.0561348 1.0000000 4 0.00000 0.0000002 0.2780373 1.0000000 0.0889216 1.0000000 4.1 0.00000 0.0000000 0.1978987 0.9801987 0.1353353 1.0000000 4.2 0.00000 0.0000000 0.1353353 0.9231163 0.1978987 1.0000000 4.3 0.00000 0.0000000 0.0889216 0.8352702 0.2780373 1.0000000 4.4 0.00000 0.0000000 0.0561348 0.7261490 0.3753111 1.0000000 4.5 0.00000 0.0000000 0.0340475 0.6065307 0.4867523 1.0000000 4.6 0.00000 0.0000000 0.0198411 0.4867523 0.6065307 1.0000000 4.7 0.00000 0.0000000 0.0111090 0.3753111 0.7261490 1.0000000 4.8 0.00000 0.0000000 0.0059760 0.2780373 0.8352702 1.0000000 4.9 0.00000 0.0000000 0.0030887 0.1978987 0.9231163 1.0000000 5 0.00000 0.0000000 0.0015338 0.1353353 0.9801987 1.0000000 5.1 0.00000 0.0000000 0.0007318 0.0889216 1.0000000 1.0000000 5.2 0.00000 0.0000000 0.0003355 0.0561348 0.9801987 1.0000000 5.3 0.00000 0.0000000 0.0001477 0.0340475 0.9231163 1.0000000 5.4 0.00000 0.0000000 0.0000625 0.0198411 0.8352702 1.0000000 5.5 0.00000 0.0000000 0.0000254 0.0111090 0.7261490 1.0000000 5.6 0.00000 0.0000000 0.0000099 0.0059760 0.6065307 1.0000000 5.7 0.00000 0.0000000 0.0000037 0.0030887 0.4867523 1.0000000 5.8 0.00000 0.0000000 0.0000013 0.0015338 0.3753111 1.0000000 5.9 0.00000 0.0000000 0.0000005 0.0007318 0.2780373 1.0000000 6 0.00000 0.0000000 0.0000002 0.0003355 0.1978987 1.0000000
Pada awalnya semua nilai bobot adalah satu, sehingga semua estimasi y juga satu seperti
yang diilustrasikan pada tabel diatas. kemudian menghitung kuadrat kesalahan dari estimasi y
Table 3. Nilai kuadrat kesalahan.
X k(x.X1) k(x,X2) k(x,X3) k(x,X4) k(x,X5) est.y Y sq.error 0 0.13534 0.0561348 0.0000000 0.0000000 0.0000000 1.0000000
0.1 0.19790 0.0889216 0.0000000 0.0000000 0.0000000 1.0000000 0.2 0.27804 0.1353353 0.0000000 0.0000000 0.0000000 1.0000000 0.3 0.37531 0.1978987 0.0000000 0.0000000 0.0000000 1.0000000 0.4 0.48675 0.2780373 0.0000002 0.0000000 0.0000000 1.0000000 0.5 0.60653 0.3753111 0.0000005 0.0000000 0.0000000 1.0000000 0.6 0.72615 0.4867523 0.0000013 0.0000000 0.0000000 1.0000000 0.7 0.83527 0.6065307 0.0000037 0.0000000 0.0000000 1.0000000 0.8 0.92312 0.7261490 0.0000099 0.0000000 0.0000000 1.0000000 0.9 0.98020 0.8352702 0.0000254 0.0000000 0.0000000 1.0000000
1 1.00000 0.9231163 0.0000625 0.0000000 0.0000000 1.0000000 23 484 1.1 0.98020 0.9801987 0.0001477 0.0000000 0.0000000 1.0000000
1.2 0.92312 1.0000000 0.0003355 0.0000002 0.0000000 1.0000000 17 256 1.3 0.83527 0.9801987 0.0007318 0.0000005 0.0000000 1.0000000
1.4 0.72615 0.9231163 0.0015338 0.0000013 0.0000000 1.0000000 1.5 0.60653 0.8352702 0.0030887 0.0000037 0.0000000 1.0000000 1.6 0.48675 0.7261490 0.0059760 0.0000099 0.0000000 1.0000000 1.7 0.37531 0.6065307 0.0111090 0.0000254 0.0000000 1.0000000 1.8 0.27804 0.4867523 0.0198411 0.0000625 0.0000000 1.0000000 1.9 0.19790 0.3753111 0.0340475 0.0001477 0.0000000 1.0000000 2 0.13534 0.2780373 0.0561348 0.0003355 0.0000000 1.0000000 2.1 0.08892 0.1978987 0.0889216 0.0007318 0.0000000 1.0000000 2.2 0.05613 0.1353353 0.1353353 0.0015338 0.0000000 1.0000000 2.3 0.03405 0.0889216 0.1978987 0.0030887 0.0000002 1.0000000 2.4 0.01984 0.0561348 0.2780373 0.0059760 0.0000005 1.0000000 2.5 0.01111 0.0340475 0.3753111 0.0111090 0.0000013 1.0000000 2.6 0.00598 0.0198411 0.4867523 0.0198411 0.0000037 1.0000000 2.7 0.00309 0.0111090 0.6065307 0.0340475 0.0000099 1.0000000 2.8 0.00153 0.0059760 0.7261490 0.0561348 0.0000254 1.0000000 2.9 0.00073 0.0030887 0.8352702 0.0889216 0.0000625 1.0000000 3 0.00034 0.0015338 0.9231163 0.1353353 0.0001477 1.0000000 3.1 0.00015 0.0007318 0.9801987 0.1978987 0.0003355 1.0000000
3.2 0.00006 0.0003355 1.0000000 0.2780373 0.0007318 1.0000000 12 121 3.3 0.00003 0.0001477 0.9801987 0.3753111 0.0015338 1.0000000
3.9 0.00000 0.0000005 0.3753111 0.9801987 0.0561348 1.0000000
4 0.00000 0.0000002 0.2780373 1.0000000 0.0889216 1.0000000 27 676 4.1 0.00000 0.0000000 0.1978987 0.9801987 0.1353353 1.0000000
4.2 0.00000 0.0000000 0.1353353 0.9231163 0.1978987 1.0000000 4.3 0.00000 0.0000000 0.0889216 0.8352702 0.2780373 1.0000000 4.4 0.00000 0.0000000 0.0561348 0.7261490 0.3753111 1.0000000 4.5 0.00000 0.0000000 0.0340475 0.6065307 0.4867523 1.0000000 4.6 0.00000 0.0000000 0.0198411 0.4867523 0.6065307 1.0000000 4.7 0.00000 0.0000000 0.0111090 0.3753111 0.7261490 1.0000000 4.8 0.00000 0.0000000 0.0059760 0.2780373 0.8352702 1.0000000 4.9 0.00000 0.0000000 0.0030887 0.1978987 0.9231163 1.0000000 5 0.00000 0.0000000 0.0015338 0.1353353 0.9801987 1.0000000
5.1 0.00000 0.0000000 0.0007318 0.0889216 1.0000000 1.0000000 8 49 5.2 0.00000 0.0000000 0.0003355 0.0561348 0.9801987 1.0000000
5.3 0.00000 0.0000000 0.0001477 0.0340475 0.9231163 1.0000000 5.4 0.00000 0.0000000 0.0000625 0.0198411 0.8352702 1.0000000 5.5 0.00000 0.0000000 0.0000254 0.0111090 0.7261490 1.0000000 5.6 0.00000 0.0000000 0.0000099 0.0059760 0.6065307 1.0000000 5.7 0.00000 0.0000000 0.0000037 0.0030887 0.4867523 1.0000000 5.8 0.00000 0.0000000 0.0000013 0.0015338 0.3753111 1.0000000 5.9 0.00000 0.0000000 0.0000005 0.0007318 0.2780373 1.0000000 6 0.00000 0.0000000 0.0000002 0.0003355 0.1978987 1.0000000
1586
Dalam perhitungan diatas jumlah SSE = 1586. Sekarang siap untuk solusi. Untuk
menemukan solusi akan digunakan MS Excel Solver.
Periksa menu Tools. Jika tidak ada menu pemecah, berarti perlu menginstal Solver
tersebut. Untuk menginstal Solver, pilih menu Tools-Add-Ins ... dan memeriksa Solver Add-in
Gambar 12. Tahap petama penggunaan MS Excel Solver.
Jika Solver sudah tersedia, klik menu Tools-bahwa Solver ... dan akan muncul dialog
Ingin mencari bobot untuk setiap kernel yang meminimalkan jumlah kesalahan kuadrat.
Mengatur sel target dari jumlah square error (SSE) sama dengan Min dengan mengubah sel-sel
array. Lalu klik tombol Memecahkan dan klik tombol OK.
Gambar 14. Tahapan ketiga penggunaan MS Excel Solver.
Ketika mendapatkan array bobot baru sebagai solusi, secara otomatis mengatasi regresi
dengan menghitung nilai-nilai y. Berikut diperlihatkan pada tabel menunjukkan bahwa jumlah
kesalahan nol ( ).
Tabel 4. Hasil perhitungan dengan menggunakan MS Excel Solver
X 1 1.2 3.2 4 5.1
Y 23 17 12 27 8
Weight 95.0204691 -55.01797 5.674117 34.8308959 5.61585368
X k(x.X1) k(x,X2) k(x,X3) k(x,X4) k(x,X5) est.y Y sq.error 0 0.13534 0.0561348 0.0000000 0.0000000 0.0000000 51.0325324
0.1 0.19790 0.0889216 0.0000000 0.0000000 0.0000000 48.5047234 0.2 0.27804 0.1353353 0.0000000 0.0000000 0.0000000 45.8989354 0.3 0.37531 0.1978987 0.0000000 0.0000000 0.0000000 43.2202139 0.4 0.48675 0.2780373 0.0000002 0.0000000 0.0000000 40.4743685 0.5 0.60653 0.3753111 0.0000005 0.0000000 0.0000000 37.6679416 0.6 0.72615 0.4867523 0.0000013 0.0000000 0.0000000 34.8081596 0.7 0.83527 0.6065307 0.0000037 0.0000000 0.0000000 31.9028686 0.8 0.92312 0.7261490 0.0000099 0.0000000 0.0000000 28.9604520 0.9 0.98020 0.8352702 0.0000254 0.0000000 0.0000000 25.9897320
1 1.00000 0.9231163 0.0000625 0.0000000 0.0000000 22.9998556 23 2.08E-08 1.1 0.98020 0.9801987 0.0001477 0.0000000 0.0000000 20.0001701
1.4 0.72615 0.9231163 0.0015338 0.0000013 0.0000000 11.0369386 1.5 0.60653 0.8352702 0.0030887 0.0000037 0.0000000 8.0944465 1.6 0.48675 0.7261490 0.0059760 0.0000099 0.0000000 5.1969007 1.7 0.37531 0.6065307 0.0111090 0.0000254 0.0000000 2.3727356 1.8 0.27804 0.4867523 0.0198411 0.0000625 0.0000000 -0.3136616 1.9 0.19790 0.3753111 0.0340475 0.0001477 0.0000000 -2.7100406 2 0.13534 0.2780373 0.0561348 0.0003355 0.0000000 -4.4849598 2.1 0.08892 0.1978987 0.0889216 0.0007318 0.0000000 -5.0695961 2.2 0.05613 0.1353353 0.1353353 0.0015338 0.0000000 -3.9306566 2.3 0.03405 0.0889216 0.1978987 0.0030887 0.0000002 -1.3168362 2.4 0.01984 0.0561348 0.2780373 0.0059760 0.0000005 1.6185422 2.5 0.01111 0.0340475 0.3753111 0.0111090 0.0000013 3.9363998 2.6 0.00598 0.0198411 0.4867523 0.0198411 0.0000037 5.5017710 2.7 0.00309 0.0111090 0.6065307 0.0340475 0.0000099 6.5819724 2.8 0.00153 0.0059760 0.7261490 0.0561348 0.0000254 7.4606660 2.9 0.00073 0.0030887 0.8352702 0.0889216 0.0000625 8.3361733 3 0.00034 0.0015338 0.9231163 0.1353353 0.0001477 9.3355307 3.1 0.00015 0.0007318 0.9801987 0.1978987 0.0003355 10.5403893
3.2 0.00006 0.0003355 1.0000000 0.2780373 0.0007318 11.9999955 12 2.04E-11 3.3 0.00003 0.0001477 0.9801987 0.3753111 0.0015338 13.7318405
3.4 0.00001 0.0000625 0.9231163 0.4867523 0.0030887 15.7156892 3.5 0.00000 0.0000254 0.8352702 0.6065307 0.0059760 17.8877159 3.6 0.00000 0.0000099 0.7261490 0.7261490 0.0111090 20.1409556 3.7 0.00000 0.0000037 0.6065307 0.8352702 0.0198411 22.3350907 3.8 0.00000 0.0000013 0.4867523 0.9231163 0.0340475 24.3130259 3.9 0.00000 0.0000005 0.3753111 0.9801987 0.0561348 25.9172663
4 0.00000 0.0000002 0.2780373 1.0000000 0.0889216 26.9999856 27 2.06E-10 4.1 0.00000 0.0000000 0.1978987 0.9801987 0.1353353 27.4274570
4.2 0.00000 0.0000000 0.1353353 0.9231163 0.1978987 27.0881821 4.3 0.00000 0.0000000 0.0889216 0.8352702 0.2780373 25.9178364 4.4 0.00000 0.0000000 0.0561348 0.7261490 0.3753111 23.9450164 4.5 0.00000 0.0000000 0.0340475 0.6065307 0.4867523 21.3360037 4.6 0.00000 0.0000000 0.0198411 0.4867523 0.6065307 18.3921873 4.7 0.00000 0.0000000 0.0111090 0.3753111 0.7261490 15.4717597 4.8 0.00000 0.0000000 0.0059760 0.2780373 0.8352702 12.8733710 4.9 0.00000 0.0000000 0.0030887 0.1978987 0.9231163 10.7593280 5 0.00000 0.0000000 0.0015338 0.1353353 0.9801987 9.1554020
5.1 0.00000 0.0000000 0.0007318 0.0889216 1.0000000 7.9999984 8 2.57E-12 5.2 0.00000 0.0000000 0.0003355 0.0561348 0.9801987 7.1978429
5.5 0.00000 0.0000000 0.0000254 0.0111090 0.7261490 6.0560525 5.6 0.00000 0.0000000 0.0000099 0.0059760 0.6065307 5.9008914 5.7 0.00000 0.0000000 0.0000037 0.0030887 0.4867523 5.8000696 5.8 0.00000 0.0000000 0.0000013 0.0015338 0.3753111 5.7347627 5.9 0.00000 0.0000000 0.0000005 0.0007318 0.2780373 5.6925467 6 0.00000 0.0000000 0.0000002 0.0003355 0.1978987 5.6652930
3.23E-08
BAB IV
KESIMPULAN DAN SARAN
4.1Kesimpulan
Dari hasil pembahasan sebelumnya dapat disimpulkan bahwa:
1. Untuk mengestimasi fungsi regresi yang sulit diprediksi bentuknya dapat
digunakan metode kernel. Permasalahan utama pada kernel bukan pada pemilihan
kernel tetapi pada pemilihan bandwith.
2. Dari hasil pembahasan yang dapat dilakukan hanyalah memprediksi dengan kata
lain hasil perhitungan hanya berupa harapan.
3. Dalam perhitungan bobot menggunakan alat bantu yang berupa solver yang
tersedia di dalam Microsoft Excel.
4. Dari hasil perhitungan didapat nilai SSE = 1586. Sedangkan untuk bobotnya
adalah 95.0204691, -55.01797, 5.674117, 34.8308959 dan 5.61585368. Dengan
didapatnya nilai bobot maka nilai SSE pun berubah yaitu 3.23E-08.
4.2Saran
Metode kernel adalah metode yang membutuhkan ketelitian dalam pengerjaannya
sehingga diperoleh kemudahan dan dapat mendalami serta memahami dalam
Daftar Pustaka
[1] Suyono, Subanar. 1998. Perbandingan regresi parametrik dan regresi nonparametrik.
Universitas Gajah Mada.
[2] Suparti, Sudargo. 2005. Estimasi fungsi regresi menggunakan metode deret fourier.
Semarang.
[3] Laome, Lilis. 2010. Perbandingan model regresi nonparametrik dengan regresi spilne
dan kernel. Universitas Haluoleo Kendari.
[4] Arifin, Johar. 2008. Statistik bisnis terapan dengan Microsoft excel 2007. Jakarta
[5] http:/// wikipedia/Kernel_%28statistics%29.htm, 15-2-2011
[6] http:// /Kernel.htm-kardi teknomo, 26-1-2011