• Tidak ada hasil yang ditemukan

Fungsi Kernel Pada Metode Regresi Non-Parametrik

N/A
N/A
Protected

Academic year: 2016

Membagikan "Fungsi Kernel Pada Metode Regresi Non-Parametrik"

Copied!
40
0
0

Teks penuh

(1)

FUNGSI KERNEL PADA METODE REGRESI NON-PARAMETRIK

SKRIPSI

INDRI HAFSARI 090823018

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

(2)

FUNGSI KERNEL PADA METODE REGRESI NON-PARAMETRIK

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar sarjana sains

INDRI HAFSARI 090823018

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

(3)

PERSETUJUAN

Judul : FUNGSI KERNEL PADA METODE REGRESI

NON-PARAMETRIK

Kategori : SKRIPSI

Nama : INDRI HAFSARI

Nomor Induk Mahasiswa : 090823018

Program Studi : S1 STATISTIKA EKSTENSI

Departemen : MATEMATIKA

Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM

(FMIPA) UNIVERSITAS SUMATERA UTARA

Diluluskan di Medan, Juli 2011

Komisi Pembimbing:

Pembimbing 2, pembimbing 1,

Drs. Djakaria Sebayang, M.Si Prof. Dr. Drs. Iryanto, M.Si

NIP. 195112271985031002 NIP. 194604041971071001

diketahui/ disetujui oleh

Departemen Matematika FMIPA USU

(4)

PERNYATAAN

FUNGSI KERNEL PADA METODE REGRESI NON-PARAMETRIK

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan

ringkasan yang masing-masing disebutkan sumbernya.

Medan, Juli 2011

INDRI HAFSARI 090823018

(5)

PENGHARGAAN

Syukur Alhamdulillah penulis ucapkan kehadirat ALLAH SWT yang telah memberikan rahmat

dan hidayah serta karunia sehingga penyusunan skripsi ini dapat diselesaikan dengan baik dan

tepat waktu.

Adapun tujuan dari penulisan skripsi ini adalah merupakan salah satu syarat untuk

menyelesaikan Program S1 Statistika Ekstensi pada Fakultas Matematika dan Ilmu Pengetahuan

Alam Universitas Sumatera Utara.

Sebagai salah satu perwujudan dari proses pendidikan kemahasiswaan, penyusunan

skripsi ini disajikan berdasarkan pembahasan oleh penulis.

Selama dalam penyusunan skripsi ini penulis telah banyak memperoleh bantuan dan

bimbingan, untuk itu pada kesempatan ini penulis mau mengucapkan terima kasih yang

sebesar-besarnya kepada:

1. Bapak Prof. Dr. Drs. Iryanto, M.Si selaku pembimbing 1 pada penulisan skripsi ini yang telah bersedia memberikan arahan, bimbingan dan petunjuk kepada penulis dalam penyelesaian skripsi ini.

2. Bapak Drs. Djakaria Sebayang, M.Si selaku pembimbing 2 pada penulisan skripsi ini yang telah bersedia memberikan arahan, bimbingan dan petunjuk kepada penulis dalam penyelesaian skripsi ini.

3. Bapak Drs. Ujian Sinulingga, M.Si dan Ibu Dra. Elly Rosmaini, M.Si selaku dosen penguji yang telah memberikan masukan dalam penyelesaian skripsi ini.

4. Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU.

5. Bapak Prof. Dr. Tulus, M.Si selaku Ketua Departemen Matematika FMIPA USU. 6. Bapak Drs. Pengarapan Bangun, M.Si selaku Ketua Pelaksana Jurusan Progam

S1Statistika Ekstensi.

7. Kepada Ayahanda M. Jamil dan Ibunda Elfidarna serta adik-adik atas bimbingan moral dan materil yang telah diberikan.

8. Seluruh staf pengajar di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara Khususnya Departemen Matematika Jurusan Statistika Ekstensi.

(6)

Sepenuhnya penulis menyadari bahwa dalam penyusunan skripsi ini masih banyak

terdapat kekurangan. Untuk itu penulis mengharapkan saran dan kritik yang bersifat

membangun, dimana saran dan kritik tersebut dapat dimanfaatkan untuk kemajuan ilmu

pengetahuan pada saat ini dan yang akan datang.

Semoga penulisan skripsi ini dapat memberikan manfaat dan berguna bagi pembaca dan

penulis khususnya. Akhir kata penulis mengucapkan banyak terima kasih.

Medan, Juli 2011

(7)

ABSTRAK

Statistik nonparametrik merupakan kumpulan metode untuk analisis data yang menawarkan

sebuah pendekatan dengan cara-cara pengambilan keputusan. Ada beberapa metode dalam

mengestimasi regresi nonparametrik salah satunya metode kernel. Metode kernel tersebut

digunakan untuk mengestimasi fungsi regresi bila sebuah data Y diberikan. Metode ini juga

digunakan untuk mengestimasi fungsi regresi yang sulit diprediksi bentuknya. Metode kernel

memiliki beberapa fungsi, diantaranya Gaussian, Norm, Quadratik, Spline, Multi quadratic dan

lain-lain. Pemilihan bandwith dilakukan dengan cara meminimumkan bias dan varians. Dalam

penelitian ini digunakan salah satu dari fungsi tersebut yaitu fungsi kernel Gaussian. Karena

fungsi ini memiliki kemudahan dalam penggunaannya. Data yang digunakan dalam penelitian ini

adalah data nonparametrik. Dari hasil penelitian yang dapat dilakukan hanyalah memprediksi

dengan kata lain hasil perhitungan hanya berupa harapan. Dari hasil penelitian didapat SSE

sebesar 3.23 x 10-8. Pengestimasian dalam tulisan ini menggunakan excel.

(8)

ABSTRACT

Nonparametric statistics is a collection of methods for data analysis offers an approach to ways of decision making. There are several methods in estimating the nonparametric regression kernel methods one of them. Kernel method is used to estimate the regression function when a data Y is given. This method is also used to estimate the regression function are difficult to predict its form. Kernel method has several functions, including Gaussian, Norm, Quadratik, Spline, Multi quadratic and others. The selection of bandwidth is done by minimizing bias and variance. This study used one of these functions is the Gaussian kernel function. Since this function has the ease of use. The data used in this study is nonparametric data. From the results of research can do is predict the results of calculations in other words just a hope. Research results obtained from the SSE at 3:23 x 10-8. Estimating in this paper using excel.

(9)

DAFTAR ISI

Halaman

Persetujuan i

Pernyataan ii

Penghargaan iii

Abstrak v

Abstract vi

Daftara Isi vii

Daftar Tabel viii

Daftar Gambar ix

Bab I Pendahuluan 1

1.1LatarBelakang 1

1.2Perumusan Masalah 2

1.3Tinjauan Pustaka 2

1.4Tujuan Penelitian 3

1.5Kontribusi Penelitian 3

1.6Metode Penelitian 4

Bab II Landasan Teori 5

2.1 Regresi Non-Parametrik 5

2.2 Rgresi Kernel 7

2.3 Fungsi Kernel 8

2.4 Pemilihan Bandwith 12

2.5 Solver 13

Bab III Pembahasan 15

3.1 Pembahasan 15

Bab IV Kesimpulan dan Saran 26

4.1 Kesimpulan 26

4.2 Saran 26

(10)

Daftar Tabel

Halaman

Tabel 1. Contoh data 15

Tabel 2. Nilai K(x, X1)-K(x, X5) 18

Tabel 3. Nilai kuadrat kesalahan 20

(11)

Daftar Gambar

Halaman

Gambar 1. Grafik Gaussian 9

Gambar 2. Grafik Norm 9

Gambar 3. Grafik Quadratic 10

Gambar 4. Grafik Multi quadratic 10

Gambar 5. Grafik Spline 11

Gambar 6. Grafik Epanechnikov 11

Gambar 7. Grafik Tri-cube 12

Gambar 8. Contoh kurva bandwith 13

Gambar 9. Posisi perangkat solver 14

Gambar 10. Grafik Gaussian kernel 16

Gambar 11. Formulasi fungsi excel y menggunakan formula regresi kernel untuk x = 0 18

Gambar 12. Tahap petama penggunaan MS Excel Solver 22

Gambar 13. Tahapan kedua penggunaan MS Excel Solver 22

Gambar 14. Tahapan ketiga penggunaan MS Excel Solver 23

(12)

ABSTRAK

Statistik nonparametrik merupakan kumpulan metode untuk analisis data yang menawarkan

sebuah pendekatan dengan cara-cara pengambilan keputusan. Ada beberapa metode dalam

mengestimasi regresi nonparametrik salah satunya metode kernel. Metode kernel tersebut

digunakan untuk mengestimasi fungsi regresi bila sebuah data Y diberikan. Metode ini juga

digunakan untuk mengestimasi fungsi regresi yang sulit diprediksi bentuknya. Metode kernel

memiliki beberapa fungsi, diantaranya Gaussian, Norm, Quadratik, Spline, Multi quadratic dan

lain-lain. Pemilihan bandwith dilakukan dengan cara meminimumkan bias dan varians. Dalam

penelitian ini digunakan salah satu dari fungsi tersebut yaitu fungsi kernel Gaussian. Karena

fungsi ini memiliki kemudahan dalam penggunaannya. Data yang digunakan dalam penelitian ini

adalah data nonparametrik. Dari hasil penelitian yang dapat dilakukan hanyalah memprediksi

dengan kata lain hasil perhitungan hanya berupa harapan. Dari hasil penelitian didapat SSE

sebesar 3.23 x 10-8. Pengestimasian dalam tulisan ini menggunakan excel.

(13)

ABSTRACT

Nonparametric statistics is a collection of methods for data analysis offers an approach to ways of decision making. There are several methods in estimating the nonparametric regression kernel methods one of them. Kernel method is used to estimate the regression function when a data Y is given. This method is also used to estimate the regression function are difficult to predict its form. Kernel method has several functions, including Gaussian, Norm, Quadratik, Spline, Multi quadratic and others. The selection of bandwidth is done by minimizing bias and variance. This study used one of these functions is the Gaussian kernel function. Since this function has the ease of use. The data used in this study is nonparametric data. From the results of research can do is predict the results of calculations in other words just a hope. Research results obtained from the SSE at 3:23 x 10-8. Estimating in this paper using excel.

(14)

BAB I

PENDAHULUAN

1.1Latar Belakang

Analisis regresi merupakan analisis dalam statistika yang sangat banyak digunakan untuk

melihat hubungan antara Y variabel respon dengan X variabel-variabel prediktornya. Untuk

sebuah sampel berukuran n data pengamatan (X1, Y1),…, (Xn, Yn), hubungan antara

variabel-variabel tersebut dapat dinyatakan dengan model regresi Y = m(X) + ε. Dimana m adalah fungsi

matematik yang disebut sebagai fungsi regresi yang tidak diketahui dan ε adalah error.

Ada beberapa metode pendekatan regresi nonparametrik diantaranya spline, kernel,

k-nearest neigborhood dan lain-lain. Diantara metode-metode pendekatan tersebut, regresi

nonparametrik dengan pendekatan spline dan kernel merupakan metode yang sering digunakan.

Kedua metode tersebut memiliki keunggulan masing-masing. Pendekatan kernel memiliki

bentuk yang lebih fleksibel dan perhitungan matematisnya mudah disesuaikan. Sedangkan

pendekatan spline dapat menyesuaikan diri secara efektif terhadap data tersebut, sehingga

didapatkan hasil yang mendekati kebenaran.

Statistika nonparametrik adalah suatu cabang ilmu statistik yang mempelajari

prosedur-prosedur inferensial dengan kesahihan yang tidak bergantung kepada asumsi-asumsi yang kaku.

Misalnya syarat kenormalan suatu data, atau ragam yang sama, dan lain-lain. Tetapi cukup pada

asumsi yang umum. Terdapat dua tipe utama prosedur statistik yang dianggap nonparametrik

yaitu nonparametrik murni dan bebas sebaran.

Berdasarkan uraian diatas, penulis mengambil judul “Fungsi Kernel Pada Metode

(15)

1.2 Perumusan Masalah

Sesuai dengan latar belakang yang telah dikemukakan sebelumnya, maka masalah yang akan

dibahas dalam penelitian ini adalah bagaimana model fungsi kernel pada metode regresi

nonparametrik.

1.3 Tinjauan Pustaka

Regresi kernel adalah teknik statistik nonparametrik untuk menaksir nilai ekspektasi bersyarat

suatu variabel random. Nilai ekspektasi ini lazim dinotasikan E(Y|X) [7]. Tujuan regresi kernel

adalah mendapatkan hubungan nonlinier antara X dengan Y. Ekspektasi bersyarat Y terhadap X

dinyatakan sebagai berikut:

E(Y|X) = m(X) atau yˆ= m(x) (1)

Persamaan m(x) tidak dapat diwujudkan, tetapi yˆ dapat dihitung (Pada regresi linier,

E(Y|X) = X b atau yˆ = X b). Penaksir respon, yaitu yˆ= m(x), dapat dihitung menggunakan

formula sebagai berikut :

(2)

Keterangan: K adalah kernel

(16)

Tingkat kemulusan mˆ ditentukan oleh fungsi kernel K dan lebar jendela h yang disebut h

parameter pemulus, tetapi pengaruh kernel K tidak sedominan parameter pemulus h. Nilai h kecil

memberikan grafik yang kurang mulus sedangkan nilai h besar memberikan grafik yang sangat

mulus [2].

Dalam jurnal Suyono, Subanar [1] dan Suparti, Sudargo [2] menguraikan tentang model

regresi Y = m(X) + ε dengan ε bebas random tidak terobservasi yang diasumsikan tidak

berkorelasi dengan mean 0. Dalam regresi nonparametrik fungsi regresi m umumnya hanya

diasumsikan termuat dalam suatu ruang fungsi yang berdimensi tak hingga.

Terdapat beberapa macam teknik smoothing antara lain regressogram, barisan estimator

ortogonal dan estimator kernel. Estimator kernel untuk fungsi regresi m diberikan pada persaman

(2).

Kriteria pemilihan fungsi kernel yang baik berdasarkan pada resiko kernel minimum

yang dapat diperoleh dari kernel optimal atau kernel-kernel dengan variansi minimum [3].

Solver yang digunakan untuk membantu dalam hal perhitungan yang terdapat dalam

program Microsoft Excel [4].

1.4 Tujuan Penelitian

Tujuan penelitian ini adalah untuk mengetahui peranan model fungsi kernel pada metode regresi

non-parametrik.

1.5 Kontribusi Penelitian

Hasil penelitian ini diharapkan dapat memperkaya dan menambah wawasan dalam bidang

(17)

1.6 Metode Penelitian

Metode yang digunakan dalam penelitian ini adalah:

- Melakukan studi literatur dari buku, jurnal dan artikel tentang fungsi kernel dan metode

regresi non-parametrik.

- Mendefinisikan fungsi kernel dalam bidang regresi non-parametrik.

(18)

BAB II

LANDASAN TEORI

2.1 Regresi Non-Parametrik

Statistik nonparametrik disebut juga statistik bebas sebaran. Statistik nonparametrik tidak

mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik dapat digunakan pada

data yang memiliki sebaran normal atau tidak. Statistik nonparametrik biasanya digunakan untuk

melakukan analisis pada data nominal atau ordinal.

Metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan

mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistik parametrik, terutama

yang berkaitan dengan distribusi normal. Nama lain yang sering digunakan untuk statistik

nonparametrik adalah statistik bebas distribusi.

Analisa regresi adalah Analisis statistik yang mempelajari bagaimana membangun

sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan suatu

fenomena alami atas dasar fenomena yang lain. Analisa regresi merupakan salah satu teknik

statistik yang digunakan secara luas dalam ilmu pengetahuan terapan. Regresi di samping

digunakan untuk mengetahui bentuk hubungan antar peubah regresi, juga dapat dipergunakan

untuk peramalan.

Dalam banyak hal, pengamatan-pengamatan yang akan dikaji tidak selalu memenuhi

asumsi-asumsi yang mendasari uji-uji parametrik sehingga kerap kali dibutuhkan teknik-teknik

inferensial dengan validitas yang tidak bergantung pada asumsi-asumsi yang kaku. Dalam hal

(19)

walaupun tidak diperlukan pemenuhan asumsi kenormalan galat dan hanya berlandaskan

asumsi-asumsi yang sangat umum. Penggunaan regresi nonparametrik dilandasi pada asumsi-asumsi :

a. contoh yang diambil bersifat acak dan kontinu .

b. regresi (Y|X) bersifat linier.

c. semua nilai Xi saling bebas.

d. data diasumsikan tidak berdistribusi normal.

Contoh regresi non parametrik adalah uji tanda (sign test), uji jenjang bertanda wilcoxon,

metode theil, metode deret fourier, uji chi square dan lain-lain.

Perbandingan statistik nonparametrik dan statistik parametrik. Kekurangan dan kelebihan

setiap pemilihan prosedur pengujian data, apakah itu menggunakan nonparametrik atau

parametrik memiliki kelebihan dan kekurangan masing-masing. Berikut adalah kelebihan dan

kekurangan masing-masing prosedur :

Kelebihan statistik nonparametrik dibandingkan dengan statistik parametrik ialah :

1. Asumsi yang digunakan minimum sehingga mengurangi kesalahan penggunaan.

2. Perhitungan dapat dilakukan dengan cepat dan mudah.

3. Konsep dan metode nonparametrik mudah dipahami bahkan oleh seseorang dengan

kemampuan matematik yang minim.

4. Dapat diterapkan pada skala peubah kualitatif (nominal dan ordinal).

Kekurangan statistik nonparametrik dibandingkan dengan statistik parametrik ialah :

1. Bila digunakan pada data yang dapat diuji menggunakan statistika parametrik maka hasil

pengujian menggunakan statistik nonparametrik menyebabkan pemborosan informasi.

2. Pekerjaan hitung-menghitung (aritmetik) karena memerlukan ketelitian terkadang

menjemukan.

(20)

2. Bila data telah diukur menggunakan skala nominal atau ordinal.

3. Bila asumsi-asumsi yang diperlukan pada suatu prosedur pengujian parametrik tidak

terpenuhi.

4. Bila penghitungan harus dilakukan secara manual.

Menurut jenisnya data terdiri dari data kualitatif dan kuantitatif. Data kuantitatif adalah

data yang diukur dalam suatu skala numerik (angka). Data kuantitatif dapat dibedakan

menjadi:

1. Data interval yaitu data yang diukur dengan jarak diantara dua titik pada skala yang

sudah diketahui.

2. Data rasio yaitu data yang diukur dengan dengan suatu proporsi.

Data kualitatif adalah data yang tidak dapat diukur dalam skala numerik. Namun dalam

statistik semua data harus dalam bentuk angka, maka data kualitatif umumnya dikuantifikasi agar

dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasifikasi data dalam bentuk kategori.

Data kualitatif dapat dibedaka menjadi:

1. Data nominal yaitu data yang dinyatakan dalam bentuk kategori.

2. Data ordinal yaitu data yang dinyatakan dalam bentuk kategori, namun posisi data

tidak sama derajatnya karena dinyatakan dalam skala peringkat.

2.2 Regresi Kernel

Regresi kernel adalah teknik non-parametrik dalam statistik untuk memperkirakan

ekspektasi bersyarat dari variabel acak. Tujuannya adalah untuk menemukan hubungan

non-linear antara sepasang variabel acak X dan Y, untuk mendapatkan dan menggunakan bobot yang

sesuai.

Dalam setiap regresi nonparametrik, harapan bersyarat dari variabel Y relatif terhadap

variabel X dapat ditulis E(Y|X) = m(X) atau E(Y|X = x) = dy

(21)

Untuk mengestimasi m sebagai rata-rata tertimbang secara lokal, menggunakan kernel

sebagai fungsi pembobotan. Penaksir Nadaraya-Watson (2):

Ada tiga macam estimasi kernel yaitu:

1. Nadaraya-watson

Pada [5], [6] menjelaskan fungsi kernel, dinotasikan K(t) merupakan suatu fungsi yang pada

pemanfaatannya diberlakukan pada setiap titik data. Fungsi ini mempunyai tiga sifat, yaitu :

(22)

b.

Kriteria pemilihan fungsi kernel yang baik berdasarkan pada resiko kernel minimum

yang dapat diperoleh dari kernel optimal atau kernel-kernel dengan variansi minimum. Berikut

diberikan 7 macam fungsi kernel:

(23)

3. Quadratic

Gambar 3. Grafik Quadratic

4. Muti Quadratic

(24)

5. Spline

(25)

7. Tri-cube

Memilih bandwidth yang sesuai (parameter smoothing) adalah bagian penting dari regresi

nonparametrik. Untuk mendapatkan bandwidth yang tepat maka harus ditemukan keseimbangan

antara varians dan bias. Formula untuk bias asimtotik dan varians dari prediksi saat

menggunakan estimasi Nadaraya-Watson (2).

Telah diketahui secara umum, bahwa permasalahan utama pada kernel smoothing bukan

terletak pada pemilihan kernel tetapi pada pemilihan bandwidth. Pemilihan bandwidth optimum

lebih ditekankan pada penyeimbangan antara bias dan varians. Satu perumusan masalah yang

dapat memperlihatkan hubungan antara bias dan varians adalah mean square error – MSE karena

itu dengan meminimumkan MSE maka permasalah antara bias dan varians di atas dapat

diminimumkan juga.

Bandwidth dari kernel adalah parameter bebas yang menunjukkan pengaruh yang kuat

pada perkiraan yang dihasilkan. Untuk menggambarkan efeknya, lihat gambar dibawah ini

(26)

Gambar 8. Contoh kurva bandwith

Kurva abu-abu menyatakan kepadatan normal dengan mean 0 dan varians 1. Sebagai

perbandingan, kurva merah undersmoothed (tidak mulus) karena mengandung terlalu banyak

data palsu yang timbul dari menggunakan bandwidth h = 0,05 yang terlalu kecil. Kurva hijau

oversmoothed (terlalu mulus) karena menggunakan bandwidth h = 2 mengaburkan banyak

struktur yang mendasarinya. Kurva hitam dianggap optimal karena mendekati data sebenarnya.

Kriteria optimalitas yang paling umum digunakan untuk pemilihan parameter ini adalah

kesalahan kuadrat rata-rata. Jika bandwidth tidak tetap tetapi bervariasi tergantung pada estimasi

atau sampel, ini menghasilkan metode yang sangat kuat yang dikenal sebagai estimasi kernel

bandwidth yang adaptif.

2.5 Solver

Solver merupakan salah satu perangkat tambahan (add-ins) yang digunakan untuk memecahkan

kasus yang rumit yang terdapat dalam program aplikasi Microsoft Excel. Perangkat solver

memungkinkan dalam menghitung nilai yang dibutuhkan untuk mencapai hasil yang terdapat

pada satu sel atau sederetan sel (range). Dengan kata lain, solver dapat menangani masalah yang

melibatkan banyak sel variabel dan membantu mencari kombinasi variabel untuk meminimalkan

atau memaksimalkan nilai satu sel target. Solver memungkinkan untuk mendefinisikan sendiri

(27)

Solver merupakan perangkat atau vasilitas tambahan (add-ins) yang belum tentu ada pada

program excel setelah menginstal Microsoft office. Perangkat ini dapat diperiksa pada grup

analisis dalam ribbon data seperti diperlihatkan pada gambar berikut ini.

(28)

BAB III

PEMBAHASAN

3.1 Pembahasan

Regresi kernel adalah teknik estimasi sesuai dengan data yang dimiliki. Diberikan suatu data,

ingin dicari fungsi regresi seperti fungsi yang paling sesuai dengan data yang dimiliki di

titik-titik data. Mungkin juga ingin menginterpolasi dan memperkiraan sedikit di luar data tersebut.

Ide regresi kernel adalah menempatkan satu set fungsi tertimbang identik yang disebut

kernel lokal untuk setiap titik data pengamatan. Kernel akan menetapkan bobot untuk setiap

lokasi berdasarkan jarak dari titik data.

Jika diberikan data sebagai berikut:

Table 1. Contoh data

1 2 3 4 5

1 1.2 3.2 4 5.1

23 17 12 27 8

Dari data tersebut ingin didapatkan kurva-fitting fungsi untuk data. Ada banyak cara

untuk melakukan kurva regresi dan kernel hanyalah salah satunya.

Dalam regresi kernel, apa yang harus dilakukan adalah untuk meletakkan sebuah kernel

(semacam fungsi benjolan) untuk setiap titik data X. Grafik berikut menunjukkan Gaussian

(29)

Gambar 10. Grafik Gaussian kernel

Dengan menempatkan kernel pada data asli Xi, sekarang dapat memperpanjang nilai data

asli Xi menjadi nilai yang jauh lebih kecil dari x pada langkah kecil tertentu x. Sebagai contoh,

gunakan x = 0,1. Untuk titik data pertama X1 = 1, kita dapat melihat nilai kernel pada setiap

langkah x kecil.

Rumus Fungsi Kernel Gaussian

(4)

Keteranagan: x = jangkauan

X = nilai data X

Y = nilai data Y

(30)

Penggunaan fungsi kernel Gaussian dikarenakan fungsi ini yang lebih mudah dalam

penggunaanya. Sedangkan fungsi spline, epanechnikov dan tri-cube memerlukan syarat dalam

pengerjaannya setelah itu perhitungan bisa dilanjutkan.

Dalam contoh ini, notasi titik data pengamatan (X, Y), sedangkan estimasi dan titik

domain sampling dinotasikan dengan (x, y). Dalam contoh sederhana ini hanya memiliki 5 titik

data tetapi dapat membuat titik sampling sebanyak yang diinginkan dengan menetapkan

sampling rate x.

Diasumsikan bahwa lebar kernel α =0,5, maka kernel dapat dihitung sebagai berikut:

dan seterusnya.

Prosedur yang sama dapat dilakukan untuk semua titik data Xi. Sebagai titik data telah

memiliki jangkauan Xi dari 1 sampai 5.1, dapat memperpanjang domain x antara 0 dan 6. Maka

nilai estimasi Yj sebesar nilai domain Xj yang diberikan oleh rumus regresi kernel juga disebut

Nadaraya-Watson kernel.

Para nominator dari rumus regresi kernel adalah array jumlah produk kernel dan berat,

(31)

Gambar berikut menunjukkan formulasi fungsi excel y diperkirakan menggunakan formula

regresi kernel untuk x = 0

Gambar 11. Formulasi fungsi excel y menggunakan formula regresi kernel untuk x = 0.

Table 2. Nilai K(x, X1)-K(x, X5).

(32)

2.8 0.00153 0.0059760 0.7261490 0.0561348 0.0000254 1.0000000 2.9 0.00073 0.0030887 0.8352702 0.0889216 0.0000625 1.0000000 3 0.00034 0.0015338 0.9231163 0.1353353 0.0001477 1.0000000 3.1 0.00015 0.0007318 0.9801987 0.1978987 0.0003355 1.0000000 3.2 0.00006 0.0003355 1.0000000 0.2780373 0.0007318 1.0000000 3.3 0.00003 0.0001477 0.9801987 0.3753111 0.0015338 1.0000000 3.4 0.00001 0.0000625 0.9231163 0.4867523 0.0030887 1.0000000 3.5 0.00000 0.0000254 0.8352702 0.6065307 0.0059760 1.0000000 3.6 0.00000 0.0000099 0.7261490 0.7261490 0.0111090 1.0000000 3.7 0.00000 0.0000037 0.6065307 0.8352702 0.0198411 1.0000000 3.8 0.00000 0.0000013 0.4867523 0.9231163 0.0340475 1.0000000 3.9 0.00000 0.0000005 0.3753111 0.9801987 0.0561348 1.0000000 4 0.00000 0.0000002 0.2780373 1.0000000 0.0889216 1.0000000 4.1 0.00000 0.0000000 0.1978987 0.9801987 0.1353353 1.0000000 4.2 0.00000 0.0000000 0.1353353 0.9231163 0.1978987 1.0000000 4.3 0.00000 0.0000000 0.0889216 0.8352702 0.2780373 1.0000000 4.4 0.00000 0.0000000 0.0561348 0.7261490 0.3753111 1.0000000 4.5 0.00000 0.0000000 0.0340475 0.6065307 0.4867523 1.0000000 4.6 0.00000 0.0000000 0.0198411 0.4867523 0.6065307 1.0000000 4.7 0.00000 0.0000000 0.0111090 0.3753111 0.7261490 1.0000000 4.8 0.00000 0.0000000 0.0059760 0.2780373 0.8352702 1.0000000 4.9 0.00000 0.0000000 0.0030887 0.1978987 0.9231163 1.0000000 5 0.00000 0.0000000 0.0015338 0.1353353 0.9801987 1.0000000 5.1 0.00000 0.0000000 0.0007318 0.0889216 1.0000000 1.0000000 5.2 0.00000 0.0000000 0.0003355 0.0561348 0.9801987 1.0000000 5.3 0.00000 0.0000000 0.0001477 0.0340475 0.9231163 1.0000000 5.4 0.00000 0.0000000 0.0000625 0.0198411 0.8352702 1.0000000 5.5 0.00000 0.0000000 0.0000254 0.0111090 0.7261490 1.0000000 5.6 0.00000 0.0000000 0.0000099 0.0059760 0.6065307 1.0000000 5.7 0.00000 0.0000000 0.0000037 0.0030887 0.4867523 1.0000000 5.8 0.00000 0.0000000 0.0000013 0.0015338 0.3753111 1.0000000 5.9 0.00000 0.0000000 0.0000005 0.0007318 0.2780373 1.0000000 6 0.00000 0.0000000 0.0000002 0.0003355 0.1978987 1.0000000

Pada awalnya semua nilai bobot adalah satu, sehingga semua estimasi y juga satu seperti

yang diilustrasikan pada tabel diatas. kemudian menghitung kuadrat kesalahan dari estimasi y

(33)

Table 3. Nilai kuadrat kesalahan.

X k(x.X1) k(x,X2) k(x,X3) k(x,X4) k(x,X5) est.y Y sq.error 0 0.13534 0.0561348 0.0000000 0.0000000 0.0000000 1.0000000

0.1 0.19790 0.0889216 0.0000000 0.0000000 0.0000000 1.0000000 0.2 0.27804 0.1353353 0.0000000 0.0000000 0.0000000 1.0000000 0.3 0.37531 0.1978987 0.0000000 0.0000000 0.0000000 1.0000000 0.4 0.48675 0.2780373 0.0000002 0.0000000 0.0000000 1.0000000 0.5 0.60653 0.3753111 0.0000005 0.0000000 0.0000000 1.0000000 0.6 0.72615 0.4867523 0.0000013 0.0000000 0.0000000 1.0000000 0.7 0.83527 0.6065307 0.0000037 0.0000000 0.0000000 1.0000000 0.8 0.92312 0.7261490 0.0000099 0.0000000 0.0000000 1.0000000 0.9 0.98020 0.8352702 0.0000254 0.0000000 0.0000000 1.0000000

1 1.00000 0.9231163 0.0000625 0.0000000 0.0000000 1.0000000 23 484 1.1 0.98020 0.9801987 0.0001477 0.0000000 0.0000000 1.0000000

1.2 0.92312 1.0000000 0.0003355 0.0000002 0.0000000 1.0000000 17 256 1.3 0.83527 0.9801987 0.0007318 0.0000005 0.0000000 1.0000000

1.4 0.72615 0.9231163 0.0015338 0.0000013 0.0000000 1.0000000 1.5 0.60653 0.8352702 0.0030887 0.0000037 0.0000000 1.0000000 1.6 0.48675 0.7261490 0.0059760 0.0000099 0.0000000 1.0000000 1.7 0.37531 0.6065307 0.0111090 0.0000254 0.0000000 1.0000000 1.8 0.27804 0.4867523 0.0198411 0.0000625 0.0000000 1.0000000 1.9 0.19790 0.3753111 0.0340475 0.0001477 0.0000000 1.0000000 2 0.13534 0.2780373 0.0561348 0.0003355 0.0000000 1.0000000 2.1 0.08892 0.1978987 0.0889216 0.0007318 0.0000000 1.0000000 2.2 0.05613 0.1353353 0.1353353 0.0015338 0.0000000 1.0000000 2.3 0.03405 0.0889216 0.1978987 0.0030887 0.0000002 1.0000000 2.4 0.01984 0.0561348 0.2780373 0.0059760 0.0000005 1.0000000 2.5 0.01111 0.0340475 0.3753111 0.0111090 0.0000013 1.0000000 2.6 0.00598 0.0198411 0.4867523 0.0198411 0.0000037 1.0000000 2.7 0.00309 0.0111090 0.6065307 0.0340475 0.0000099 1.0000000 2.8 0.00153 0.0059760 0.7261490 0.0561348 0.0000254 1.0000000 2.9 0.00073 0.0030887 0.8352702 0.0889216 0.0000625 1.0000000 3 0.00034 0.0015338 0.9231163 0.1353353 0.0001477 1.0000000 3.1 0.00015 0.0007318 0.9801987 0.1978987 0.0003355 1.0000000

3.2 0.00006 0.0003355 1.0000000 0.2780373 0.0007318 1.0000000 12 121 3.3 0.00003 0.0001477 0.9801987 0.3753111 0.0015338 1.0000000

(34)

3.9 0.00000 0.0000005 0.3753111 0.9801987 0.0561348 1.0000000

4 0.00000 0.0000002 0.2780373 1.0000000 0.0889216 1.0000000 27 676 4.1 0.00000 0.0000000 0.1978987 0.9801987 0.1353353 1.0000000

4.2 0.00000 0.0000000 0.1353353 0.9231163 0.1978987 1.0000000 4.3 0.00000 0.0000000 0.0889216 0.8352702 0.2780373 1.0000000 4.4 0.00000 0.0000000 0.0561348 0.7261490 0.3753111 1.0000000 4.5 0.00000 0.0000000 0.0340475 0.6065307 0.4867523 1.0000000 4.6 0.00000 0.0000000 0.0198411 0.4867523 0.6065307 1.0000000 4.7 0.00000 0.0000000 0.0111090 0.3753111 0.7261490 1.0000000 4.8 0.00000 0.0000000 0.0059760 0.2780373 0.8352702 1.0000000 4.9 0.00000 0.0000000 0.0030887 0.1978987 0.9231163 1.0000000 5 0.00000 0.0000000 0.0015338 0.1353353 0.9801987 1.0000000

5.1 0.00000 0.0000000 0.0007318 0.0889216 1.0000000 1.0000000 8 49 5.2 0.00000 0.0000000 0.0003355 0.0561348 0.9801987 1.0000000

5.3 0.00000 0.0000000 0.0001477 0.0340475 0.9231163 1.0000000 5.4 0.00000 0.0000000 0.0000625 0.0198411 0.8352702 1.0000000 5.5 0.00000 0.0000000 0.0000254 0.0111090 0.7261490 1.0000000 5.6 0.00000 0.0000000 0.0000099 0.0059760 0.6065307 1.0000000 5.7 0.00000 0.0000000 0.0000037 0.0030887 0.4867523 1.0000000 5.8 0.00000 0.0000000 0.0000013 0.0015338 0.3753111 1.0000000 5.9 0.00000 0.0000000 0.0000005 0.0007318 0.2780373 1.0000000 6 0.00000 0.0000000 0.0000002 0.0003355 0.1978987 1.0000000

1586

Dalam perhitungan diatas jumlah SSE = 1586. Sekarang siap untuk solusi. Untuk

menemukan solusi akan digunakan MS Excel Solver.

Periksa menu Tools. Jika tidak ada menu pemecah, berarti perlu menginstal Solver

tersebut. Untuk menginstal Solver, pilih menu Tools-Add-Ins ... dan memeriksa Solver Add-in

(35)

Gambar 12. Tahap petama penggunaan MS Excel Solver.

Jika Solver sudah tersedia, klik menu Tools-bahwa Solver ... dan akan muncul dialog

(36)

Ingin mencari bobot untuk setiap kernel yang meminimalkan jumlah kesalahan kuadrat.

Mengatur sel target dari jumlah square error (SSE) sama dengan Min dengan mengubah sel-sel

array. Lalu klik tombol Memecahkan dan klik tombol OK.

Gambar 14. Tahapan ketiga penggunaan MS Excel Solver.

Ketika mendapatkan array bobot baru sebagai solusi, secara otomatis mengatasi regresi

dengan menghitung nilai-nilai y. Berikut diperlihatkan pada tabel menunjukkan bahwa jumlah

kesalahan nol ( ).

Tabel 4. Hasil perhitungan dengan menggunakan MS Excel Solver

X 1 1.2 3.2 4 5.1

Y 23 17 12 27 8

Weight 95.0204691 -55.01797 5.674117 34.8308959 5.61585368

X k(x.X1) k(x,X2) k(x,X3) k(x,X4) k(x,X5) est.y Y sq.error 0 0.13534 0.0561348 0.0000000 0.0000000 0.0000000 51.0325324

0.1 0.19790 0.0889216 0.0000000 0.0000000 0.0000000 48.5047234 0.2 0.27804 0.1353353 0.0000000 0.0000000 0.0000000 45.8989354 0.3 0.37531 0.1978987 0.0000000 0.0000000 0.0000000 43.2202139 0.4 0.48675 0.2780373 0.0000002 0.0000000 0.0000000 40.4743685 0.5 0.60653 0.3753111 0.0000005 0.0000000 0.0000000 37.6679416 0.6 0.72615 0.4867523 0.0000013 0.0000000 0.0000000 34.8081596 0.7 0.83527 0.6065307 0.0000037 0.0000000 0.0000000 31.9028686 0.8 0.92312 0.7261490 0.0000099 0.0000000 0.0000000 28.9604520 0.9 0.98020 0.8352702 0.0000254 0.0000000 0.0000000 25.9897320

1 1.00000 0.9231163 0.0000625 0.0000000 0.0000000 22.9998556 23 2.08E-08 1.1 0.98020 0.9801987 0.0001477 0.0000000 0.0000000 20.0001701

(37)

1.4 0.72615 0.9231163 0.0015338 0.0000013 0.0000000 11.0369386 1.5 0.60653 0.8352702 0.0030887 0.0000037 0.0000000 8.0944465 1.6 0.48675 0.7261490 0.0059760 0.0000099 0.0000000 5.1969007 1.7 0.37531 0.6065307 0.0111090 0.0000254 0.0000000 2.3727356 1.8 0.27804 0.4867523 0.0198411 0.0000625 0.0000000 -0.3136616 1.9 0.19790 0.3753111 0.0340475 0.0001477 0.0000000 -2.7100406 2 0.13534 0.2780373 0.0561348 0.0003355 0.0000000 -4.4849598 2.1 0.08892 0.1978987 0.0889216 0.0007318 0.0000000 -5.0695961 2.2 0.05613 0.1353353 0.1353353 0.0015338 0.0000000 -3.9306566 2.3 0.03405 0.0889216 0.1978987 0.0030887 0.0000002 -1.3168362 2.4 0.01984 0.0561348 0.2780373 0.0059760 0.0000005 1.6185422 2.5 0.01111 0.0340475 0.3753111 0.0111090 0.0000013 3.9363998 2.6 0.00598 0.0198411 0.4867523 0.0198411 0.0000037 5.5017710 2.7 0.00309 0.0111090 0.6065307 0.0340475 0.0000099 6.5819724 2.8 0.00153 0.0059760 0.7261490 0.0561348 0.0000254 7.4606660 2.9 0.00073 0.0030887 0.8352702 0.0889216 0.0000625 8.3361733 3 0.00034 0.0015338 0.9231163 0.1353353 0.0001477 9.3355307 3.1 0.00015 0.0007318 0.9801987 0.1978987 0.0003355 10.5403893

3.2 0.00006 0.0003355 1.0000000 0.2780373 0.0007318 11.9999955 12 2.04E-11 3.3 0.00003 0.0001477 0.9801987 0.3753111 0.0015338 13.7318405

3.4 0.00001 0.0000625 0.9231163 0.4867523 0.0030887 15.7156892 3.5 0.00000 0.0000254 0.8352702 0.6065307 0.0059760 17.8877159 3.6 0.00000 0.0000099 0.7261490 0.7261490 0.0111090 20.1409556 3.7 0.00000 0.0000037 0.6065307 0.8352702 0.0198411 22.3350907 3.8 0.00000 0.0000013 0.4867523 0.9231163 0.0340475 24.3130259 3.9 0.00000 0.0000005 0.3753111 0.9801987 0.0561348 25.9172663

4 0.00000 0.0000002 0.2780373 1.0000000 0.0889216 26.9999856 27 2.06E-10 4.1 0.00000 0.0000000 0.1978987 0.9801987 0.1353353 27.4274570

4.2 0.00000 0.0000000 0.1353353 0.9231163 0.1978987 27.0881821 4.3 0.00000 0.0000000 0.0889216 0.8352702 0.2780373 25.9178364 4.4 0.00000 0.0000000 0.0561348 0.7261490 0.3753111 23.9450164 4.5 0.00000 0.0000000 0.0340475 0.6065307 0.4867523 21.3360037 4.6 0.00000 0.0000000 0.0198411 0.4867523 0.6065307 18.3921873 4.7 0.00000 0.0000000 0.0111090 0.3753111 0.7261490 15.4717597 4.8 0.00000 0.0000000 0.0059760 0.2780373 0.8352702 12.8733710 4.9 0.00000 0.0000000 0.0030887 0.1978987 0.9231163 10.7593280 5 0.00000 0.0000000 0.0015338 0.1353353 0.9801987 9.1554020

5.1 0.00000 0.0000000 0.0007318 0.0889216 1.0000000 7.9999984 8 2.57E-12 5.2 0.00000 0.0000000 0.0003355 0.0561348 0.9801987 7.1978429

(38)

5.5 0.00000 0.0000000 0.0000254 0.0111090 0.7261490 6.0560525 5.6 0.00000 0.0000000 0.0000099 0.0059760 0.6065307 5.9008914 5.7 0.00000 0.0000000 0.0000037 0.0030887 0.4867523 5.8000696 5.8 0.00000 0.0000000 0.0000013 0.0015338 0.3753111 5.7347627 5.9 0.00000 0.0000000 0.0000005 0.0007318 0.2780373 5.6925467 6 0.00000 0.0000000 0.0000002 0.0003355 0.1978987 5.6652930

3.23E-08

(39)

BAB IV

KESIMPULAN DAN SARAN

4.1Kesimpulan

Dari hasil pembahasan sebelumnya dapat disimpulkan bahwa:

1. Untuk mengestimasi fungsi regresi yang sulit diprediksi bentuknya dapat

digunakan metode kernel. Permasalahan utama pada kernel bukan pada pemilihan

kernel tetapi pada pemilihan bandwith.

2. Dari hasil pembahasan yang dapat dilakukan hanyalah memprediksi dengan kata

lain hasil perhitungan hanya berupa harapan.

3. Dalam perhitungan bobot menggunakan alat bantu yang berupa solver yang

tersedia di dalam Microsoft Excel.

4. Dari hasil perhitungan didapat nilai SSE = 1586. Sedangkan untuk bobotnya

adalah 95.0204691, -55.01797, 5.674117, 34.8308959 dan 5.61585368. Dengan

didapatnya nilai bobot maka nilai SSE pun berubah yaitu 3.23E-08.

4.2Saran

Metode kernel adalah metode yang membutuhkan ketelitian dalam pengerjaannya

sehingga diperoleh kemudahan dan dapat mendalami serta memahami dalam

(40)

Daftar Pustaka

[1] Suyono, Subanar. 1998. Perbandingan regresi parametrik dan regresi nonparametrik.

Universitas Gajah Mada.

[2] Suparti, Sudargo. 2005. Estimasi fungsi regresi menggunakan metode deret fourier.

Semarang.

[3] Laome, Lilis. 2010. Perbandingan model regresi nonparametrik dengan regresi spilne

dan kernel. Universitas Haluoleo Kendari.

[4] Arifin, Johar. 2008. Statistik bisnis terapan dengan Microsoft excel 2007. Jakarta

[5] http:/// wikipedia/Kernel_%28statistics%29.htm, 15-2-2011

[6] http:// /Kernel.htm-kardi teknomo, 26-1-2011

Gambar

Gambar 4. Grafik Multi Quadratic
Gambar 6. Grafik Epanechnikov
Gambar  9. Posisi perangkat solver
Gambar berikut menunjukkan formulasi fungsi excel y diperkirakan menggunakan formula
+4

Referensi

Dokumen terkait

Produksi terjadi karena kerja sama empat faktor produksi, yaitu faktor produksi alam, tenaga kerja, modal dan pengusaha. Pengusaha ini yang mengkombinasikan faktor produksi

termasuk episode sporadik, episode sporadik yang didapat dari komunitas, dalam hal ini sistitis akut dan pielonefritis akut pada individu yang sehat.. • ISK ini banyak didapat

Pada periode 2006-2007, kelompok sektor utilitas mendominasi PDRB Kabupaten Kepulauan Meranti, ini ditunjukkan oleh sumbangnnya yang menunjukkan angka paling besar terhadap

Berkaitan dengan target capaian pelaksanaan PKM ini, maka revitalisasi pemahaman paham Islam Ahlussunnah wal Jama’ah dan pengenalan diri pada Majelis Taklim Ummahat DDI

Jenis penelitian yang digunakan dalam penelitian ini adalah penelitian quasi experiment atau penelitian eksperimen semu untuk menguji hipotesis adakah dampak

Fungsi Pelaksana sebagaimana dimaksud dalam Pasal 8 merupakan fungsi Pelaksana BPBD dilaksanakan secara terkoordinasi dan terintegrasi dengan satuan kerja perangkat

Jika tanah tidak mampu menahan air hujan di daerah yang tinggi maka akan terjadi.. Yang bukan merupakan upaya untuk mencegah tanah

khulu’ atau dengan lafadz yang menunjukan makna khulu’ seperti kata mubara’ah (melepas diri) atau fidyah (tebusan). Jika tidak dengan lafadz khulu’ atau lafadz yang