BAB II KAJIAN PUSTAKA
2.8 Regresi Nonparametrik
28 Keterangan : π = konstanta (1 β π΅) = pembedaan pertama (1 β β 1π΅)ππ‘ = koefisien model AR (1 β π1π΅)πΌπ‘ = koefisien model MA 2.8 Regresi Nonparametrik
Regresi nonparametrik dapat digunakan pada data yang mempunyai distribusi normal ataupun tidak berdistribusi normal. Regresi nonparametrik pertamakali diperkenalkan oleh Francis Galtom pada tahun 1885. Pendekatan nonparametrik merupakan pendekatan regresi yang sesuai untuk pola yang tidak diketahui bentuknya, dan tidak terdapat pengalaman informasi masa lalu mengenai pola data
Estimasi juga dapat dilakukan berdasarkan pada pendekatan yang tidak terikat dengan asumsi bentuk kurva regresi khusus yang memberikan fleksibilitas yang lebih besar. Kurva regresi yang sesuai, maka pendekatan ini dinamakan dengan pendekatan nonparametrik.
Regresi nonparametrik merupakan metode regresi untuk memahami pola hubungan antara variabel terikat y dan variabel bebas x. Regresi nonparametrik tidak membutuhkan asumsi mengenai bentuk kurva regresi, oleh karena itu regresi nonparametrik bersifat fleksibel terhadap perubahan pola data. Secara umum hubungan variabel dapat dinyatakan sebagai ππ = π(ππ) + ππ, π = 1, 2, 3, β¦ π dimana ππ adalah variabel random yang diasumsikan independent
29
diketahui disebut dengan fungsi regresi atau kurva regresi. Fungsi regresi hanya diasumsikan dalam suatu ruang fungsi yang berdimensi tidak hingga. Kemudian estimasi π(ππ) dapat dilakukan berdasarkan data pengamatan dengan teknik penghalus tertentu.
Terdapat beberapa teknik penghalus dalam regresi nonparametrik yaitu histogram, estimasi kernel, estimasi spline, deret fourier, dan k-NN.
2.8.1 Fungsi Kernel
Model pendekatan nonparametrik yang umum digunakan adalah estimator kernel. Hal ini disebabkan estimator kernel mempunyai beberapa kelebihan yaitu estimator kernel mempunyai bentuk yang fleksibel dan mudah disesuaikan dan estimator kernel mempunyai rata-rata kekonvergenan yang relatif cepat.
Beberapa jenis fungsi kernel sebagai berikut : a. Kernel Gaussian : πΎ(π’) = 1 β2πexp (β1 2π’2)πΌ(ββ,β)(π’) b. Kernel Kudrat : πΎ(π’) =15 8 (1 β 4π’2)2πΌ[β0,5 ;0,5](π’) c. Kernel Segitiga : πΎ(π’) = (1 β |π’|)πΌ[β1,1](π’) d. Kernel Epanechnikov : πΎ(π’) =3 4(1 β π’2)πΌ[β1,1](π’) e. Kernel Uniform : πΎ(π’) =1 2πΌ[β1,1](π’)
Secara umum untuk fungsi kernel pada dimensi satu dapat didefinisikan sebagai berikut :
πΎβ(π’) = 1
βπΎ (π’
30
Fungsi kernel πΎ merupakan fungsi yang kontinu, terbatas, simetrik, dan terintegral ke satu, β«βββ πΎ(π’)ππ’ = 1.
Jika suatu fungsi kernel memenuhi syarat berikut : a. β«βββ πΎ(π’)ππ’ = 1
b. β«βββ π’πΎ(π’)ππ’ = 0 c. β«βββ π’2πΎ(π’)ππ’ β 0 d. β«βββ πΎ(π’2)ππ’< β
Maka fungsi kernel πΎ termasuk fungsi berordo 2.
2.8.2 Estimasi Densitas Kernel
Estimator densitas kernel merupakan salah satu pengembangan dari estimator histogram. Estimator densitas kernel adalah metode pendekatan dengan fungsi kernel terhadap fungsi densitas yang belum diketahui. Pemulusan pada densitas kernel bergantung dari fungsi kernel dan nilai bandwidth. Estimator densitas kernel dengan fungsi πΜ(π₯) adalah (Zulfikar, 2008): πΜ(π₯)ππ₯ =1 πβππ=1πΎβ(π₯π β π₯) πΜ(π₯)ππ₯ = 1 πββ πΎ (π₯πβπ₯ β ) π π=1 (2.25)
Dengan πΎ adalah fungsi kernel yang kontinu dan spesifik yang memenuhi persamaan β« πΎ(π₯)ππ₯ = 1. Selanjutnya β adalah nilai bandwidth dengan bilangan positif. Beberapa asumsi kernel yang harus dipenuhi adalah sebagai berikut (Reyes, Fernandez, & Cao, 2014):
31
a. πΎ(π₯) β₯ 0, untuk semua π₯
b. πΎ(π₯) bersifat simetris, πΎ(βπ₯) = πΎ(π₯), untuk semua π₯ c. β« πΎ(π₯)ππ₯ = 1
d. β« π₯πΎ(π₯)ππ₯ = 0
e. β« π₯2πΎ(π₯)ππ₯ = π2πΎ β 0 dengan π2πΎ momen kedua tertentu f. β«[πΎ(π₯)]2ππ₯ = β« πΎ2(π₯)ππ₯ = βπΎβ22 = πΈ[πΎ2(π₯)] = π (πΎ)
2.8.3 Regresi Nonparametrik Kernel
Regresi nonparametrik kernel dengan menggunakan pendekatan linear konstan menggunakan sampel random (π₯π, π¦π), π = 1, 2, 3, β¦ , π. Estimasi kurva π¦Μ = πΜ (π₯) diperoleh dengan meminimumkan :
βπ ππ2
π=1 πΎβ(π₯ β ππ) = βπ {π¦πβ [πΏ0+ πΏ1(π₯ β ππ) + β― + πΏπ(π₯ β
π=1
ππ)π]}2πΎβ(π₯ β ππ)
Dimana πΎ adalah fungsi kernel dan β disebut bandwidth(Hafiyusholeh, 2006).
2.9 Estimasi Bias
Pada estimator densitas kernel fungsi πΜ(π₯) merupakan estimator yang tak bias dari suatu fungsi densitas π(π₯). Jika fungsi πΜ(π₯) adalah estimator densitas kernel dari suatu fungsi densitas π(π₯) pada titik π₯ππ dan ππ berdistribusi ekuivalen dengan fungsi densitas π(π₯), maka untuk estimasi bias adalah(Apriani, 2015):
32 πΈ[πΜ(π₯)] = πΈ [1 πββ πΎ ( ππβ π₯ β ) π π=1 ] πΈ[πΜ(π₯)] = 1 πββ πΈ [πΎ ( ππβ π₯ β )] π π=1 πΈ[πΜ(π₯)] =1 βπΈ [πΎ ( ππ β π₯ β )] πΈ[πΜ(π₯)] =1 ββ« πΎ ( π¦ β π₯ β ) π(π¦)ππ¦ Misalkan π =π¦βπ₯
β maka ππ¦ = βππ , sehingga didapatkan : πΈ[πΜ(π₯)] =1
ββ« πΎ(π )π(π₯ + π β)βππ πΈ[πΜ(π₯)] = β« πΎ(π )π(π₯ + π β)ππ
Dengan mengaplikasikan suatu pendekatan ekspansi taylor dari fungsiπ(π₯ + π β) dan nilai π β = 0 ketika β β 0 sehingga untuk setiap kernel pada orde ke-π£ dapat menggunakan kaidah sebagai berikut (Saputra & Listyani, 2016):
π(π₯ + π β) = π(π₯) + πβ²(π₯)π β +2!1πβ²β²(π₯)β2π 2+ 1
2!πβ²β²β²(π₯)β3π 3+ β― +
1
π£!ππ£(π₯)βπ£π π£+ π(βπ£)
Dengan π(βπ£) adalah sisa dari orde yang lebih rendah dari βπ£ ketika β β 0 sehingga ekspansi taylor orde 2 untuk fungsiπ(π₯ + π β) adalah :
π(π₯ + π β) = π(π₯) + πβ²(π₯)π β + 1 2!π
β²β²(π₯)β2π 2+ π(βπ£)
33 πΈ[πΜ(π₯)] = β« πΎ(π ) [π(π₯) + πβ²(π₯)βπ +12πβ²β²(π₯)β2π 2+ π(β2)] ππ πΈ[πΜ(π₯)] = π(π₯) β« πΎ(π )ππ + πβ²(π₯)β β« π πΎ(π )ππ +12πβ²β²(π₯)β2β« π 2πΎ(π )ππ + π(β2) β« πΎ(π )ππ πΈ[πΜ(π₯)] = π(π₯)(1) + πβ²(π₯)β(0) +1 2πβ²β²(π₯)β2β« π 2πΎ(π )ππ + π(β2)(1) πΈ[πΜ(π₯)] = π(π₯) +1 2πβ²β²(π₯)β2π2(πΎ) + π(β2) (2.26) Kemudian menghitung nilai bias dan variansi dari fungsi πΜ(π₯), yaitu (Yuniarti & Hartati, 2017): a. Bias dari πΜ(π₯) π΅πππ πΜ(π₯) = πΈ[πΜ(π₯)] β π(π₯) π΅πππ πΜ(π₯) = π(π₯) +1 2πβ²β²(π₯)β2π2(πΎ) + π(β2) β π(π₯) π΅πππ πΜ(π₯) =1 2πβ²β²(π₯)β2π2(πΎ) + π(β2) (2.27) b. Variansi dari πΜ(π₯)
Untuk menghitung variansi dari πΜ(π₯) dapat menggunakan pendekatan taylor orde 1.
πππ (πΜ(π₯)) = 1 π2πππ(βππ=1πΎ(ππβ π₯)) πππ (πΜ(π₯)) = 1 π2βππ=1πππ(πΎ(ππ β π₯)) πππ (πΜ(π₯)) = 1 ππππ(πΎ(ππ β π₯)) πππ (πΜ(π₯)) = 1 π{πΈ[πΎ2(ππβ π₯)] β (πΈ[πΎ(ππ β π₯)])2} πππ (πΜ(π₯)) = 1 π{1 β2β« πΎ2(π¦βπ₯ β ) π(π¦)ππ¦ β (π(π₯) + π(β))2}
34
Mensubstitusikan π =π¦βπ₯
β maka ππ¦ = βππ , sehingga diperoleh : πππ (πΜ(π₯)) = 1 πβ2β« πΎ2(π )π(π₯ + π β)βππ β1 π(π(π₯) + π(β))2 πππ (πΜ(π₯)) = 1 πββ« πΎ2(π )ππ π(π₯ + π β) β1 π(π(π₯) + π(β))2 πππ (πΜ(π₯)) = 1 πβπ (πΎ)π(π₯) + π(β) β1 π(π(π₯) + π(β))2 πππ (πΜ(π₯)) = 1 πβπ (πΎ)π(π₯) + π 1 πβ (2.28) 2.10 Estimator Shibata
Estimator untuk regresi non parametrik kernel dengan menggunakan pemilihan bandwidth shibata dengan mendefinisikan fungsi loss.
Definisi fungsi loss
πΏ(β) = πβ1βππ=1[π(ππ) β πΜβ(ππ)]2 (2.29) Nilai rata-rata dari fungsi loss adalah π (β) = πΈ[πΏ(β)] yang disebut dengan Risk.
π (β) = πΈ (πβ1βππ=1[π(ππ) β πΜβ(ππ)]2) (2.30) Fungsi π (β) atau πΏ(β) merupakan kriteria yang digunakan untuk mengukur kebaikan estimator. Nilai terkecil dari kriteria adalah suatu indikasi dari estimator yang terbaik. Perhitungan lain yang berhubungan dengan π (β) adalah salah satu prediksi risk yang disebut dengan prediksi mean square error yang berhubungan dengan π (β) yaitu :
π(β) = π2+ π (β) (2.31)
35
meminimumkan π(β) juga akan meminimumkan π (β). Sehingga untuk mengestimasi nilai π(β) adalah dengan mean square error.
πππΈ(β) = πβ1βππ=1(ππβ πΜβ(ππ))2 (2.32) Nilai πππΈ(β) merupakan nilai estimator yang bias terhadap nilai π(β), untuk membuktikan bahwa nilai πππΈ(β) bias terhadap nilai π(β) dapat dilihat pada uraian berikut :
πππΈ(β) = πβ1βππ=1(ππβ πΜβ(ππ))2
= πβ1βππ=1[ππ2 + πΜβ2(ππ) β 2 (πππΜβ(ππ))] Dengan memperhatikan nilai ππ = π(ππ) + ππ, maka :
πππΈ(β) = πβ1βππ=1[(π(ππ) + ππ)2+ πΜβ2(ππ) β 2 (π(ππ)) + πππΜβ(ππ)] = πβ1βππ=1[π2(ππ) + ππ2+ 2π(ππ)ππ+ πΜβ2(ππ) β 2 (π(ππ)πΜβ(ππ) + πππΜβ(ππ))] = πβ1βππ=1[π2(ππ) + ππ2+ 2π(ππ)ππ+ πΜβ2(ππ) + (β2π(ππ)πΜβ(ππ) β 2πππΜβ(ππ))] = πβ1βππ=1[ππ2+ π2(ππ) + πΜβ2(ππ) β 2π(ππ)πΜβ(ππ) β 2πππΜβ(ππ) + 2π(ππ)ππ] = πβ1βππ=1[ππ2+ π2(ππ) + πΜβ2(ππ) β 2π(ππ)πΜβ(ππ) β 2πππΜβ(ππ) β π(ππ)] (2.33)
36 πΏ(β) = πβ1βππ=1[π(ππ) β πΜβ(ππ)]2 = πβ1β[π2(ππ) + πΜβ2(ππ) β 2π(ππ)πΜβ(ππ)] π π=1
Maka persamaan (2.33) menjadi :
πππΈ(β) = πβ1βπ=1π ππ2+ πΏ(β) β 2πβ1βππ=1ππ(πΜβ(ππ)) β π(ππ) Dengan melihat bahwa nilai error ππ adalah nilai ekspektasi nol dan variansi π2 maka : πΈ[πππΈ(β)] = πβ1βππ=1πΈ(ππ2) + πΈ(πΏ(β)) β 2πβ1πΈ(βππ=1ππ(πΜβ(ππ)) β π(ππ)) = π2+ π (β) + πΈπΆππ (2.34) Dengan nilai πΈπΆππ= β2πβ1πΈ (βππ=1ππ(πΜβ(ππ)) β π(ππ)) (2.35) Untuk estimator kernel shibata untuk πΜβ(π₯) dari fungsi regresi adalah :
πΜβ(π₯) = πβ1β πβπ(π₯)ππ π π=1 Dimana : πβπ(π₯) =β πΎ ( ππβ π₯ β ) π π=1 βππ=1πΎ (ππββ π₯)
Sehingga dapat diperoleh persamaan untuk estimator shibata dari fungsi regresi adalah(Hafiyusholeh, 2006) :
37
2.11 Pemilihan Bandwidth Optimum
Pada regresi kernel yang menjadi masalah utama adalah pada pemilihan bandwidth yang digunakan untuk menyeimbangkan nilai antara bias dan varians dari fungsi tersebut. Jika nilai bandwidth kecil maka kurva yang dihasilkan kurang mulus tetapi memiliki bias kecil. Sedangkan jika nilai bandwidth besar maka kurva yang dihasilkan terlalu mulus sehingga memiliki bias besar dan varians rendah.
Untuk menghasilkan kurva yang optimal maka dapat dilakukan pemulusan kurva dengan menggunakan bandwidth yang paling optimal. Pemilihan bandwidth optimal dengan menggunakan estimasi shibata.
2.12 Evaluasi Ketepatan Model 2.12.1 Koefisien Determinasi
Koefisien determinasi digunakan untuk mengetahui seberapa besar keterlibatan antara variabel independen terhadap variabel dependennya, sehingga untuk mendapatkan nilai koefisien determinasi dapat dihitung dengan persmaan berikut :
π 2 = π½πΎπ π½πΎπ = π½πΎπ π½πΎπ +π½πΎπΊ (2.45) Keterangan : π½πΎπ (π½π’πππβ πΎπ’πππππ‘ πππππππ’ππ) = βππ=1(π¦Μ1β π¦Μ )2 π½πΎπΊ (π½π’πππβ πΎπ’πππππ‘ πΊππππ‘) = βπ (π¦πβ π¦Μ1)2 π=1 π½πΎπ (π½π’πππβ πΎπ’πππππ‘ πππ‘ππ) = π½πΎπ + π½πΎπΊ
38
π 2 = koefisien determinasi π¦π = data aktual subjek ke-π π¦Μ1 = hasil estimasi subjek ke-π π¦Μ = rat-rata data aktual
Nilai koefisien determinasi berada di titik interval 0 sampai dengan 1. Apabila nilai koefisien determinasi semakin mendekati 1, maka model yang dihasilkan semakin baik. Akan tetapi jika sebaliknya, apabila nilai koefisien determinasi semakin mendekati 0, maka model yang dihasilkan kurang baik(Nanda, Suparti, & Hoyyi, 2016).
2.12.2 MSE (Mean Square Error)
Untuk melihat seberapa besar nilai kegalatan dari suatu estimator dapat dilihat dari nilai MSE (Mean Square Error). Jika semakin kecil nilai MSE maka semakin baik hasil atau model yang diperoleh. Persamaan yang digunakan untuk menghitung nilai MSE adalah (Sungkawa & Megasari, 2011):
πππΈ =βππ=1ππ2 π β π πππΈ = ββππ=1ππ2 π πππΈ =βπ (ππβπΉπ)2 π=1 π (2.46) Keterangan :
ππ = (ππβ πΉπ) = kesalahan pada periode ke-i ππ = data aktual periode ke-i
39