• Tidak ada hasil yang ditemukan

ESTIMASI MODEL REGRESI SEMIPARAMETRIK DISKRIT

N/A
N/A
Protected

Academic year: 2022

Membagikan "ESTIMASI MODEL REGRESI SEMIPARAMETRIK DISKRIT"

Copied!
7
0
0

Teks penuh

(1)

ESTIMASI MODEL REGRESI SEMIPARAMETRIK DISKRIT

Baiq Diah Fitasari1, Sri Haryatmi2, dan Zulaela2

1 Universitas Islam Al-Azhar Mataram, baiq diah [email protected],

2 Universitas Gadjah Mada, s [email protected],

3 Universitas Gadjah Mada, [email protected]

Abstract. Approaches that are used to estimate the regression function are paramet- ric regression model approaching and nonparametric regression model approaching.

Semiparametric regression is association of parametric regression and nonparametric regression. Semiparametric regression is used if the relation pattern between inde- pendent variables and dependent variables has the known pattern and also has the unknown pattern. Estimating the unknown regression approaching and in this case is using the Nadaraya Watso estimator. Semiparametric estimator is better than non- parametric estimator for the data which have the unknown relationpattern between dependent and independent variable and also has the unknown relation pattern be- tween dependent and independent variable by using the MSE value.

Keywords: estimator, parametric, Nadaraya-Watson estimator, semiparametric es- timator.

Abstrak. Pendekatan yang digunakan untuk mengestimasi fungsi regresi ada dua jenis yaitu pendekatan model regresi parametrik dan pendekatan model regresi non- parametrik. Regresi semiparametrik merupakan gabungan antara regresi parametrik dan nonparametrik. Regresi semiparametrik digunakan jika pola hubungan antara sekumpulan variabel independen terhadap variabel dependen ada yang polanya dike- tahui dan ada pula yang polanya tidak dapat diketahui. Mengestimasi fungsi regresi yang tidak diketahui dapat menggunakan pendekatan estimator kernel dalam hal ini mengunakan estimator Nadaraya-Watson. Estimator semiparametrik lebih baik dibandingkan dengan estimator nonparametrik untuk data yang sebagian pola hubun- gan variabel dependen dan independennya diketahui dan sebagian polanya tidak dike- tahui dapat dilihat dari nilai MSE yang lebih kecil.

Kata Kunci: estimator, parametrik, estimator Nadaraya-Watson, estimator semi- parametrik.

1 Pendahuluan

Analisis regresi merupakan alat statistik yang banyak digunakan dalam berba- gai bidang, yang bertujuan untuk mengetahui hubungan antara variabel de- penden dan variabel independen [3]. Pendekatan model regresi semiparametrik merupakan pendekatan model baru dalam regresi yang menggabungkan antara regresi parametrik dan nonparametrik, dalam artian sebagian variabel inde- pendennya bersifat parametrik dan sebagian lain bersifat nonparametrik. Re- gresi semiparametrik digunakan jika pola hubungan antara sekumpulan vari- abel independen terhadap variabel dependen ada yang polanya diketahui dan ada pula yang polanya tidak dapat diketahui [8].

Mengestimasi fungsi regresi yang tidak diketahui dapat menggunakan pen- dekatan estimator kernel [9]. Kernel merupakan suatu fungsi yang mewakili

(2)

variabel-variabel independen yang bersifat nonparametrik. Estimator kernel memiliki bentuk yang lebih fleksibel dan perhitungan matematisnya mudah disesuaikan. Estimasi model regresi semiparametrik dapat dilakukan dengan berbagai metode yang ada misalnya metode kuadrat terkecil, metode likeli- hood, metode Mean Square Error (MSE), Root Mean Squared Error (RMSE) dan lain-lain [5], [6].

Variabel diskrit merupakan variabel yang hasil pengukurannya (kodomain) berupa bilangan bulat. Variabel diskrit sering juga dinyatakan sebagai vari- abel kategori. Contoh variabel diskrit dikotomi adalah jenis kelamin, status perkawinan, sedangkan variabel diskrit polikotomi contohnya yaitu tingkat pendidikan. Untuk beberapa model regresi semiparametrik kontinu telah diba- has oleh [4] dan [7]. Berdasarkan uraian di atas penulis tertarik untuk mengkaji tentang estimasi model regresi semiparametrik diskrit dan simulasinya meng- gunakan program R.

2 MODEL REGRESI SEMIPARAMETRIK

Bentuk dari model regresi semiparametrik didefinisikan sebagai berikut [8]:

Yi = m(Xi) + εi, i = 1, 2, .., n (1) dengan Yi adalah nilai variabel dependen ke-i, Xi adalah nilai variabel inde- penden ke-i, m adalah fungsi regresi yang tidak diketahui untuk diestimasi dan εi adalah error dengan mean E(εi) = 0 dan variansi V ar(εi) = σ2 < ∞, serta

m(x) = r(x; β)ω(x) (2)

=: mω(x; β), untuk x ∈ Nd

dengan r(x; β) adalah fungsi parametrik yang tergantung pada parameter yang tidak diketahui β = (β1, · · · , βp)T dan ω(.) fungsi koreksi perkalian non- parametrik.

2.1 Komponen Parametrik

Bentuk dari model linier didefinisikan sebagai berikut [3]:

Yi = β0+ β1Xi+ εi, i = 1, 2, · · · , n (3) dengan Yi adalah nilai variabel dependen ke-i, Xi adalah nilai variabel in- dependen ke-i dan εi adalah error dengan mean E(εi) = 0 dan variansi V ar(εi) = σ2 < ∞. Berdasarkan Persamaan 3 dan dengan menggunakan metode kuadrat terkecil akan diperoleh estimator untuk β0 dan β1 sebagai berikut:

βˆ0= ¯Y − β1X¯ (4)

βˆ1= nPni=1XiYiPni=1XiPni=1Yi

nPni=1Xi2− (Pni=1Xi)2 (5)

(3)

2.2 Komponen Nonparametrik

2.2.1 Gabungan Kernel Diskrit Dalam metode gabungan kernel diskrit fungsi kernel Kx,h(·) merupakan fungsi massa probabilitas (f.m.p) dengan sup- port Sx yang tidak tergantung pada h dan x ∈ Sx. Selain itu, diberlakukan dua asumsi sebagai berikut [2]:

h→0limE(Kx,h) = x (6)

h→0limV ar(Kx,h) = 0 (7)

dimana Kx,h adalah variabel acak diskrit dengan f.m.p adalah Kx,h(·).

2.2.2 Estimasi Regresi Nonparametrik Diketahui estimator Nadaraya- Watson sebagai berikut [5]:

˜

mn(x) =

Pn

i=1YiKx,h(Xi)

Pn

j=1Kx,h(Xj) , x ∈ N (8) dengan h = h(n) > 0 adalah urutan sebarang parameter smoothing yang memenuhi limn→∞h(n) = 0 dan Kx,h(·) adalah gabungan fungsi kernel diskrit.

Teorema 1. Misalkan f merupakan f.m.p dari variabel acak diskrit X yang didefinisikan pada N. Diasumsikan bahwa f (x) = P (X = x) > 0 untuk x ∈ N.

Selanjutnya, andaikan bandwidth h = h(n) > 0 memenuhi limn→∞h = 0 dan kernel diskrit Kx,h(·) memenuhi asumsi 6 dan 7, maka bias dan variansi dari

˜

mn(x) yaitu:

Bias[ ˜mn(x)] =



m(2)(x) + 2m(1)(x)

f(1) f



(x)

V ar(Kx,h)

2 + O

1 n



+ o(h) (9)

V ar[ ˜mn(x)] = V ar(Y |X = x)

nf (x) [P (Kx,h= x)]2+ o(1

n) (10)

dengan f(1), m(1) dan m(2) merupakan turunan hingga.

Bukti. Estimator regresi nonparametrik pada Persamaan 8, dapat ditulis se- bagai:

˜

mn(x) = Nn(x; h)

Dn(x; h) (11)

dengan Dn(x; h) = n−1Pnj=1Kx,h(Xj) dan Nn(x; h) = n−1Pni=1YiKx,h(Xi).

Konvergensi dari Dn(x; h) ke f (x) ditentukan menurut [1] dan dengan cara yang sama konvergensi dari Nn(x; h) ke mf (x) dapat diperoleh. Kemudian, berdasarkan deret Taylor dapat ditulis sebagai berikut:

˜

mn(x) = m(x) + 1

f (x)[Nn(x; h) − (mf )(x)] −(mf )(x)

f2(x) [Dn(x; h) − f (x)]

− 1

f2(x)[Nn(x; h) − (mf )(x)][Dn(x; h) − f (x)]

+Nn(x; h)

f3(x) [Dn(x; h) − f (x)]2[1 + o(1)]a.s (12)

(4)

Ekspektasi dari Dn(x; h) dapat didekati dengan E[Dn(x; h)] = f [E(Kx,h)] + 1

2V ar(Kx,h)f(2)(x) + o(h) , h → 0 Dengan cara yang sama, untuk ekspektasi dari Nn(x; h) diperoleh:

E[Nn(x; h)] = (mf )[E(Kx,h)] + 1

2V ar(Kx,h)(mf )(2)(x) + o(h) (13) Dengan demikian, berdasarkan asumsi 6 dari gabungan kernel diskrit, diper- oleh:

Bias[Dn(x; h)] = E[Dn(x; h)] − f (x) = 1

2V ar(Kx,h)f(2)(x) + o(h) (14) dan

Bias[Nn(x; h)] = E[Nn(x; h)]−(mf )(x) = 1

2V ar(Kx,h)(mf )(2)(x)+o(h) (15) Selanjutnya,

E



Nn(x; h)[Dn(x; h) − f (x)]2



= O(1/n)2+ O(1/n) + E[Dn(x; h) − f (x)]2E[Nn(x; h)] (16) sehingga diperoleh

E[ ˜mn(x)] − m(x) =

(mf )(2)(x)

f (x) − mf(2)(x) f (x)

V ar(Kx,h)

2 + O(1/n) + o(h) dan

M SE(x) = V ar[ ˜mn(x)] + Bias2[ ˜mn(x)]

=



m(2)(x) + 2m(1)(x)

f(1) f



(x)

2V ar2(Kx,h) 4

= E(Y12|X1 = x) − f (x)E2(Y1|X1 = x)

nf (x) [P (Kx,h= x)]2 +o



h2+ 1 n



(17)

3 ESTIMASI REGRESI SEMIPARAMETRIK

Bentuk estimator semiparametrik dari m dapat ditulis sebagai:

ˆ

mn(x) = r0(x)˜ωn(x) =

n

X

i=1

YiKx,h(Xi)

Pn

j=1Kx,h(Xj) × r0(x)

r0(Xi), x ∈ N (18)

(5)

Teorema 2. Misalkan diberikan x titik di N yang memenuhi f (x) = P (X = x) > 0. Diasumsikan bahwa fungsi regresi memenuhi m(x) = r0(x)ω(x) dengan r0(x) = r(x; β0) sebagai awal tetap. Maka, dengan syarat h = h(n) → 0 untuk n → ∞, estimator ˆmn(x) membuktikan

Bias[ ˆmn(x)] =



r0(x)ω(2)(x) + 2r0(x)ω(1)(x)

f(1) f



(x)

V ar(Kx,h) 2 +O

1 n



+ o(h) (19)

V ar[ ˆmn(x)] = V ar(Y |X = x)

nf (x) [P (Kx,h = x)]2 + o

1 n



(20) dengan f(1), ω(1) dan ω(2) merupakan beda hingga.

Bukti. Bukti dari teorema ini diperoleh dengan cara yang sama pada Teorema 1. Estimator semiparametrik ˆmn(x) dapat ditulis sebagai

ˆ

mn(x) = Hn(x; h) Fn(x; h)

dan dengan deret Taylor diperoleh persamaan yang sama seperti Persamaan 12

dengan Hn(x; h) = n−1Pni=1[r0(x)/r0(Xi)]YiKx,h(Xi) dan Fn(x; h) = n−1Pnj=1Kx,h(Xj) = Dn(x; h). Nilai ekspektasi dari ˆmn(x) yaitu

E[Hn(x; h)] = (mf )(x) + 1

2V ar(Kx,h)r0(x)(ωf )2(x) + o(h) (21) dan nilai biasnya adalah sebagai berikut

Bias[Hn(x; h)] = E[Hn(x; h)] − (mf )(x)

=1

2V ar(Kx,h)r0(x)(ωf )2(x) + o(h) Kemudian untuk variansi,

V ar[Hn(x; h)] = n−1r0(x)



(E(ωf )2(Kx,h2 )) − (E(ωf )(Kx,h))2



Untuk mendapatkan bias ˆmn(x) dan Var ˆmn(x), menggunakan argumen yang sama seperti dalam bukti Teorema 1.

4 STUDI KASUS

Dalam penelitian ini akan digunakan data sekunder. Data sekunder yang di- gunakan merupakan informasi data yang diperoleh dari SMA Muhammadiyah Kecamatan Masbagik Kabupaten Lombok Timur Provinsi Nusa Tenggara Barat.

Data tersebut berupa data pembelajaran kooperatif tipe jigsaw dan dan ak- tivitas belajar siswa terhadap prestasi belajar siswa kelas X tahun pelajaran 2011/2012. Data ini digunakan untuk studi kasus dalam mengestimasi model

(6)

regresi semiparametrik diskrit dan untuk melakukan analisis data menggu- nakan program R. Pada penelitian ini yang menjadi variabel independen adalah pembelajaran kooperatif tipe jigsaw dan aktivitas belajar siswa dengan vari- abel independen adalah prestasi belajar siswa, serta yang menjadi sampel pada penelitian ini adalah kelas X.3 yaitu sebanyak 28 orang siswa.

Analisis data menggunakan program R. Dari hasil analisis data diperoleh hasil sebagai berikut:

1. Komponen Parametrik

Dengan menggunakan regresi linier diperoleh nilai ˆβ0 = 19, 8626915 dan βˆ1 = 0, 9539114.

2. Komponen Nonparametrik

Dengan menggunakan estimator Nadaraya-Watson diperoleh nilai M SE = 4605, 595

3. Komponen Semiparametrik

Dengan menggunakan hasil estimator yang pada sub bab 3 diperoleh nilai M SE = 88, 74602

5 KESIMPULAN

Berdasar atas hasil dan pembahasan dapat diambil kesimpulan sebagai berikut:

1. Estimator model regresi semiparametrik diskrit diperoleh sebagai berikut:

ˆ

mn(x) = r0(x)˜ωn(x) =

n

X

i=1

YiKx,h(Xi)

Pn

j=1Kx,h(Xj) × r0(x)

r0(Xi), x ∈ N

2. Bias asimtotik dan variansi asimtotik dari estimator model regresi semi- parametrik diskrit diperoleh sebagai berikut:

Bias[ ˆmn(x)] =



r0(x)ω(2)(x) + 2r0(x)ω(1)(x)

f(1) f



(x)

V ar(Kx,h) 2 +O

1 n



+ o(h)

V ar[ ˆmn(x)] = V ar(Y |X = x)

nf (x) [P (Kx,h = x)]2 + o

1 n



3. Nilai MSE dari model regresi semiparametrik diskrit adalah MSE=88,74602 lebih kecil dibandingkan dengan nilai MSE dari model regresi nonparametrik MSE=4605,595. Jadi, dapat dikatakan bahwa dalam hal ini estimator re- gresi semiparametrik diskrit lebih baik dibandingkan dengan estimator re- gresi nonparametrik.

Daftar Pustaka

[1] Abdous, B., Kokonendji, C. C., dan Senga Kiesse, T. 2010. On Semiparametric Regression for Count Explanatory Variables Journal of Statistical Planning dan Inference. 6:1537-1548.

(7)

[2] Kokonendji, C. C., dan Senga Kiesse, T. 2011. Discrete Associated Kernels Method and Exten- sions. Statistical Methodology. 8:497-516.

[3] Draper, R. N., dan Smith, H. 1996. Applied Regression Analysis. Johan Wiley dan Sons, Inc.

[4] Fan, J., Wu, Y., dan Feng, Y. 2009. Local Quasi-Likelihood with a Parametric Guide. The Annals of Statistics. 37:4153-4283.

[5] Hardle, W. 1991. Smoothing Techniques with Implementation in S. SpringerVerlag. New York.

[6] Hastie, T. J., dan Tibshirani. 1990. Generalized Additive Model 4th ed. Chapman dan Hall.

London.

[7] Martins-Filho, C., Mishra, S., dan Ullah, A. 2008. A Class of Improved Parametrically Guided Nonparametric Regression Estimators. Econometrics Reviews. 27:542-573.

[8] Ruppert, D., Wand, M. P., dan Carrol, R. J. 2003. Semiparametric Regression. Cambridge University. United Kingdom.

[9] Wand, M. P., dan Jones, M. C. 1995 Kernel Smoothing. Chapman dan Hall. London.

Referensi

Dokumen terkait

Sebaran data dari variabel yang diketahui bentuk kurva regresinya diduga menggunakan regresi parametrik, sedangkan peubah yang tidak diketahui bentuk kurva

Salah satu keunggulan pendekatan regresi nonparametrik dengan menggunakan Deret Fourier adalah mampu mengatasi data yang mempunyai pola berulang, yaitu

Berdasarkan hasil analisis yang telah dilakukan untuk menentukan estimasi model regresi nonparametrik kernel dengan estimator Nadaraya-Watson, maka dapat disimpulkan

Regresi nonparametrik merupakan suatu teknik analisis data dalam statistika yang da- pat menjelaskan hubungan antara variabel prediktor dengan variabel respon yang tidak

3.4 Estimasi Model Regresi Semiparametrik dengan Metode Likelihood Maximum Penalized. Suatu asumsi ideal yang telah dikenal umum dalam suatu model

Teknik smoothing yang digunakan untuk memperkirakan model regresi nonparametrik pada data longitudinal adalah estimator polinomial lokal terboboti, untuk membuat algoritma dan

Namun dalam perkembangan analisis regresi, untuk mengatasi permasalahan bila variabel prediktornya tidak dapat diestimasi dengan pendekatan parametrik maupun nonparametrik,

Pada kasus riil-nya dengan variabel bebas lebih dari 1 multivariabel, seringkali dijumpai kasus yang dimana sebagian pola hubungan antara variabel terikat dengan bebas diketahui, dan