Improvisasi Penaksir Model Linier

(1)

Improvisasi Penaksir Model Linier

Mulyana

Jurusan Statistika FMIPA Unpad

1. Pendahuluan

Dalam model linier dengan asumsi kekeliruannya berdistribusi identik independen dengan rata-rata 0 dan varians konstan sama dengan 2_{, menggabungkan antara penaksir} aktual (nilai ramalan) dengan nilai rata-rata merupakan segi (aspect) penting dalam analisis regresi terapan. Misalkan sebuah pabrik farmasi membuat obat dengan formulasi baru dan ingin menelaah daya sembuhnya jika dibandingkan dengan formulasi lama, yang tingkat (lama) kesembuhannya dipengaruhi oleh beberapa variabel pada pasien. Dalam hal ini biasanya yang ditelaah pihak produsen adalah rata-rata tingkat kesembuhan, sedangkan pasien nilai aktualnya, sehingga persoalannya bagaimana menggabungkan kedua telaahan itu secara statistika ?

2. Teori

Perhatikan model linier

e

X

Y







(1)

dengan

Y

, vektor variabel respon (variabel tidak bebas) berukuran nx1

X, matriks variabelexplanatory(variabel bebas) berukuran nxm , m < n, m > 2 , dengan rank penuh



, vektor parameter model berukuran mx1

e

, vektor kekeliruan model berukuran nx1, dengan asumsi

E

 

e



0

, dan

I

E

_

_

_

2













_{, I matriks identitas berukuran nxn}

Dengan menggunakan metode kuadrat terkecil, penaksir untuk  adalah



X

_

X



1

X

_

Y





 

(2) yang merupakan statistik tak-bias dan bervarians minimum, sehingga penaksir aktual untuk

Y

adalah

Y





X



.

Karena

E

 

Y



X



, maka berdasarkan sifat kelinieran, penaksir untuk rata-rata

Y

,

 

Y

E

adalah

E

 



Y



X



, sehingga dari paparan tersebut tersurat bahwa

X



 memiliki peran dua penaksir, yaitu sebagai penaksir nilai aktual dan nilai rata-rata untuk

Y

. Persoalannya bagaimana menyajikan statistik

X



 jika diinginkan perannya lebih dominan sebagai penaksir nilai aktual dari pada sebagai nilai rata-rata atau sebaliknya? Berdasarkan teori Statistika-Matematis, untuk keperluan tersebut diperlukan formulasi dari jumlah kuadrat kekeliruan model, agar bisa dibangun fungsi target beserta fungsi kegagalan (loss function) dan fungsi resikonya (risk function).

Jumlah kuadrat kekeliruan model adalah







 













_e

_Y

_X

_Y

_X

e

(3)

(2)













_

_

_















_

_

_















_

_















_

_





   

X

Y

X

Y

e

(4)

Pada Persamaan (4) tersurat, fungsi kegagalan untuk 



X

jika digunakan sebagai penaksir

X



dibangun atas kombinasi linier yang diboboti dengan persamaan

















_

_

_















_

_

_

















_

_















_

_















_

    

X

c

1 X

Y

X

Y

c

X

,

X

f

(5) c: skalar nonstokastik, 0 < c < 1

Karena suku pertama pada Persamaan (4) merupakan jumlah kuadrat penaksir nilai aktual

Y

dan suku keduanya jumlah kuadrat residu

E

 

Y

, sehingga fungsi target untuk

Y

dapat dibangun berdasarkan persamaan





Y

E

 

Y

T



1 







(6)

: skalar nonstokastik, 0 << 1

Dapat ditunjukan bahwa

T







1 





Y







E

 



Y



X



 dan

E

 

T



X



yang berarti

 



T



X





E

, sehingga

T

identik dengan

Y

. Fungsi kegagalan untuk

T

 jika digunakan sebagai penaksir

T

sama dengan





















_

_

_















_

_





















_

_

_















_

_

_

















_

_















_

_



















_

_















_

_















        

X

Y

1

2 X

X

Y

X

Y

1 X

T

X

T

,

T

f

2 2 (7)

Pada Persamaan (7) tersurat, dua suku pertamanya identik dengan Persamaan (5) dan suku ketiganya merupakan kovarian yang diboboti antara residu nilai aktual dengan residu rata-rata hitung

Y

. Sehingga Persamaan (7) merupakan pengembangan sederhana (simple extention) dari Persamaan (5), yang berarti Persamaan (7) merupakan fungsi kegagalan untuk





X

(jika digunakan sebagai penaksir

X



) yang sebaiknya digunakan, dengan fungsi resiko sama dengan













_

_















_

_





















_

_

_















_

_

_

















_

_















_

_































      

X

Y

X

Y

E

1

2 X

X

E

X

Y

X

Y

E

1 T

T

f

E

2 2

)

(

)

(

,

yang sama dengan total dari penaksir rata-rata jumlah kuadrat kekeliruan (total predictive mean square error). Dari paparan ini disimpulkan bahwa formulasi untuk menggabungkan antara penaksir nilai aktual dengan rata-rata hitungnya harus mengikuti Persamaan (6).

Shalabh (1999) mengemukakan, menggunakan fungsi resiko di bawah fungsi kegagalan dengan Persamaan (7) dapat digunakan dua bentuk penaksir untuk



, yaitu

(3)

penaksir kuadrat terkecil seperti pada Persamaan (2), dan penaksir berdasarkan aturan Stein (Stein-rule estimator), yang persamaannya

 





































Y

H

Y

H

Y

2 m

n

a

1

C S (8)

a: a > 0, skalar karakaterisasi penaksir



X



X

H

_

_

1

_

,

H

C



I



H

, I matriks identitas Dapat ditunjukan S 



bukan penaksir takbias, dan akan merupakan penaksir takbias jika

Y



H

C

Y

_

0

_{, yaitu jika}

_Y



_

_Y

_{(model regresi sangat cocok sebagai model ramalan),}

sehingga dalam penggunaannya harus dikombinasi linierkan dengan penaksir kuadrat terkecil, dengan persamaan S

w

1 b



(



)









 (9) 0<w<1, skalar nonstokastik

Jadi dalam hal ini penaksir untuk

X



, bisa digunakan



X



X

Y

H

Y

X

p

_

_



_

_

1

_

_

(9) atau

Y

H

Y

H

Y

H

Y

2 m

n

a

Y

H

Y

H

Y

H

Y

2 m

n

a

1 X

X

p

_S _S C





_

C



























































  (10)

atau kombinasi liniernya

Y

H

Y

H

Y

H

Y

2 m

n

a

w

Y

H

Y

H

Y

H

Y

H

Y

2 m

n

a

Y

H

w

Y

H

w

1 p

w

p

w

1 P

C C S



























































)

(

)

(

(11)

yang formulasinya setara dengan Persamaan (10).

Jika

p

dan

P

digunakan sebagai penaksir untuk fungsi target

T

, maka









0 X

X

Y

E

X

Y

E

Y

E

1 Y

HE

Y

E

Y

E

1 Y

H

Y

E

Y

1 E

p

T

E

1

_

_

_

_

_

_

_

_

_

_









































)

(

)

(

)

(

)}

(

{

)

(

)

(

(12) dan





































































































































X

Y

H

Y

H

Y

2 m

n

a

w

Y

HE

Y

H

Y

H

Y

2 m

n

a

w

Y

H

Y

H

Y

H

Y

2 m

n

a

Ew

Y

H

Y

E

Y

1 E

Y

H

Y

H

Y

H

Y

2 m

n

a

w

Y

H

Y

E

Y

1 E

P

T

E

C C C C

)

(

)

(

(13)

(4)

karena

₁

Y

H

Y

H

Y

2 m

n

a

w

0 

C



















, maka

E



T



p





E



T



P



Fungsi resiko jika

p

dan

P

digunakan sebagai penaksir untuk fungsi target

T

, masing-masing sama dengan



_T

_p

 

_T

_p







₁



2

_n



₁

₂



_m



2

E

)

p

(

R





















(14)

 



 



















4 2 2

wa

2 m

2 Y

H

Y

1 E

2 m

n

m

n

wa

m

2

1 n

1 P

T

P

T

E

P

R













































(15)

Dari Persamaan (12), (13), (14) dan (15) dapat disimpulkan 1.jika





0

, maka Y T ,

_R

 

_p

_



_n

_

_m



_

2_,

_{  }

_

2 2 2 4

Y

H

Y

1 E

2 m

n

m

n

a

w

m

n

P

R

_





























, sehingga

 

p

R

 

P

R



. Hal ini berarti

p

superior dari

P

jika

p

digunakan sebagai penaksir nilai aktual

Y

, dan karena

p



X



, maka jika

X



 digunakan sebagai penaksir nilai aktual

Y

maka nilai resikonya sama dengan



n



m





2,



2 varians residu

2.jika

0 





1

, dan jika

wa



2 



m



2 

atau





_,

_m

₂

w

2 m

2 a









maka







2 m

2 wa



0 Y

H

Y

1 E

2 m

n

m

n

wa

_





































sehingga

R

 

p



R

 

P

. Hal ini berarti

P

superior dari

p

jika

P

digunakan sebagai penaksir rata-rata

Y

, yang berarti

X



 tidak sepenuhnya dapat dijadikan penaksir aktual

Y

karena terkombinasi dengan sebagai penaksir rata-rata

Dari paparan tersebut, disimpulkan jika

X



 digunakan sebagai penaksir nilai aktual

Y

, maka resikonya



n



m





2,



2 varians residu, dan nilai ini akan cukup kecil jika model regresi cocok digunakan sebagai model ramalan, dan untuk penaksir rata-rata

Y

, E(

Y

), sebaiknya digunakan statistik

 























X

Y

H

Y

H

Y

2 m

n

a

w

X

P

C

karena nilai resikonya lebih kecil dari



n



m





2, jika





,

m

2 w

2 m

2 a









.

3. Terapan

Untuk menggunakan teori ini diperlukan dua kelompok sampel yang identik, dengan sampel kedua merupakan sampel lanjutan dari sampel pertama, misalnya untuk kasus pabrik farmasi seperti yang dikemukan pada pendahuluan, sampel pertama adalah tingkat penyembuhan obat dengan formulasi lama, dan yang kedua dengan formulasi baru.

Jika model linier sampel pertama disajikan seperti pada Persamaan (1), maka untuk sampel kedua oleh

(5)

f f f

X

e

Y







(16)

dengan

Y

_t vektor berukuran kx1, Xf matriks berukuran kxm dengan rank penuh,

n

k

m



.

Sudah dikemukakan pada teori, pada sampel pertama penaksir untuk

X



adalah



X



X

Y

X

p

_

_

1

_

_atau

_p

Y

H

Y

H

Y

2 m

n

a

w

p

)

w

1 (

P





C

















dengan





,

m

2 w

2 m

2 a









,

H

_

X



X

_

X



1

X

_

,

H

C

_

I

_

H

_{, I matriks identitas berukuran}

mxm

dan fungsi targetnya

 

Y



Y

E

 

Y



E

Y

)

1 (

T



















sehingga pada sampel kedua penaksir untuk

X

_f



dapat digunakan f f 1 f f f f

X

Y

p





_







_







atau f f f f f C f f f f

(

1 w

)

p

w

_k

_m

a

₂

Y

_Y

H

_H

_Y

Y

p

P



















dengan





,

m

2 w

2 m

2 a









,

H

_f



X

_f

_





X

_f



X

_f

_





1

X

_f



,

H

_fC



I

_f



H

_f, If matriks identitas berukuran kxk.

dan fungsi targetnya

 

f f



f

 

f



f

(

1 )

Y

E

Y

E

Y

T



















Pada sampel pertama, jika

p

sebagai penaksir

T

(atau

X



 sebagai nilai ramalan

Y

, 







X

Y

) maka nilai resikonya sama dengan



n



m





2,



2varians residu sampel pertama, dan jika

P

sebagai penaksir

T

(atau

P

sebagai penaksir rata-rata

Y

,

E

 



Y



P

) maka nilai resikonya lebih kecil dari



n



m





2. Analog untuk sampel kedua, jika

f

p

sebagai penaksir

T

_f

(atau

X

_f



 sebagai nilai ramalan

Y

_f,

Y

_f



X

_f



) maka nilai resikonya sama dengan





f

2

m

k





 , f2 



varians residu model sampel kedua, dan jika

P

_f sebagai penaksir

T

_f (atau

P

_f

sebagai penaksir rata-rata

Y

_f,

E

 

Y

 _f



P

_f) maka nilai resikonya lebih kecil dari





2 f

m

k





 . Sehingga jika hasil penaksiran pada sampel pertama dan kedua digabungkan, maka penaksir nilai aktual respon sama dengan

p

)

1 (





_f





,

dan penaksir rata-ratanya sama dengan

P

)

1 (





f





.

4. Daftar Pustaka

Searle, S. R., 1971, Linear Models, John Wiley & Sons, New York.

Drafer, N. & Smith, H., 1981,Applied Regression Analysis, second edition, John Wiley & Sons, New York.

Shalabh, 1999,Improving The Prediction in Linear Regression Models, Journal of Statistical Research, Vol. 3 No. 1 pp 33 – 39, Bangladesh.

Graybill, F. A. , 1961, An Introduction to Linear Statistical Models, McGraw-Hill Book Co. Inc., New York

(6)

Berger, J. O., 1985, Statistical Decision Theory and Bayesian Analysis, second edition, Springer-Verlag, New York.

Ohtani, K., 1998, The Excact Risk of Weighted Average Estimator of OLS and Stein-rule Estimator in Regression under Balanced Loss, Statistics & Decisions, Vol. 16, pp 35–45.

Hogg, R. V. & Craig, A. T., 1978, Introduction to Mathematical Statistics, fourth edition, Macmillan Pub. Co. Inc., New York.