• Tidak ada hasil yang ditemukan

Estimasi Model Regresi Nonparametrik Dengan Menggunakan Metode Maksimum Likelihood Pada Distribusi Normal Multivariat

N/A
N/A
Protected

Academic year: 2016

Membagikan "Estimasi Model Regresi Nonparametrik Dengan Menggunakan Metode Maksimum Likelihood Pada Distribusi Normal Multivariat"

Copied!
31
0
0

Teks penuh

(1)

ESTIMASI MODEL REGRESI NONPARAMETRIK DENGAN

MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD PADA

DISTRIBUSI NORMAL MULTIVARIAT

SKRIPSI

NOVIA BUDHI ASTRI TARIGAN

090823021

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

(2)

ESTIMASI MODEL REGRESI NONPARAMETRIK DENGAN

MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD PADA

DISTRIBUSI NORMAL MULTIVARIAT

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar sarjana sains

NOVIA BUDHI ASTRI TARIGAN

090823021

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

(3)

PERSETUJUAN

Judul : ESTIMASI MODEL REGRESI NONPARAMETRIK DENGAN MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD PADA FUNGSI DISTRIBUSI MULTIVARIAT

Kategori : SKRIPSI

Nama : NOVIA BUDHI ASTRI TARIGAN Nomor Induk Mahasiswa : 090823021

Program Studi : S1 STATISTIKA Departemen : MATEMATIKA

Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN

ALAM

Di luluskan di Medan, Juli 2013

Komisi pembimbing

Pembimbing 2 Pembimbing 1

Drs. Djakaria Sebayang, M.Si Drs. Rachmad Sitepu, M.Si

1951122719855031002 195304181987031001

Diketahui/Disetujui oleh

Departemen Matematika FMIPA USU Ketua

(4)

PERNYATAAN

ESTIMASI MODEL REGRESI NONPARAMETRIK DENGAN

MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD PADA

FUNGSI DISTRIBUSI MULTIVARIAT

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri. Kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, Juli 2013

(5)

ABSTRAK

(6)

ABSTRACT

(7)

DAFTAR ISI

PERSETUJUAN i

PERNYATAAN ii

PENGHARGAAN iii

ABSTRAK iv

ABSTRAC v

DAFTAR ISI vi

BAB I PENDAHULUAN

1.1Latar Belakang 1

1.2Perumusan Masalah 2

1.3Tinjauan Pustaka 2

1.4Tujuan Penelitian 5

1.5Kontribusi Penelitian 6

1.6Metode Penelitian 6

1.7Sistematika Penulisan 7

BAB II LANDASAN TEORI

2.1 Regresi Nonparametrik 9

2.1.1 Regresi Spline 11

2.2 Metode Maksimum Likelihood 15

2.3 Estimasi Metode Maksimum Likelihood 2.3 Distribusi Normal Multivariate BAB III PEMBAHASAN

(8)

BAB IV PENUTUP

4.1 Kesimpulan 27

4.2 Saran 27

(9)

ABSTRAK

(10)

ABSTRACT

(11)

BAB I

PENDAHULUAN

1.1Latar Belakang

Jika kita mempunyai data yang terdiri dari dua atau lebih variabel maka sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat berhubungan, hubungan yang didapat pada umumnya dinyatakan dalam bentuk matematika yang menyatakan hubungan fungsional antara variabel-variabel. Studi yang menyangkut masalah ini dikenal dengan analisis regresi. Dalam analisis regresi ada beberapa syarat yang harus dipenuhi agar hasil estimasi yang diperoleh adalah benar dan efektif.

Analisis regresi merupakan alat bantu statistika untuk melihat hubungan antara satu atau lebih variabel bebas atau variabel prediktor dan satu variabel tak bebas, untuk keperluan analisis, variabel bebas akan dinyatakan dengan X1,X2,…,Xk

Hasil yang diperoleh dari analisis regresi yang berfungsi untuk melihat hubungan antara 2 variabel yang atau lebih harus diartikan secara hati-hati. Meskipun perhitungan statistika yg digunakan ntuk menghitung estimasi kuat dan sifat hubungan antara variabel telah benar, estimasi statistikanya dapat bias.

(k>1) sedangkan variabel tak bebas akan dinyatakan dengan Y, pada umumnya variabel yang dikumpulkan dari survey atau observasi.

(12)

Dalam statistika inferensi, biasanya diasumsikan bahwa distribusi populasi diketahui. Teknik yang digunakan untuk menaksir nilai parameter bila distribusi populasi diketahui adalah metode maximum likelihood. Metode ini hanya mendasarkan inferensinya pada sampel. Tetapi jika distribusi populasi tidak diketahui maka metode maksimum likelihood tidak dapat digunakan.

1.2 Perumusan masalah

Pada penelitian ini rumusan masalah yang dibahas adalah bagaimana mengestimasi Regresi Nonparametrik dengan estimator Spline pada Generalized Maximum Likelihood yang berdistribusi normal multivariate

1.3 Tinjauan Pustaka

Dalam teknik-teknik dalam regresi nonparametrik memenuhi kebutuhan ini karena tetap valid walaupun tidak diperlukan pemenuhan asumsi kenormalan galat dan hanya berlandaskan asumsi-asumsi yang sangat umum.

Conover (1980) menjelaskan bahwa penggunaan regresi nonparametrik dilandasi pada asumsi:

a. contoh yang diambil bersifat acak dan kontinu ; b. regresi (Y/X) bersifat linier;

c. semua nilai Xi

Regresi nonparametrik merupakan pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuknya atau tidak terdapat informasi masa lalu tentang pola data.

(13)

MAKSIMUM LIKELIHOOD ESTIMATORS

Misalkan variabel acak dengan fungsi probabilitas, dimana merupakan himpunan parameter yang tidak diketahui dan saling independent maka pengkonstruksian fungsi likelihood dapat dinyatakan

f (X1,X2, …, Xn:β) = f(X1,β), f(X2,β), …,f( Xn

=

,β)

=

n

i

Xi f 1

) ,

( β

= L(β ǀ X1,X2, …, Xn

Setelah fungsi likelihood dikonstruksi, langkah selanjutnya adalah mencari nilai estimator yang memaksimumkan fungsi likelihood tersebut. Dalam hal ini, memaksimumkan fungsi likelihood dilakukan dengan menurunkan fungsi likelihood terhadap parameter. Kemudian persamaan hasil turunan tersebut disamakan dengan nol sehingga dapat diperoleh nilai estimator parameter yang memaksimumkan fungsi likelihood tersebut.

)

DISTRIBUSI SAMPLING MULTIVARIATE

Misalkan x sebagai sampel random sampling dari distribusi normal univariat dengan

mean μ dan variansi σ2 dinyatakan sebagai N(μ,σ2

2

1 1

( ) exp ;

2 2 .

x

f x µ x

σ π σ

 

= − − ∞ < < ∞

 

) dengan fungsi densitas probabilitasnya:

.

Kuantitas

2 2 (x µ)

σ

= 2 2

(x−µ σ) − = −(x µ σ) −2(x−µ)untuk membawa ke

(14)

Misalkan 1, 2,...., T p

X = x x x

 sebagai sampel random dari distribusi normal

multivariat p-dimensi dengan vektor mean µ 

dan kovarian matrik ∑pxp dinyatakan

sebagai Np( , )µ ∑

 . Dengan fungsi densitas probabilitasnya dinyatakan dalam

bentuk:

( )

1 1

2 2

1 1

( ) ex p ( ) ( ) ;

2

2 .

T p

f x x µ x µ x

π

= − − ∑ − − ∞ < < ∞

  ;

dengan kuantitas (x−µ)T∑−1(x−µ) merupakan elipsoid.

Model Regresi Linier Multivariat merupakan perluasan dari model Regresi Linier Berganda pada statistik univariat. Model Regresi Linier Multivariat ini dalam bentuk matriks dapat dituliskan sebagai Y = XB +E , dimana Y , X, B dan E berbentuk matriks. Model Regresi Linier Multivariat ini mempunyai parameter yang harus diestimasi yaitu B Selain B, parameter lain yang harus diestimasi adalah

matriks kovarian Σ , dimana matriks kovarian ini menunjukkan variasi pada

pengamatan respon Y.

Selanjutnya akan ditentukan distribusi beserta sifat – sifat dari kedua parameter tersebut. Dalam mencari estimator parameter B dan estimator matriks kovarian digunakan metode Maximum Likelihood Estimation (MLE) sehingga

diperoleh Βˆ dan Σˆ . Untuk kajian distribusi dari estimator parameter model Regresi

(15)

1.4Tujuan Penelitian

Penelitian ini bertujuan untuk melakukan pengestimasian Regresi Nonparametrik spline dengan Generalized Maximum Likelihood serta menyelidiki penerapan Metode Maksimum Likelihood dalam distribusi normal multivariat.

1.5Manfaat Penelitian

1. Sebagai bahan acuan untuk mempelajari permasalahan estimasi guna memudahkan dalam mengambil keputusan

2. Mengembangkan pengestimasian model regresi nonparametrik dengan menggunakan metode maksimum likelihood

3. Mengetahui penerapan metode maksimum likelihood dalam pengidentifikasian outlier distribusi normal multivariate

1.6 Metode Penelitian

Penelitian ini merupakan kajian literatur yang kemudian dikembangkan. Hal ini dilakukan pembahasan tentang mengestimasi titik kurva regresi nonparametrik dengan menggunakan maximum likelihood. Adapun metode penelitiannya:

1. Menjelaskan tentang bentuk umum dari regresi nonparametrik 2. Menjelaskan tentang metode maksimum likelihood

3. Menjelaskan mengenai model regresi nonparametrik spline

4. Menjelaskan bagaimana likelihood dapat mengestimasi kurva regresi f yang termuat dalam suatu ruang tertentu

(16)

1.7 Sistematika Penulisan

Sistematika penulisan diuraikan untuk memberikan kerangka atau gambaran dari Skripsi ini yaitu sebagai berikut ;

BAB 1 : PENDAHULUAN

Pada bab ini berisi tentang latar belakang pengambilan judul, perumusan masalah, tinjauan pustaka, tujuan penelitian, manfaat penelitian, metode penelitianserta sistematika penulisan.

BAB 2 : LANDASAN TEORI

Pada Bab ini berisi tentang bentuk fungsi regresi nonparametrik, regresi nonparametrik spline dalam ruang tertentu, distribusi normal multivariat, distribusi normal univariat serta perbedaan keduanya.

BAB 3 : PEMBAHASAN

Pada Bab ini menjelaskan pembahasan Hubungan antara variabel yaitu estimasi kurva f regresi nonparametrik spline dalam suatu ruang tertentu dengan metode maksimum likelihood serta distribusi normal multivariat.

BAB 4 : KESIMPULAN DAN SARAN

(17)

BAB II

LANDASAN TEORI

2.1 Regresi Nonparametrik

Metode statistika nonparametrik merupakan metode statistika yang dapat digunakan dengan mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistik parametrik. Terutama yang berkaitan dengan distribusi normal. Nama lain yang sering digunakan untuk statistika nonparametrik adalah statistik bebas distribusi.

Istilah yang sering digunakan untuk statistika nonparametrik adalah distribution free statistic atau assumption free test. Dari istilah ini dapat dikatakan bahwa pendekatan statistika nonparametrik merupakan metode penggunaan yang tidak terikat asumsi tentang kurva regesi tertentu. Kurva regresi berdasarkan model regresi nonparametrik ini diawali oleh model yang disebut model regresi nonparametrik.

Regresi nonparametrik memiliki fleksibelitas yang tinggi dalam menafsirkan kurva regresi, karena tidak mengasumsikan bentuk kurva regresi. Dalam pandangan regresi nonparametrik berdasarkan data yang diharapkan dapat dicari taksiran kurva tanpa dipengaruhi oleh subyektifitas dari peneliti (Eubank,1999 : 10).

Ada beberapa teknik penaksiran nilai variabel respon (Y) dalam regresi nonparametrik yakni estimator kernel dan estimator spline.

Berikut ini adalah bentuk umum regresi nonparametrik :

i i x f

(18)

Dengan yi f (x

= variabel respon

i

ε

) = fungsi nonparametrik

i

Tujuan dari regresi nonparametrik adalah untuk menentukan pada penaksiran fungsi regresi daripada penaksiran parameter, kebanyakan dari regresi nonparametrik sederhana secara tidak langsung juga disebut “ scratles plot smoothing “ karena penggunaannya adalah untuk menentukan kurva yang mulus melalui plot pencar y terhadap x (Simanjuntak,2009)

= error, faktor pengguna yang tidak dapat dijelaskan oleh model

Statistika nonparametrik disebut juga statistika bebas sebaran, statistika nonparametrik tidak mensyaratkan bentuk sebaran parameter populasi. Statistika nonparametrik dapat digunakan pada data yang sebaran normal atau ordinal.

Conover (1980) menjelaskan bahwa penggunaan regresi nonparametrik dilandasi pada asumsi:

a. contoh yang diambil bersifat acak dan kontinu ; b. regresi (Y/X) bersifat linier;

c. semua nilai Xi

Regresi nonparametrik merupakan pendekatan regresi yang sesuai untuk pola data yang tidak diketahui bentuknya atau tidak terdapat informasi masa lalu tentang pola data.

saling bebas.

(19)

2.1.1 Regresi Nonparametrik Spline

Ada beberapa teknik estimasi dalam regresi nonparametrik antara lain pendekatan histogram, estimator spline, estimator kernel, estimator deret orthogonal, analisis wavelet dan lain-lain. Pendekatan estimator spline ada bermacam-macam antara lain spline original, spline type M, spline relaxed, spline terbobot dan lain-lain.

Diantara model-model regresi nonparametrik di atas, Spline merupakan model regresi yang mempunyai interpretasi Statistik dan Visual sangat khusus dan sangat baik. Disamping itu Spline mampu menangani karakter data/fungsi yang mulus (smooth). Spline juga memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu.

Bentuk umum dari regresi nonparametrik spline

i i t f

yi= ( )+ε

Dimana f(ti

Dalam regresi nonparametrik Spline, penduga kurva regresi diperoleh dari optimasi PLS atau Penalized Likelihood (PL). Namun untuk menduga kurva regresi yang diperoleh dari optimasi Likelihood dapat menjadi pilihan yang cukup baik karena secara matematik mudah dan sederhana.

) merupakan fungsi yang tidak diketahui yang diduga dan diasumsikan merupakan fungsi yang kontinu diferensiabel.

2.2 Metode Maksimum Likelihood

(20)

nonparametrik dengan pendekatan secara. empiris pada fungsi distribusinya, sehingga dinamakan metode empirical Likelihood.

Dari dua metode tersebut, dapat digunakan untuk mengkontruksi statistik uji kesamaan dua mean pada model semiparametrik (situ Model parametrik dan model yang lain nonparametrik), yaitu dengan metode Maximum Semi — empirical Likelihood Rati test (kombinasi dari metode Likelihood clan metode empirical Likelihood ).

Misalkan X1,X2,…,Xn menyatakan peubah acak yang saling bebas dengan fungsi pada peluangnya dinyatakan oleh f(xi,β) dengan β adalah parameter yang ditaksir dengan metode maksimum likelihood, maka fungsi padat peluang gabungannya adalah :

f (X1,X2, …, Xn:β) = f(X1,β), f(X2,β), …,f( Xn

=

,β)

=

n

i

Xi f 1

) ,

( β

= L(β ǀ X1,X2, …, Xn

Sedangkan metode maximum likelihood estimation adalah merupakan suatu metode untuk memilih estimator yang membuat probabilitas sampel yang diteliti menjadi maksimum.

)

Adapun Fungsi Likelihood yaitu:

L 

  

− +

= 1 0 2 1 1 2

5 , 0 2

2

)) (

( exp ) 2 (

1

σ β β πσ

X y

(21)

      − +

− 2 0 2 1 2 2

5 , 0 2 2 )) ( ( exp ) 2 ( 1 σ β β πσ X y

X . . . X

      − +

− 0 2 1 2

5 , 0 2 2 )) ( ( exp ) 2 ( 1 σ β β

πσ n n

X y .       + =

= n i i i

n y X

L 1 2 1 0 2 5 , 0

2 ( ( ))

2 1 exp ) 2 (

1 β β

σ πσ

. ln fungsi likelihood :

= − − = − + −       − + = + −      − + = n i i i n n i i i n X y X y L 1 2 1 0 1 2 5 , 0 2 1 2 1 0 2 5 , 0 2 )) ( ( 2 ) ( ) 2 ln( )) ( ( 2 1 ) 2 ln( ln β β σ πσ β β σ πσ

Penurunan fungsi likelihood

0 ) ( ) ( 2 1 ) 1 ( 1 2 )) ( ( ) ( 2 1 ) 1 ( 1 2 ) ( ln 1 2 2 2 2 1 2 1 0 2 2 2 2 =       − − − = + −       − − − =

= − = − n i i n i i i n X y n d L d ε σ σ β β σ σ σ

= = − =      = n i i n i

i maka n

n 1 2 2 1 2 2

2 ( ) ˆ ( ) /

2 1 1

2σ σ ε σ ε

2.3 Estimasi Parameter Metode Maximum Likelihood

(22)

2.4 Distribusi Normal Multivariat

Distribusi normal multivariat merupakan suatu distribusi yang diperoleh dari perluasan distribusi normal univariat, perbedaannya dapat dilihat pada dimensinya.

Pada univariat dimensi yang digunakan adalah 1 (p=1), sedangkan untuk bivariat dimensi yang digunakan adalah 2 (p=2) dan untuk multivariate dimensi yang digunakan lebih dari 2 (p>2). Salah satu keuntungan yang diperoleh dari distribusi normal multivariat, adalah secara matematis mudah digunakan dan hasil yang diperoleh memuaskan dan baik serta serta menarik dalam pelaksanaannya (Johnson dan Wicher,2002).

Meskipun demikian, distribusi normal multivariat dalam prakteknya digunakan untuk 2 alasan. Pertama, distribusi normal disajikan sebagai model populasi yang dapat dipercaya di beberapa hal. Kedua, distribusi sampel dari beberapa statistic multivariat secara pendekatannya adalah berdistribusi normal (Johnson danWichern,2002)

Menurut Rencher (2002), beberapa sifat penting dari distribusi normal multivariat diantaranya adalah

(1) distribusi dapat secara lengkap digambarkan hanya melalui rata-rata, variansi dan kovariansi;

(2) plot bivariat dari data multivariat dapat menunjukkan trend linier;

(3) fungsi linier dari variabel yang berdistribusi normal multivariat juga akan berdistribusi normal;

Apabila X mempunyai distribusi normal multivariat dengan vektor ratarata μ

(23)

( )

1 1

2 2

1 1

( ) ex p ( ) ( ) ;

2

2 .

T p

f x x µ x µ x

π

= − − ∑ − − ∞ < < ∞

  ;

Dengan

p : banyaknya variabel

Ʃ : matriks kovariansi

µ : vector

Variabel acak X dikatakan berdistribusi normal dengan rata-rata=µ, dan

variansi = , dimana > 0, jika fungsi kepadatan probabilitas dari X tertentu oleh rumus

f(X)= , untuk -∞ <X<∞

Grafik dari y= f(X) merupakan kurva atau garis lengkung, yang lazim dikatakan berbentuk lonceng (irisan bentuk lonceng).

Pada situasi multivariate terlihat lebih dari satu variabel. Sekelompok variabel (X1,X2,…,Xn) dikatakan berdistribusi normal p-variate dengan vector

(24)

BAB III

PEMBAHASAN

3.1 Estimasi Untuk Kurva Regresi Spline

Fungsi regresi nonparametrik yang telah ditulis pada bab sebelumnya adalah yi = f(xi) + ε

Menurut Fahmeir dan Tuhtz (1994) Taksiran kurva pemulusan f(x

i

i) diperoleh dari data observasi (xi,yi) dengan i=1,2,…,m. Fungsi f(xi) merupakan kurva diasumsikan tidak diketahui bentuknya tetap, f(xi) hanya termuat dalam suatu ruang fungsi termuat di dalam ruang tertentu atau ditulis f ϵ WkP[a,b], dengan xi

W

ϵ [a,b]

dengan:

kP[a,b]= {g;

(f (p) (X))kdx<∞}

Untuk suatu p bilangan positif dan ϵi sesatan random yang diasumsikan berdistribusi normal dengan rata-rata nol dan varians σ2

Selanjutnya estimasi titik untuk kurva f diperoleh dengan menggunakan Optimasi Likelihood. Diberikan suatu Basis untuk ruang Spline berorde k (Budiantara,2001(b)) berbentuk:

.(Wahba,1990)

1

1, ,..., .(t tk t−λ) ,..., (k+ t−λn)k+

dengan (t−λ)k+ = ( ) , 0,

k

t t t

λ λ

λ

 − ≥

(25)

dan λ1, λ2, λ3

f(t

merupakan titik-titik knots. Titik knots merupakan titik perpaduan bersama yang memperlihatkan terjadinya perubahan pola prilaku dari fungsi Spline pada interval-interval yang berbeda. Untuk setiap fungsi f dalam ruang Spline dapat dinyatakan menjadi :

i

= + + = − + n r k r i k r k j j i

jt t

1 0 ) ( λ γ γ

)= (1)

dengan γj γ

merupakan konstanta yang bernilai real.

j ,

Maka Model regresi Spline dapat ditulis menjadi : j= 0,1,…,k,k+1, …,k+n

yi = f(ti) + εi

=

= + + = + − + n r i k r i k r k j j i

jt t

1 0 ) ( λ ε γ γ

Apabila diasumsikan sesatan random εi

2

σ

berdistribusi normal independen dengan

mean nol dan variansi , maka yi juga berdistribusi normal dengan mean f( ti

2

σ

) dan

variansi . Akibatnya diperoleh fungsi Likelihood: L(y,f)

{

(

)



}

     − = − =

2 2 / 1 1 2 2 )) ( ( exp 2 σ

πσ i i

m i t f y =       − − 2 2 2 / 2 2 )) ( ( exp ) 2 ( σ πσ m yi f ti

(26)

Estimasi titik untuk f diperoleh dengan menyelesaikan Optimasi Likelihood

j

Max

{

L(y,f)

}

=

− −

= − ∈ ++ m i i m R y Max n 1 2 2 / 2 ( 2 1 exp( ) 2 {( 1

2 πσ σ

γ

= +

= + − + n r k r r k j j i

jt x

1 2 0 ) ( λ γ

γ )2

Apabila diambil transformasi Logaritma dan mengingat persamaan (1) maka diperoleh fungsi :

Log L(y,λ,γ)= − −

= m i i y m 1 2 2 ( 2 1 ) 2 log(

2 πσ σ

=

+ + = − + n r k r r k j j i

jt x

1 2 0 ) ( λ γ

γ )2

Dengan penyajian matriks, diperoleh:

Log L(y,λ,γ)= ( (, ) )'( ( , ) ) 2 1 ) 2 log( 2 2

2 λ γ λ γ

σ

πσ y T t y T t

m − − − − (2)

denganγ =(γ0123,...,γ6)

y=(y1,…,yn) dan S(t,λ) matrik berukuran mx(n+3) diberikan oleh :

S(T, λ)= 2

2

1 1 1 1 1

1

2 2 2 1

2 ( ) ( ) ( ) ( ) ( , ) ( ) ( ) n k k k k n k k

m m m m m n

t t t t

t t t t

S T

t t t t

λ λ λ λ λ λ λ + + + + + +  − −    − −        − −         

Apabila persamaan (2) diderivatifkan parsial terhadap γ kemudian hasilnya

disamakan dengan nol, didapat :

0 ) ) , ( ( ) ) , ( ( 2 1 ) , , ( log ,

2 =

(27)

Dengan sedikit penjabaran dan mengingat S(t,λ) merupakan matriks dengan rank

penuh, maka diperoleh estimasi Likelihood untuk γ adalah :

y t S t

S t

S

t, ) [ ( , ) ( , )] '( , )

( ' 1

^

λ λ

λ λ

γ =

Estimator kurva regresi f(x) diberikan oleh :

=

) , ( ^

λ t

f S(t,λ)[S'(t,λ)−S(t,λ)]−1S'(t,λ)y

y t W(,λ) =

Dengan

y t

W( ,λ) =S(t,λ)[S'(t,λ)−S(t,λ)]−1S'(t,λ)

Terlihat bahwa ( , ) ^

λ

t

f merupakan estimator linear dalam observasi y dan

sangat tergantung pada titik knots λ12,...,λm . Dalam model Spline titik knots

harus dipilih dengan metode Generalized Maximum Likelihood (GML) (Wang,1998), atau metode-metode yang lainnya. Estimator linear ini sangat membantu dalam membangun inferensi Statistik, seperti interval konfidensi untuk kurva regresi f.

3.2 Penaksiran Dalam Distribusi Normal Multivariat

(28)

Menurut Rencher(2002), metode ini secara konsep adalah sederhana yaitu

dimisalkan diketahui vektor pengamatan x1, x2,...xn dan nilai μ dan Ʃ ditentukan

sedemikian rupa sehingga memaksimumkan densitas bersama dari X, yang disebut sebagai likelihood function. Karena Xi dinyatakan sebagai suatu variabel acak, maka Xi

= ∑ = ∑ n i i

n f x

x x x L 1 2

1, ,..., , , ) ( , , )

( µ µ

akan saling bebas dan densitas bersamanya merupakan perkalian dari densitas x, sehingga fungsi likelihood adalah :

( ) ( )/2

1 1/2

1

exp )

2 (

1 µ µ

π − ∑ − − = −

= xi t xi

n i p 2 / ) ( ) ( 2 / 1 1 exp ) 2 (

1 µ µ

π − ∑ − − − = ∑ ∑ = i t i n i x x n np

Untuk melihat bahwa = x ^

µ memaksimumkan fungsi likelihood, dimulai dengan menambah dan mengurangi x kedalam eksponen dalam Persamaan diatas, sehingga menjadi :

( ) ( ) 2 1 1 1 µ µ ∑ − + − − + − − − =

x x x xi x x

t i

n

i

Ketika bentuk diatas diperluas dalam bentuk xix dan ^ µ

x maka akan

memberikan hasil Ʃi xix=0 sehingga persamaanya menjadi

(29)

L 2 / ) ( ) ( 2 / ) ( ) ( 2 / 1 1 1 exp ) 2 (

1 µ µ

π − ∑ − − − ∑ − − − − = ∑ ∑ = i t i i t n i x x n x x x xi n np

Oleh karena Ʃ-1

0 2 / ) ( )

( − ∑ 1 − ≤

µµ

x x

n t

merupakan matriks yang definitive positif maka diperoleh

dan 0 < exp−n(xi−µ)t∑−1(xi−µ)/2 ≤1

Dimana nilainya akan maksimum pada eksponen sama dengan 0, sehinggal L

akan memaksimumkan pada saat =x ^

µ

Sehingga variabel acak berdistribusi normal multivariate, penaksiran

maksimum likelihood dari µ dan Ʃ adalah :

= = n i i x n x 1 ^ 1 µ T i n i

i x x x x

n ( )( )

1 0 ^ − − = ∑

= W n 1 ^ = ∑

Dimana W= T

i n

i

i x x x x

n 1 ( )( )

1

0

− −

=
(30)

BAB IV

PENUTUP

4.1 Kesimpulan

1. Terlihat bahwa ( , ) ^

λ

t

f merupakan estimator linear dalam observasi y dan

sangat tergantung pada titik knots λ12,...,λm . Dalam model Spline titik

knots harus dipilih dengan metode Generalized Maximum Likelihood (GML) atau metode-metode yang lainnya. Estimator linear ini sangat membantu dalam membangun inferensi Statistik, seperti interval konfidensi untuk kurva regresi f.

2. Pada distribusi normal multivariat telah terpenuhi untuk suatu populasi tertentu, maka penaksir parameter seringkali dapat ditentukan dengan metode MLE.

4.2 Saran

(31)

DAFTAR PUSTAKA

Draper, N. dan Harry Smith. 1981. Applied Regression Analisys. John Wiley & Sons, Inc.New York.

Wahba, G. (1990). Spline Models for Observational Data. SIAM, Philadelphia. Green, P. J. and Silverman, B. W. (1994). Nonparametric Regression and Generalized Linear Models. CRC Press.

W. Hardle (1 992). Applied Nonparametric Regression, reprint edition, Cambridge University Press.

R.L. Eubank ( I 999). Spline Smoothing and Nonparametric Regression, 2nd edition, Marcel Dekker/CRC.

C. Loader (1999). Local Regression and Likelihood, Springer-Verlag.

L. Fahrmeir, and G. Tutz (2001). Multivariate Statistical Modelling Based on Generalized Linear Models, 2nd edition, Springer-Verlag.

G. Wahba (1990). Spline Models for Observational Data, Society for Industrial and Applied Mathematics.

JURNAL

Nonparametric Regression,Appendix to An R and S-PLUS Companion to Applied Regression John Fox, January 2002

Budiantara, I. N. 2001. “Regresi Nonparametrik dan Semiparametrik Serta

Perkembangannya”. Makalah Pembicara Utama pada Seminar Nasional Alumni Pasca

Sarjana Matematika Universitas Gadjah Mada. Yogyakarta.

Budiantara, I. N. 2006. “Regresi Nonparametrik Dalam Statistika”. Makalah Pembicara

Utama pada Seminar Nasional Matematika, Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahua Alam. Universitas Negeri Makasar (UNM), Makasar.

Budiantara, I. N. 2009. “Spline dalam Regresi Nonparametrik dan Semiparametrik : Sebuah

Pemodelan Statitika Masa Kini dan Masa Mendatang”. Pidato Pengukuhan Untuk

Referensi

Dokumen terkait

Namun, jika titik-titik pasangan data tersebar satu sama lain, maka persamaan linier yang baik untuk mengestimasi nilai variabel bebas adalah persamaan linier yang kurvanya

Regresi logistik biner digunakan pada data respon yang mengandung dua kategorik, dan ketika terjadi multikolinearitas pada variabel prediktor yang berskala campuran, maka

Regresi nonparametrik merupakan suatu teknik analisis data dalam statistika yang da- pat menjelaskan hubungan antara variabel prediktor dengan variabel respon yang tidak

parameter model regresi COM-Poisson untuk data tersensor kanan diterapkan pada faktor-faktor yang mempengaruhi banyaknya komplikasi penyakit dari suatu penderita diabetes

Data yang digunakan dalam penerapan model regresi nonparametrik multivariat adalah data berat badan balita pada di Rumah Sakit Haji Surabaya pada tahun 2006

Karena fungsi distribusi dari regresi model logit adalah membentuk distribusi Bernoulli maka dalam mengestimasi parameter β ini dapat didekati dengan estimasi dengan metode

Dalam fungsi spline terdapat titik knot yang merupakan titik perpaduan yang menunjukkan perubahan perilaku kurva pada selang yang berbeda [9].. Dalam bagian ini dibahas

Estimasi parameter model survival distribusi Eksponensial data tersensor dengan menggunakan metode MLE dan metode Bayesian SELF dilakukan dengan data waktu survival 137