• Tidak ada hasil yang ditemukan

PENENTUAN ESTIMASI PARAMETER REGRESI DENGAN VARIABEL DEPENDEN TERSENSOR. Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENENTUAN ESTIMASI PARAMETER REGRESI DENGAN VARIABEL DEPENDEN TERSENSOR. Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang"

Copied!
6
0
0

Teks penuh

(1)

DEPENDEN TERSENSOR

Ignacia Diana Larissa1 dan Dwi Ispriyanti2 1, 2

Program Studi Statistika Jurusan Matematika FMIPA Universitas Diponegoro Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang

Abstract. Regression analysis is a statistical analysis that use relation between two or more

variables. To use regression analysis, the value of each variable (dependent or independent) must be available. In fact, not all of the information is available. Missing value on dependent variable cause Ordinary Least Square is no longer to be used. One method to handle this problem is censored regression. On this regression, missing value is replaced with a censored point. This censored point may occur naturally or made by researcher, depend on the goal of research. Maximum Likelihood Method following Newton-Raphson Iteration Method, is used to get parameter estimation of censored regression. Test of model signification uses Likelihood Ratio-test and Wald-Ratio-test.

Keywords: censored point, maximum likelihood method, Newton Raphson Iteration method.

1. PENDAHULUAN

Model regresi linear adalah suatu model yang digunakan untuk mengetahui hubungan antara sebuah variabel dependen dengan satu atau lebih variabel independen. Menurut [2] persamaan umum model regresi adalah:

i ip p i i i x x x y =β +β +β +…+β +ε 2 2 1 1 0 . Masing-masing koefisien diestimasi dengan menggunakan metode kuadrat terkecil (Ordinary Least Square). Menurut G. David Garson model regresi dengan metode OLS hanya cocok diterapkan untuk variabel dependen yang kontinu dan tidak mengalami pembatasan nilai. Tetapi pada kenyataannya, variabel dependen dapat mengalami pembatasan nilai atau sering disebut sebagai variabel dependen tersensor ( terbatas).

Misalkan ingin diteliti besarnya pengeluaran konsumsi telur suatu rumah tangga dikaitkan dengan tingkat pendidikan kepala rumah tangga, jumlah anggota rumah tangga, dan rata-rata pengeluaran per bulan suatu rumah tangga. Kenyataannya tidak semua rumah tangga terpilih memiliki informasi tentang besarnya jumlah pengeluaran untuk

tersebut tidak memberikan informasi tentang seberapa besar pengeluaran konsumsi telur. Dengan hilangnya informasi terhadap variabel X tersebut , maka metode kuadrat terkecil tidak dapat digunakan untuk mengestimasi parameternya.

Salah satu metode statistika yang dapat digunakan untuk menentukan model bila terjadi pembatasan pada variabel dependennya adalah model regresi tersensor. Pada model regresi tersensor beberapa nilai sampel dicatat sebagai nilai batas dari nilai yang sebenarnya. Data pengamatan pada variabel jenis ini mengelompok akibat adanya batas bawah (tersensor kiri), batas atas (tersensor kanan) atau dapat juga keduanya. Pembatasan tersebut dapat terjadi secara alamiah seperti beberapa nilai yang lebih dekat terhadap suatu nilai tertentu. Pembatasan juga dapat ditentukan oleh peneliti tergantung pada tujuan penelitiannya [1]. Adanya pembatasan terhadap suatu nilai tertentu terhadap variabel dependen Y, sebut saja a, mengakibatkan distribusi data tersebut berubah. Jika suatu populasi telah diketahui berdistribusi normal, maka

(2)

tertentu berubah menjadi distribusi normal tersensor.

Sebelum pembentukan model regresi tersensor, terlebih dahulu harus ditentukan dulu mean tersensor dan varian tersensor dari distribusi normal tersensor, sehingga mempermudah langkah selanjutnya untuk melakukan estimasi terhadap parameter-parameternya.

2. METODE MAKSIMUM

LIKELIHOOD

Misalkan X variabel random distribusi probabilitas f(x|θ), dengan parameter tunggal θ tidak diketahui. Misalkan X1, X2, …, Xn adalah sampel random dari populasi dengan densitas f(xi|θ1, θ2,...,θk), maka menurut [5], fungsi

Likelihood didefinisikan dengan:

(

)

(

)

= = n i k i k X f x L 1 2 1 ~ 2 1,θ , ,θ / /θ,θ , ,θ θ … …

Untuk menentukan estimator maksimum Likelihood dari θ dapat digunakan langkah berikut ini:

 Tentukan fungsi Likelihood:

(

1, 2, , /X~

)

Lθ θ  θk

(

)

= = n i k i x f 1 2 1, , , /θ θ θ .

 Bentuk log Likelihood : l logL

(

θ1,θ2, ,θk /X~

)

… =

 Tentukan turunan dari l terhadap θ12,…,θk :

(

)

~ 2 1, , / logL k X i θ θ θ θ … ∂ ∂ .  Bentuk persamaan Likelihood dan

selesaikan

(

, , , /

)

0 log ~ 2 1 = ∂ ∂ X L k i θ θ θ θ … 3. DISTRIBUSI NORMAL TERSENSOR

Variabel tersensor didefinisikan sebagai berikut.

Misalkan y* berdistribusi normal dengan mean µ dan varian σ2,

   ≤ = lainnya jika , * * jika , y a y a y

maka probabilitas tersensor y = a bernilai Prob(y = a) = Prob (y* ≤ a)

= * * 2 1 exp 2 1 2 dy y a

             − − σ µ σ π =

− ∝ − − σ µ π a z dz e 2 2 1 2 1 , dengan σ µ − = y* z dan 1 dy*=dz σ . Sehingga       − Φ = = σ µ a a y ) ( ob Pr .

Sedangkan untuk probabilitas tidak tersensor y = y* adalah

Prob (y = y*) = Prob (y* > a) =1−Prob(y*≤a) =       − Φ − σ µ a 1

Menurut [4] fungsi densitas dari y adalah: j j y a e y f            − Φ         = −       − − σ µ σ π σ µ 1 2 1 2 2 1 ) ( = j j a y             − Φ             − − σ µ σ µ φ σ 1 1 , (5) dengan    = = lainnya jika , 0 jika , 1 y a j ,

φ dan Φ masing-masing adalah fungsi densitas dan fungsi distribusi dari distribusi normal standar. Selanjutnya dari persamaan (5) diperoleh densitas untuk nilai y = y* atau nilai y > a adalah

= *) ( y f       − σ µ φ σ * 1 y

dan densitas dari y = a adalah :       − Φ = = = σ µ a a y a f( ) Prob( ) .

(3)

Gambar 1. Variabel Normal y* dan Variabel Tersensor y

Menurut [3] momen untuk variabel normal tersensor adalah: jika y* ~ N[µ,σ2] maka ) )( 1 ( ] [ya+ −Φ µ+σλ E dan ] ) ( ) 1 )[( 1 ( ] [y =σ2 −Φ −δ + α−λ 2Φ Var dengan σ µ α = a− ,

( )

α σ µ Φ =       − Φ a ,

( )

α φ φ σ µ φ = =      −a ,

( )

Φ − = = 1 φ α λ λ dan λ2 −αλ =δ .

4. MODEL REGRESI TERSENSOR Model yang didasarkan pada variabel dependen tersensor disebut dengan model regresi tersensor . Model ini dibentuk dengan mengaitkan mean yang sudah diperoleh sebelumnya dengan model regresi linear. Persamaan umum model tersebut adalah yi*=xi'β+εi dan    > ≤ = a y y a y a y i i i i * jika , * * jika , , dimana: * i

y : variabel dependen laten i

y : variabel dependen yang diamati

[

i ik

]

i x1 x12 … x ' = 1 x : vektor variabel independen               = k β β β β 1 0

: vektor koefisien dan

aadalah titik sensor, dan εi diasumsikan berdistribusi normal dengan mean 0 dan

normal maka menurut [2] dapat diasumsikan yi* ~ N

(

x'iβ,σ2

)

dan

(

ε

)

f

( )

ε

f i i' =

/ x .

Nilai ekspektasi variable dependen baru i y diketahui x'i adalah

(

/ '

)

.

(

1

)

(

σλ 'β

)

i i i i i a y E x =Φ + −Φ +x

(

)

      + Φ − Φ − + Φ = σ φ 'β 1 1 . i i i i i a x

(

i

)

i i i a+ + −Φ Φ = . σφ x'β 1 .

Sedangkan nilai variansi dari variabel dependen baru yi diketahui '

i x adalah

(

yi/ i'

)

2

(

1 i

)(

[

1 i

) (

i i

)

2 i

]

, Var x =

σ

−Φ −

δ

+

α

λ

Φ dengan σ β α ' i i ax = ,

( )

      − Φ = Φ = Φ σ β α ' i i i a x ,

( )

( )

( )

i i i i α α φ α λ λ Φ − = = 1 dan

( )

. '       − = = σ β φ α φ φ i i i a x ESTIMASI PARAMETER

Metode untuk melakukan estimasi parameter tersensor ini digunkan dengan metode Maksimum Likehood dengan variabel dependen baru. Fungsi log-likelihoodnya adalah

(

, / '

)

logL β σ xi                       − Φ               =

= − n i j i j i i x a x y 1 ' 1 ' 1 log σ β σ β φ σ

= −                       − Φ +               = n i j i j i i x a x y 1 ' 1 ' log 1 log σ β σ β φ σ

>               − + + − = a y i i i x y ' 2 2 2 log log 2 1 σ β π σ +

Φ −a xiβ ' log

(4)

Dengan mengganti σ β γ = dan σ θ = 1 maka fungsi log likelihoodnya menjadi

(

'

)

/ , logLθ γ xi

(

)

[

]

> − + + − − = a y i i i x y ' 2 2 2 log log 2 1 γ θ π θ

(

)

= − Φ + a y i i x a γ θ ' log

(

)

[

]

> − + − − = a y i i i x y ' 2 2 log 2 log 2 1 γ θ θ π

(

)

= − Φ + a y i i x a γ θ ' log . dan log

(

, /

)

0 ' =       ∂ ∂ = γ θ γ θ xi L G , di mana

(

)

      ∂ ∂ γ θ γ θ ' / , logL xi

(

)

[

]

   − + − −       ∂ ∂ =

>a y i i i x y ' 2 2 log 2 log 2 1 γ θ θ π λ θ log

(

'

)

=0   − Φ +

=a y i i x a γ θ .

Dilakukan perhitungan secara terpisah:

I.

[

(

)

]

  − + − − ∂ ∂

>a y i i i x y ' 2 2 log 2 log 2 1 γ θ θ π θ log

(

'

)

=0   − Φ +

=a y i i x a γ θ

(

)

> > − − − − 0 0 ' ) 2 ( 2 1 1 ) 2 ( 2 1 i i y y i i i y x y θ γ θ

(

)

(

)

= = − Φ − + 0 ' ' 0 i y i i x a x a a γ θ γ θ φ

(

)

= > > = + − − a y i a y y a i i i y x a y i i 0 ) ( 1 θ 'γ λ α θ

(

)

= > = +     − − a y i a y i i i i i a x y y ( ) 0 1 θ 'γ λ α θ , dengan ) ( ) ( ) ( i i i α α φ α λ Φ = . II. 

[

(

)

]

  − + − − ∂ ∂

>a y i i i x y ' 2 2 log 2 log 2 1 γ θ θ π λ log

(

'

)

=0   − Φ +

=a y i i x a γ θ

(

)

(

(

)

)

0 ) 2 ( 2 1 0 ' ' ' ' ' = − Φ − − − − −

= > i i y i i i a y i i i x a x a x x y x γ θ γ θ φ γ θ

(

'

)

'

( )

0 ' = − −

>a = y y a i i i i i i i x x y x θ γ λα .

Kemudian penyelesaiannya digunakan metode iterasi Newton Raphson.

Metode Newton Raphson Untuk Regresi Tersensor

Turunan kedua dari persamaan diatas adalah :

(

)

θ θ γ θ ∂ ∂ ∂2 ' / , logL xi

(

)

( )

      +     − − ∂ ∂ =

>a = y y a i i i i i i a x y y θ γ λα θ θ ' 1

(

)

(

)

= > Φ − − +       − − = a y i i a y i i i a x x a a y λ θ γ θ φ θ ' ' 2 2 1

(

)

> = + −       − − = a y y a i i i i i i a y2 2 2 2 1 λ λ α θ ,

(

)

γ θ λ θ ∂ ∂ ∂2 ' / , logL xi

(

)

( )

      +     − − ∂ ∂ =

= > y a i a y i i i i i a x y y θ γ λ α θ θ ' 1

(

2

)

' ' i a y i i i a y i ix a x y i i

= > + + = αλ λ ,

(

)

γ γ λ θ ∂ ∂ ∂2log , / ' i x L

(

)

( )

      − − ∂ ∂ =

>a = y y a i i i i i i i x x y x θ γ λα γ ' ' '

(

)

(

)

> =       − Φ − − − = a y y a i i i i i i i a x x a x x x γ θ γ θ φ ' ' ' ' '

[

(

)

]

> = + − − = a y y a i i i i i i i i i x x x x' ' ' 'αλ λ2 ,

(5)

(

)

θ γ γ θ ∂ ∂ ∂2log , / ' i x L

(

)

( )

      − − ∂ ∂ =

>a = y y a i i i i i i i x x y x θ γ λα θ ' ' '

(

)

(

)

> =       − Φ − − = a y y a i i i i i i i a x x a x y x γ θ γ θ φ ' ' ' '

[

(

)

]

> = + + = a y y a i i i i i i i i x a y x' 'αλ λ2 . Diperoleh matriks turunan kedua adalah

(

)

(

)

(

)

(

)

            ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ = γ γ γ θ θ γ γ θ γ θ γ θ θ θ γ θ ' 2 ' 2 ' 2 ' 2 / , log / , log / , log / , log i i i i x L x L x L x L G , atau      = 22 21 12 11 g g g g G , dengan

(

)

> = + −       − − = a y y a i i i i i i a y g11 12 2 2 αλ λ2 θ ,

(

2

)

' ' 12 i a y i i i a y i ix a x y g i i

= > + + = αλ λ ,

(

)

[

]

> = + + = a y y a i i i i i i i i x a y x g21 ' 'αλ λ2 dan

(

)

[

]

> = + − − = a y y a i i i i i i i i i x x x x g22 ' ' ' 'αλ λ2 .

Sehingga diperoleh matrik Hessiannya adalah Hm =−G atau

(

)

(

)

(

)

(

)

            ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ − = γ γ γ θ θ γ γ θ γ θ γ θ θ θ γ θ ' 2 ' 2 ' 2 ' 2 / , log / , log / , log / , log i i i i m x L x L x L x L H

Dengan demikian estimasi parameter dengan metode Maksimum Likelihood dengan bantuan metode Newton Raphson dapat dirumuskan m m m m m m H 1g 1 1 ˆ ˆ − + + +       =       γ θ γ θ  , dengan      = 22 21 12 11 h h h h Hm , di mana

(

)

 + + + = yi a i i i h11 12 2 2 αλ λ2 ,

(

)

[

]

> = + − − = a y y a i i i i i i i i x x y h ' 2 ' 12 αλ λ ,

(

)

[

]

> = + − − = a y y a i i i i i i i i x y x h21 ' 'αλ λ2 ,

(

)

[

]

> = + + = a y y a i i i i i i i i x x x h22 ' ' αλ λ2 ' dan

(

)

(

)

            − − − +       − − =

> = > = a y y a i i i i i a y y a i i i i m i i i i y a y y g λ γ θ λ γ θ θ ' ' ' ' 1 x x x x .

Jika nilai estimasi parameter θˆ dan γˆ telah diperoleh maka dengan menggunakan persamaan θ σ ˆ 1 ˆ = dan θ γ β ˆ ˆ ˆ = nilai estimasi parameter σˆ dan βˆ dapat

diperoleh. Sehingga diperoleh model regresi tersensor dugaan yaitu:

(

/ '

)

(

1

)

(

σˆλ 'βˆ

)

i i i i i i x a x y E =Φ ⋅ + −Φ + , dengan         − Φ −         − = σ β σ β φ λ ˆ ˆ 1 ˆ ˆ ' ' i i i x a x a . 5. KESIMPULAN

1. Model regresi dengan metode OLS hanya cocok diterapkan untuk variabel dependen yang tidak mengalami pembatasan nilai.

2. Model regresi dengan variabel dependen tersensor, metode estimasi parameternya digunakan adalah metode Maksimum Likehood yang dilanjutkan dengan metode iterasi Newton Rapshson. Pembatasan dapat terjadi secara alamiah atau dapat juga ditentukan oleh peneliti tergantung pada tujuan penelitiannya. 3. Harga mean dan varian dari regresi

tersensor berturut-turut adalah

E[y]=Φa+(1−Φ)(µ+σλ) dan Var[y]=σ2(1Φ)[(1δ)+(αλ)2Φ] 6. DAFTAR PUSTAKA

[1] Frone, R. Michael (1997), Regression Models For Discrete and Limited

(6)

_forum_regression_models.htmlfrone diakses tanggal 20 Mei 2008.

[2] Greene, H. William (1993), Econometric Analysis, second edition, Macmillan Publishing Company, USA.

[3] Hamilton, James D. (1994), Time Series Analysis, Princeton University Press, UK.

[4] Joreskog, K.G. (2002), Censored Variabels and Censored Regression, http://aac.asm.org/cgi/reprint/50/1/62 diakses tanggal 20 Mei 2008

Gambar

Gambar 1. Variabel Normal y* dan                          Variabel Tersensor y

Referensi

Dokumen terkait

Data-data hasil dari penilaian alumni terhadap dirinya sendiri tersebut akan disegmentasi menggunakan metode pengelompokan data ( clustering ) sehingga hasil

Berdasar- kan hasil analisa yang telah dilakukan, diketahui bahwa sebagian besar orang tua atau wali murid TKIT Al Mukmin memperlihatkan bahwasannya gadget memiliki

Penelitian didasarkan pada kebutuhan informasi akan kombinasi konsentrasi auksin (IBA dan NAA) yang tepat, yang akan berpengaruh baik terhadap pengakaran setek

9/6/PBI/2007 tanggal 30 Maret 2007 dengan mempertimbangkan evaluasi manajemen atas prospek usaha setiap debitur, kinerja (performance) dan kemampuan membayar setiap

Angka kebuntingan 14,3% untuk semen beku pada penelitian ini cukup rendah dibandingkan dengan laporan peneliti sebelumnya, tetapi hal ini dapat dipahami mengingat kuda-kuda

Bila besarnya pengaruh promosi terhadap loyalitas nasabah Bank BRI Kantor Unit Simpang Haru Padang secara langsung adalah sebesar 2,62, maka apabila Bank BRI Kantor Unit Simpang

Berdasarkan hasil penelitian dan pembahasan, dapat disimpulkan bahwa problem posing dalam pembelajaran matematika pada materi segitiga dan segiempat merupakan

Mencakup kegiatan apersepsi, penyampaian tujuan pembelajaran, dan kegiatan-kegiatan pembelajaran yang akan dilakukan peserta didik pada