Proses inferensi pada model logit
Agus RusgiyonoAbstracts
Let
Y1,Y2,Y3,,Yn
represent the response on a nominal random variable of Bernoulli distribution, with P
Yj 1
p , P
Yj 0
1p where pis a parameter with unknown value. Problems of estimating used smallest square methods in linier regression model can overcome with used maximum likelihood method in logistic regression..Suppose ln( ( ))
ln( )
ln(1 ) 11
p Y
n p Y
p L
n
j j n
j j
n
is
maksimum likelihood estimstors of pˆ . In case can be obtained from first condition, ln(Ln(p)) to
be maximum at point p pˆthen be obtained
n
j j Y n Y p
1 1
ˆ and
that is unbiased estimator because E(Y ) p n
1 ) pˆ ( E
n
1 j
j
To be test hipothesis that pp0, with a large sample size used fact that
0,1 )1 (
)
ˆ
(
0 0
0 N
p p
p p n
Keyword : Estimator, unbiased estimator, test statistic
1. Pendahuluan
Diketahui
Y1,Y2,Y3,,Yn
adalah sampel acak dari distribusi Bernoulli, dengan dua nilai yang mungkin bagi Y yaitu 0 atau 1. Misalkan P
Yj 1
p dan
Y 0 1 pP j dengan p sebuah nilai yang tidak diketahui.
Sebagai ilustrasi , pandang kejadian jenis kelamin anak sapi yang dilahirkan jantan atau betina. Untuk meyakinkan bahwa probabilitas jenis kelamin anak-anak sapi yang dilahirkan jantan atau betina tidak sama, artinya pp0 0,5 Maka untuk setiap kelahiran ke j dikaitkan dengan nilai Yj 1 jika anak sapi yang lahir adalah betina dan
0
j
Y bila anak sapi lahir jantan.
varian yang harus konstan. Sehingga diperlukan fungsi yang menghubungkan varibel
probabilitasnya
peristiwa Y=0.
Penaksiran parameter p ini menggunakan metode maximum likelihhod i
3. Penaksir maksimum Likelihood untuk proporsi p
Sebuah fungsi probabilitas terkait masalah yang tersebut pada sub bab pendahuluan di atas dapat didefinisikan sebagai:
Fungsi likelihood dalam kasus ini didefinisikan sebagai ;
merupakan probabilitas bersama dari
Y1,Y2,Y3,,Yn
., bila p p0Dasar pemikiran taksiran maximum likelihood sekarang adalah memilih p sedemikian hingga probabilitas dari sampel yang diambil maksimal.
Karena memaximalkan Ln(p)equivalent dengan memaximalkan
ln( )
ln(1 )Perhatikan bahwa ini adalah estimator tak bias (Agus Rusgiyono, 1998) karena :
0
lebih dari itu dari teorema limit pusat didapat :
Hasil ini dapat digunakan untuk menguji hipotesis tentang p0
Dalam hal ini dibawah hipotesis null bahwa probabilitas kelahiran sapi jantan dan betina
sama , p0= 0,5 didapat :
0,1Sebuah alasan formal bagi penaksiran maksimum likelihood didasarkan pada fakta bahwa 0<x<1 dan x>1, ln(x) < x – 1. Hall ini diilustrasikan dalam gambar sbb :
1 )
ln(x x
Pertidaksamaan , ln(x) < x – 1 terpenuhi dengan baik untuk x1, dan ln(1) = 1 – 1 = 0 Konsekwensinya :
1 ) (
) ( )
( ) ( ln
0 0
p Y f
p Y f
p Y f
p Y f
j j j
j
Dengan mengambil nilai harapan matematisnya diperoleh :
0 1 1
1 ) 1 ( 1
1
1 0 )
0 (
) 0 ( 1 )
1 (
) 1 (
1 ) (
) ( )
( ) ( ln
0 0 0
0
0 0
0 0
p p
p p
p p
p p
Y P p f
p f Y
P p f
p f
p Y f
p Y f E p
Y f
p Y f E
j j
j j j
j
selanjutnya didapat :
0) (
) ( ln( ))
( ln( ))
( ln(
0
0
p Y f
p Y f E p
Y f E p Y f E
j j j
j
ln(L (p))
Eln(L (p0))
E n n
Jadi E
ln(Ln(p))
adalah maximal untuk p p0dan dalam hal ini dapat ditunjukkan bahwa nilai maximum ini adalah tunggal.4. Penaksiran maximum likelihood bagi model logit
Misalkan
Y1,X1
,,,
Yn1,Xn
adalah sample acak dari distribusi logit bersyarat :
) exp(
1
) exp(
0
) exp(
1
1 1
0 0
0 0
0 0
j j j
j
j j
j
X X X
Y P
X X
Y P
dimana 0dan 0adalah nilai parameter yang ditaksir. Model ini disebut model logit karena
Yj 1Xj
F( 0 0Xj)P
dimana
) exp( 1
1 )
(
x x
F
adalah fungsi distribusi dari distribusi logistik (logit)
fungsi probabilitas bersyarat yang terkandung adalah :
0 )
( 1
1 )
(
)) (
1 ( ) (
) , , (
0 0
0 0
1 0 0 0
0 0
0
y jika X
F
y jika X
F
X F
X F
X y f
j j
y j y
j j
sekarang fungsi log likelihood bersyarat adalah :
n
j
j
j X
Y f Ln
1
)) , , ( ln( ))
, (
ln(
n
j
j j
n
j
j
j F X Y F X
Y
1 1
)) (
ln( ) 1 ( )) (
sehingga diperoleh :
selanjutnya hasil ini memberikan arah dalam menaksir 0 dan 0dengan memaximalkan ln(Ln(,)) untuk nilai dan :
syarat pertama bagi nilai maximum adalah :
penaksir maximum likelihood diperoleh dari pemecahan secara numeric yang dapat dikerjakan dengan cepat melalui software ekonometri.
5. Asimtotis normal dan pembangkitan nilai statistic uji t
Telah ditunjukkan bahwa jika ukuran sample n cukup besar ;
20 0,
ˆ
N
n dan n
ˆ0
N
0,2jika ˆ2 dan ˆ2 sebagai penaksir konsisten dari masinng-masing 2 dan 2 telah dihitung secara numeris , akan didapat untuk berikutnya :
1 , 0
ˆ
ˆ 0 N
n
dan
0,1ˆ ˆ
0 N
n
Hasil ini dapat digunakan untuk menguji apakah 0 dan 0 berbeda secara statistic dengan 0 apa tidak.
Misalkan ingin diuji hipotesis null 0=0 .
Hipotesis ini tidak mengakibatkan probabilitas bersyarat P
Yj 1Xj
tidak bergantung pada Xjmaka dibawah penerimaan hipotesis null 0=0 akan diperoleh :
0,1ˆ ˆ
ˆ n N
t
Statistik ˆdinamakan nilai t yang dibangkitkan karena ini digunakan pada jalan yang sama sebagaimana nilai t dalam regresi linier.
Misal pada daerah kritis 5% pada uji dua sisi berdasarkan distribusi normal diperoleh 1,96 , maka dalam hal ini criteria penolakan H null : 0=0 pada tingkat signifikansi 5% adalah ˆ 1,96
6. Kesimpulan
1. misalkan
Y1,X1
,,,
Yn1,Xn
adalah sample acak dari distribusi logit bersyarat :
) exp(
1
) exp(
0
) exp(
1
1 1
0 0
0 0
0 0
j j j
j
j j
j
X X X
Y P
X X
Y P
dalam menaksir 0 dan 0
dilakukan dengan memaximalkan ln(Ln(,)) untuk nilai
dan dimana
,
)) , ( ln( max )) ˆ , ˆ (
ln(Ln Ln
dan
n
j
j
j X
Y f Ln
1
)) , , ( ln( ))
, (
ln(
2. jika ukuran sample n cukup besar ;
20 0,
ˆ
N
n dan n
ˆ0
N
0,2jika ˆ2
dan ˆ2
sebagai penaksir konsisten dari masing-masing 2
dan 2
telah dihitung secara numeris , akan didapat untuk berikutnya :
1 , 0
ˆ
ˆ 0 N
n
dan
0,1ˆ ˆ
0 N
n
Hasil ini dapat digunakan untuk menguji apakah 0 dan 0 berbeda secara statistic dengan 0 apa tidak.
Daftar Pustaka :
1. Mood,Alexander ; Introduction to the theory of statistics ; McGraw-Hill; 1974 2. Bierens,Herman J; The logit model : estimation,Testing and
Interpretation,http://econ.La.psu.edu/-hbierens/ML-logit.pdf