Regresi dengan Respon
Biner
Arti Fungsi Respon
Pandang model regresi linier sederhana berikut:
Dengan nilai Yi yang mungkin adalah 0 dan 1.
Karena Yi adalah peubah biner maka Yi memiliki sebaran Bernouli dengan
sebaran peluang
Permasalahan yang muncul bila
peubah respon adalah biner
1. Galat tidak menyebar normal
Bila peubah respon adalah biner, maka galat juga hanya mempunyai dua
kemungkinan nilai,
2. Ragam galat tidak konstan
3. Batasan pada Fungsi Respon
Fungsi respon yang linier tidak memenuhi batasan ini
Model Regresi Logistik
Atau
Pendugaan Parameter
Dengan nilai Y yang bersifat biner, kita dapat menggunakan Bernoulli sebagai sebaran variabel Y sehingga fungsi
Nilai maksimum dari fungsi
kemungkinan dapat dicari dengan melogaritmakan kedua ruas.
Karena βj yang akan diduga bersifat nonlinier, maka penyelesaian
Pengujian Terhadap Pendugaan
Parameter
a. Pengujianpendugaan parameter () secaraparsial.
Untukmemeriksaperanankoefisienregr
esidarimasing-masingvariabelprediktorsecaraindividu dalammodel.
Hipotesis yang digunakanadalah :
Uji yang
digunakanadalahujinisbahkemungkinan(Likelihood Ratio Test) yaitu:
dengan:
L0= nilai log likelihood model
regresilogistiktanpavariabelprediktor Lp = nilai log likelihood model
regresilogistikdenganvariabelprediktor Likelihood ratio test berdistribusi
Interpretasi untuk variabel
independen polikotomus
Misalkan peubah bebas memiliki kategori lebih dari 2.Contoh:
Karena Variabel bebas memiliki kategori lebih dari 2 maka kita
Hasil estimasi adalah sebagai berikut:
Interpretasi untuk variabel
Independen Kontinu
• Asumsikan logit= g(x) adalah linier. • Persamaanlogitadalah
• 1merupakanperubahan log odds (logit)
untuksetiappeningkatansebesar 1 satuan x
• 1 =g(x+1) – g(x) = untuk setiapnilai x.
• Secaraumumjika x berubahsebesar c
satuanmakalogitakanberubahsebesar c1,
• Didapatkandari
= c1
• Sehingga OR(c)=OR(x+c,x) =
exp(c1)
Contoh :
padapenelitianpengaruhusiaterhadapterjadiny a CHD didapatkanmodel
Odd Ratio dugauntukkenaikanusia 10 tahunadalah
Artinyasetiapkenaikanusiasebesar 10 tahunmakaresikoterjadinya CHD
meningkatsebesar 3.03 kali
Multivariable Model
Suatu
penelitiandilakukanuntukmengetahuipengaruhus ia (AGE), jeniskelamindan level cathecolamin
(CAT) terhadapterjadinya CHD. Model yang digunakanadalah
Dimana X1 = usia
X2 = jeniskelamin (0 = perempuan, 1=laki – laki)
X3 = level cathecolamin ( 0= rendah, 1=tinggi)
Odd ratio untukvariabel 0-1
adalahdenganasumsivariabel yang lain tetap.
Sedangkanuntukvariabelkontinu, Odd ratio didapatkandari
Secaraumumrumusuntuk Odd Ratio adalah
Goodness of fit
Misalkan model kitaterdiridari p peubahbebas
J adalahbanyaknyanilaipengamatanx yang berbeda. Jikabeberapasubjekmemilikinilaix yang samamaka J < n
Notasikanbanyaknyasubjekdengannilaix=xjdengan
mj, j = 1, 2, …, J. Maka
Yjadalahbanyaknya y=1
diantaramjsubjekdenganx=xj.
Sehinggayaitubanyaknyasubjekdengan y=1
Pearson Residual didefinisikan sebagai
Deviance Residual didefinisikansebagai
Tanda + atau – , samadengantandadari Statistik Deviance adalah
Statistik 2dan Deviance
menyebar2denganderajatbebas J – (p+1)
Diagnostic Residual Plot
Jika model regresilogistikbenar, maka E(Yi) = I
Sehingga E(Yi - = E(ei) = 0.
Jadijika model benarmaka plot antaradan residual
akanmenunjukkanpolagarishorisontald enganintersepnol