Multiple Regression Logistic
ANALISIS
Pengertian Regresi Logistik:
Suatu model matematik yang digunakan untuk mempelajari
hubungan satu atau beberapa variabel independen dengan satu
variabel dependen yang bersifat dikotomi (binary). Variabel binary : adalah variabel yang hanya memiliki dua nilai, misalnya (sakit / sehat), (merokok/ tdk merokok), (BBLR/ normal) dll
Variabel Independen (prediktor) sebaiknya kategorik, agar mudah
untuk menginterpretasikan hasil analisisnya.
Bila variabel prediktor 3 kategori atau lebih, maka dibuat dua
kategori. Caranya ; dummy variabel, kategori ulang sesuai logika biologik.
Analisis regresi ganda logistik adalah alat statistik yang sangat kuat
untuk menganalisis hubungan antara paparan dan penyakit dengan serentak mengontrol pengaruh sejumlah faktor perancu potensial.
Tujuan analisis regresi ganda logistik yaitu menemukan model
regresi yang paling sesuai, paling irit, sekaligus masuk akal secara biologik, untuk menggambarkan hubungan antara variabel
dependen dan satu set variabel prediktor dalam populasi.
Manfaat analisis regresi ganda : (a) Meramalkan terjadinya variabel
dependen pada individu berdasarkan nilai-nilai sejumlah variabel prediktor yang ada pada individu tersebut.
Manfaat : (b) Mengukur hubungan antara veriabel respon dan
prediktor, setelah mengontrol pengaruh prediktor (kovariat)
lainnya.
Keistimewaan
Regresi Logistik Ganda
(a) Kemampuan kengkonversi koefisien regresi (bi) menjadi rasio
odds (OR). OR = exp [bi]
(b) Kemampuan menaksir probabilitas individu untuk sakit
(mengalami event) berdasarkan nilai-nilai sejumlah variabel prediktor, dengan rumus sebagai berikut :
Macam Regresi logistik :
1. Regresi logistik sederhana
Untuk mempelajari hubungan antara satu variabel
prediktor dengan satu variabel dependen dikotomus.
2. Regresi logistik ganda (Multiple Regression Logistic)
Untuk mempelajari hubungan antara beberapa variabel
prediktor dengan satu varibel dependen dikotomus.
Model Regresi Ganda Logistik
Ln (p/(1-p) = logodd (logit). Logaritme natural dari odds.
Odds : rasio probabilitas suatu peristiwa untuk terjadi dan probabilitas suatu peristiwa untuk tidak terjadi
a = Konstanta ( intersep)
b1 , b2 , .... bk = koefisien regresi variabel prediktor (slope)
X1, X 2 ....Xk = variabel prediktor yg pengaruhnya akan diteliti. p = probabilitas untuk terjadinya “peristiwa” dari
Pembangunan model regresi ganda logistik hendaknya tidak
terjebak oleh penggunaan veriabel prediktor yang terlalu
banyak.
Pemilihan variabel sebaiknya dilakukan dengan cara-cara yang
lebih purposif, dan tidak terpaku pada pendekatan yang
sifatnya deterministik menurut kamaknaan statistik.
Makin banyak variabel yang dimasukkan dalam model hanya akan
meningkatkan kesesuaian garis regresi dengan hubungan antara variabel dependen dan sejumlah variabel prediktor pada data
sampel, tetapi belum tentu menggambarkan hubungan tersebut pada tingkat populasi.
Hal itu disebabkan karena, bertambahnya variabel prediktor (baik
yang relevan maupun tidak relevan) hanya akan menaikkan nilai taksiran kesalahan baku, sehingga membuat model tersebut sangat tegantung kepada data pengamatan sampel.
Kesimpulannya, model tersebut tidak merefleksikan /
meggambarkan hubungan variabel respon dan variabel-variabel prediktor dalam populasi yang sesungguhnya.
PROSEDUR PEMILIHAN VARIABEL
Agar diperoleh model regresi yang baik adalah
sebagai berikut :
1.
Melakukan analisis univariate untuk menyaring
variabel-variabel yang penting.
2.
Memasukkan dan/ atau mengeluarkan
variabel-variabel dalam model multivariate
3.
Memasukkan dan memeriksa kemungkinan ada
Melakukan analisis univariate
untuk penyaringan awal :
Uji statistik yang dipakai adalah : chi-quadrat atau yg lain
Jika ada variabel prediktor lebih dari dua kategori, maka dibuat
menjadi dua kategori terlebih dahulu. Perlu diingat bahwa
dalam melakukan recode harus mempunyai alasan biologik.
Atau pendekatan statistik dg membuat Dummy Variabel.
Mickey dan Greenland : variabel variabel yang mempunyai
nilai p= 0,25 dan memiliki kemaknaan biologik sangat erat
hendaknya dipertimbangkan untuk dimasukkan ke dalam
model multivariate.
Univariate ...
Batasan P= 0,25, untuk mengantisipasi kemungkinan variabel
yang secara terselubung sesungguhnya penting untuk
dimasukkan dalam model.
“Terselubung
” kemungkinan
variabel-variabel secara kolektif dapat menjadi prediktor
penting, walaupun secara sendiri sendiri merupakan
Beberapa Metode :
1.
Enter
2.
Stepwise
3.
Forward
4.
Backward
Conditional, LR (likelihood ratio), Wald
Memasukkan / mengeluarkan variabel
dalam model regresi :
Memeriksa Kemungkinan Interaksi
Jika dengan uji interaksi menunjukkan kemaknaan statistik,
maka kita katakan interaksi memberikan kontribusi penting
kepada model. Jika suatu interaksi hanya memperbesar
taksiran kesalahan baku (S.E.) dan tidak mengubah taksiran
koefisiens regresi (b
1), maka interaksi tersebut mungkin tidak
penting.
Latihan
Sebuah studi Kohor prospektif, meneliti pengaruh
aktifitas fisik (AF) terhadap kejadian infark otot
jantung (MI). Variabel lain yang diukur adalah
umur dalam kategori (AGRP) dan kebiasaan
Kategorisasi nilai variabel
MI = 1 : sakit 0 : tidak sakit
AF = 1 : aktifitas fisik >= 2500 kcal/ hari 0 : aktifitas fisik < 2500 kcal/hari AGRP(Age_Group) = 1 : umur >= 55 tahun
0 : umur < 55 tahun
Kebiasaan merokok = 2 : merokok >= 15 btg / hari 1 : merokok < 15 btg /hari 0 : tidak merokok
Membuat dummy variabel
Variabel rancangan
Kebiasaan merokok
-
Jumlah variabel yang dibutuhkan ( k-1) 3-1 : 2
-Sebagai contoh MRK menjadi D1 dan D2
-
Sebagai salah satu rancangan pengkodean variabel tersebut,
maka variabel bukan perokok sebagai variabel acuan
(refference) dengan kode
D1=0 D2=0
-
Selanjutnya merokok <15 btg / hari D1=1 D2=0
Sehingga menjadi :
Variabel asli Variabel rancangan
MRK D1 D2 Tidak merokok 0 0 Merokok < 15 btg / hari 1 0 Merokok >= 15 btg / hari 0 1 http://www.ziddu.com/download/8461706/RegresiLogistik.rar.html File download :
Cek kelayakan variabel untuk dimasukkan dalam model :
Menggunakan chi-square
Hasil analisis univariate... ?
AF
p=0,000
AGRP
p=0,000
D1
p=0,000
Hasil Regresi Logistik
B S.E. Wald df Sig. Exp(B)
95,0% C.I.for EXP(B) Lower Upper Step 1(a) AF -2,243 1,019 4,846 1 ,028 ,106 ,014 ,782 AGRP 2,013 ,977 4,242 1 ,039 7,487 1,102 50,848 D1 2,478 1,084 5,225 1 ,022 11,920 1,424 99,793 D2 2,673 1,316 4,130 1 ,042 14,490 1,100 190,922 Constant -1,915 ,995 3,699 1 ,054 ,147
Persamaan yg di dapat :
Variables in the Equation
-2,243 1,019 4,846 1 ,028 ,106 2,013 ,977 4,242 1 ,039 7,487 2,478 1,084 5,225 1 ,022 11,920 2,673 1,316 4,130 1 ,042 14,490 -1,915 ,995 3,699 1 ,054 ,147 AF AGRP D1 D2 Constant St ep 1a
B S. E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AF, AGRP, D1, D2. a.
1
P= _________________________________________ - [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2) 1 + e
Meramalkan Probabilitas Individu untuk mengalami sakit
Berdasarkan persamaan tersebut diatas, berapa probabilitas
untuk mengalami sakit pada individu dengan kriteria sebagai
berikut ?
1)
Melakukan aktifitas fisik 2.000 kcal / hari
2)Berumur 35 tahun
Perhitungan :
1
P= _________________________________________
- [-1,9146 – 2,2431(AF) + 2,0131 (AGRP) + 2,4782(D1) + 2,6734(D2)] 1 + e
Variables in the Equation
-2,243 1,019 4,846 1 ,028 ,106 2,013 ,977 4,242 1 ,039 7,487 2,478 1,084 5,225 1 ,022 11,920 2,673 1,316 4,130 1 ,042 14,490 -1,915 ,995 3,699 1 ,054 ,147 AF AGRP D1 D2 Constant St ep 1a
B S. E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AF, AGRP, D1, D2. a.
1
P= _________________________________________ - [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2) 1 + e
1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)] 1 + e
Berdasarkan persamaan tersebut diatas, berapa probabilitas untuk mengalami sakit pada individu dengan kriteria sebagai berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari 2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari
AF = 0 tidak berisiko Umur = 0 tidak berisikok
Perhitungan :
1 P= _________________________________________ - [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)] 1 + e= 0,64 64%
In mathematics, the exponential function is the function ex, where e is the number