http://ariyoso.wordpress.com/2009/11/11/regresi-logistik http://ariyoso.wordpress.com/2009/11/11/regresi-logistik
Regresi linier seperti yang kita ketahui tidak dapat menyelesaikan kasus dimana variabel Regresi linier seperti yang kita ketahui tidak dapat menyelesaikan kasus dimana variabel dependent bersiat dikotomi dan kategori dengan dua atau lebih kemungkinan !e". sukses dependent bersiat dikotomi dan kategori dengan dua atau lebih kemungkinan !e". sukses atau #agal$ terpilih atau tidak terpilih$ lulus atau tidak lulus$ melakukan pembelian atau atau #agal$ terpilih atau tidak terpilih$ lulus atau tidak lulus$ melakukan pembelian atau tidak$ mendapat promosi atau tidak% dan lain-lain&.
tidak$ mendapat promosi atau tidak% dan lain-lain&. Regresi logistik Regresi logistik umumnya melibatkan umumnya melibatkan berbagai macam variabel prediktor baik numerik ataupun kategorik% termasuk variabel berbagai macam variabel prediktor baik numerik ataupun kategorik% termasuk variabel
dummy
dummy. 'ada regresi linier% variabel prediktor yang digunakan biasanya numerik% tetapi (ika. 'ada regresi linier% variabel prediktor yang digunakan biasanya numerik% tetapi (ika kita melibatkan campuran antara numerik maupun kategorik kita dapat menggunakan
kita melibatkan campuran antara numerik maupun kategorik kita dapat menggunakan regresiregresi logistik
logistik ..
Regresi logistik
Regresi logistik membentuk persamaan atau ungsi dengan pendekatan membentuk persamaan atau ungsi dengan pendekatan maximum likelihood maximum likelihood %% yang memaksimalkan peluang pengklasiikasian ob(ek yang diamati men(adi kategori yang yang memaksimalkan peluang pengklasiikasian ob(ek yang diamati men(adi kategori yang sesuai kemudian mengubahnya men(adi koeisien regresi yang sederhana. )ua nilai yang sesuai kemudian mengubahnya men(adi koeisien regresi yang sederhana. )ua nilai yang biasa digunakan sebagai variabel dependen yang dipredik
biasa digunakan sebagai variabel dependen yang diprediksi adalah 0 dan 1 !e". 1*berhasil%si adalah 0 dan 1 !e". 1*berhasil% 0*gagal&.
0*gagal&.
Regresi logistik
Regresi logistik menghasilkan rasio peluang ! menghasilkan rasio peluang !odds ratiosodds ratios& antara keberhasilan atau kegagalan& antara keberhasilan atau kegagalan suatu dari analisis. )apat kita contohkan dengan seorang tokoh yang ingin men(adi presiden% suatu dari analisis. )apat kita contohkan dengan seorang tokoh yang ingin men(adi presiden% akan lebih baik peluangnya (ika men(adi ketua partai politik tertentu. )isini
akan lebih baik peluangnya (ika men(adi ketua partai politik tertentu. )isini odds ratioodds ratio yang yang dimaksud adalah seberapa besar peluang tokoh tersebut dengan mempertimbangkan variabel dimaksud adalah seberapa besar peluang tokoh tersebut dengan mempertimbangkan variabel prediktor yang ada.
prediktor yang ada. Regresi logistik
Regresi logistik akan membentuk variabel prediktor/respon !log !p/!1-p&& yang merupakan akan membentuk variabel prediktor/respon !log !p/!1-p&& yang merupakan kombinasi linier dari variabel independen. +ilai variabel prediktor ini kemudian
kombinasi linier dari variabel independen. +ilai variabel prediktor ini kemudian ditransormasikan men(adi probabilitas dengan
ditransormasikan men(adi probabilitas dengan fungsi logit fungsi logit .. Asumsi-asumsi dalam regresi logistik:
Asumsi-asumsi dalam regresi logistik:
•
• ,idak mengasumsikan hubungan linier antar variabel dependen dan ,idak mengasumsikan hubungan linier antar variabel dependen dan independentindependent •
• aariabel dependen riabel dependen harus bersiat harus bersiat dikotomi !2 variabel&dikotomi !2 variabel& •
• aariabel independent tidak harus riabel independent tidak harus memiliki keragaman yang sama memiliki keragaman yang sama antar kelompokantar kelompok
variabel variabel
•
• ategori dalam variabel independent harus terpisah satu sama lain atau bersiatategori dalam variabel independent harus terpisah satu sama lain atau bersiat
eksklusi eksklusi
•
• ampel yang diperlukan dalam (umlah rampel yang diperlukan dalam (umlah relati besar% minimum dibutuhkan hingga 0elati besar% minimum dibutuhkan hingga 0
sampel data untuk sebuah variabel prediktor !bebas&. sampel data untuk sebuah variabel prediktor !bebas&. Persamaan
Persamaan Regresi Logis Regresi Logistik tik Regresi logistik
Regresi logistik menghasilkan rasio peluang yang dinyatakan dengan transormasi ungsi menghasilkan rasio peluang yang dinyatakan dengan transormasi ungsi logaritma !
logaritma !log log &% dengan demikian ungsi transormasi&% dengan demikian ungsi transormasi log log ataupun ataupun lnln diperlukan untuk diperlukan untuk p- p-value
value% dengan demikian dapat dinyatakan bahwa% dengan demikian dapat dinyatakan bahwa logit(p)logit(p) merupakan merupakan log log dari peluang ! dari peluang !oddsodds ratio
ratio& atau& atau likelihood ratiolikelihood ratio dengan kemungkinan terbesar nilai peluang adalah 1% dengan dengan kemungkinan terbesar nilai peluang adalah 1% dengan demikian persamaan
demikian persamaan regresi logistikregresi logistik men(adi:men(adi:
egresi
logit(p) = log (p/1-p) = ln (p/1-p) dimana p bernilai antara 0-1.
odel yang digunakan pada regresi logistik adalah:
Log (P / 1 – p) = β0 + β1X1 + βX + !" + βk Xk
)imana p adalah kemungkinan bahwa * 1% dan 31% 32% 34 adalah variabel independen% dan b adalah koeisien regresi.
#onsep Odds dan Relative Odds ita lihat sampel berikut ini:
)ata berikut ini diberikan oleh pengurus mes(id di yang terletak diantara 2 kampung% data tersebut dapat dilihat sebagai berikut:
- 'ersepsi pengurus mes(id terhadap 100 orang warga di kedua kampung yang memiliki penyakit 5'678, dalam memberikan sumbangan bagi keropak amal mes(id mereka%
- ariable prediktor yang digunakan adalah kampung dan kampung ;% - )ata disa(ikan dalam bentuk tabulasi silang !crosstab&.
Pen$akit Pelit #ampung A #ampung % &'&AL
a <0 !0%<& 2= !0%2=& 140 !0%>& ,idak 20 !0%2& =4 !0%=4& =0 !0%4& ,?,7 100 !0@& 100 !0@& 200 !100@& )ari data diatas konsep odds !peluang& dapat di(elaskan sebagai berikut:
- Aarga kampung yang memiliki kecenderungan 5'678, adalah <0/20 * B0 terhadap 1 !anggaplah konsep taruhan yang artinya B : 1&.
- Aarga kampung yang memiliki kecenderungan tidak 5'678, adalah 20/<0 * 0%2 terhadap 1 !dalam konsep taruhan artinya 1: B&.
- )emikian (uga dengan warga kampung ; yang memiliki kecenderungan 5'678, dan tidak 5'678, adalah 2=/=4 * 0%4= terhadap 1 !dalam konsep taruhan artinya 1 : 2&
edangkan konsep Relative Odds berdasarkan data diatas menun(ukkan bahwa warga
kampung memiliki kecenderungan 5'678, daripada warga kampung ; sebesar B/0%=4 * % terhadap 1% dengan kata lain warga kampung lebih pelit % kali daripada warga
kampung ;% atau dengan kata lain pengurus mes(id mempersepsikan bahwa warga yang memiliki penyakit 5'678, kebanyakan berasal dari kampung yaitu % kali daripada warga kampung ;.
Logit !log odds& merupakan koeisien slope !b& dari persamaan regresi. Slope disini adalah perubahan nilai rata-rata dari dari satu unit perubahan nilai 3. Regresi logistik melihat perubahan pada nilai variabel dependen yang ditransormasi men(adi peluang% bukan nilai
aslinya seperti pada regresi linier. ebagai ilustrasi (ika nilai peluang adalah 0%2% maka nilai odds adalah 4 !2 : =&% sedangkan (ika nilai peluang 0% maka nilai odds adalah 1 !0 : 0&% atau (ika nilai peluang 0%44% maka nilai odds adalah 2 !44 : >=& dengan total keseluruhan nilai peluang adalah 1. +ilai odds ratio biasanya dapat kita lihat pada kolom ; pada C variables in
the equationD output '.
#eookan odel (model fit ) dan *ungsi likelihood
Likelihood berarti (uga peluang atau probabilitas untuk hipotesis tertentu. eperti yang kita ketahui pada kurva regresi linier kita lihat adanya hubungan linier% peningkatan pada sumbu akan diikuti dengan peningkatan pada sumbu 3 dan sebaliknya. ,etapi pada regresi logistik dengan nilai antara 0 dan 1% pendekatan linier tidak bisa kita gunakan. ?leh karena itu
metode maximum likelihood sangat berguna dalam menentukan kecocokan model yang tepat bagi persamaan yang kita miliki.
Eipotesis dalam regresi logistik antara lain:
1. h0 * ketika persamaan regresi bernilai 0 Flogit!p& * 0G.
2. h1 * persamaan regresi berbeda nyata dari 0 Flogit!p& H 0G.
Regresi logistik merupakan regresi non linier dimana model yang ditentukan akan mengikuti pola kurva linier seperti gambar di bawah ini.
Regresi logistik (uga menghasilkan rasio peluang !odds ratios& terkait dengan nilai setiap prediktor. 'eluang !odds& dari suatu ke(adian diartikan sebagai probabilitas hasil yang muncul
yang dibagi dengan probabilitas suatu ke(adian tidak ter(adi. ecara umum% rasio peluang !odds ratios& merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio
peluang bagi predictor diartikan sebagai (umlah relati dimana peluang hasil meningkat !rasio peluang I 1& atau turun !rasio peluang J 1& ketika nilai variabel prediktor meningkat sebesar
Lei, elasn$a kita dapat mengikuti ilustrasi erikut ini:
Kika kita ingin mengetahui pembelian kosmetik merk tertentu oleh beberapa orang wanita dengan beberapa variabel pen(elas antara lain adalah umur% tingkat pendapatan !low% medium% high&% dan status ! L menikah$ untuk single&. 'ada data tersebut% pembelian merupakan variabel prediktor yang di(elaskan dengan angka 1 sebagai membeli dan 0 sebagai tidak membeli.
1" )engan .P.. 1"0 data yang diinput dapat berupa:
" etelah muncul kotak dialog logistic regression% masukkan variabel dependen purchase ke kolom )ependent% dan ketiga variabel independen ke dalam kolom covariates% lalu pilih button categorical untuk memasukkan variabel kategorik yaitu pendapatan dan status L klik
continue:
" etelah itu pilih option% ,eklist classification plot dan "osmer-lemesho# goodness of fit % kemudian continue:
2" emudian pada method pilih enter % kemudian klik O$ :
Output Case Processing Summary menghilangkan variabel yang tidak diperhitungkan dalam model.
?utput classification tabl e diatas men(elaskan bahwa persentase variabel yang diprediksi sebesar 4456 persen adalah baik% dan dari perbandingan antara kedua nilai mengindikasikan tidak terdapatnya masalah homoskedastisitas.
'ada output variables in eMuation signiikansi adalah 0%0 artinya model tidak signiikan dan dengan demikian terima E0.
'ada output omnibus test menyatakan bahwa hasil u(i chi-square goodness of fit lebih kecil dari 0%0% ini mengindikasikan bahwa model adalah signiikan.
Easil output pada 7o8-.nell 9 dan agelkerke 9 memiliki analogi sama dengan nilai 9-s;uare pada regresi linier% menyakatan bahwa sebanyak 205 persen keragaman dapat di(elaskan oleh model% sedangkan sisanya diluar model.
Easil pada output "osmer and Lemesho# %oodness-of-&it 'est mengindikasikan bahwa kita dapat menerima E0 karena lebih dari 0%0 !1 I 0%0&.
output classification table mengindikasikan dalam model regresi logistik% masih terdapat masalah homoskedastisitas karena nilai persentase keseluruhan adalah sama !100@&.
output variables in the equation menun(ukkan nilai signiikansi berdasarkan Aald tatistic% (ika model signiikan% maka nilai sig" adalah kurang dari 0%0.
olom <8p(%) menun(ukkan nilai odds ratio yang dihasilkan. +ilai odds ratio yang mendekati 1%0 mengindikasikan bahwa variabel independen tidak mempengaruhi variabel dependen.
?utput classplot diatas menun(ukkan prediksi pada regresi logistik . umbu 3 menu(ukkan probabilitas yang diprediksi% sedangkan sumbu menun(ukkan (umlah kasus yang diamati.