MULTINOMIAL LOGISTIC REGRESSION
Oleh: Agung Priyo Utomo Politeknik Statistika STIS
Agung Priyo Utomo -agung@stis.ac.id
CONTOH
1. Apa yang mempengaruhi bidang yang diminati jika akan melanjutkan studi?
Variabel Tak bebas: Bidang studi (Ekonomi, Psikologi, Teknik, & Lainnya)
Variabel bebas: Jenis Kelamin, Tingkat Pendidikan KRT, Tempat tinggal (desa/kota)
2. Apakah yang mempengaruhi lapangan kerja yg dimasuki?
Variabel tak bebas: Lapangan Kerja (Pertanian, Industri, Perdagangan, Jasa)
Variabel bebas: Usia, Jenis Kelamin, Pendidikan, Status Perkawinan
2
Agung Priyo Utomo -agung@stis.ac.id
CONTOH
3. Apa yang mempengaruhi pilihan transportasi kerja?
Variabel Tak bebas: Pilihan moda transportasi (kategorik): Kereta, bus, motor, mobil pribadi
Variabel bebas: Jarak ke tempat kerja, Pendapatan (rupiah), Harga BBM, Kondisi Jalan, Kenyamanan
4. Apakah yang memengaruhi pilihan tempat tinggal?
Variabel tak bebas: apartemen, perumahan, atau perkampungan
Variabel bebas: Pendapatan Keluarga, Banyaknya Anggota Keluarga, Usia Kepala Keluarga.
3
Agung Priyo Utomo -agung@stis.ac.id
MODEL REGRESI LOGISTIK MULTINOMIAL
¢ Response variable (Y) bersifat multicategory è berdistribusi multinomial dengan J kategori. Probabilita outcome di kategori ke-j dinotasikan dengan 𝜋!, j = 1, 2, ..., J.
¢ Variabel prediktor dapat berupa variabel kuantitatif (continuous), kualitatif (discrete), atau keduanya/campuran
¢ Regresi logistik multinomial terdiri atas (J – 1) logit, dimana satu kategori (kategori ke-J) dianggap sebagai kategori referensi (reference category)
¢ Logit merupakan log odds dari outcome di kategori ke-j relatif terhadap kategori referensi è 𝑙𝑜𝑔𝑖𝑡 𝜋! = ln "!
""
¢ Logit untuk semua (J-1) kategori yaitu: ln ""#
" , ln ""$
" , ..., ln """%#
" 4
Agung Priyo Utomo -agung@stis.ac.id
MODEL REGRESI LOGISTIK MULTINOMIAL
¢
Model regresi logistik multinomial untuk memprediksikan odds outcome di kategori 𝑗 relatif terhadap 𝐽 dg variabel bebas 𝑋
!, 𝑋
", ⋯ , 𝑋
#adalah
𝑙𝑛 𝜋!
𝜋# = 𝛽!$ + 𝛽!%𝑋% + 𝛽!&𝑋& + ⋯ + 𝛽!'𝑋'
¢
Akan ada J-1 persamaan logit:
𝑙𝑛 𝜋%
𝜋# = 𝛽%$ + 𝛽%%𝑋% + 𝛽%&𝑋& + ⋯ + 𝛽%'𝑋'
𝑙𝑛 𝜋&
𝜋# = 𝛽&$ + 𝛽&%𝑋% + 𝛽&&𝑋& + ⋯ + 𝛽&'𝑋' ...
𝑙𝑛 𝜋#(%
𝜋# = 𝛽(#(%)$ + 𝛽(#(%)%𝑋% + 𝛽(#(%)&𝑋& + ⋯ + 𝛽(#(%)'𝑋' 5
AgungPriyoUtomo-agung@stis.ac.id
INTERPRETASI
¢ Interpretasi pada model regresi logistik multinomial sama seperti pada binary logistic regression
¢ Perbandingan dilakukan antar kategori yg ada, tidak harus dibandingkan dg kategori J.
¢ Misal membandingkan kategori a terhadap kategori b Logit untuk kategori a:
𝑙𝑛 𝜋!
𝜋" = 𝛽!# + 𝛽!$𝑋$ + 𝛽!%𝑋% + ⋯ + 𝛽!&𝑋&
Logit untuk kategori b:
𝑙𝑛 𝜋'
𝜋" = 𝛽'# + 𝛽'$𝑋$ + 𝛽'%𝑋% + ⋯ + 𝛽'&𝑋&
Logit untuk kategori a relatif terhadap b:
𝑙𝑛 𝜋!
𝜋' = 𝑙𝑛 𝜋!⁄𝜋"
𝜋'⁄𝜋" 6
AgungPriyoUtomo-agung@stis.ac.id
INTERPRETASI
¢ Predicted probability dihitung menggunakan rumus:
¢ Odds Rasio (Rasio Kecenderungan) è analogi dg OR pada Regresi Logistik Biner
7
AgungPriyoUtomo-agung@stis.ac.id
C ONTOH :
¢ Diteliti tentang variabel yang memengaruhi pilihan merk handphone antara merk A, X, dan S.
¢ Variabel yang diduga memengaruhi:
1. Jenis kelamin responden
2. Usia responden
¢ Model yg diajukan (merk S sebagai referensi/pembanding) 𝑙𝑛 𝜋+
𝜋, = 𝛽%$ + 𝛽%%𝑋% + 𝛽%&𝑋&
𝑙𝑛 𝜋-
𝜋, = 𝛽&$ + 𝛽&%𝑋% + 𝛽&&𝑋&
Agung Priyo Utomo -agung@stis.ac.id
C ONTOH (L):
¢
Data: mlogit-merkhp.sav
¢
SPSS: Analyze > Regression > Multinomial Logistic …
Agung Priyo Utomo -agung@stis.ac.idC ONTOH (L):
Agung Priyo Utomo -agung@stis.ac.id
Pada contoh:
§ Y = 1 (A); 2 (X); 3 (S)
§ X1 = Jenis Kelamin
(1 = female; 0 = male)
§ X2 = Usia (thn, numerik)
Berdasarkan tabel diatas, persamaan dapat ditulis sbb:
Merk A: 𝑙𝑛 &&!
" = 22,721 − 0,466𝑋' − 0,686𝑋( Merk X: 𝑙𝑛 &&#
" = 10,947 + 0,058𝑋' − 0,318𝑋(
Wanita memiliki kecenderungan sebesar exp(-0,466) = 0,628 kali dibandingkan laki-laki utk memilih
HP merk A, atau laki-laki memiliki kecederungan sebesar 1/0,628 =
1,59 kali dibandingkan wanita untuk memilih HP merk A dengan
asumsi umurnya sama/konstan
Seseorang yang memiliki usia 1 tahun
lebih tua memiliki kecenderungan sebesar
exp(-0,686) = 0,504 kali untuk memilih HP merk A dengan asumsi jenis
kelaminnya sama
Wanita memiliki kecenderungan sebesar
exp(0,058) = 1,060 kali dibandingkan laki-laki utk memilih HP merk X dengan asumsi umurnya
sama/konstan
Seseorang yang memiliki usia 1 tahun
lebih tua memiliki kecenderungan sebesar
exp(-0,318) = 0,728 kali untuk memilih HP merk
X dengan asumsi jenis kelaminnya sama
C ONTOH (L)
¢ Berapa peluang calon konsumen perempuan yang berumur 25 tahun untuk membeli HP merk A, X, dan S?
𝑃 𝐴 𝑋$ = 1, 𝑋% = 25 = ⋯
𝑃 𝑋 𝑋$ = 1, 𝑋% = 25 = ⋯
𝑃 𝑆 𝑋$ = 1, 𝑋% = 25 = ⋯
Agung Priyo Utomo -agung@stis.ac.id
C ONTOH (L)
¢ Berapa peluang calon konsumen perempuan yang berumur 25 tahun untuk membeli HP merk A, X, dan S?
𝑃 𝐴 𝑋$ = 1, 𝑋% = 25 = ()* %%,,%$-#,.// $ -#,/0/ %1
()* %%,,%$-#,.// $ -#,/0/ %1 2()* $#,3.,2#,#10 $ -#,4$0 %1 2$
𝑃 𝑋 𝑋$ = 1, 𝑋% = 25 = ()* $#,3.,2#,#10 $ -#,4$0 %1
()* %%,,%$-#,.// $ -#,/0/ %1 2()* $#,3.,2#,#10 $ -#,4$0 %1 2$
𝑃 𝑆 𝑋$ = 1, 𝑋% = 25 = ()* %%,,%$-#,.// $ -#,/0/ %1 2()* $#,3.,2#,#10 $ -#,4$0 %1 2$$
Agung Priyo Utomo -agung@stis.ac.id
o Logit perbandingan antara HP merk A dan X dapat dilakukan sbb:
ln 𝑝5
𝑝6 = ln 𝑃5⁄𝑃7
𝑃6⁄𝑃7 = 22,721 − 10,947 + −0,466 − 0,058 𝑋$ + (−0,686 − −0,318 )𝑋% ln 𝑝5
𝑝6 = 11,774 − 0,524𝑋$ − 0,368𝑋%
S OAL R ESPONSI :
¢
Apakah gender dan Race memengaruhi pilihan partai? Lakukan pengujian signifikasi dari setiap variabel tersebut dan interpretasikan hasilnya melalui
nilai Odds Ratio, berdasarkan tabel berikut:
AgungPriyo Utomo -agung@stis.ac.id
Agung Priyo Utomo -agung@stis.ac.id
14