Kuliah 9 Regresi Logisik Dan an

(1)

LECTURE 9

REGRESI LOGISTIK &

DISKRIMINAN

DR. MUDRAJAD KUNCORO, M.Soc.Sc

Fakultas Ekonomi & Pascasarjana UGM Outline: Outline:

•

• Multinomial Multinomial RegresiRegresi •

• Binary Binary LogistikLogistik •

• AnalisisAnalisis DiskriminanDiskriminan •

• PerbandinganPerbandingan

multinomial, binary,

multinomial, binary, dandan diskriminan

(2)

ANALISIS REGRESI LOGISTIK

–

Tidak memiliki asumsi normalitas atas

variabel bebas yang digunakan dalam

model

–

Variabel bebas bisa variabel kontinyu,

diskrit, dan dikotomis

–

Distribusi respon atas variabel terikat

diharapkan nonlinear

–

Jenis:

• binary logistic regression

(3)

STUDI KASUS WANITA KARIR VS IBU RT

• Studi kasus mengenai

probabilitas wanita karir dan

ibu rumah tangga

(Tabachnick, 1996: bab 12)

• Pertanyaan yang hendak

dijawab adalah: apakah

status pekerjaan (wanita

karir versus ibu rumah

tangga) dapat dijelaskan

oleh empat variabel perilaku

(ATTHOUSE, ATTMAR,

ATTROLE, dan CONTROL)

• Keempat variabel penjelas

tersebut adalah:

– ATTHOUSE= perilaku terhadap pekerjaan di dalam rumah. – ATTMAR=perilaku terhadap status pernikahan. – ATTROLE= perilaku terhadap perannan/hak wanita. – CONTROL= kemampuan mengendalikan diri (locus of control).

(4)

Tahapan

Estimasi

Regresi

Logistik

Multinomial (1)

(5)

Tahapan

(6)

Hasil

Output SPSS

Model Fitting Information

884.175 836.411 47.764 8 .000 Model Intercept Only Final -2 Log

Likelihood Chi-Square df Sig.

• Chi square signifikan pada derajat 1% dengan nilai 47,8. artinya model dengan hanya intercept berbeda secara statistik dibandingkan dengan model yang memasukkan semua variabel prediktor.

Classification 213 25 2 88.8% 98 30 2 23.1% 63 10 3 3.9% 83.9% 14.6% 1.6% 55.2% Observed wanita karir ibu RT bahagia ibu RT tidak bahagia Overall Percentage wanita karir ibu RT bahagia ibu RT tidak bahagia Percent Correct Predicted

• Dari hasil overall classification result untuk regresi logistik multinomial ternyata kurang baik. Persentase kebenaran klasifikasi untuk ibu RT bahagia dan ibu RT tidak bahagia yang di bawah 50 %, yaitu 23.1% dan 3.9%, menunjukkan banyak salah klasifikasi untuk ibu RT bahagia dan tidak bahagia. Oleh karenanya, kita perlu melakukan klasifikasi ulang dan menggunakan regresi logistik binari.

(7)

Tahapan

Estimasi

Binary Logistic Regression

Klasifikasi

ulang

:

MengubahMengubah values values padapada workstatworkstat

Æ

11””wanita wanita karir

karir””, 2, 2””Ibu RT Ibu RT bahagiabahagia””, 3 , 3 ““IbuIbu RT RT tidaktidak bahagiabahagia””, , dandan values values padapada status

(8)

Tahapan

(9)

Tahapan

(10)

Tahapan

(11)

Output

Estimasi

Regresi

Logistik

Binari

• Pengujian dengan model penuh dengan 4 variabel bebas dibanding model hanya dengan konstanta terbukti secara statistik dapat dipercaya. Ini terlihat dari Chi-Square(4,

N=440)=22.78 yang

signifikan dengan p<,001 artinya model dengan hanya intercept berbeda secara statistik dibandingkan dengan model yang memasukkan semua variabel prediktor.

• Kemampuan prediksi model ini lumayan bagus. Tingkat sukses total 60%, dengan 46.6% ibu RT dan 71.3% wanita karir telah mampu diprediksi secara benar

Omnibus Tests of Model Coefficients

22.781 4 .000 22.781 4 .000 22.781 4 .000 Step Block Model Step 1 Chi-square df Sig. Classification Tablea 96 110 46.6 69 171 71.3 59.9 Observed Ibu RT wanita karir work status Overall Percentage Step 1

Ibu RT wanita karir

work status _Percentage Correct Predicted

The cut value is .500 a.

(12)

Output

Estimasi

Binary

Regresi

Variables in the Equation

-.032 .023 1.826 1 .177 .969 .925 1.014 -.070 .016 19.851 1 .000 .932 .904 .962 .014 .012 1.345 1 .246 1.014 .991 1.038 -.055 .077 .506 1 .477 .947 .814 1.101 3.423 .978 12.255 1 .000 30.656 ATTHOUS ATTROLE ATTMAR CONTRO Constant Step 1a

B S.E. Wald df Sig. Exp(B) Lower Upper 5.0% C.I.for EXP(B

Variable(s) entered on step 1: ATTHOUSE, ATTROLE, ATTMAR, CONTROL. a. Correlation Matrix 1.000 -.618 -.726 -.036 -.414 -.618 1.000 .313 -.230 -.113 -.726 .313 1.000 -.036 -.016 -.036 -.230 -.036 1.000 -.165 -.414 -.113 -.016 -.165 1.000 Constant ATTHOUSE ATTROLE ATTMAR CONTROL Step 1

(13)

Output

Estimasi

Binary

Logistik

• Matriks korelasi menunjukkan tidak adanya

multikolinearitas yang serius antarvariabel bebas,

sebagaimana terlihat dari nilai korelasi antarvariabel

bebas yang di bawah 0,8.

• Hasil di atas juga menyajikan koefisien regresi, statistik

Wald, odds ratio, serta interval dengan keyakinan 95%

atas odds ratio untuk masing-masing variabel bebas.

Menurut kriteria Wald, hanya variabel perilaku terhadap

peranan wanita yang dapat diandalkan untuk

memprediksi status pekerjaan wanita. Ini terlihat dari

nilai z sebesar –19.8 dengan p<0,01. Odds ratio 0,93

menunjukkan adanya sedikit perubahan dalam

kemungkinan bekerja atas dasar satu unit perubahan

perilaku terhadap peranan wanita.

(14)

ANALISIS DISKRIMINAN

-

Semua variabel independen merupakan

variabel yang kontinyu dan berdistribusi

normal

-

Tujuan utama:

• diskriminasi

: Pembedaan grup

dicapai dengan fungsi diskriminan

• klasifikas

i: mengklasifikan

individu/obyek ke dalam grup

terpisah berdasarkan sejumlah

variabel bebas

(15)

Studi tentang Kluster Industri

Michael E. Porter

• Innovation: Location Matters (2001) •Competing Across Locations (1998) • On Competition (1998)

• The Role of Geography in the Process of Innovation and the Sustainable (1998)

• Competitive Advantage of Firms (1998)

• Clusters and the New Economics of Competition (1998)

Mudrajad Kuncoro

• Analisis Spasial & Regional: Studi Aglomerasi dan Kluster Industri Indonesia (2002)

• Why Manufacturing Industry Persisted to Cluster Spatially in Java ?, Gadjah Mada International Journal of Business (2003), 5(2)

• “Regional Clustering Of Indonesia’s Manufacturing Industry: A Spatial Analysis with Geographic Information System (GIS)”, Gadjah Mada

(16)

(17)

Kasus

IKRT

di

Jawa

• Sebagai contoh aplikasi analisis diskriminan akan disajikan studi empiris mengenai industri kecil dan rumah tangga (IKRT) di Jawa

(Kuncoro, 2000)

• Pertanyaan penelitian yang

hendak dijawab adalah: Apakah sentra-sentra IKRT di Jawa

merupakan industrial district

dengan ciri-ciri yang menonjol?

• Untuk memudahkan analisis, kita

mengklasifikasikan sentra-sentra industri dan non-sentra industri

• Di = di1 RURAL + di2 WAGES +

di3 SKILL + di4 STEP + di5AGE + di6 POP + di7 UNPAIDW + di8 PRODUCTIVITY

Variabel:

• proporsi daerah perdesaan

(RURAL)

• upah rata-rata (WAGES)

• jumlah tenaga terdidik dengan

pendidikan minimum SMU (SKILL)

• proporsi perusahaan yang

terlibat dalam program Bapak Angkat (STEP)

• rata-rata umur perusahaan

(AGE)

• jumlah penduduk (POP)

• proporsi pekerja keluarga (UNPAIDW)

• produktivitas tenaga kerjada (PRODUCTIVITY)

(18)

Tahapan

(19)

Tahapan

Estimasi

Diskriminan

define range

(20)

Tahapan

Estimasi

Diskriminan

Æ

(21)

Tahapan

Estimasi

Diskriminan

Æ

(22)

Output

Estimasi

Diskriminan

Classification Results a 52 6 58 8 37 45 89.7 10.3 100.0 17.8 82.2 100.0 Industrial clusters Non-industrial clusters Industrial clusters Non-industrial clusters Industrial clusters Count % Original Non-industrial clusters Industrial clusters Predicted Group Membership Total

86.4% of original grouped cases correctly classified. a.

Secara umum model diskriminan ini mampu

mengalokasikan secara benar lebih dari 86% kasus.

Tabel diatas menyajikan ringkasan klasifikasi dari model

tsb, yang hanya gagal mengalokasikan 6 kabupaten ke

dalam non-sentra industri dan 8 kasus untuk sentra

industri. Akibatnya, keanggotan grup secara benar telah

diprediksi sebesar 89.7% untuk non-sentra industri dan

82.2% untuk sentra industri.

(23)

Output

Estimasi

Diskriminan

Wilks' Lambda

.407 87.312 8 .000 Test of Function(

1

Wilks'

Lambda Chi-square df Sig.

Tabel diatas memperlihatkan chi-square yang tinggi

dan signifikan pada derajat kepercayaan 1% yaitu

sebesar 87.312. Artinya model dengan hanya

intercept berbeda secara statistik dibandingkan

dengan model yang memasukkan semua variabel

prediktor

(24)

Output

Estimasi

Diskriminan

• upah merupakan variabel terbaik untuk memprediksi lokasi IKRT di sentra industri dan non-sentra industri.

• Koefsien untuk upah yang positif menunjukkan bahwa semakin tinggi

upah semakin besar kemungkinan IKRT mengelompok di sekitar sentra industri

• Proporsi tenaga kerja keluarga dan proporsi yang tinggal di perdesaan memiliki daya prediksi yang kurang lebih sama dengan tanda negatif. Tanda koefisien yang negatif menunjukkan bahwa semakin rendah

proporsi pekerja keluarga dan proporsi pedesaan dalam suatu kabupaten maka akan mendorong IKRT untuk mengelompok di seputar sentra

industri. Structure Matrix .667 -.659 -.656 .558 -.319 .232 .054 .041 Average wages

Family workers proportion Rural proportion

Productivity of labour Age of firm

Step father proportion Number of skilled workers

Population

1 Function

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.

(25)

HOMEWORK

1.Untuk kasus studi wanita:

a. coba anda lakukan estimasi dengan model diskriminan, baik dengan 3 klasifikasi (workstat) dan 2 klasifikasi (STATUS), dengan menggunakan prediktor yang sama.

b. Bandingkan hasil estimasi dengan diskriminan dan regresi logistik.

c. Interpretasikan hasil berdasarkan model yang menurut anda paling baik.

2.Untuk kasus IKRT di Jawa:

a. Bandingkan hasil estimasi model diskriminan dengan 2 klasifikasi daerah (D) dan 3 klasifikasi (GROUP3).

b. Bandingkan hasil estimasi dengan diskriminan dan regresi logistik.