Model dalam Binomial Logit adalah seperti pada Persamaan 5.3.
ln =β +βX ...(5.3) Bagaimana mengubah nilai variabel independen menjadi nilai probabilitas variabel independen?
Y = f(x ) → p = f Y (x ) ...(5.4) p = E(Y = 1|X ) = ...(5.5) 1 − p = ; Y =β ...(5.6) = eβ β ...(5.7)
Mengapa fungsi logaritmik dapat memastikan nilai probabilita variabel independen berada diantara 0 dan 1?
p = E(Y = 1|X ) = β β ataup = ...(5.9) X = ∞→ Y = −∞→ e ∞= 0 → p =
∞= = 1...(5.10)
X = −∞→ Y =∞→ e∞=∞→ p =
∞= ∞= 0... (5.11) (2) Uji-Uji dalam Model Binomial Logit
Uji Kesesuaian Model
Analisis kesesuaian model logit dengan data yang akan diestimasi dilakukan dengan 2 cara yaitu (1) dengan membandingkan percentage correct predicted value untuk masing-masing nilai observasi dan (2) dengan membandingkan distribusi data dan distribusi Logit.
- UjiPercentage Correct/Change Accuracy
Dalam logit, parameter yang dipilih adalah parameter dapat memaksimalkan prediksi nilai-nilai observasi (dalam OLS, paramater dipilih adalah paramater yang dapat meminimumkan nilai kuadrat error term). Artinya, paramater yang dapat memberikanpercentage correct yang paling tinggi merupakan parameter yang paling baik. Untuk model Logit Binary nilai sampel ada 2 yaitu 0 dan 1, sehingga yang diinginkan adalah Percentage Correct bagi kedua nilai observasi tersebut. Dengan SPSS, kondisi tersebut dapat dilihat dari Classification Table. Berikut salah satu contoh hasil estimasi suatu persamaanLogit Binary.
PadaClassification Table tersebut terlihat bahwaoverall percentagecukup baik sebesar 78%. Namun jika dilihat secara detail, ternyataPercentage Correct tersebut hanya baik untuk observasi yang bernilai 1 sebesar 100%. Hal ini menunjukkan bahwa parameter yang dipilih dapat memprediksi seluruh observasi yang bernilai 1. Sebaliknya, parameter tersebut tidak dapat memprediksi satupun nilai observasi 0 (Percentage Correct= 0). Hal tersebut menunjukkan bahwa ModelBinary Logit sudah dapat digunakan untuk dataset yang dimiliki, namun parameter yang diestimasi belum mengakomodir seluruh variasi variabel dependen. Dengan demikian, sebaiknya dilakukan diagnosa data kembali. Kemungkinan masih ada outlier yang belum dibersihkan untuk memperbaiki hasil estimasi.
- Uji Distribusi (Hosmer dan Lemeshow)
Dalam Model Binary Logit uji perbandingan distribusi Binary LogitUji dengan distribusi data dilakukan dengan Uji Hosmer dan Lemeshow, rumus yang digunakan adalah sebagai
= ∑
/ ...(5.12) Dimana Og = nilai observasi, Eg = nilai prediksi dan ng = jumlah observasi. Jika Model Logit merupakan model yang sesuai dengan data, maka nilai observasi akan sama dengan
nilai prediksi. Jika nilai keduanya sama maka − = 0, sehingga nilai = 0. Hipotesis nul yang digunakan adalah = 0. Jika p-value > 0.05 berarti H0 tidak dapat ditolak,
sehingga dapat disimpulkan Model Logit sangat sesuai dengan distribusi data observasi. Semakin besar dan mendekati nilai , semakin akurat prediksi Model Logit terhadap data yang digunakan.
Uji Kesesuaian Variabel/Uji Serempak (Omnibus)
Konsep yang digunakan dalam Uji Omnibus adalah perbandingan nilai Likelihood antara model yang tidak memasukkan satupun variabel independen (hanya memasukkan intersep) dengan nilai Likelihood yang memasukkan seluruh variabel independen. Sebagaimana yang telah dijelaskan sebelumnya, nilai Likelihood menunjukkan perbedaan antara nilai prediksi (dengan parameter yanag terpilih) dengan nilai observasi. Jika variabel independen yang dimasukkan ke dalam persamaan dapat menerangkan variasi variabel independen, diharapkan perbedaan antara nilai prediksi dengan nilai observasi akan semakin kecil. Jika tidak ada perbedaannya, berarti variabel independen yang dimasukkan ke dalam persamaan tidak berpengaruh terhadap variasi variabel dependen. Dalam Uji Omnibus, rumus yang digunakan adalah:
= −2 ...(5.13) dimana model A adalah model yang menggunakan seluruh paramater yang dipilih (hasil estimasi), sementara model B adalah model yang mengasumsikan seluruh parameter tersebut bernilai 0 (1 =2= ... = n= 0). Jika likelihood model B =
likelihood model A berarti tidak ada satupun parameter yang dipilih yang signifikan. Jika likelihood model B = likelihood model A maka rasio keduanya = 1 dan nilai ln nya = 0. Akibatnya nilai G = 0, yang merupakan hipotesis nol yang
digunakan. Jika p-value > 0.05 berarti Ho tidak dapat ditolak, sehingga dapat disimpulkan bahwa tidak ada satupun variabel independen yang dimasukkan ke dalam model yang signifikan. Uji Parsial (Wald)
Dalam Uji Wald rumus yang digunakan adalah:
= ... (5.14) Dimana s merupakan standard error dari estimasi masing- masing nilai parameter. Hipotesisnya adalah = 0. Jika p- value < 0.05 berarti H0 dapat ditolak, sehingga dapat
disimpulkan bahwa variabel yang sedang diuji signifikan mempengaruhi variabel independen. Catatan dalam uji ini adalah standar error > 2 merupakan indikasi adanya masalah multikolinearitas.
(3) Hasil dan Interpretasi Nilai β dan Eksponen β - Variabel Kategorikal
Misalkan X = 1 menunjukkan pengusaha dan X = 0 bukan pengusaha. P adalah peluang mempunyai rumah. Diketahui
= . Jika X = 1 maka = , sedangkan jika
X = 0 maka = 0. Artinya, nilai pada
pengusaha lebih besar sebesar dibandingkan dengan bukan pengusaha. Atau nilai pada pengusaha lebih besar sebesarexp( ) dibandingkan dengan bukan pengusaha. Karena untuk bukan pengusaha nilai odd rationya adalah = 0,
maka = exp(0) = 1 atau peluang yang bukan
0,5, maka pengusaha menjadi 1+0.5 = 1,5 atau nilai p menjadi 0,6. Artinya, peluang pengusaha lebih besar 10% dibandingkan dengan yang bukan pengusaha.
- Variabel kovariat
Variabel kovariat diinterpretasikan berdasarkan nilai Marginal Effect, yang dihitung dengan rumus:
p = β = 1 + e β ...(5.15) = β ...(5.16) = −1 1 + e β β ; e ( ) ′= e ( )u′(X)...(5.17) = − β 0 + e β −β ...(5.18) β ; 1 − p = ...(5.19) = β p (1 − p )...(5.20) Jika Xiadalah luas lahan (dalam ha) dan piadalah peluang
untuk mengadopsi inovasi, maka = ̂ (1 − ̂ )= 0,1 menunjukkan bahwa ketika luas lahan bertambah 1 ha maka peluang untuk mengadopsi inovasi meningkat sebesar 10%. Nilai tersebut dikenal sebagaiMultiplier Effect.
(4) Manual SPSS Logit Binomial a. Input data
Langkah-langkah yang dilakukan adalah: - Buka program SPSS
- Buka program Excel
- Buka “Variable View”
- Isi sel pada name untuk nama yang akan ditampilkan - Isi keterangan pada sel label
b. Analisis data
Langkah yang dilakukan adalah: - Analyze/Regression/Binary Logistic
- Menandai variabel kategorikal
Klik Categorical/ Pilih Variable/ Pilih metode penandaan
Jika kita mempunyai data kategori pada salah satu variabel independen, maka kita harus menandainya. Pilih variabel kategori tersebut untuk dimasukkan ke box “Categorical Covariates” l. Pilih “Indicator” sebagai “Contrast”, dan “Last” sebagai “Reference Category”. Misal jika categorical variable "marital" dengan 5 level (terdapat 4 dummy): 1 = married, 2 = widowed, 3 = divorced, 4 =separated, 5 =never married, maka "Never married" dipilih sebagai “Reference Category” yang merupakan pilihan 5 atau yang terakhir (”Last”). .Jika hanya terdapat 2 level 0 = tidak alih fungsi dan 1 = alih fungsi, maka 0 (“First”) selalu menjadi “Reference Category”. Klik Continue dan Save dalam Logistic Regression dialog box.
c. Melakukan Uji-Uji
Dari menu Logistic Regression pilih “Option”
Dalam Statistics and Plot terdapat beberapa uji yang dapat dipilih dengan memberi tanda √ pada kotak di sampingnya. Tanpa memberi tanda pada salah satu kotak, hasil estimasi akan menyertakan 3 dari 4 uji yang telah dibahas sebelumnya yaitu Percentage Correct/Change Correct, Omnibus dan Wald. Untuk mendapatkan hasil Uji Hosmer dan Lemeshow, beri tanda √ pada kotak di sampingberi tanda √ pada kotak di samping Hosmer- Lemeshow goodness-of-fit.
2. Multinomial Logit