π’
i j
: koefisien level 2
: efek random kelompok ke-j level 2
: residual individu ke i level 1 dalam kelompok ke j level 2
: rumah tangga ke i : provinsi ke j
4. Tahapan Pengujian Model Regresi Multilevel Logistik Biner
Tahap pertama yang dilakukan peneliti sebelum pengujian adalah teknik Winsorize yang digunakan untuk mengurangi ketidaksempurnaan data (distorsi data) pada hasil pengolahan karena terdapat outlier data. Dalam analisis model regresi multilevel logistik biner terdapat beberapa tahapan pengujian yaitu uji asumsi klasik multikolinearitas, uji signifikasi random effect, Interclass Corelation Coefficient (ICC), estimasi parameter, uji signifikansi parameter secara simultan, uji signifikansi parameter secara parsial dan interpretasi parameter (Hox, 2010). Berikut penjelasan untuk masing-masing pengujian:
a. Winsorize
Winsorize merupakan salah satu metode untuk menangani masalah outlier dalam proses distribusi data tetapi tidak mengubah substansi dari data tersebut (Reifman & Garrett, 2016). Outlier didefinisikan sebagai data yang menyimpang secara ekstrim dengan data-data lainnya. Tahapan Winsorize dalam STATA dilakukan dengan terlebih dahulu menginstal modul winsor dengan command βssc install winsorβ.
b. Uji Multikolinearitas
Dalam model regresi logistik, tidak memerlukan uji asumsi klasik normalitas, heteroskedastisitas dan autokorelasi karena variabel dependen dalam regresi logistik berupa variabel dikotomi (bernilai 1 dan 0) sehingga residualnya tidak memerlukan pengujian tersebut (Hosmer & Lemeshow, 1989). Uji asumsi klasik yang diperlukan dalam model multilevel regression adalah uji multikolinearitas (Hox, 2010). Uji multikolinearitas digunakan untuk menguji ada tidaknya korelasi antar variabel independen dalam model (Gujarati, 2004).
Uji multikolinearitas dilakukan dengan melihat nilai Variance Inflation Faktor (VIF) dengan formulasi sebagai berikut:
... (3.18) Keterangan:
, yang mengindikasikan bahwa tidak terdapat adanya masalah multikolinearitas, atau dengan kata lain tidak ada korelasi yang signifikan antar variabel independen dalam model.
, yang mengindikasikan bahwa terdapat adanya masalah multikolinearitas, atau dengan kata lain terdapat korelasi yang signifikan antar variabel independen dalam model.
c. Uji Signifikasi Random effect
Dalam tahapan Maximum Likelihood Estimator (MLE) dapat menghasilkan suatu deviance yang menunjukkan tingkat kecocokan model dengan data (Hox, 2010). Model yang baik (fit) adalah model dengan tingkat deviance yang lebih rendah. Dalam model multilevel, pengujian deviance digunakan untuk mengatahui apakah model random effect lebih baik daripada model tanpa random effect. Random effect merupakan efek yang disebabkan variasi antar kelompok pada level 2. Pengujian deviance dilakukan dengan membandingkan antara nilai -2log likelihood dari setiap model yaitu model dengan random effect dan model tanpa random effect. Varians yang berbeda pada dua model multilevel memiliki distribusi chi-square, dengan degree of freedom yang sama dengan perbedaan jumlah parameter yang diestimasi dalam dua model (Hox, 2010). Pengujian signifikasi random effect dilakukan dengan hipotesis:
H0 : = 0, yang berarti bahwa random effect tidak signifikan H1 : β 0, yang berarti bahwa random effect signifikan
Uji signifikansi random effect dapat dilakukan dengan Likelihood ratio Test (LR Test). Adapun formulasi perhitungan Likelihood ratio sebagai berikut:
(
( )
( )) ... (3.19)
Keterangan:
( ) : likelihood model logistik tanpa random effect
( ) : likelihood model logistik dengan random effect
Dengan tingkat kepercayaan sebesar 95% maka diperoleh Ξ±=5%, sehingga jika nilai LR > ( ) dimana nilai v merupakan selisih jumlah parameter kedua model maka H0 ditolak yang berarti bahwa random effect signifikan. H0 ditolak dapat disimpulkan bahwa variasi variabel respon signifikan antar kelompok sehingga model multilevel menjadi model yang terbaik dalam menjelaskan data jika dibanding dengan model logistik.
d. Variance Partition Coefficients (VPCs)
Variance Partition Coefficients (VPCs) digunakan untuk menginterpretasikan komponen varian dalam model bertingkat (Chi et al., 2021). Nilai VPC berkisar dari 0 hingga 1; 0 menandakan tidak ada perbedaan antarkelompok dan 1 menandakan tidak ada perbedaan dalam kelompok. VPC yang lebih tinggi pada level tertentu menunjukkan perbedaan yang lebih besar antar grup pada level tersebut. VPC dapat dihitung dengan 3 pendekatan sebagai berikut (Leckie, 2008):
1) Linierisasi model (Model linearisation)
Linierisasi model dilakukan dengan menggunakan pengembangan deret Taylor orde pertama di sekitar rata-rata dari distribusi sehingga menjadi π ( )
( )
turunan pertama terhadap menjadi
π
( )
pengembangan deret menjadi
π π’π βπ ( π ) dimana π£ π( ) = 1.
Hasil rumus perkiraan untuk VPC sebagai berikut ( ( ))
( ( )) ( )
2) Simulasi (Simulation)
Alogaritma ini disimulasikan dari model untuk memberikan perkiraan nilai VPC yang meningkat seiring dengan meningkatnya jumlah simulasi. Adapun langkah-langkahnya sebagai berikut:
a) Tentukan nilai π’ dari distribusi ( ) sebesar π
b) Untuk nilai tetap tertentu dari , hitung nilai π yang sesuai dari π , π , k = 1, β¦, π
c) Hitung varian Bernoulli yang sesuai π£ π ( π ) π π dan hitung rata-rata dengan β π£
d) Maka ( ) dimana π£ π (π ) 3) Pendekatan variabel laten (Latent Variabel Approach)
Dalam penelitian dengan respon biner, untuk mewakili variabel kontinu dengan ambang batas 0 sampai 1. Dalam model logit memiliki distribusi logistik yang mendasari variabel. Distribusi logistik standar memiliki varians =3,29 sehingga nilai tersebut dapat dianggap sebagai varian level 1 dan varian level 1 dan 2 dapat dihitung dengan rumus:
e. Interclass Corelation Coefficient (ICC)
Interclass Corelation Coefficient (ICC) digunakan untuk menghitung variasi variabel respon yang dapat dijelaskan oleh perbedaan karakteristik antar kelompok (Hox, 2010). Nilai ICC yang besar menunjukkan bahwa antar unit di level 1 semakin homogen dan antar unit di level 2 semakin heterogen.
Dalam model multilevel, estimasi ICC dilakukan dengan model intercept only (model yang tidak memiliki variabel penjelas). Model menguraikan varians menjadi dua komponen independen yaitu pertama, Μ merupakan varians pada error level terendah yang memiliki nilai tetap sebesar /3 β 3,29. Kedua, Μ merupakan varians error level tertinggi π’ . Berdasarkan kedua komponen tersebut maka ICC dapat diformulasikan sebagai berikut:
Μ
Μ Μ ... (3.20) Nilai ICC di atas 5% berarti bahwa terdapat indikasi bahwa variasi antar kelompok lebih besar dari yang diharapkan sehingga mengimplikasikan bahwa penyaringan ditiap kelompok memiliki pengaruh pada respon setiap individu sehingga diperlukan model multilevel (Sorra & Dyer, 2010).
f. Estimasi Parameter
Dalam Generalized Linear Model (GLM), estimasi parameter dilakukan dengan Maximum Likelihood Estimation (MLE) yang digunakan sebagai metode untuk menghasilkan estimasi yang konsisten dan efisien (Hurlin, 2013). Prinsip dalam MLE yaitu memaksimumkan fungsi likelihood melalui inverse dari link function guna memprediksi variabel respon (Agresti, 2009).
Tahapan MLE pada model multilevel merupakan hasil dari iterasi dari nilai parameter perkiraan yang meningkat dalam setiap iterasi berturut-turut sehingga nilai parameter akan berubah selama iterasi (Aliyudin & Budyanra, 2017).
g. Uji Signifikansi Parameter secara Simultan
Uji signifikansi parameter secara simultan dapat dilakukan dengan uji ( test) dimana pengujian ini digunakan untuk melihat signifikansi seluruh variabel penjelas di dalam model secara simultan (bersama-sama). Uji dilakukan dengan hipotesis sebagai berikut:
H0 : β¦= β¦ , yang berarti bahwa tidak ada pengaruh antara variabel penjelas terhadap variabel respon.
H1 : minimal terdapat β 0, yang berarti bahwa minimal terdapat satu pengaruh antara variabel penjelas terhadap variabel respon.
Adapun formulasi untuk uji sebagai berikut (Hosmer & Lemeshow, 1989):
( (ππ’ππ ππ π)
( ππ ππ‘πππ π ππ π)) ... (3.21) Keterangan:
(ππ’ππ ππ π) : likelihood tanpa variabel penjelas
( ππ ππ‘πππ π ππ π) : likelihood dengan variabel penjelas
Nilai berdistribusi ( ) dimana degree of freedom r merupakan jumlah parameter pada level 1 dan 2. Jika nilai > ( ) maka H0 ditolak sehingga disimpulkan bahwa model dengan variabel penjelas fit pada singnifikansi Ξ±, atau dengan tingkat kepercayaan (1-Ξ±) persen paling tidak terdapat satu variabel penjelas yang memenuhi variabel respon (Aliyudin & Budyanra, 2017).
h. Uji Signifikansi Parameter secara Parsial
Uji signifikansi parameter secara parsial dapat dilakukan dengan uji wald sehingga dapat dilihat pengaruh dari masing-masing parameter dalam model dengan hipotesis sebagai berikut (Hox, 2010):
H0 : , yang berarti bahwa tidak terdapat pengaruh variabel penjelas ke j terhadap variabel respon.
H1 : , yang berarti bahwa terdapat pengaruh variabel penjelas ke j terhadap variabel respon
Adapun formulasi uji wald sebagai berikut:
Μ ( Μ)
... (3.22)
Nilai W berdistribusi normal sehingga jika | | > Z tabel atau nilai p < Ξ± maka menolak H0, yang berarti bahwa variabel penjelas signifikan berpengaruh terhadap variabel respon (Hox, 2010).
i. Interpretasi Parameter
Interpretasi parameter dapat dilakukan dengan menggunakan hasil nilai odds ratio untuk memperkirakan kecenderungan terjadinya suatu kejadian pada pengamatan pertama dibanding dengan pengamatan kedua (Hox, 2010). Nilai odds ratio diperoleh dengan membandingkan risiko terjadinya suatu event suatu kelompok terhadap kelompok lain. Adapun formulasi perhitungan odds ratio sebagai berikut (Hosmer & Lemeshow, 1989):
Μ ( ) ( ) ( ) ( )
( Μ Μ ) ( Μ Μ ) ( Μ Μ )
X ( Μ )
( Μ ) ( Μ )
( Μ Μ ) ( Μ ) ( Μ )
... (3.23)
Interpetasi hasil dari perhitungan Μ merupakan resiko kecenderungan terjadi peristiwa y=1 merupakan sebesar ( Μ ) yang dikali kecenderungan terjadi peristiwa y=a pada kategori x=0 (Aliyudin & Budyanra, 2017).