Uji Asumsi Model
Part 1 – Deteksi Pelanggaran Asumsi*
Wahyu Dwi Lesmono
Kapan Pengujian Asumsi Model
dilakukan?
Pengujian asumsi model dilakukan apabila
metode penduga parameter yang digunakan
adalah metode OLS (
Ordinary Least Square
).
Namun tidak menutup kemungkinan jika
Kenapa Perlu dilakukan Uji Asumsi?
Suatu model dapat dikatakan memiliki nilai penduga terbaik
apabila memenuhi kriteria BLUE (Best Linear Unbiased
Estimator) berdasarkan minimisasi iteratif dengan teorema
Gauss-Markov, yaitu:
1. Penduga parameter bersifat efisien (Nilai ragam yang
minimum)
2. Penduga parameter bersifat linear terhadap variabel
bergantung.
3. Penduga parameter bersifat tidak bias (Nilai rata-rata dari
penduga parameter sama dengan nilai parameter itu
Aturan dalam asumsi
1. Hubungan antara variabel bergantung dengan variabel bebas bersifat linear.
2. Variabel bebas bersifat tetap pada setiap observasi (tidak
berubah-ubah/tidak stokastik).
3. Nilai variabel bebas harus bervariasi.
4. Nilai rata-rata residual/galat dengan syarat dari masing-masing variabel
bebasnya adalah 0.
5. Ragam residual/galat adalah konstan atau bersifat homokedastisitas.
6. Tidak ada hubungan antar perbedaan observasi residual (
serial correlation
).
7. Tidak ada hubungan antara variabel bebas dengan residual.
8. Variabel residual/galat berdistribusi normal.
9. Tidak ada korelasi-korelasi yang sempurna antar variabel bebas.
Definisi Autokorelasi
Autokorelasi (Korelasi Silang atau Korelasi Seri)
merupakan suatu kondisi adanya korelasi antar galat
pada observasi yang berbeda. Suatu model dikatakan
baik apabila bebas dari masalah autokorelasi.
Autokorelasi sering terjadi pada data time series (data
dengan variabel waktu), namun tidak menutup
Faktor Penyebab Autokorelasi
1. Data mengandung pergerakan naik-turun secara musiman.
2. Kekeliruan memanipulasi data.
3. Data yang dianalisis tidak bersifat stasioner.
4. Data yang digunakan bersifat runtut.
5. Adanya bias spesifikasi (Mengeluarkan variabel yang
benar dari persamaan model karena alasan-asalan
tertentu).
6. Adanya keterlambatan (Lag)
Indikasi dan Konsekuensi Akibat Autokorelasi
1. Metode penduga masih bersifat linear dan tidak bias
namun tidak efisien sehingga tidak mempunyai ragam
yang minimum. Akibatnya kriteri metode penduga
berubah menjadi LUE (Linear Unbiased Estimation).
2. Nilai standard error pada parameter menjadi
underestimated dan nilai statistik t, F, dan koefisien
determinasi menjadi overestimated sehingga
memberikan kesimpulan yang menyesatkan tentang
arti statistik dan hasil dari koefisien penduga
Cara Mendeteksi Adanya Autokorelasi
1. Menggambarkan korelogram autokorelasi
dan autokorelasi parsial.
2. Menggambarkan scatter plot antara residual
dengan residual pada observasi sebelumnya.
3. Menggunakan uji Durbin-Watson atau uji
Cara Penanggulangan Adanya Autokorelasi
1. Biarkan data apa adanya (Jika datanya Cross-Sectional)
2. Menambahkan data observasi
3. Melakukan transformasi data dengan melakukan lag,
differencing pada variabel bebas, atau transformasi
dengan fungsi tertentu.
4. Menggunakan metode penduga Maximum Likelihood,
Yule-Walker, Full Information Maximum Likelihood, atau
Unconstrained Least Square (ULS).
Definisi Heterokesdastisitas
Heterokesdastisitas (Kebalikan dari Homokesdastisitas)
merupakan suatu kondisi terjadinya keragaman
residual/galat dengan observasi dari satu observasi ke
observasi yang lainnya. Suatu model dikatakan baik
apabila rata-rata nilai residualnya adalah nol, residualnya
memiliki ragam yang konstan, dan tidak saling
berhubungan dengan residual observasi yang lainnya.
Faktor Penyebab Heterokesdastisitas
1. Adanya penggolongan antarobjek, baik secara numerik maupun
kategorik, yang menyebabkan nilai penduganya terlalu jauh.
2. Metode penduga dan pengumpulan sampel yang menghasilkan
nilai simpangan baku parameter yang semakin besar.
3. Adanya pencilan pada data sehingga menyebabkan terjadinya
keragaman yang tinggi.
4. Kemiringan (skewness) yang tidak merata.
5. Spesifikasi model yang tidak tepat.
Indikasi dan Konsekuensi Akibat
Heterokesdastisitas
1. Uji F pada persamaan model yang signifikan namun banyak uji t dari
masing-masing parameter yang tidak signifikan atau sebaliknya
sehingga mengakibatkan nilai simpangan baku dari setiap variabel
bebasnya tidak dapat dipercaya kebenarannya serta mengakibatkan
ragamnya tidak minimum.
2. Nilai penduga parameter model tidak efisien sehingga mengakibatkan
nilai penduganya menjadi LUE (Linear Unbiased Estimation).
3. Nilai residual pada beberapa observasi cukup besar sehingga
mengakibatkan model tidak cocok untuk dilakukan prediksi
(cross-sectional) atau peramalan (time series).
Cara Mendeteksi Adanya Heterokesdastisitas
1. Melihat scatter plot/scatter gram antara
kuadrat residual dengan penduga variabel
bergantung atau variabel bebas.
2. Menghitung korelasi antara variabel bebas
dengan variabel residual dengan metode
korelasi Spearman-Rank.
Cara Penanggulangan Adanya
Heterokesdastisitas
1. Menggunakan metode penduga Regresi Instrumen
Variabel (IV), Generalized Least Square (GLS), Generalized
Method of Moment (GMM), Feasible GLS (FGLS), dan
Weighted Least Square (WLS) (Jika ragam kelompok
observasinya diketahui).
2. Transformasikan data dengan fungsi yang sesuai.
3. Menggunakan metode koreksi Heteroskedasticity
Consistent Coefficient Covariance (Jika ragam kelompok
observasinya tidak diketahui).
Definisi Multikolinearitas
Multikolinearitas merupakan suatu kondisi
adanya korelasi antarvariabel. Suatu model yang
baik “seharusnya” tidak terjadi korelasi di antara
variabel bebasnya.
Secara aljabar, multikolinearitas disebabkan oleh
adanya kombinasi linear dari salah satu atau
Faktor Penyebab Multikolinearitas
1. Metode pengumpulan data yang digunakan
terbatas pada populasi yang diambil sampelnya.
2. Retriksi yang ada pada model
3. Spesifikasi model yang minim atau berlebihan
4. Model yang
overdetermined
(Lebih banyak
jumlah parameternya dibandingkan jumlah
observasi)
5. Pergerakan nilai antar variabel yang sama dengan
Indikasi dan Konsekuensi Akibat
Multikolinearitas
1. Nilai koefisien determinasi tinggi namun banyak variabel
bebas yang tidak signifikan atau sebaliknya. Sehingga
menyebabkan selang kepercayaan nilai penduga
parameternya lebih lebar.
2. Nilai standard error yang sangat rendah dibandingkan nilai
penduga parameter atau sebaliknya. Sehingga
menyebabkan terjadi kesesatan prediksi yang tidak ak
3. Nilai ragam dan koragam antar variabel yang cukup besar,
sehingga variabel-variabel tersebut sulit digunakan untuk
estimasi. Walaupun sulit digunakan untuk estimasi,
Cara Mendeteksi Adanya Multikolinearitas
1. Melihat bentuk scatterplot antar variabel
2. Melihat adanya koefisien korelasi antar variabel bebas
yang tinggi.
3. Melihat adanya koefisien korelasi parsial antar variabel
bebas dengan antar variabel kontrol yang tinggi.
4. Menghitung nilai eigen dan indeks kondisi.
5. Menghitung nilai toleransi dan
Variance Inflating
Factor
(VIF)
Cara Penanggulangan Adanya
Multikolinearitas
1. Biarkan apa adanya.
2. Mengetahui adanya retriksi secara teoritis terdahulu pada model dari hasil penduga parameter dan menambahkan retriksi pada model.
3. Mengkombinasikan data cross-sectional dan data time series. 4. Tambahkan jumlah observasi jika memungkinkan.
5. Hilangkan salah satu variabel bebas yang mengandung korelasi yang kuat terhadap variabel yang lain.
6. Transformasi variabel dengan fungsi resiprokal pada variabel yang memiliki korelasi kuat.
7. Transformasi variabel dengan melakukan differencing pertama. (Untuk data time series)
8. Menggunakan analisis faktor.
Contoh Kasus 1
Diketahui model regresi berganda yang didefinisikan sebagai berikut:
Dengan menetapkan tingkat kepercayaan sebesar 95%:
a. Buatlah persamaan Regresinya dengan metode penduga OLS dan lakukan pengujian signifikansi modelnya! b. Apakah metode penduga OLS dari
model tersebut terdapat asumsi yang dilanggar? Periksalah dengan uji
autokorelasi, heterokedastisitas, multikolinearitas!
-Analyze > Regression > Linear
-Masukkan variabel Y di kotak Dependent dan variabel X1 dan X2 di kotak Independent
-Statistics > Ceklis Estimates, Model Fit, R Squared Change, Collinearity Diagnostics, Durbin-Watson, Casewise Diagnostics pilih All cases > Continue
-Plot > Masukkan X sebagai ZPRED dan Y sebagai SRESID >
-Plot > di kotak Residuals ceklis Unstandardized > Continue
-Klik OK
-Uji normalitas (nilai statistik):
Analyze > Nonparametric Test > 1-Sample KS
Masukkan Unstandardized Residual ke Test Variable List > Ceklis Test Distribution Normal > OK
-Uji normalitas (visual):
Jawaban A
Berdasarkan nilai Adjusted R-Square
menunjukkan nilai 0.994 yang berarti 99.4% variasi dari Y dapat dijelaskan oleh variasi dari variabel x1 dan x2, sisanya dijelaskan oleh variabel bebas lainnya.
Berdasarkan uji F dapat disimpulkan bahwa seluruh variabel bebas secara bersama-sama memberikan pengaruh terhadap variabel y.
Berdasarkan uji t dapat disimpulkan bahwa seluruh variabel bebas secara terpisah memberikan pengaruh
terhadap variabel y.
N.B: Variabel bebas berpengaruh jika nilai Sig < Taraf Nyata . Baik uji F maupun uji t
1 2
9.261 0.261
1.187
Y
X
X
Jawaban A
Berdasarkan nilai Standard Error of the
Estimate adalah 0.1287 menunjukkan bahwa variasi Y yang tidak dijelaskan oleh variabel bebas sebesar 0.1287 satuan.
Berdasarkan uji F dapat disimpulkan bahwa nilai akar dari mean square residual yaitu 0.1287 yang
menunjukkan bahwa nilai error yang mungkin terjadi pada model sebesar 12.87%
Berdasarkan uji t dapat disimpulkan bahwa nilai simpangan baku untuk setiap penduga parameternya cukup kecil sehingga tidak berakibat banyak penyimpangan dalam menduga
variabel bergantung.
Prosedur Pengujian Autokorelasi dengan
Durbin-Watson
1. Tentukan banyaknya observasi (n) dan banyaknya variabel bebas pada model (k) 2. Hitung Durbin-Watson Statistik
3. Tentukan nilai Durbin-Watson Tabel (dL dan dU) dan selisih nilai 4 dengan Durbin-Watson batas atas (4-dU) dan batas bawah (4-dL)
Jawaban B (Uji Autokorelasi)
Pengujian dengan Durbin-Watson: -Banyaknya observasi n = 20
-Banyaknya variabel bebas k = 2
-Nilai Durbin-Watson statistik: DW=1.804
-Berdasarkan tabel Durbin Watson, diperoleh: 1. Batas bawah Durbin-Watson tabel:
dL = 1.1004
2. Batas atas Durbin-Watson tabel: dU = 1.5367
Jawaban B (Uji Autokorelasi)
Berdasarkan hasil uji Durbin-Watson didapat bahwa nilai Durbin-Watson
statistik berada diantara
dL
dan
4-dU
sehingga metode OLS pada model
regresi tidak mengalami masalah autokorelasi.
0
1.1004
1.5367
2
2.4633
2.8996
4
Terjadi autokorelasi positif
Tidak dapat disimpulkan
Tidak terjadi autokorelasi Terjadi autokorelasi negatif
1.804
Deteksi Heterokesdastisitas Secara Visual
dengan Scatter Plot
Untuk axis merupakan hasil estimasi dan ordinat merupakan kuadrat residual, gambar a tidak mengalami masalah heterokedastisitas, Gambar b, c, d, e mengalami masalah heterokedastisitas. Tidak adanya
Deteksi Heterokesdastisitas Secara
Visual dengan Scatter Plot
Jawaban B (Uji Heterokesdastisitas)
Dari scatter plot standardized predicted value dengan studentized
residual diperoleh pola yang tidak jelas sehingga dapat dikatakan bahwa
metode OLS pada model regresi tidak mengalami masalah
Deteksi Multikolinearitas
Untuk mendeteksi adanya multikolinearitas
dapat menggunakan nilai Indeks Kondisi,
Toleransi, atau nilai
Variance Inflation Factor
(VIF).
Conditional
Index (CI) Toleransi(TOL)
Variance
Jawaban B (Uji Multikolinearitas)
Jawaban C (Uji Normalitas)
Dengan nilai P-Value = 0.721 > Taraf Nyata = 0.05 maka
residual berdistribusi normal sehingga tidak
Jawaban C (Uji Normalitas)
Berdasarkan P-P plot menunjukkan bahwa residual berdistribusi normal.
Pada normal P-P Plot titik observasinya mendekati garis linear Z dan pada
detrended normal P-P plot titik observasinya menjauhi garis deviasi.
Jawaban C (Uji Normalitas)
Contoh Kasus 1 Versi SAS
(Input Program)
Keterangan:
fit untuk menduga parameter dari variabel bergantung
ols untuk metode penduga parameter
dw, dwprob, godfrey untuk uji autokorelasi
collin untuk uji multikolinearitas
white, breusch untuk uji heterokesdatisitas
Positif Negatif
Model Regresi dengan OLS seluruhnya normal, baik satu persamaan maupun sistem
Model Regresi dengan OLS seluruhnya tidak mengalami masalah autokorelasi, baik dengan metode Durbin-Watson maupun
Godfrey Model Regresi dengan OLS
Contoh Kasus 2
Penelitian yang dilakukan oleh Winda bertujuan
untuk mengetahui dampak volume maksimal
kebugaran tubuh berdasarkan faktor indeks
Kebugaran Gizi Aktiv fisik
a. Bentuklah model yang
menggambarkan tujuan
kasus tersebut dan dugalah
parameter model dengan
menggunakan metode OLS!
b. Lakukan pengujian asumsi
model untuk mengetahui
adanya pelanggaran asumsi
autokorelasi,
Jawaban A
Karena tujuannya ingin mengetahui pengaruh faktor indeks massa gizi
tubuh dan tingkat aktivitas fisik terhadap volume maksimal kebugaran
tubuh berdasarkan. Maka model dapat diformulasikan dengan model
regresi berganda:
0MAX 0 1 2
V
IMT
AF
Dengan menggunakan metode OLS diperoleh:
0MAX
48.7168 1.0224
8.3684
Jawaban B
Berdasarkan uji asumsi masalah heterokedastisitas dengan metode White dan
Bresuch-Pagan menunjukkan model tidak mengalami masalah heterokedastisitas.
Jawaban B
Berdasarkan nilai kondisi indeks menunjukkan bahwa variabel AF mengalami masalah multikolinearitas. Selain itu variasi proporsi parameter β3 terhadap parameter β2 dan β3 cukup tinggi sehingga metode OLS pada model regresi mengalami masalah multikolinearitas.
Contoh Kasus 3
Diketahui suatu sistem persamaan model yang didefinisikan sebagai berikut:
a. Dugalah parameter sistem model dengan metode OLS!
b. Lakukan pengujian asumsi untuk
Jawaban A
Nilai penduga parameter sistem model dengan metode
OLS didapat sebagai berikut:
Dari pengujian asumsi menunjukkan bahwa seluruh persamaan dengan penduga OLS tidak mengalami masalah heterokedastisitas namun y1 mengalami masalah autokorelasi