Ekonometrika
Program Studi Statistika, semester Ganjil 2012/2013
Pengujian Asumsiasumsi di dalam Regresi
Linier
Galat menyebar normal
Multikolinearity
Heteroskedasticity
Autocorrelation
Misspecification:
Peubah bebas yang kurang tepat
Measurement errors
Asumsi kenormalan
Pelanggaran, dengan kemungkinan
penyebab:
1.
Sebaran peubah eksogen atau endogennya tidak
normal
2.
Pelanggaran asumsi linieritas
3.
Sebaran galat menjulur karena adanya pencilan
4.Ukuran sampel yang terlalu kecil
Efek pelanggaran:
Pencilan berpengaruh besar terhadap penduga
parameter (bias)
Hasil pengujian tidak sah
Asumsi Kenormalan
Bagaimana mendeteksinya?
Normal probability plot Histogram dari sisaan
Chi square goodness test of fit Anderson Darling normality test Jarque Berra normality test
Jika dilanggar, bagaimana memperbaikinya?
Transformasi non linier pada penyebab 1 atau 2
Pada penyebab 3, pencilan harus dievaluasi penyebabnya
Murni kesalahan: pencilan dapat dibuang
Apa adanya: pencilan memberikan informasi tambahan pada hasil
analisis
Perbesar ukuran sampel untuk penyebab 4
Transformasi: sesuaikan dengan permasalahan teori ekonomi
yang ingin dianalisis
Multikolinieritas
Terdapat hubungan linier di antara peubah eksogen
Multikolinieritas sempurna:
Satu peubah eksogen adalah fungsi linier dari peubah
eksogen yang lain
u
X
X
Y
1
2 2
3 3
2 2 1
3
X
Multikolinieritas
Efek dari multikolinieritas:
u
X
X
Y
1
2 2
3 3
X
3
1
2X
2
X
u
X
Y
1
2 2
3
1
2 2
X
u
Y
1
3
1
2
3
2 2
u
X
v
v
Y
1
2 2
Multikolinieritas
Untuk memperoleh penduga β
1dan β
2: solusi dari
persamaan berikut:
2 3 2 2 1 3 1 1ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
v
v
2 persamaan untuk 3 peubah
Tidak ada solusi unik bagi penduga parameter
populasi
Efek dari struktur matriks akibat satu kolom
yang merupakan fungsi linier dari kolom yang
lain:
X
Karena determinan matriks singular = 0
0
'
X
X
Tidak dapat diperoleh inverse dari
X
’
X
pada:
X
'
X
X
'
Y
ˆ
12
X
X
X
X
X
X
'
'
1
'
1
adj
Karena:
Multikolinieritas tak sempurna
Terjadi jika terdapat hubungan linier yang tidak
sempurna antar peubah eksogen
v
X
X
3
2
Dengan
v
sebagai galat acak yang tidak
sama dengan nol
Kasus ini sering terjadi pada kasus terapan
Bagaimana mengidentifikasi seberapa
Efek dari Multikolinieritas tak sempurna
Penduga OLS tetap dapat diduga
Penduga OLS tetap bersifat BLUE
Penduga OLS tetap efisien (ragam dari penduga
paling kecil dari semua penduga yang mungkin)
Akan tetapi pada nilai yang cukup besar
Relatif lebih besar jika tidak ada multikolinieritas
1'
ˆ
var
X
X
X
X
X
X
X
X
'
'
1
'
1adj
0
'
X
Efek dari Multikolinieritas tak sempurna
Ragam dan peragam dari penduga OLS relatif
besar
Selang kepercayaan menjadi lebih besar
Lebih banyak menerima hipotesis nol (koefisien tidak
nyata)
Statistik uji t dari satu atau beberapa koefisien
menjadi tidak nyata
Walaupun
R
2secara keseluruhan besar
Tanda bagi penduga koefisien berkebalikan
Struktur Ragam Peragam dengan adanya
Multikolinieritas
Pada
multiple regression:
2
1X
X'
ˆ
β
var
Dengan 2 peubah eksogen:
k ki
ki
X
X
x
23 2 2 3 2 2 2 3 2 2
ˆ
var
i i i i ix
x
x
x
x
2 3 2 2 2 3 2 2 23 i i i ix
x
x
x
r
2
23 2
2 2
1
r
x
i
23 2 2 3 2 2 2 2 2 3
ˆ
var
i i i i ix
x
x
x
x
2
23 2
3 2
1
r
x
i
Struktur Korelasi dinamakan dengan Variance Inflation
Factor (VIF)
2 3 2 2 2 23 2 23 3 21
ˆ
,
ˆ
cov
i ix
x
r
r
2
23
1
1
r
VIF
VIF
x
i
2 2 2 2ˆ
var
x
i
VIF
23 2 3
ˆ
var
Semakin besar multikolinieritas maka semakin
besar VIF
Semakin besar VIF semakin besar ragam penduga
Untuk regresi lebih dari 2 peubah definisi dari VIF:
1
2
1
j
R
VIF
:
2
j
R
Koefisien determinasi dari
auxiliary
regression
Auxiliary regression
: regresi dengan
X
jsebagai
Nilai VIF berdasarkan Koefisien Determinasi
dari Auxiliary Regression
0
1
0.5
2
0.8
5
0.9
10
0.95
20
0.975
40
0.99
100
0.995
200
0.999
1000
2
j
R
VIF
VIF yang naik seiring dengan
kenaikan koefisien determinasi
VIF yang lebih dari 10: bukti
Pendeteksian Multikolinieritas
Dari koefisien korelasi sederhana
Efektif untuk regresi dengan 2 peubah eksogen
Dari VIF, multikolinieritas serius jika
r ≥
0.9
Dari koefisien determinasi
auxiliary regression
Efektif untuk regresi dengan 3 peubah eksogen
atau lebih
Peubah eksogen pada
auxiliary regression
:
peubah yang mempunyai masalah
multikolinieritas
Hasil dari
auxiliary regression:
Standar error yang kecil
Contoh:
Model regresi dengan 2 peubah eksogen,
Dua peubah eksogen tsb mempunyai korelasi tinggi:
Dari matrix korelasi berikut:
X2
X3
Y
X2
1
X3
0.999995
1
Y
0.857369
0.857438
1
Output dari pendugaan Model Regresi
dengan Kedua Peubah
Model 1: OLS, using observations 1-25 Dependent variable: Y
coefficient std. error t-ratio p-value const 35.8677 19.3872 1.850 0.0778 * X2 -6.32650 33.7510 -0.1874 0.8530 X3 1.78976 8.43832 0.2121 0.8340
Output model regresi dengan memakai
X
2
saja
Model 2: OLS, using observations 1-25 Dependent variable: Y
Output model regresi dengan peubah
X
3
saja
Model 3: OLS, using observations 1-25 Dependent variable: Y
Output dari
auxiliary regression
Regresi
X
2terhadap
X
3Model 4: OLS, using observations 1-25 Dependent variable: X2
coefficient std. error t-ratio p-value const -0.117288 0.117251 -1.000 0.3276
X3 0.250016 0.000164318 1522 4.83e-059 *** Mean dependent var 159.4320 S.D. dependent var 81.46795
Bagaimana mengatasinya?
Do nothing
Rule of Thumb Procedure
A priori information
Combining cross sectional and time series data
Dropping a variable(s) and specification bias
Transformation of variables
Do Nothing
Multikolinieritas adalah masalah akibat
ketidaksempurnaan data
Untuk data ekonomi: tidak dapat dikontrol dan
tidak ada pilihan
A priori information
Informasi dari penelitian sebelumnya mengenai
hubungan fungsional antar parameter peubah yang
berkorelasi
u
X
X
Y
1
2 2
3 3
Dengan
X
2
yang berkorelasi tinggi dengan
X
3
Misal:
X
2: pendapatan,
X
3: Kekayaan,
Y
: konsumsi
Diketahui dari penelitian sebelumnya bahwa
perubahan kekayaan terhadap perubahan konsumsi
adalah 1/10 perubahan pendapatan terhadap
perubahan konsumsi
2 3
0
.
1
Lakukan transformasi terhadap kedua peubah eksogen
dengan hubungan sesuai (*)
Lakukan pendugaan menggunakan peubah yang sudah
ditransformasi
u
X
X
Y
1
2 2
3 3
3
0
.
1
2u
X
X
Y
1
2 2
0
.
1
2 3
u
X
Y
1
2
0
.
1
*
3
2
X
X
Menggabungkan data cross section dan
time series
Misalkan:
Y
: jumlah penjualan mobil
P
: rata-rata harga mobil
I
: pendapatan
Pada data time series,
P
dan
I
cenderung berkorelasi
t t
t
t
P
I
u
Y
ln
ln
ln
1
2
3
β
2:
adalah elastisitas harga terhadap jumlah
penjualan mobil
Jika terdapat data cross section (pada satu waktu)
yang dapat dipakai untuk menduga koefisien
elastisitas pedapatan β
3
Dengan asumsi bahwa pada satu waktu harga tidak
terlalu bervariasi
Gunakan penduga bagi β
3untuk melakukan
transformasi terhadap
Y
t t
t
t
P
I
u
Y
ln
ˆ
ln
ln
1
2
3t t
t
t
I
P
u
Y
ˆ
ln
ln
ln
3
1
2t t
t
P
u
Dropping a variable(s) and specification
bias
Membuang salah satu dari peubah yang
berkorelasi
Masalah:
Jika semua peubah secara ekonomi harus ada di dalam
model:
specification bias
Jika pendapatan dan kekayaan memang harus ada di
dalam model konsumsi
Tujuan perbaikan multikolinieritas dapat
Transformation of variables
Contoh pada data time series pada
X
2: pendapatan,
X
3: Kekayaan,
Y
: konsumsi
Dengan
X
2yang berkorelasi tinggi dengan
X
3seiring
dengan waktu
Pada waktu
t
berlaku:
t t
t
t
X
X
u
Y
1
2 2
3 3
Model yang sama dapat berlaku pada waktu
t-
1
1 1
, 3 3 1
, 2 2 1
1
t
t
tt
X
X
u
Untuk meminimumkan multikolinieritas, dilakukan
pembedaan dari model di waktu
t
dan waktu
t-
1
First difference form
2 2 1
3
3 3 1
1
2
1
t t t t t t tt
Y
X
X
X
X
u
u
Y
t t
t
t
X
X
v
Y
2 2
3 3
Regresi dilakukan pada masing-masing peubah
yang sudah dibedakan
Korelasi di antara peubah beda (∆
X
2dan
∆
X
3) tidak
Additional or new data
Jika multikolinieritas terjadi akibat
pengambilan sampel
Penambahan ukuran sampel dapat
mengurangi efek dari multikolinieritas
2
23 2
2 2 2
1
ˆ
var
r
x
i
Sampel bertambah akan
memperbesar nilai
komponen ini
Komponen ini diasumsikan
tetap